La check list essenziale per un’efficace democratizzazione dei dati

[ad_1]

Le aziende realmente data-driven ottengono risultati di business nettamente migliori rispetto a quelle che non lo sono. Secondo un recente whitepaper di IDC [in inglese], i loro leader hanno registrato, in media, performance due volte e mezzo superiori rispetto alle altre, in molti contesti. In particolare, le imprese leader nell’utilizzo di dati e analisi hanno ottenuto un miglioramento tre volte superiore dei ricavi, hanno avuto quasi una probabilità tre volte maggiore di raggiungere tempi di commercializzazione più brevi per i nuovi prodotti e i nuovi servizi, e di migliorare più del doppio la soddisfazione dei clienti, i profitti e l’efficienza operativa.

Tuttavia, per ottenere il massimo valore dai dati e dagli analytics, le imprese devono avere una cultura data-driven che le permei nella loro totalità, in cui ogni unità abbia pieno accesso ai dati di cui ha bisogno, e nel modo più efficace.’

Questa è la cosiddetta democratizzazione dei dati. Per conquistarla, è necessario raccogliere le unità informative in modo ponderato, scegliere con cura una piattaforma che consenta un accesso olistico e sicuro alle risorse, e formare e responsabilizzare i dipendenti affinché abbiano una mentalità data-driven. Anche i rischi legati alla sicurezza e alla conformità sono da tenere in massima considerazione.

Partire da una base di dati solida

Prima di scegliere una piattaforma per la condivisione dei dati, un’azienda deve capire quali sono già in suo possesso ed eliminare gli errori e le duplicazioni.

Una parte importante della preparazione dei dati da condividere consiste nell’effettuare la loro normalizzazione, afferma Juan Orlandini, chief architect e distinguished engineer di Insight Enterprises.

I dati possono essere incompleti e i loro formati e le loro architetture incoerenti. “Quando si cerca di trasferirli a qualcuno che non ha esperienza in materia”, spiega Orlandini, “è molto facile che, da quei dati, vengano tratte conclusioni errate o fuorvianti”.

Le aziende si rivolgono spesso a un aiuto esterno per la normalizzazione dei dati perché, se essa viene eseguita in modo errato, l’azienda potrebbe ritrovarsi con problemi relativi alla loro qualità e non riuscire a farne l’uso previsto.

Con l’aumento delle aziende che utilizzano il cloud e con la diffusione dello sviluppo cloud-native, la normalizzazione dei dati è diventata più complicata.

“Potrebbero trovarsi in un database NoSQL, a grafo o in tutti gli altri tipi di basi ora disponibili, e renderli coerenti diventerebbe davvero impegnativo”, aggiunge Orlandini.

Selezionare la piattaforma con cura

In molti casi, nelle aziende che non praticano la democratizzazione dei dati, solo l’IT ha accesso a essi e agli strumenti di data intelligence. Quindi, per renderli accessibili a tutti, sono necessari nuovi strumenti e nuove tecnologie.

Naturalmente, il costo è un aspetto importante, continua Orlandini, così come lo è la decisione su dove ospitare i dati e di come renderli disponibili in modo fiscalmente responsabile. Una società potrebbe anche chiedersi se debbano essere mantenuti in sede a causa di problemi di sicurezza nel cloud pubblico. Kevin Young, consulente senior in materia di dati e analisi della società di consulenza SPR, sostiene che le imprese possono, innanzitutto, condividere i dati creando un data lake come Amazon S3 o Google Cloud Storage. “Qualunque membro dell’azienda potrà aggiungere i suoi dati al “lago” per consentire a tutti i reparti di utilizzarli”, spiega Young. Tuttavia, senza una cura adeguata, un data lake può finire disorganizzato e ingombro di elementi inutilizzabili. La maggior parte delle aziende finisce per avere non dei laghi, ma delle paludi di dati”, avverte Orlandini.

Ma i data lake non sono l’unica opzione per creare un archivio di dati centralizzato.

Un’altra possibilità è quella di creare una data fabric, un’architettura e un insieme di servizi che forniscono una visione unificata dei dati di un’azienda, e consentono l’integrazione da varie fonti in sede, nel cloud e sui dispositivi edge.

Una data fabric consente di combinare vari set, senza la necessità di creare copie, e può rendere i silos più stabili.


Esistono software vendor specializzati nel data fabric, come IBM con Cloud Pak for Data e SAP con Data Intelligence, entrambi nominati leader del settore nello scorso anno. studio Enterprise Data Fabric Q2 2022 di Forrester [in inglese]. Ma con molte opzioni disponibili, può essere difficile sapere quale scegliere.

La cosa più importante è analizzare e monitorare i dati, spiega Amaresh Tripathy, global analytics leader della società di servizi professionali Genpact.

“Ci sono molte piattaforme”, dice. “Scegliete quella che fa per voi, ma assicuratevi che sia automatizzata e facilmente accessibile”. Anche da una soluzione self-service che, possibilmente, semplifichi il reporting delle analisi anche per chi non ha esperienza tecnica: “Come un portale, in cui le persone possono vedere tutti i dati, il loro significato, le metriche e la loro provenienza”, dice Tripathy.

Non esiste uno strumento perfetto e, spesso, c’è bisogno di trovare un compromesso tra la capacità di una soluzione di gestire il lineage, la catalogazione e il mantenimento della qualità dei dati. “La maggior parte delle aziende cerca di risolvere tutti e tre i problemi insieme”, aggiunge Tripathy. “A volte ci si concentra troppo su uno di essi, e non si ottiene un buon risultato con un altro”. Un’impresa dovrebbe, quindi, decidere cosa, per lei, è più importante. “Servirebbe sempre avere la consapevolezza del perché lo stanno facendo, quale strumento offre il miglior rapporto qualità-prezzo sulle tre dimensioni, e poi prendere la decisione più appropriata”.

Quando si pensa a come condividere i dati, un’impresa può anche prendere in considerazione l’implementazione di una rete di dati (data mesh), che adotta un approccio opposto a quello della data fabric. Mentre quest’ultima gestisce più fonti da un unico sistema virtuale centralizzato, la data mesh è una forma di architettura che adotta un approccio decentralizzato e crea più sistemi specifici per il dominio.

Con una rete di dati, le aziende possono assicurarsi che le risorse siano gestite correttamente mettendole nelle mani di coloro che li conoscono meglio, spiega Chris McLellan, direttore delle operation di Data Collaboration Alliance, un’organizzazione no-profit globale che aiuta le persone e le società a ottenere il pieno controllo dei propri dati. Può trattarsi di una persona, come il responsabile finanziario, o di un gruppo di persone che agiscono come data steward.

“Alla base c’è il concetto di dati come prodotto”, spiega. “E un prodotto di dati è qualcosa che può e deve essere governato e curato da qualcuno con esperienza nel settore”.

L’implementazione di un’architettura a rete di dati consente a un’impresa di affidare specifici set a esperti del settore. “Queste persone sono più vicine alle normative, ai clienti e agli utenti finali”, afferma McLellan. “A tutto ciò che riguarda quello specifico dominio di informazioni”.

Una data mesh non è legata ad alcuno strumento specifico, quindi i singoli team possono scegliere quella che meglio si adatta alle loro esigenze, senza che vi sia il collo di bottiglia di tutto ciò che deve passare attraverso un team centrale.

“Stiamo assistendo a un decentramento, non solo dell’Information Technology o della distribuzione delle app, ma anche della gestione e della governance dei dati”, osserva McLellan, “il che è positivo, perché gli addetti al marketing conoscono le leggi sulla protezione dei consumatori, e la finanza ha competenze sulle normative finanziarie superiori a quelle dell’IT”.

Anche se ci sono molti vendor di data mesh, si tratta ancora di un oggetto relativamente nuovo, avverte Forrester, e ha le sue difficoltà da affrontare, tra cui i conflitti nel modo in cui viene definito, le tecnologie che utilizza, e il suo valore.

Formazione e gestione del cambiamento

Una volta stabilita un’architettura per la democratizzazione dei dati, i dipendenti devono capire come lavorare con i nuovi processi. Potranno ricevere i dati giusti, ma anche se hanno una formazione da amministratori o contabili, non capiranno necessariamente cosa farne, avverte Orlandini di Insight. L’accesso ai dati non è di per sé sufficiente a rendere un’azienda data-driven. “È necessario fare un po’ di formazione”, dice Orlandini. “Se non la si fa in modo adeguato, il successo sarà alterno, nella migliore delle ipotesi o, addirittura, un fallimento”.

Alcune società hanno avviato programmi di formazione interna per garantire che i dipendenti comprendano come interpretare e gestire correttamente i dati.

Genpact, per esempio, ha introdotto l’anno scorso quella che chiama l’iniziativa DataBridge per aumentare l’alfabetizzazione sui dati in tutta l’impresa.

“La nostra intenzione non era quella di trasformare 100.000 persone in citizen data scientist”, dichiara Tripathy. “Forniamo la consapevolezza nel contesto del loro lavoro”. Per esempio, un dipendente che si occupa dell’analisi dei sinistri non ha bisogno di imparare tutto sul rilevamento delle anomalie, ma deve capire cosa significano per lui gli aspetti essenziali per il suo lavoro. “Si possono avere o meno tutte le competenze per esaminare i dati in autonomia, ma si dovrà anche essere in grado di porre una domanda nel modo giusto e chiedere aiuto”, aggiunge.

Porre le basi per la sicurezza e la conformità

Un’adeguata governance dei dati deve essere implementata fin dall’inizio per mantenere la loro integrità ed evitare costose sanzioni.

Insieme ai responsabili IT, i team che si occupano di sicurezza e conformità devono partecipare fin dalle fasi iniziali, prosegue il manager di Insight. “È una grande sfida e molte imprese hanno difficoltà in questo senso”, sottolineando l’importanza che la leadership dell’azienda comprenda esattamente cosa sta offrendo da condividere, e si assicuri che ciò arrivi alle persone giuste.

“Viviamo in un mondo altamente regolamentato e dobbiamo stare molto attenti”, avverte, “soprattutto in settori come quello sanitario e finanziario, dove esistono leggi che comportano gravi conseguenze se si lascia che la persona sbagliata abbia accesso ai dati sbagliati”.

Esistono anche strumenti che aiutano le aziende a mascherare e offuscare i dati per evitare di rivelare informazioni di identificazione personale. “È possibile iniziare a ottenerne senza rivelare i dati PII, i record HIPAA o qualsiasi altro requisito normativo”, continua. “Esistono anche strumenti con controlli di accesso basati sugli attributi che consentono di etichettare i dati in maniera molto specifica (PII o HIPAA, qualunque siano i vostri attributi) e di accedere solo ai dati con il giusto tipo di attributi associati”.

In questo modo, i dati si controllano automaticamente e sono disponibili in un cloud pubblico o in un ambiente ibrido con risorse in più sedi, o anche in ambienti privati con rigorosi controlli di conformità che possono essere messi in atto.

I vantaggi a lungo termine

La democratizzazione dei dati non solo può aiutare un’azienda ad accelerare le sue pipeline di dati, ma può anche consentire alle persone di trovare nuovi modi per risolvere i problemi grazie a una maggiore consapevolezza di come analizzare e lavorare con i dati.

Secondo Gartner, adottando la democratizzazione dei dati, le aziende possono risolvere le carenze di risorse, ridurre i colli di bottiglia e consentire alle unità aziendali di gestire più facilmente le proprie richieste di dati. Inoltre, possono migliorare il processo decisionale consentendo a un maggior numero di persone di contribuire all’analisi e all’interpretazione dei dati, aumentare la collaborazione tra i team interni e migliorare la trasparenza, poiché più persone hanno accesso alle informazioni e possono vedere come vengono prese le decisioni data-driven.

[ad_2]

link originale

Condividi sui Canali Social

Facebook
Twitter
LinkedIn
Pinterest
Pocket
WhatsApp
Trustpilot