MM040 – Le 5 regole per un progetto di Data Science

Pubblicato da Alberto Visentin il

Prevedere” (v. tr.): “Fare ipotesi o supposizioni su ciò che avverrà, ritenere probabile qualcosa, anche in base a determinati dati.” (treccani.it)

Capire l’esigenza. Di business.

La data science deve entrare in azienda in punta di piedi. Proporsi non come un nuovo, indiscutibile paradigma a cui tutti devono adeguarsi senza poter dire nulla, bensì come una proposta, basata sui dati, per supportare gli stakeholder aiutandoli nel raggiungimento degli obiettivi aziendali.

L’approccio di chi propone la data science deve essere in primo luogo di ascolto. Partire non dagli algoritmi, ma dalla condivisione delle esigenze concrete dell’azienda. Non dagli strumenti, ma risultati di business che si vogliono ottenere.  Solo quando questo contatto sarà stabilito e gli obiettivi saranno chiari a tutti, allora si potrà iniziare a lavorare “tecnicamente”, sia sul piano statistico che informatico.

Verificare i dati.

Ovvero, capire quali siano effettivamente i dati interni a disposizione, assieme a quelli reperibili dall’esterno, e quanto questi siano consistenti. Si tratta di una fase iniziale necessaria, che può portare alla luce carenze nei processi di “data retrieval” tali da far addirittura sorgere dubbi sull’opportunità di costruirci sopra un progetto realistico di data science. Tuttavia, anche qui, bisogna essere chiari con l’interlocutore, sia tecnologico (IT Dept.) che di business. In questa fase il famigerato algoritmo non è ancora entrato in scena.

Essere chiari, realisti, credibili.

Come detto, la data science non deve avere la pretesa di sapere da subito “come vanno le cose”, a prescindere dal contesto in cui si va a operare e soprattutto dal confronto con le persone che in quel contesto ci vivono ogni giorno (e che devono essere i primi sponsor dell’iniziativa).

Bisogna procedere per gradi. Sarà opportuno iniziare definendo un perimetro limitato di dati oggetto di analisi, che sia comunque di interesse per l’azienda e possa allo stesso tempo dimostrare la bontà dei metodi che si andranno ad applicare: un contesto regionale per i point of sale, una categoria merceologica, ecc.

In questo modo sarà possibile sviluppare un primo test avente i seguenti obiettivi:

– Verificare che un algoritmo di machine learning potrebbe (condizionale, mi raccomando) essere valutato anche oltre il set limitato di dati su cui ha dato incoraggianti risultati.

– Avere un’idea su cosa servirebbe (ancora condizionale, mi raccomando) per poter fare questo salto di qualità. Sia in termini di dati che in termini di conoscenza delle dinamiche più o meno nascoste dell’azienda in cui si sta operando.

Prima di intraprendere un progetto di advanced analytics bisogna dimostrare che si è in grado di farlo. Partire dal piccolo, con obiettivi limitati ma allo stesso tempo chiari e condivisi, è molto spesso la scelta migliore.

Creare una data science “su misura”.

Molti strumenti di Business Intelligence & Analytics includono oggi tra le loro funzionalità anche oggetti grafici di machine learning. L’ambizione (o la pretesa) è dare all’utente la possibilità di ottenere in modo rapido e relativamente semplice un forecast di vendita piuttosto che un’analisi di correlazione tra prodotti, senza imbastirci sopra un progetto vero e proprio.

Ecco, nella data science ancor più che in altri contesti la rapidità, così come l’apparente semplicità, si possono poi pagare in termini di affidabilità del risultato finale.

Definire correttamente un algoritmo all’interno di uno specifico ecosistema aziendale è un processo delicato e ad approssimazioni successive, in cui a un test limitato segue un’analisi dei risultati che porterà a un perfezionamento dell’algoritmo stesso per un nuovo test, magari più ambizioso, e così via.

In tutto ciò non dovremo essere intransigenti nell’applicazione dell’algoritmo, ma anzi dovremo far tesoro di tutte quelle informazioni “soggettive” che solo gli stakeholder aziendali potranno dare: un ritardo nelle consegne, non registrato ma di impatto per le vendite di un certo negozio, la definizione di priorità non presenti a sistema ma che di fatto hanno spinto le vendite un prodotto rispetto a un altro, un evento che ha determinato una vendita anomala in un determinato mercato.

Rendere umano l’algoritmo, lavorando assieme al business. Partire sì da un framework metodologico e di contenuti, ma adattandolo alla realtà specifica in cui si va a operare.

Mostrare i risultati. Al business.

Alla fine, l’importante è comunicare i risultati agli stakeholder aziendali. Ed è qui che spesso, paradossalmente, i progetti di advanced analytics rischiano di fallire. Perché non riescono a spiegare quanto fatto in una modalità che gli stakeholder stessi possano riconoscere come propria, ovvero utile al loro lavoro.

Bisogna allora ricordare da dove si è partiti: l’esigenza di business. E tornare a quella, per mostrare come gli obiettivi aziendali siano più concretamente raggiungibili tramite l’applicazione di metodi di advanced analytics a supporto dell’esperienza aziendale.

In questa fase diventa fondamentale realizzare un ambiente di data visualization che parli al business e non al data scientist. Mostrando ad esempio il miglioramento previsto nei tempi di supply chain per una migliore previsione della domanda, e non l’algoritmo di forecast sottostante. Valorizzando il maggiore impatto economico di una promozione mirata a una particolare classe di clienti registrati, e non i metodi di clustering applicati per arrivarci. Evidenziando l’impatto trasversale – positivo o negativo – che la vendita di un prodotto ha su un altro, senza elencare gli indici utilizzati per determinare le regole di associazione.

Attenzione: questo non vuol dire che non sia necessario andare anche su un piano squisitamente tecnico-statistico per certificare la bontà e la solidità dei metodi applicati. Ma questo è un altro film, un’altra data visualization, con altri interlocutori. E anche un’altra fase, necessaria quanto temporalmente precedente rispetto a quella di condivisione con il business.

Riuscire a includere, all’interno di un progetto di advanced analytics, la componente “science” con la componente “business” è fondamentale per la comprensione, e quindi il successo dell’intera iniziativa.

Vuoi saperne di più? Contattaci!

(Banner image by Megan Rexazin from Pixabay)