MM009 – Il web e le immagini, fonte di informazione per il business

Pubblicato da Filippo Balla il

Intro

Per le imprese è diventato ormai imprescindibile il concetto di vantaggio competitivo, ossia avere una capacità distintiva rispetto ai propri concorrenti che permetta di avere maggiore redditività. Tramite il processo di digitalizzazione e un utilizzo intelligente dei dati è possibile sfruttare le più moderne tecnologie per identificare i punti di forza e di debolezza non solo propri ma anche dei diretti concorrenti. Per raggiungere questo scopo e possibile sfruttare informazioni esterne provenienti da fonti eterogenee (web, social, ecc..), per poi integrarle con i dati interni già in possesso dell’azienda (vendite, movimenti di magazzino, informazioni sui clienti registrati – CRM, ecc..).

All’interno della nostra divisione di Ricerca e Sviluppo abbiamo realizzato una metodologia per integrare nuove fonti dati all’interno di piattaforme per la Business Analytics. Lo scopo è quello di ottenere nuove informazioni e riuscire ad integrarle con altre conosciute in modo da ottenere potenziali insight per consolidare e migliorare le proprie strategie di business.

Vantaggio competitivo

Focus

L’obbiettivo è stato quello di raccogliere informazioni di prodotti venduti su piattaforme e-commerce, come: url, immagine, modello, brand, colore, taglia, prezzo, ecc… Questi dati fortemente non strutturati vengono inseriti giornalmente all’interno di una struttura di storage (Data Hub), storicizzati ed uniformati tramite un processo di omogeneizzazione del dato. Le informazioni raccolte, in questo modo, sono fruibili come servizio (Saas) oppure integrabili all’interno del Data Mart dei clienti (On-premises) e utilizzabili congiuntamente ai dati interni per nuovi tipi di analisi. Tramite questo sistema è possibile effettuare, ad esempio, il tracking dell’andamento dei prezzi di vendita sulle diverse piattaforme on-line e, quindi, conoscere le variazioni temporali dei prezzi dei prodotti, propri e dei concorrenti.

Sfida tecnologica

Il punto cruciale per queste analisi è riuscire a identificare correttamente i prodotti venduti on-line. Il sistema sfrutta tecniche basate sul testo e sulle immagini con lo scopo di identificare lo stesso articolo venduto su piattaforme differenti. Tramite il testo è possibile individuare ed estrarre le caratteristiche chiave di un prodotto (Brand, Categoria, Colore e Materiale). Sfruttando queste tecniche diText Matching è possibile distribuire in insiemi, detti Cluster, i prodotti che posseggono le stesse caratteristiche chiave , identificando perciò lo stesso prodotto in base al testo. Le tecniche visive sono in grado di catturare informazioni dalle immagini presenti sui siti di e-commerce e poi tramite algoritmi di Image Matching di stabilire quanto le immagini di due prodotti siano simili. L’analisi di questi due metodi di matching, di Clustering testuale e per immagine ha permesso di individuare i punti di forza e di debolezza dei differenti approcci e di concepire l’idea di un sistema di Reccomendation che sfrutti entrambe le tecniche. Questo sistema, sfrutta il modello del Graph DB permettendo di considerare i prodotti come nodi di un grafo e i diversi legami di similarità (testo o immagine) come un collegamento fra di loro. Quanto più il legame è forte tanto più è probabile che i prodotti siano simili. Questo permette di esprimere una percentuale che rappresenta la similarità basandosi sulla forza del legame fra due prodotti e, quindi, suggerire quando due di loro risultino simili.

Graph Data Base
Modello a grafo

Possibili applicazioni

Per le aziende del mondo Retail è molto semplice monitorare l’andamento delle vendite dei propri negozi, fisici ed on-line, in quanto hanno pieno controllo dell’informazione appartenente a tutta la filiera del prodotto, dalla produzione fino alla vendita al cliente finale. Ciò che non è possibile controllare sono tutti quei prodotti che vengono venduti a clienti Wholesale (all’ingrosso) e a piattaforme on-line di terzi. In questi casi per l’azienda si parla di relazioni B2B (Business to Business) e la filiera dell’informazione si interrompe prima, non riuscendo ad arrivare al cliente finale. Mentre per i clienti Wholesale esistono degli accordi commerciali legati al territorio, per i siti e-commerce esterni non esiste una divisione geografica che eviti la cosiddetta ‘cannibalizzazione‘. Infatti, se lo stesso prodotto viene venduto con prezzi più ‘aggressivi’, su un sito e-commerce esterno, è probabile che l’andamento delle vendite sul sito online proprietario ne risentirà. Riuscire a conoscere e addirittura prevedere la variazione dei prezzi sulle piattaforme esterne permette di modificare e migliorare le proprie strategie di vendita. Un ulteriore aspetto interessante è quello di sapere, invece, come si collocano sul mercato i propri prodotti rispetto ai competitor e quindi scoprire le aree deboli da sfruttare per aumentare il proprio volume di vendita e ‘rubare’ fette di mercato ai concorrenti.

Disegno architetturale

Vuoi saperne di più? Contatta il nostro Team!