Il datamining è una delle attività fondamentali per la comprensione, la navigazione e lo sfruttamento dei dati nella nuova era digitale. E' una fase successiva a quella della reportistica, e si caratterizza per un processo automatico di scoperta ed individuazione di strutture all’interno dei dati, dove per struttura si intendono patterns, modelli e relazioni. Questo processo, noto anche col nome KDD (Knowledge Discovery in Databases), consente di estrarre conoscenza, in termini di informazioni significative e immediatamente utilizzabili, da grandi quantità di dati, tramite l’applicazione di particolari tecniche ed algoritmi.

In campo economico-finanziario, le principali applicazioni sono:
- segmentazione della clientela (databasemarketing) applicazione di tecniche di clustering per individuare i raggruppamenti impliciti nei dati, omogenei in termini di comportamento d’acquisto e di caratteristiche socio-demografiche;
- customer retention ossia applicazione di tecniche previsive per individuare i clienti a rischio di abbandono;
- segmentazione della clientela (databasemarketing) applicazione di tecniche di clustering per individuare i raggruppamenti impliciti nei dati, omogenei in termini di comportamento d’acquisto e di caratteristiche socio-demografiche;
- customer retention ossia applicazione di tecniche previsive per individuare i clienti a rischio di abbandono;
- fraud detection, o meglio, individuazione di comportamenti fraudolenti;
-analisi delle associazioni (market basket analysis) che si caratterizza per la individuazione dei prodotti acquistati congiuntamente. Nello specifico questo è uno strumento di data mining basato sulle regole associative, che permette di studiare le abitudini di acquisto dei consumatori per evidenziare eventuali affinità esistenti tra prodotti o gruppi di prodotti venduti. Lo scopo è quello di inferire delle implicazioni, del tipo "if condition then result", che esprimano la probabilità di acquisto di prodotti differenti al fine di stabilire quanto l’acquisto di un prodotto influenzi l’acquisto di un altro.
L’analisi delle regole associative da informazioni del tipo: il 75% dei clienti che acquistano fragole acquistano anche panna, così da poter affermare che fragole e panna sono correlati, o altrimenti, che esiste un'implicazione tra le due. Tale analisi costistuisce un forte strumento di marketing sfruttabile per incrementare i profitti con mirate strategie promozionali: non mettendo in promozione contemporaneamente item fortemente correlati. La promozione su uno dei prodotti e quindi l’aumento delle vendite del prodotto in promozione implicherà l’aumento delle vendite anche sugli item associati; il miglioramento della struttura logica del sito, creando iperlink o banner che colleghino i prodotti associati, nel caso dell’e-commerce; o trovando la posizione ottimale dei prodotti sugli scaffali, nel caso di un supermercato tradizionale. Cosicchè prodotti correlati potranno essere posizionati vicini o, al contrario, in diverse corsie, in modo tale da invogliare e stimolare il cliente ad acquistare diversi prodotti;
-analisi delle associazioni (market basket analysis) che si caratterizza per la individuazione dei prodotti acquistati congiuntamente. Nello specifico questo è uno strumento di data mining basato sulle regole associative, che permette di studiare le abitudini di acquisto dei consumatori per evidenziare eventuali affinità esistenti tra prodotti o gruppi di prodotti venduti. Lo scopo è quello di inferire delle implicazioni, del tipo "if condition then result", che esprimano la probabilità di acquisto di prodotti differenti al fine di stabilire quanto l’acquisto di un prodotto influenzi l’acquisto di un altro.
L’analisi delle regole associative da informazioni del tipo: il 75% dei clienti che acquistano fragole acquistano anche panna, così da poter affermare che fragole e panna sono correlati, o altrimenti, che esiste un'implicazione tra le due. Tale analisi costistuisce un forte strumento di marketing sfruttabile per incrementare i profitti con mirate strategie promozionali: non mettendo in promozione contemporaneamente item fortemente correlati. La promozione su uno dei prodotti e quindi l’aumento delle vendite del prodotto in promozione implicherà l’aumento delle vendite anche sugli item associati; il miglioramento della struttura logica del sito, creando iperlink o banner che colleghino i prodotti associati, nel caso dell’e-commerce; o trovando la posizione ottimale dei prodotti sugli scaffali, nel caso di un supermercato tradizionale. Cosicchè prodotti correlati potranno essere posizionati vicini o, al contrario, in diverse corsie, in modo tale da invogliare e stimolare il cliente ad acquistare diversi prodotti;
- profilazione, ossia una tecnica di valutazione qualitativa in grado di “stimare” precisamente le caratteristiche del singolo utente in modo da poter cogliere per ognuno abilità varie, tipi di comportamento, aspetti della personalità. Questi sono dati che se sottoposti a specifici esami sono in grado di generare “correlazioni” significative da un punto di vista commerciale (cd. pattern). Qust’ultimo aspetto della profilazione prende il nome di data mining : una sorta di “ricostruzione ordinata” e classificata di una montagna di dati reperiti precedentemente;
- sequential patterns che consiste nella individuazione di comportamenti ricorrenti in sequenze temporali di eventi. Nello specifico ha lo scopo di estrarre correlazioni interessanti, ad esempio se acquisto un libro di datamining, mi saranno consigliati altri libri oltre a quello che ho già scelto, e riguardanti lo stesso argomento;
- competitive intelligence che si caratterizza per applicazione di tecniche di clustering a documenti estratti da banche dati internazionali di tipo tecnicoscientifico volte ad individuare le tecnologie emergenti, le loro relazioni, l’evoluzione temporale e le aziende coinvolte;
- analisi testuale (text mining) che si concretizza nella individuazione degli argomenti trattati da un set di documenti e della ricerca ed individuazione delle eventuali relazioni tra argomenti.
Il data mining ha una duplice valenza: da un lato funge da strumento utile per l'estrazione, con tecniche analitiche all'avanguardia, di informazione implicita, nascosta, da dati già strutturati, per renderla disponibile e direttamente utilizzabile; dall'altro è uno strumento utile per l'esplorazione ed analisi, eseguita in modo automatico o semiautomatico, su grandi quantità di dati allo scopo di scoprire pattern (schemi) significativi.
L’applicazione di tecniche di data mining, sfruttando appieno la ricchezza informativa insita nel patrimonio di dati disponibili, consente di acquisire un effettivo vantaggio competitivo.
La conoscenza delle diverse tipologie di comportamento presenti all’interno della propria clientela, delle regole che governano l’acquisto di un prodotto, delle strategie della concorrenza, così come l’individuazione tempestiva di nuove nicchie di mercato, di nuovi potenziali concorrenti, di innovazioni tecnologiche che avranno un impatto nel proprio campo di attività, sono elementi importantissimi per la sopravvivenza in mercati altamente competitivi e in rapida evoluzione.
La conoscenza delle diverse tipologie di comportamento presenti all’interno della propria clientela, delle regole che governano l’acquisto di un prodotto, delle strategie della concorrenza, così come l’individuazione tempestiva di nuove nicchie di mercato, di nuovi potenziali concorrenti, di innovazioni tecnologiche che avranno un impatto nel proprio campo di attività, sono elementi importantissimi per la sopravvivenza in mercati altamente competitivi e in rapida evoluzione.
Durante la lezione di laboratorio ci siamo esercitati con il software DataTime, creando layout differenti (verticale, orizzontale, cross) tabelle pivot table etc...
Nessun commento:
Posta un commento