Lezione 1 di 4
In Corso

Come leggere e raccontare i dati, creando report per i tuoi clienti – Lezione 1

24 Giugno 2025

Trascrizione

L’argomento della giornata è Data Storytelling. Il Data Storytelling è una scienza abbastanza recente. Se ne è iniziata a parlare forse una decina di anni fa, anche se il concetto di semiologia del grafico è un concetto un po’ più vecchio, un po’ più antico, risale forse una trentina di anni fa. Il concetto di Data Storytelling è legato ad una assumption di base, ad un concetto fondamentale. Il concetto è che i dati di per sé sono in grado di raccontare delle storie. I dati raccontano delle storie, nascondono in qualche modo le storie all’interno del loro database e quindi il compito di chi analizza i dati, e dopo averli analizzati costruisce delle visualizzazioni, costruisce delle riportistiche che interpretano questi dati, ha proprio il compito di raccontare le storie nascoste dentro i dati nel modo migliore. Tanto è vero questo concetto chiave che, appunto, quando parliamo di dati parliamo di storia. Vorrei iniziare da una storia conosciutissima, che tutti conosciamo bene, e che è Cappuccetto Rosso. Adesso pensate allo storytelling di Cappuccetto Rosso, pensate a come si struttura il racconto di Cappuccetto Rosso. Sapete che su questa favola e su altre favole simili sono stati effettuati degli studi importanti, a cominciare dallo studio di Vladimir Propp a proposito della seminologia della favola. Lo strutturalismo russo è nato dietro a Cappuccetto Rosso, è uno dei motivi chiave che ha accompagnato questo tipo di analisi sulla storia di Cappuccetto Rosso, è stato il fatto che ogni volta che ripensiamo alla favola noi pensiamo ad alcuni elementi chiave che la contraddistinguono. Questi elementi sono quelli senza i quali la favola non avrebbe senso. Quindi ogni volta che noi ad esempio raccontiamo al nostro figlio, nipotino, fratellino minore, la favola di Cappuccetto Rosso, noi necessariamente inseriamo degli elementi narrativi. Possiamo anche, se abbiamo fretta, se abbiamo tempo, allungarla, accorciarla, inserire anche degli elementi nuovi che non sono previsti alla favola originaria. Possiamo immaginare che Cappuccetto Rosso, che ne so, passeggia lungamente nel bosco, si ferma, raccoglie le margherite, poi si riposa sotto un faggio, poi fa altre cose, poi parla con i goriglietti, eccetera. Tutte queste cose qui sono degli elementi accessori che in qualche maniera allungano, specificano, in qualche modo anche caratterizzano meglio la favola, ma non sono essenziali. Gli elementi essenziali della favola invece sono quelli che costruiscono la chiave di lettura stessa del racconto. Quali sono? Innanzitutto, ovviamente, la nonna malata, la reason why possiamo dire per cui Cappuccetto Rosso attraversa il bosco, il bosco da attraversare, quindi la prova da superare Cappuccetto Rosso attraversa da solo il bosco, il cestino, il lupo, ovviamente, e poi il cacciatore alla fine. Insomma, nel momento in cui noi dimenticassimo di parlare di uno di questi elementi, evidentemente la favola perderebbe senso. Non avrebbe alcun senso perché se non ci fosse il lupo la favola si chiuderebbe semplicemente con Cappuccetto Rosso che arriva alla fine del suo percorso e consegna il cestino alla nonna. Se non ci fosse la nonna mancherebbe il motivo per cui Cappuccetto Rosso attraversa il bosco. Insomma, si tratta di elementi essenziali, di elementi che vanno a costruire il plot. L’essenziale è la storia, la struttura narrativa di base. Ora, quando parliamo di dati, quando noi leggiamo dei dati, cerchiamo di interpretarli, cerchiamo poi di comunicare le nostre scoperte a qualcuno, a un committente qualsiasi, che sia un cliente, che sia un manager, un capo ufficio, eccetera, noi necessariamente dobbiamo inserire all’interno del nostro percorso narrativo degli elementi chiave che sono irrinunciabili e senza i quali il nostro racconto non avrebbe senso. Quindi quando noi parliamo di storytelling dei dati parliamo proprio di un lavoro narrativo di trasformazione della nostra analisi in informazioni. Informazioni che evidentemente devono essere rivolte ad un audience e che questo audience deve essere in grado di poi leggere, esattamente così come noi abbiamo scritto. Ora, il problema qual è? Il problema è che quando noi scriviamo, o raccontiamo meglio, una favola come Cappuccetto Rosso, utilizziamo un linguaggio che è facilmente intelligibile, su cui siamo sicuri di ciò che stiamo, ragionevolmente sicuri, di ciò che stiamo comunicando. Nel momento in cui noi parliamo di lupo il nostro interlocutore, la nostra audience, capisce perfettamente che cos’è un lupo e capisce che un lupo rappresenta in quel contesto una miaccia, un pericolo. Quando noi parliamo di dati purtroppo questo non accade e allora, appunto, a maggior ragione dobbiamo essere estremamente attenti e accorti nel momento in cui costruiamo le nostre reportistica, non solo dell’ordine in cui vengono trasmesse le informazioni, ma anche nelle informazioni puntuali stesse, le tabelle, i grafici, eccetera, i testi di commento, dobbiamo essere sicuri che tutto ciò che noi scriviamo venga letto dal nostro interlocutore, dalla nostra audience, esattamente nel modo in cui noi l’abbiamo inteso, cioè l’informazione che noi stiamo trasmettendo dovrebbe arrivare più o meno, appunto, nello stesso modo in cui è partita e quindi essere interpretata a partire da una stessa struttura di base. Allora, quando noi scriviamo un report, per l’appunto, scriviamo una narrazione attraverso i dati e quindi non possiamo fare almeno di immaginare una struttura chiave che possa, in qualche maniera, orientare il nostro racconto. Ovviamente questo racconto, come tutti i racconti da Aristotele in poi, deve avere un inizio, uno sviluppo e ovviamente una conclusione. Quindi, cosa si fa? Si parte innanzitutto, ovviamente, dalle premesse. Si fornisce al lettore il contesto in cui, al lettore, all’audience, se si tratta di un report raccontato oralmente, appunto, si parte dalle premesse e si fornisce al lettore un contesto. Un contesto che è, naturalmente, un contesto di tipo quantitativo, quindi le metodologie di analisi, di cosa stiamo parlando, quali dati verranno analizzati, per quale scopo e, possibilmente, anche con quale conclusione. Poi si procede nello sviluppo e l’analisi e si sviluppano i punti fondamentali delle nostre tesi. Alla fine si giungono le conclusioni, dove queste conclusioni dovranno essere necessariamente di carattere operativo, di carattere prescrittivo. Uno dei grandi problemi, dei grandi difetti che io ho riscontrato in tantissime reportistiche che mi è capitato per le mani di vedere, oppure che sono state riportate a me in quanto cliente quando lavoravo in altri contesti, era esattamente questo. Allora, io arrivavo a leggere un report dall’inizio alla fine e poi, buh, una volta giunti alla conclusione del report, non sapevo cosa farmene. Quindi lo chiudevo in un cassetto, lo mettevo via e restava lì. Questo è il più grande pericolo di tutti i report quantitativi, di tutte le analisi sui dati che noi facciamo. Il più grande pericolo è che il nostro interlocutore, la nostra audience, una volta arrivati in fondo alla narrazione, perché comunque di narrazione si tratta, arrivi a dire, ok, e adesso che ci faccio con questa roba? A che mi serve? Sì, vabbè, ho saputo delle cose e finisce lì. Che devo fare per evitare questo? Ogni analitica deve essere una analitica in qualche modo prescrittiva, cioè deve a un certo punto sollecitare un intervento, dire attenzione, se tu a questo punto non agisci in questo modo, succederanno queste cose, oppure abbiamo discontrato questi difetti, per poter migliorare la situazione abbiamo bisogno di un intervento diretto che deve essere effettuato in questo, questo e quest’altro modo. Insomma, ogni reportistica, così come ogni elemento narrativo, dovrà avere alla fine una call to action, uno stimolo all’azione, qualcosa che stimoli il nostro interlocutore e lo, in qualche maniera, lo faccia svegliare da un torpore della situazione precedente. Allora, per iniziare la narrazione con i dati io normalmente consiglio di agire in questo modo. Ebbene, nelle parti iniziali si dovrebbe partire appunto dalle premesse che normalmente sono delle premesse di carattere metodologico, lo dicevo appunto, quali dati ho guardato, in quale periodo di tempo, se si tratta di dati che riguardano una parte di un tutto, ad esempio il mese di luglio del 2018, confrontato con quello dell’anno precedente, per cui dati parziali, non la totalità del database, per quali obiettivi sto guardando i dati. Io inserirei anche all’interno della parte iniziale della mia narrazione che cosa ho trovato e in che modo, appunto, si deve risolvere il problema che è stato riscontrato. Questa è una parte essenziale. Quando io parlo di reportisti, normalmente faccio l’esempio che forse qualcuno si ricorderà, anche se poi di anni sono passati, di un vecchio telefilm che si chiamava Tenente Colombo, in italiano, e che era un telefilm giallo che aveva una struttura narrativa rovesciata. Si sapeva subito chi fosse l’assassino e il detective doveva poi ricercare, appunto, arrivare all’assassino che lo spettatore sapeva già, appunto, quale fosse. Questo per dire che normalmente conviene all’interno delle nostre reportistiche, per focalizzare meglio l’attenzione della nostra audience, riportare già nelle primissime pagine, possibilmente addirittura nella prima pagina, i takeaways, ossia ciò che è importante che il nostro interlocutore sappia. E quali sono i problemi e quali le soluzioni ai risultati. Per cui, insomma, questi elementi devono essere collocati all’inizio, assieme a cosa? Assieme a, evidentemente, il contesto. Come dicevo, il contesto corrisponde a quando e a come, quali dati sto analizzando, di quale periodo e come li ho analizzati. Il problema, ossia l’elemento di imbalance, è cosa vorrei che succedesse. Quindi, tutte queste parti possibilmente già dall’inizio. All’inizio, naturalmente, metteremo anche qualche grafico che poi svilupperemo all’interno della nostra reportistica. Ora, quando noi iniziamo a sviluppare la nostra struttura narrativa, quindi iniziamo a capire in che modo andremo a costruire la nostra reportistica, una delle cose che normalmente tutti fanno, tutte le volte che ho fatto questo corso in presenza, in aula, mi sono trovato davanti a persone che erano magari capi uffici o comunque lavoravano in uffici statistica e che tutte le volte mi dicevano che effettivamente è difficile, una volta che io ho fatto 30 elaborazioni, 30 analisi, non mostrarle tutte e 30. Perché? Perché il lavoro è stato fatto, perché comunque si ritiene importante, perché sembra di dare troppo poco nel momento in cui si fa una selezione. In realtà, una tentazione a cui bisogna resistere sempre è proprio quella di voler mostrare e dimostrare tutti i passaggi che portano verso le conclusioni. Bisogna saper selezionare i dati e saper selezionare all’interno dei dati le visualizzazioni che sono più importanti e che costituiscono il cuore del report. Se una visualizzazione non è significativa, se non ci insegna qualcosa, se non ci racconta qualcosa, quindi se non evidenzia un problema o una soluzione o comunque un elemento di imbalance, un elemento differenziale rispetto a ciò che succede di solito, è inutile dimostrarla. Perché altrimenti rischiamo di deviare l’attenzione del nostro interlocutore da quello che è il focus del nostro racconto, ossia fargli prendere delle decisioni, fargli intraprendere un percorso. Se è vero che tutto ciò che noi scriviamo nel momento in cui facciamo una reportistica è finalizzato a degli obiettivi, è finalizzato a far prendere una decisione, è finalizzato ad una call to action, allora tutto ciò che devia da questo percorso dovrebbe essere eliminato, tolto, comunque insomma relegato in una posizione del tutto secondaria, ad esempio negli attachment in cui possiamo eventualmente anche completare il nostro quadro statistico. Ma è importantissimo che quando si fa un report tutto ciò che è all’interno del report sia finalizzato ad un percorso narrativo che deve portare verso una conclusione. Nello sviluppo del racconto, quindi nella fase analitica se vogliamo del nostro racconto, noi dobbiamo fare che cosa? Dobbiamo costruire tutto ciò che è la specifica ulteriore di ciò che abbiamo spiegato nelle premesse, quindi appunto dobbiamo sviluppare ulteriormente il problema posto nelle premesse. Stiamo facendo il report per il motivo A, per cui il motivo A lo vediamo bene nel momento in cui vediamo i problemi A1, A2 e A3 che sono connessi con il motivo A e a quel punto arriviamo alla conclusione. Incorporiamo all’interno di questo sviluppo contesti, punti di comparazione esterni, quindi ulteriori elementi, ulteriori spunti, sotto storie possiamo dire, racconti secondari che in qualche maniera si aprono e si chiudono. Possiamo illustrare dei nostri argomenti utilizzando anche degli esempi, per cui ampliando un pochino il contesto narrativo rispetto alla rigida premessa che abbiamo fatto in cui ci si focalizzano soltanto sulle cose veramente importanti e alla fine includere tutti i dati che dimostrano il problema. Possibilmente non altri. In che modo dobbiamo fare questo? Lavorando su una struttura organizzata. Attenzione a non fare le collezioni di numeri o le collezioni di grafici. Noi dobbiamo strutturare tutto il nostro processo narrativo all’interno di un percorso che deve essere un percorso del tutto coerente. Si devono identificare i problemi, si devono nella fase di analisi raccogliere i dati che possano esplicitare il problema, sviscerare il problema, si fanno l’analisi. Quando si sono fatti dieci grafici di analisi si sceglie lì il grafico o i due grafici che spiegano la cosa e si inseriscono all’interno del nostro record in un contesto in cui dobbiamo portare verso una conclusione. E’ importante che il nostro decisore abbia tutti gli strumenti a supporto del suo processo decisionale ma non abbia appunto rumore di fondo, cose che distraggono, che ostacolano rispetto alla decisione che deve essere presa. Nella conclusione del racconto poi infine si tirano le somme, ovviamente, riprendendo le premesse, ampliando le premesse attraverso i dati più significativi, più salienti che sono stati visualizzati nelle parti di sviluppo e alla fine si propongono le soluzioni con delle call to action che siano estremamente mirate rispetto al problema che ci si è posto. Quindi cosa si deve fare nella chiusura del racconto? Si devono sostanzialmente fare tre cose. Primo, spiegare cosa succede se non si seguono le indicazioni fornite nella parte prescrittiva. Noi diciamo, attenzione, noi riteniamo che si debba fare A, B, C, D e questa è la parte predittiva. Poi la prescrizione implica anche che si dice che se non fai A, B, C, D questa cosa qui porterà delle conseguenze. Queste conseguenze prevediamo che siano queste tre, quattro cose. Devono essere naturalmente non chiacchiere, ma anche quelle fondate su un’analisi predittiva, quindi fondate ancora una volta sui dati. Tutta la parte prescrittiva deve essere anch’essa datatrina. Poi si argomentano i benefici che invece verrebbero dal fatto di utilizzare la soluzione che viene proposta. Se fai A, B, C, D invece prevediamo che il tuo fatturato salissa del 20%, per dire. Anche questo con delle simulazioni fondate sui dati. E quindi poi, alla fine, importantissimo la call to action, ossia spiegare ai nostri interlocutori e alla nostra audience che sono proprio loro a trovarsi nella posizione privilegiata di poter prendere delle decisioni che vadano a migliorare complessivamente tutta l’attività che noi stiamo monitorando attraverso l’analisi. Normalmente facciamo analisi di dati, io per esempio faccio analisi di dati relative al marketing, ma non solo, per cui a seconda del contesto cambieranno questi benefici, cambieranno questi vantaggi, ma ogni volta dovremo esplicitare questi vantaggi quali sono. Un report, lo faccio dire al bambino, è una cosa che sembra elementare ma non lo è, è utile, è di successo, funziona soltanto se alla fine costringe il nostro interlocutore a prendere posizione, a dire ok, questa cosa la faccio, questa cosa non la faccio, sapendo però che ci sono delle conseguenze e quindi lo costringe a scegliere. L’interlocutore non può fermarsi dopo quello che abbiamo detto a dire ok, grazie mille, arrivederci, lo metto nel cassetto. L’interlocutore si deve trovare nella condizione di dover in qualche maniera prendere sul serio ciò che noi abbiamo raccontato e su quella base prendere una decisione. Tutto questo appunto perché abbiamo fatto un lavoro di analisi dei dati che è un lavoro vincente in qualche modo che ha fatto vedere dei problemi, ha evidenziato dei punti deboli e come un’analisi svuota ha anche però messo in evidenza delle opportunità e dei punti di forza. I miei report spesso, non a caso, contengono proprio nelle fasi iniziali, nelle pagine iniziali, un’analisi svuota che in qualche maniera sintetizza e racchiude tutto il report all’interno di una semplice pagina che però diventa una guida per l’interlocutore per poter sapere cosa deve fare e cosa succederà. Tutto questo discorso regato alla struttura narrativa funziona a patto che i dati non solo sappiamo metterli in ordine e sappiamo commentarli all’interno di una cornice narrativa e all’interno di una struttura che sia rigida, quel che basta e soprattutto intelligibile e chiaramente fruibile da parte del nostro interlocutore, ma funziona solamente a patto che i dati vengano visualizzati in modo efficace. Perché questo? Perché ogni volta che noi facciamo un grafico in realtà stiamo dando a questo grafico un valore di medium, di mezzo, di mezzo esattamente secondo l’impostazione che si dà a questa parola, il significato che si dà a questa parola nell’ambito della teoria della comunicazione. Cioè il nostro grafico non è nient’altro che il mezzo attraverso cui si trasmette un messaggio e il valore di questo grafico non a caso è dato non solo dal contenuto che il grafico veicola ma anche dal modo in cui l’informazione viene strutturata e organizzata. E qui chi sente i richieggiamenti di McLuhan si sente bene, è perfettamente a ragione, perché mai come in questo caso è vero che il mezzo è il messaggio, ossia il grafico ciò che rappresenta è esattamente l’informazione stessa che stiamo trasmettendo. La nostra capacità appunto di evidenziare i risultati delle nostre analisi, di metterli in evidenza, di trasmetterli al nostro interlocutore in forma di informazione passa esattamente dalla nostra capacità di visualizzare efficacemente i nostri dati. Allora, innanzitutto, quando parliamo di informazioni che possiamo trasmettere attraverso un grafico o una visualizzazione grafica, perché poi i dati sono freddi ma potrei addirittura farvi vedere dei grafici emozionanti, ve lo assicuro, o delle visualizzazioni emozionanti, ma prima non c’è la sostanza per adesso. Per cui qual è il tipo di informazioni possiamo trasmettere? Normalmente le informazioni che trasmettiamo sono comparazioni che avvengono lungo linea del tempo, per cui quant’era questa grandezza l’anno scorso e quanto è quest’anno, relazioni di parti con il tutto o cento clienti, quanti di questi clienti sono soddisfatti, variazioni di metriche in base ad attributi, relazioni geografiche rapporto nord-sud eccetera, correlazione tra variabili, quindi quanto è vero che se cambia questa variabile cambia anche quest’altra, quanto è vero che se si riduce ad esempio il tempo di caricamento di una pagina questa cosa ha dei benefici sulla quantità di persone che non rimbalzano, oppure alla fine i rapporti tra i dati e le loro metrie o le loro metriche di rapporto. Allora iniziamo a vederli uno a uno in maniera più analitica per poi passare appunto a capire che ognuna di queste domande, ognuno di questi temi, di queste informazioni ha necessariamente associati dei grafici specifici, delle visualizzazioni specifiche. Quindi le comparazioni lungo linea del tempo sono forse i grafici tra i più usati, soprattutto in ambito marketing, ma non solo, perché tutte le volte che noi abbiamo una grandezza, una misura, una metrica, non ci poniamo il problema di come era il mese scorso, come era ieri, come era l’anno scorso e soprattutto sta crescendo o sta calando. Restiamo nell’ambito del marketing e pensiamo alla grandezza come la quantità di sessioni giornaliere. Noi sappiamo che sul nostro sito, sul sito del nostro cliente, ieri abbiamo avuto 10.000 sessioni, l’altro ieri 11.000. Ok, ma questo dato di per sé cosa vuol dire? Nulla. Dobbiamo sapere se stiamo crescendo o calando. Le visite al nostro sito stanno aumentando o diminuendo. Per poterlo fare dobbiamo necessariamente tracciare una serie storica, iniziare da un anno prima e andare a vedere mese per mese, settimana per settimana, giorno per giorno, come si modifica questa grandezza, la quantità di visite che riceve un sito web. In questo modo individuiamo dei trend, che è forse uno dei lavori di analisi più importanti. Quando noi analizziamo una grandezza normalmente ci poniamo il problema appunto del trend che questa grandezza sta avendo, perché se sta avendo un trend calante dobbiamo prendere delle decisioni. Quindi per fare questo utilizziamo delle visualizzazioni di comparazione lungo la linea del tempo. Invece utilizziamo la relazione dei parti con il tutto quando vogliamo fare un lavoro di approfondimento verticale. A quel punto il tempo non entra più in gioco ma entra in gioco semplicemente un breakdown di una variabile all’interno delle sue categorie secondarie. Ad esempio, io ho 100 clienti e devo sapere quanti sono soddisfatti e quanti non sono soddisfatti del mio servizio, del mio lavoro. Oppure posso avere in un sito web ancora delle visitatori che entrano da mobile, delle visitatori che entrano da desktop. Quindi sul totale delle visite quanti arrivano da desktop e quanti da mobile, ancora una volta le relazioni di parti con il tutto. Normalmente quando facciamo analisi di relazioni di parti con il tutto utilizziamo dei grafici come i grafici a torta e i grafici a ciambella. Oppure possiamo ampliare un pochino il discorso e parlare di variazioni di metriche in base ad attributi che assomiglia un po’ all’analisi delle parti con il tutto ma fa entrare il fattore tempo. In questo caso cosa ci interessa sapere? Non solo ci interessa sapere la quantità di clienti soddisfatti sul totale, quindi il rapporto tra soddisfatti e insoddisfatti, ma anche come questo rapporto si modifica nel tempo. Per fare questo utilizziamo dei grafici ad esempio a barra impilate dove vediamo in termini assoluti, non più in termini percentuali, come si modificano la quantità totale dei nostri clienti e la quantità di soddisfatti e insoddisfatti per vedere che tipo di trend hanno queste metriche in base agli attributi secondari che le specificano meglio. Un grafico di relazioni geografiche risponde invece a domande relative alla collocazione geografica delle grandezze che stiamo analizzando. Il nostro sito ha avuto 10.000 sessioni ma quante di queste sessioni arrivano dal nord e quante dal sud, quante da regioni altamente industrializzate e quante da regioni più agricole, quante da grande città e quanti da cittadine più piccole? Per fare questo appunto dobbiamo fare analisi di relazioni geografiche che è un’altra grande famiglia di analisi, non spessissimo utilizzata ma non per questo meno importante. Quando invece facciamo delle analisi di frequenza ci chiediamo tutt’altra cosa, ci chiediamo quali sono le frequenze con cui si verifica un dato evento in relazione al pubblico dato, ad esempio quante volte una visita si conclude con una conversione, oppure quante volte una persona visita in un anno una pagina web. Questi dati qui sono dati di frequenza, indicano data una popolazione quante volte si verificano dei fenomeni specifici. In questo modo si sviluppano delle curve che possono essere visualizzate facilmente in un grafico, vedremo come. Con le correlazioni tra variabili invece parliamo tutta un’altra lingua. In questo caso cosa facciamo? Stiamo analizzando delle correlazioni statistiche, stiamo vedendo se a fronte dell’aumento di una variabile aumentano o diminuiscono le variabili che riteniamo essere associate a quella e quindi dipendenti da quella. Noi sappiamo che le variabili normalmente si distinguono in dipendenti e indipendenti, le variabili indipendenti sono quelle che variano appunto in modo indipendente, in modo non non dipendente da altre grandezze, da altre attività. Quando invece parliamo di variabili dipendenti parliamo di variabili che presumiamo assumano dei valori soltanto in corrispondenza del valore di una variabile principale, appunto indipendente. Ad esempio che ne so, la strada percorsa in macchina in unità di tempo è funzione della velocità, quindi la velocità visto che la imponiamo noi è una variabile indipendente e la strada percorsa in un’ora è una variabile dipendente, cioè dipende da quanto noi abbiamo deciso di andare veloce. In questo caso abbiamo un rapporto certo, non sempre i rapporti tra variabili sono così certi, ad esempio ci sono delle correlazioni tra variabili che si intuiscono, si possono capire, ma che devono essere dimostrate in qualche modo. Citavo prima l’esempio della frequenza di rimbalzo in relazione con la velocità di caricamento del sito. Ci sono degli studi che in qualche maniera hanno messo in relazione queste due grandezze e dicono che tanto più un sito è lento, tanto più facilmente gli utenti tenderanno a uscire dopo aver visto una sola pagina senza effettuare nessun’altra azione. Per cui questo elemento qui è un elemento che normalmente la letteratura mette in correlazione, ma per il nostro sito è altrettanto valido. A quel punto per poterlo verificare dovremo fare un’analisi di correlazione e dovremo quindi poter poi visualizzare questa correlazione tra variabili per vedere se effettivamente dai grafici emergono delle correlazioni chiare, in genere lineari, tanto più è basso la velocità di caricamento, tanto più è bassa la frequenza di rimbalzo, tanto più alta la prima, tanto più alta la seconda variabile. Quindi abbiamo una correlazione di tipo diretto, direttamente proporzionale, che deve essere dimostrata e viene dimostrata normalmente attraverso grafici che sono i famosi grafici scatterplot, come quelli che vediamo nell’immagine. Poi ci sono i rapporti tra i dati e la loro media. Questo tipo di analisi e questo tipo di visualizzazione riguarda appunto l’aspetto di quanto i dati con cui abbiamo a che fare siano o non siano vicini alla media che dovrebbe rappresentarli. Per fare un esempio pratico, perché mi rendo conto che non è facile comprendere questa cosa, pensiamo ad esempio allo scontrino medio che noi riscontriamo in un sito e-commerce. Normalmente un KPI abbastanza importante tutte le volte che noi analizziamo un sito e-commerce è proprio lo scontrino medio. Lo scontrino medio sappiamo che si calcola dividendo i ricavi complessivi del sito, la somma dei singoli ricavi di ogni ordine, dividendolo per il numero degli ordini. Se io ho cinque ordini da 200 euro ciascuno, avrò un ricavo complessivo di 1000 euro e uno scontrino medio ovviamente di 200 euro, perché tutti gli ordini hanno la stessa dimensione, lo stesso ricavo. Il problema è che se noi creiamo delle curve di distribuzione per cui associamo un punto ad ogni ordine, non è detto che poi la media dei nostri ordini sia effettivamente un valore molto rappresentativo, perché possiamo avere ad esempio un ordine da 100.000 euro e tantissimi ordini da 100 euro, in quel caso chiaramente se noi facessimo la media del ricavo complessivo avremmo un dato medio che è molto molto molto lontano rispetto alla realtà della grande maggioranza degli ordini. Per cui fare un’analisi di rapporto tra dati e media serve proprio a capire se effettivamente la media che noi calcoliamo sia un valore che rappresenta efficacemente i dati in nostro possesso, oppure se non sia effettivamente un dato proprio affidabile per cui andrà sostituito con altri dati statistici, come ad esempio la mediana che in genere è più affidabile in questo tipo di calcolo.

✨ Assistente AI 💬

Registrati e guarda subito gratis questa lezione!*

* Registrandoti potrai seguire gratis la prima lezione di ogni corso presente sulla piattaforma.

Prima volta su Studio Samo Pro?

Guarda il video e scopri come funziona la piattaforma