1.1 – Access Log cosa sono e perchè sono importanti
Trascrizione
Oggi parliamo di Screaming Frog, ma non il tool di scansione e simulazione del crawler da parte di motore di ricerca del sito, ma il tool che ci permette di analizzare gli access log del server. Chi sono? Mi presento per chi non mi conosce, mi chiamo Claudio Fiorentino, da circa un anno sono il co-founder di Archetico, una digital agency che si presenta al mercato con l’esperienza mia e del mio socio, visto che da più di dieci anni e oramai lavoriamo nel mercato italiano per quanto riguarda le strategie di search marketing verso importanti brand e diciamo una passione che da anni portavo anche quella di condivisione delle informazioni e quindi attraverso gli eventi come questo, sia online e offline, riporto la mia esperienza che quotidianamente porto avanti da anni grazie insomma alle attività effettuate sui clienti o su progetti personali. Partiamo dagli access log proprio dal capire cosa sono gli access log. Un log file contiene informazioni delle richieste effettuate sia da un utente e sia da una macchina, macchina inteso bot dei motori di ricerca. In un file log vengono registrate tutte le richieste in ordine cronologico quindi un po’ come vedete in quelle immagini c’è una data 31 marzo 2021 e poi c’è un orario in questo caso specifico di un determinato secondo perché in quel secondo un utente o un bot ha richiesto una una risorsa, una pagina anzi del sito dove vengono richiamate più risorse in questo caso i css lo potete intravedere all’interno delle varie righe. Perché intravedere? Perchè come capite bene è difficile andare a analizzare puntualmente un file di questo tipo, adesso io ho estratto una piccola parte ma nel momento in cui abbiamo un sito con centinaia di visite al giorno questi log crescono in maniera esponenziale all’aumentare degli accessi al sito quindi ci possiamo trovare anche di fronte a dei file di giga e risulta impossibile fare una lettura puntuale a prenderlo in questo ci viene in supporto strumenti come quello che vedremo oggi. Qual è appunto l’importanza? Abbiamo visto prima negli access log vengono registrate tutte le richieste effettuate verso il server relative a risorse del sito. Possiamo vedere tutte le richieste andate a buon fine quindi con lo status code 200 ma soprattutto quelle che non sono andate a buon fine e quelle che non sono andate a buon fine. Capire il motivo per cui non sono andate a buon fine se ad esempio è un 404 se è corretto un 404 deve essere gestito, se i crawler continuano a richiedere delle risorse che sono in 301 lì potremmo capire se internamente al sito ci sono ancora link che puntano a una risorsa che andiamo a direzionare nel tempo e in questo ci viene in aiuto scrivendo frog su questa analisi on-site spettacolare come puntualità di informazione che ci permettono insomma di andare a correggere puntualmente eventuali problemi on-site. Quindi in sintesi i log sono un asset importante per noi perché capiamo quali e quante risorse vengono richieste. Nel tool e lo anticipo un attimino c’è una parte legata all’alberatura, il tool riesce a presentarci informazioni dell’alberatura del sito e ci fa capire ad esempio qual è un’area che riceve più accessi e richieste rispetto a un’altra e eventualmente un’area che ha poche richieste può essere legata a motivi di posizionamento diciamo in primi si sta parlando di zero ma potrebbe essere che internamente ha una struttura interna linking non corretta quindi è bene una strategia di ottimizzazione on-site prevedere fare un incremento dei link verso quell’area ad esempio se per noi è importante sempre ragioniamo su qualcosa di importante ad esempio andare a aggiungere un link sitewide quindi una voce di menù presente nel footer o nel leader a seconda dell’importanza. No access log no party, perché questo titolo? Perché per poter fare un’analisi io devo recuperare i file e come vedete da quelle tre immagini posso trovarli in posizioni diverse a seconda del tipo di server a cui accedo. Sicuramente accedere via ftp attraverso un software ftp di file transfer protocol è la modalità più semplice perché vedrete visivamente le varie cartelle ma allo stesso modo visivamente potete accedervi tramite un cpanel però qui un cpanel dipende poi dall’hosting su cui avete il sito dove è ospitato il vostro sito web diciamo che via ftp l’accesso viene da tutti cpanel è un modalità online di accesso e gestione dei propri siti e domini un altro potrebbe essere flask quindi dipende da ripeto dall’hosting cosa vi offre. Da evitare come la peste l’utilizzo di plugin ad esempio esiste wp file manager è un plugin che visimula una navigazione stile ftp stile cpanel così come vedete nelle immagini però i plugin sono soggetti a vulnerabilità quindi meno uso se ne fa sul proprio sito web e meglio è quindi perché devo installare un plugin quando esiste un software o una funzionalità online via browser che mi permette di farlo senza rischi senza problemi senza creare una possibile porta per l’intrusione malevola da parte di un malintenzionato, brutale ma questa è la logica. Struttiamo i software rispetto al plugin anche perché poi oggi sempre più si parla di velocità e segnali web vitali se io carico un sito web di plugin ogni singolo plugin in qualche modo andrà a rallentare il sito ma non è per forza un rallentamento visivo ma nella sua installazione tenderà a inserire nell’html dei richiami a 10 file delle sue funzionalità e queste appunto sono risorse che sia l’utente che i motori di ricerca devono scaricare per fare poi quello che è rendering della pagina quindi ripeto nemmeno ne mettiamo di plugin è meglio è. Sottotitoli a cura di QTSS
Trascrizione
Oggi parliamo di Screaming Frog, ma non il tool di scansione e simulazione del crawler da parte di motore di ricerca del sito, ma il tool che ci permette di analizzare gli access log del server. Chi sono? Mi presento per chi non mi conosce, mi chiamo Claudio Fiorentino, da circa un anno sono il co-founder di Archetico, una digital agency che si presenta al mercato con l’esperienza mia e del mio socio, visto che da più di dieci anni oramai lavoriamo nel mercato italiano per quanto riguarda le strategie di search marketing verso importanti brand e diciamo una passione che da anni portavo anche è quella di condivisione delle informazioni e quindi attraverso gli eventi come questo, sia online come offline, riporto la mia esperienza che quotidianamente porto avanti da anni grazie insomma alle attività effettuate sui clienti o su progetti personali. Partiamo dagli access log, proprio dal capire cosa sono gli access log, un log file contiene informazioni delle richieste effettuate sia da un utente e sia da una macchina, macchina inteso bot dei motori di ricerca. In un file log vengono registrate tutte le richieste in ordine cronologico quindi un po’ come vedete in quelle immagini c’è una data 31 marzo 2021 e poi c’è un orario in questo caso specifico di un determinato secondo perché in quel secondo un utente o un bot ha richiesto una risorsa, una pagina anzi che è del sito dove vengono richiamate più risorse in questo caso i CSS lo potete intravedere all’interno delle varie righe. Perché intravedere? Come capite bene è difficile andare a analizzare puntualmente un file di questo tipo, adesso io non ho estratto una piccola parte ma nel momento in cui abbiamo un sito con centinaia di visite al giorno questi log crescono in maniera esponenziale all’aumentare degli accessi al sito quindi ci possiamo trovare anche di fronte a dei file di giga e risulta impossibile fare una lettura puntuale a prenderlo in questo ci viene in supporto strumenti come quello che vedremo oggi. Qual è appunto l’importanza? Abbiamo visto prima negli access log vengono registrate tutte le richieste effettuate verso il server relative a risorse del sito. Possiamo vedere tutte le richieste andate a buon fine quindi con lo status code 200 ma soprattutto quelle che non sono andate a buon fine e quelle che non sono andate a buon fine, capire il motivo per cui non sono andate a buon fine se ad esempio è un 404 se è corretto un 404 deve essere gestito, se i crawler continuano a richiedere delle risorse che sono in 301 lì potremmo capire se internamente al sito ci sono ancora link che puntano a una risorsa che andiamo direzionato nel tempo e in questo ci viene in aiuto a scrivere un frog su questa analisi on-site spettacolare come puntualità di informazione che ci permettono di andare a correggere puntualmente eventuali problemi on-site. Quindi in sintesi i log sono un asset importante per noi perché capiamo quali e quante risorse vengono richieste. Nel tool e lo anticipo un attimino c’è una parte legata all’alberatura, il tool riesce a presentarci informazioni dell’alberatura del sito e ci fa capire ad esempio qual è un’area che riceve più accessi e richieste rispetto a un’altra e eventualmente un’area che ha poche richieste può essere legata a motivi di posizionamento, diciamo in primis sto che stiamo parlando di zero, ma potrebbe essere che internamente ha una struttura interna linking non corretta quindi è bene una strategia di ottimizzazione on-site prevedere fare un incremento dei link verso quell’area, ad esempio se per noi è importante sempre ragioniamo su qualcosa di importante, ad esempio andare a aggiungere un link site-wide quindi in una voce di menù presente nel footer o nel leader a seconda dell’importanza. No access log no party, perché questo titolo? Perché per poter fare un’analisi io devo recuperare i file e come vedete da quelle tre immagini posso trovarli in posizioni diverse a seconda del tipo di server a cui accedo. Sicuramente accedere via FTP attraverso un software FTP di file transfer protocol è la modalità più semplice perché vedrete visivamente le varie cartelle ma allo stesso modo visivamente potete accedervi tramite un cPanel, però qui un cPanel dipende poi dal hosting su cui avete il sito, dove è ospitato il vostro sito web. Diciamo che via FTP l’accesso viene da tutti, cPanel è una modalità online di accesso e gestione dei propri siti e domini, un altro potrebbe essere Plesk, quindi dipende ripeto dall’hosting cosa vi offre. Da evitare come la peste l’utilizzo di plug-in, ad esempio esiste WP File Manager che è un plug-in che visimula una navigazione stile FTP, stile cPanel, così come vedete nelle immagini, però i plug-in sono soggetti a vulnerabilità, quindi meno uso se ne fa sul proprio sito web e meglio è, quindi perché devo installare un plug-in quando esiste un software o una funzionalità online via browser che mi permette di farlo senza rischi, senza problemi, senza creare una possibile porta per un’intrusione malevola da parte di un malintenzionato, brutale, ma questa è la logica, quindi sfruttiamo i software rispetto al plug-in, anche perché poi oggi sempre più si parla di velocità e segnali web vitali, se io carico un sito web di plug-in, ogni singolo plug-in in qualche modo andrà a rallentare il sito, ma non è per forza un rallentamento visivo, ma nella sua installazione tenderà a inserire nell’html dei richiami a viso dei file delle sue funzionalità e queste appunto sono risorse che sia l’utente che il motore di ricerca devono scaricare per fare poi quello che è rendering della pagina, quindi ripeto, meno ne mettiamo di plug-in e meglio è. Sottotitoli creati dalla comunità Amara.org