Cos’è il crawl budget e come gestirlo?
Se il tuo sito è composto da più di 1000 pagine, devi farti la domanda sul crawl budget. L’idea del crawl budget è semplice: Google mira a limitare la dimensione del suo indice con contenuti (quindi pagine HTML) che non hanno un interesse specifico. Per fare questo limiterà il crawl, cioè la copia dei tuoi contenuti nei suoi data center, spostandone alcuni in un indice “secondario”, o peggio, rifiutando di indicizzarli.
Il problema posto da questo limite è che, a volte, Google si rifiuterà di indicizzare, in nome di questa limitazione del crawl budget, contenuti che hanno una grande importanza SEO, mentre il suo indice è altrimenti ingombrato da pagine a basso valore aggiunto.
Quindi devi avere una strategia per scegliere tu stesso quali pagine tenere nell’indice e quali escludere.
Ad esempio, se Google indicizza attentamente i tuoi Termini e condizioni e 12 versioni dello stesso prodotto (ad esempio, la versione blu, rossa, verde, ecc.), è possibile che anche alcune pagine di categorie importanti per te possano riscontrare problemi di indicizzazione Peccato, vero?
Come fa Google a scegliere i contenuti da indicizzare e quelli che “registra”?
Le regole seguite dal motore su questo argomento non sono sempre chiare, ma possiamo identificare 3 principali categorie di pagine che possono ingombrare l’indice e che dovrebbero essere de-indicizzate:
pagine contenenti contenuti duplicati di tipo “canonico”.(di solito una variazione dello stesso prodotto o servizio). Per riprendere l’esempio precedente, se hai diverse versioni dello stesso prodotto su un sito di e-commerce, devi indicare a Google un URL “canonico”, cioè l’URL in cui si trova la versione “principale” o “predefinita” di questo prodotto. Per fare ciò, in ogni pagina corrispondente a una variante del prodotto, aggiungerai un link cosiddetto “canonico” a questa pagina “principale”.
pagine contenenti contenuti duplicati del tipo “variante secondaria”.. Questo è il caso, ad esempio, se offri un prodotto o un servizio legato a una specifica geolocalizzazione (lezioni di piano a Lione, lezioni di piano a Parigi, lezioni di piano a Marsiglia, ecc.). Molto spesso una singola parola varierà da una pagina all’altra, se non viene offerto alcun contenuto testuale importante. Se solo 1 parola varia nel tuo etichetta del titolo e il tuo H1 e il resto della pagina è costituito da immagini, ti ritroverai in una situazione di contenuto duplicato agli occhi di Google. In questo tipo di casi, la soluzione consiste nel creare contenuti unici per ogni versione, e per questo è necessario mettere alla prova la creatività e, probabilmente, chiamare scrittori molto diversi tra loro, che avranno ognuno il proprio modo di esprimersi. e potranno così creare vere e proprie variazioni semantiche.
pagine “vuote”. Nella maggior parte dei casi, i proprietari dei siti non immaginano che ci possa essere un gran numero di pagine vuote o quasi vuote su un sito. Tuttavia, più casi possono portare a questo tipo di risultato. Facciamo un esempio: se usi wordpress, può darsi che ogni immagine che andrai a caricare nel tuo CSM genera la creazione di una pagina (un URL pulito) con solo l’immagine, il resto è vuoto, con solo il menu e gli elementi di navigazione. Ciò crea un collo di bottiglia non necessario nel tuo budget di scansione e non aiuta nemmeno il posizionamento delle immagini di Google in modo specifico.
Vuoi saperne di più sul nostro
servizi di referenziazione naturale?
Scopri la nostra agenzia SEO!