Come Indicizzare un Sito su Google: Indicizzazione Rapida

Come indicizzare un sito web su Google: indicizzazione rapida

come indicizzare un sito web su google

L’indicizzazione del sito web è l’attività del motore di ricerca che, tramite i suoi crawler (o spider, o robot) scansiona la rete e aggiunge nel proprio database siti internet e pagine web.

Sei su Internet e non riesci a trovare sui motori di ricerca il tuo sito web?

Il tuo sito potrebbe non essere indicizzato.

Come indicizzare un sito web su Google?

Ecco l’indice della guida, sentiti libero di saltare all’argomento più di tuo interesse:

Cos’è l’indicizzazione: crawling e Googlebot

Indicizzare un sito significa far sì che rientri tra i risultati nei motori di ricerca. Ma come funziona l’indicizzazione dei siti web su Google da un punto di vista tecnico?

Cercherò di spiegartelo con un esempio.

Immagina un’enorme biblioteca nel quale, ogni giorno, persone portino nuovi libri. Il capo della biblioteca vuole che nei suoi scaffali rientrino solo libri di qualità e, per questa ragione, ogni volta che arriva una nuova proposta, la valuta con attenzione, controllando e verificando che abbia i requisiti che desidera.

Sarà questo il criterio secondo il quale il bibliotecario deciderà di inserire il nuovo libro nei suoi scaffali o meno.

Accade esattamente la stessa cosa con i siti web. Google, in questo caso, è il bibliotecario e i siti internet, i nuovi libri che vengono portati quotidianamente nella libreria.

Inoltre non è detto che nel momento in cui la homepage del tuo sito sia stata indicizzata valga lo stesso per tutte le altre pagine. L’indicizzazione riguarda ogni singolo URL. 

Ma che significa “migliorare l’indicizzazione dei siti su Google”? Come si indicizza un sito web? E che differenza c’è tra posizionamento e indicizzazione su Google?

Se il sito è indicizzato vuol dire semplicemente che il motore di ricerca sa che esiste, e ce l’ha all’interno del suo database.

Google utilizza il suo spider, che si chiama Googlebot e, tramite questo, scansiona la rete alla ricerca di contenuti nuovi o aggiornati.

L’indicizzazione di un sito avviene in automatico da parte del motore di ricerca, a meno che non ci siano elementi che la impediscono. Più in basso ti spiego quali sono i problemi da evitare per indicizzare il sito web su Google rapidamente.

Quindi, l’indicizzazione non dipende dalla posizione in SERP, cioè nei risultati di ricerca: anche se il sito web compare in decima pagina per una determinata parola chiave, è comunque indicizzato.

Come indicizzare un sito web su Google e quanto costa?

Risposta breve: non costa assolutamente nulla. L’indicizzazione, infatti, non viene operata dagli esperti SEO, ma viene effettuata dai motori di ricerca, ovviamente in maniera totalmente automatica e gratuita.

Differenza fra indicizzazione e posizionamento

Ed eccoci qui, dunque, a chiarire una cosa molto importante: bisogna distinguere fra indicizzazione del sito web e posizionamento.

Come ti ho spiegato, un sito web indicizzato è un sito presente nel database di Google, e avviene in genere automaticamente, senza bisogno di lavoro.

Quello che richiede lavoro è invece il posizionamento. Fare posizionamento di un sito web su Google vuol dire portarlo in prima pagina sul motore di ricerca, per una determinata ricerca o parola chiave.

Quindi, la differenza è questa:

  • con l’indicizzazione dei siti Google vede il tuo sito, e lo inserisce nel database;
  • con il posizionamento non solo Google lo vede, ma lo mostra anche nelle prime posizioni nei risultati di ricerca (SERP).

In poche parole l’indicizzazione dei siti su Google rappresenta la base, il primo passo senza il quale il posizionamento non sarebbe nemmeno possibile.

Quest’ultimo, invece, riguarda l’abilità di far arrivare il proprio sito web in cima ai risultati di ricerca inerenti alle parole chiave di proprio interesse su Google o altri motori di ricerca.

Facciamo un esempio.

Giovanni ha creato un nuovo sito web, che si chiama “sitodigiovanni.com”.

Questo sito parla di automobili d’epoca, perchè lui è un grande appassionato di autovetture, e in particolare di automobili d’epoca.

Se noi andiamo su Google.it e cerchiamo “automobili d’epoca”, però, non troviamo il suo sito nelle prime pagine. Questo vuol dire che il suo sito non è ben posizionato per la ricerca “automobili d’epoca”.

Tuttavia se noi su Google cerchiamo “sitodigiovanni.com”, il sito appare nelle ricerche: cercando il nome del dominio (sitodigiovanni), comprensivo di estensione (.com),  Google ce lo mostra come risultato.

Questo vuol dire che il sito è comunque indicizzato, ovvero che in sostanza Google sa che esiste e lo tiene all’interno del suo database.

Però, non è ben posizionato: Google infatti non lo ritiene abbastanza rilevante e autorevole da mostrarlo tra i primi risultati di ricerca, quando vengono eseguite determinate ricerche.

Google indicizzazione del sito: elementi necessari per inviare un sito a Google

I motori di ricerca sono affamati di nuovi contenuti, ma devi far in modo da rispettare alcune regole, per permettere loro di inviare e indicizzare un sito web su Google correttamente.

Gli elementi da tener presente per inviare una URL o un sito a Google sono:

  • lo status code 200 delle pagine web;
  • Le direttive del Robots.txt;
  • il metatag noindex;
  • contenuti originali e di qualità.

Analizziamo questi elementi uno per uno.

Le pagine devono rispondere con status code 200 ok

Non preoccuparti, non è nulla di complicato: vuol dire semplicemente che le pagine del sito devono essere correttamente caricate.

Ti spiego: quando il browser (Firefox, Chrome, Edge, Safari, ecc) richiede una pagina web, il server gli dà la pagina richiesta (così che tu possa visualizzarla) e gli dice anche lo Status di quella pagina.

Uno Status 200 vuol dire semplicemente che la pagina web richiesta è stata trovata sul server, e che viene correttamente caricata.

Ovviamente se le pagine del sito danno un errore, e quindi non possono essere visualizzate sul browser, non saranno indicizzate dai motori di ricerca.

Assicurati quindi, banalmente, che le pagine web del tuo sito funzionino e vengano correttamente caricate.

Le direttive del Robots.txt

Il Robots.txt è un file di testo che contiene ordini e direttive per i motori di ricerca. Per leggere il file Robots.txt devi accedere al sito internet in FTP.

Questo file può indicare ai motori di ricerca quali contenuti e risorse leggere con i loro crawler, e quali invece non leggere.

Se il file Robots.txt è vuoto, di default permette la lettura e la scansione di tutte le pagine, a tutti gli spider di tutti i motori di ricerca.

Può però contenere una direttiva che si chiama Disallow,

Se all’interno del file leggi questo comando:

User-agent: *
Disallow: /

Sappi che stai negando l’accesso al tuo sito web a tutti i motori di ricerca.

L’asterisco, infatti, indica che vuoi bloccare a tutti i crawler l’accesso al sito.

Se, invece, trovi ad esempio questo comando:

User-agent: Googlebot
Disallow: /

Vuol dire che il file sta bloccando la scansione del tuo sito internet solo a Googlebot, cioè il crawler che usa Google per leggere e indicizzare il sito.

In entrambi i casi, a meno che tu non abbia specifiche necessità, ti consiglio di non inserire nessuna direttiva di tipo Disallow.

Per modificare il file Robots.txt puoi utilizzare il software Filezilla, che ti permette, dopo aver inserito i dati per accedere al sito web, di aprire la cartella principale del tuo sito, individuando il file Robots.txt e sovrascrivendolo con la nuova dicitura.

Il metatag noindex

Come non indicizzare un sito web su Google? Il metatag noindex va inserito nella pagina web che non si vuole indicizzare.

Mentre il Disallow, visto prima, vieta la scansione della pagina al motore di ricerca, il metatag noindex lascia che il motore di ricerca legga la pagina, ma gli dice che poi, dopo averla letta, non deve comunque mostrarla nei risultati di ricerca.

Anche in questo caso puoi impedire l’indicizzazione a tutti i motori di ricerca, con questa stringa:

<meta name=”robots” content=”noindex”>

Oppure impedirla solo a Google, con questa:

<meta name=”googlebot” content=”noindex”>

Se ti disperi perchè una pagina web non viene indicizzata, controlla che non ci sia un tag come questo. Se lo trovi, rimuovilo e attendi che il contenuto venga indicizzato.

Per verificare questo dato ti basterà analizzare il codice HTML delle pagine del tuo sito web e cercare, premendo sulla tua tastiera la combinazione ctrl+f, la parola chiave “noindex”.

Un software come Screaming Frog ti sarà d’aiuto sia a controllare che le pagine diano Status Code 200, sia che non contengano direttive di tipo noindex.

Qualità e originalità dei contenuti

L’obiettivo di Google è quello di fornire risultati di ricerca il più possibile rilevanti e di qualità.

Per tal motivo non solo tende a posizionare in prima pagina contenuti che giudica con il massimo dei voti, ma si riserva anche il diritto di non indicizzare, o deindicizzare, singole pagine o interi siti web che non meritano di comparire in nessuna SERP.

Con le penalizzazioni manuali (che hanno diversi motivi, di cui il peggiore è “puro spam”) e i filtri algoritmici (i più noti sono PandaPenguinviene limitata la visibilità di contenuti scarsi e, nella peggiore delle ipotesi, tali contenuti vengono completamente rimossi dal database.

Attenzione quindi a:

  • non creare contenuti di scarso valore;
  • non far uso di link di bassa qualità;
  • non utilizzare tecniche black hat.

L’uso massiccio di tali elementi può portare a non indicizzare alcune pagine, o un intero sito internet.

Vediamo questi casi uno per uno.

Contenuti di scarso valore

Facciamo un paio di esempi di contenuti di scarsa qualità.

Capita spesso di creare centinaia e centinaia di tag inutili, che creano a loro volte pagine web senza alcuna utilità.

Bene: i tag vanno utilizzati con raziocinio, in maniera che siano utili per i visitatori.

Oppure, spesso vedo siti web che si vogliono posizionare per parole chiave come “fotografo matrimonio milano”, “fotografo matrimonio roma”, “fotografo matrimonio torino”.

Quello che fanno è creare diverse pagine che presentano lo stesso contenuto, cambiando solo il nome della città in ciascuna di esse.

Queste pagine si chiamano doorway pages. Sono pagine create senza dar alcun valore, solo per posizionarsi sui motori di ricerca.

Google odia queste pagine, e tende a ignorarle, non posizionarle, e non indicizzarle.

Entrambi i casi appena visti sono casi di thin content, cioè di contenuti di scarsa qualità, di cui l’algoritmo Panda è ghiotto.

Link in ingresso di scarsa qualità

Ottenere backlink di scarsa qualità, magari con anchor text eccessivamente ottimizzate, può portare a penalizzazioni manuali per puro spam, e a filtri algoritmici tramite l’algoritmo Penguin.

Il danno va dalla perdita di posizionamento su Google, alla completa deindicizzazione.

Tecniche black hat

Con il termine black hat si intende quell’insieme di tecniche che, con l’inganno, hanno lo scopo di aggirare i controlli di qualità del motore di ricerca.

Un esempio è il cloaking: tramite questa attività viene mostrata ai visitatori una pagina diversa da quella mostrata a Googlebot durante la scansione.

Il cloaking può portare alla deindicizzazione dei contenuti.

Se queste informazioni ti sembrano complicate sappi che, riassumendo, proponendo contenuti di qualità e originali sul tuo blog, non avrai nulla da temere.

Come indicizzare un nuovo sito internet o un articolo rapidamente

Ora ti mostro i passaggi da compiere per ridurre al massimo il tempo di attesa, e avere il tuo sito o la tua pagina web indicizzata nel più breve tempo possibile, anche in poche ore.

Quando costruisci un sito internet o scrivi un nuovo articolo (o modifichiamo i contenuti di un articolo già esistente) in generale basta attendere qualche tempo perchè Google lo indicizzi e ne aggiorni i contenuti, ma in alcuni casi possiamo avere la necessità che questo avvenga velocemente, in meno di un giorno.

La velocità di indicizzazione del sito web dipende da quanto spesso il crawler Googlebot passa sul sito.

Indicizzare in maniera rapida può essere necessario in più casi.

Mettiamo per esempio che tu voglia promuovere un evento importante a breve scadenza, e abbia creato un sito internet dedicandolo a tale evento. Oppure, per promuoverlo, hai scritto un articolo nuovo sul tuo blog.

Essendo l’evento a breve scadenza vuoi che l’articolo o il tuo nuovo post vengano indicizzati quanto prima.

Per farlo puoi usare i seguenti strumenti:

  • Search Console: visualizza come Google;
  • sitemap;
  • RSS;
  • funzione “Aggiungi URL”.

Vediamoli nel dettaglio.

Search Console

Se hai collegato il sito internet alla Search Console, cosa che consiglio certamente di fare, va sulla pagina della Search Console, poi effettua l’accesso.

Per inviare un sito o una URL a Google ora clicca sul sito da indicizzare.

Nella colonnina sinistra trovi la voce “Scansione”. Cliccaci e poi scegli “Visualizza come Google”.

Nello spazio successivo inserisci l’URL della pagina da indicizzare, quindi clicca su “Recupera”.

Se vuoi che Google indicizzi rapidamente l’homepage di un sito, basterà lasciare lo spazio di testo vuoto e cliccare direttamente su “Recupera”.

A questo punto Google scansionerà l’URL richiesta; clicca infine su “Richiesta di indicizzazione”.

Ecco la schermata che permette di effettuare tale operazione:

indicizzazione siti web tramite visualizza come google

Ricordandoti di spuntare la casella “Non sono un robot”, che comparirà in seguito, e selezionare la voce “Esegui la scansione di questo URL e dei relativi link diretti”.

Sitemap

La Sitemap è un documento in formato XML contenente la lista di tutte le pagine del sito web.

La Sitemap è particolarmente utile nel processo di miglioramento dell’indicizzazione dei siti web  e per inviare un sito intero e tutte le URL a Google, perchè qui il motore di ricerca trova tutte le URL da indicizzare.

Possono essere create specifiche Sitemap anche per inviare specifiche URL, immagini, video e altri contenuti.

La crezione della Sitemap viene gestita automaticamente da plugin dei principali CMS.

Se utilizzi WordPress, per esempio, puoi installare il plugin Google XML Sitemaps.

Questo strumento genera automaticamente la Sitemap del tuo sito web e la aggiorna continuamente, qualora vengano create nuove pagine.

In alternativa puoi creare la tua sitemap su siti come https://www.xml-sitemaps.com/ e puoi inserirla manualmente.

Una volta creata la Sitemap torna nella Search Console.

Clicca su “Scansione” (“Crawl” se la Search Console è in inglese), poi su “Sitemap” e poi su “AGGIUNGI/TESTA SITEMAP” (“ADD/TEST SITEMAP“).

A questo punto inserisci l’URL della tua sitemap e clicca “Invia” (“Submit”).

aggiunta sitemap in search console

RSS

Perchè, oltre alla Sitemap,  dovremmo usare anche gli RSS?

Proprio per rispondere a questo dubbio è intervenuto Alkis Evlogimenos di Google, che ha così risposto:

“Per rendere ottimali le operazioni di crawling raccomandiamo di utilizzare sia la Sitemap XML che gli RSS/Atom feeds. Questo perchè la Sitemap dà informazioni su tutte le pagine presenti sul tuo sito, mentre gli RSS forniscono tutti gli aggiornamenti del sito, aiutando Google ad aggiornare e indicizzare il sito internet rapidamente.”

Se quindi aggiorni spesso i contenuti del tuo sito, invece di utilizzare la funzione “Visualizza come Google” che abbiamo visto poco prima, puoi utilizzare gli RSS.

Funzione “aggiungi URL”

Ecco un metodo molto semplice per richiedere a Google la scansione e migliorare l’indicizzazione di un contenuto o di un sito.

Recati a questa pagina: https://www.google.it/intl/it/add_url.html

Inserisci semplicemente l’URL che vuoi far indicizzare nell’apposito spazio, e clicca poi su “Aggiungi URL” per inviare la URL a Google.

Come capire se l’indicizzazione è stata eseguita correttamente

A questo punto il sito web dovrebbe essere correttamente indicizzato da Google.

Ma come puoi controllare e verificare se l’indicizzazione del sito web su Google è stata eseguita davvero?

Segui uno di questi 2 metodi:

  • operatore site;
  • stato indicizzazione in Search Console.

Vediamo come fare.

Operatore site

Dopo aver effettuato le operazioni descritte attendi massimo 48 ore, poi va su Google e digita:

site:ilmiodominio.it/pagina-che-vuoi-indicizzare/

Inutile dirti che al posto di “ilmiodominio.it/pagina-che-vuoi-indicizzare/” dovrai inserire l’URL della pagina che vuoi far indicizzare.

Se questo è  tra i risultati di ricerca allora significa che finalmente il tuo sito web è stato indicizzato da Google.

Controllare è stato molto semplice, vero?

Stato indicizzazione in Search Console

Ricordi quando ti ho indicato come aggiungere la Sitemap nella Search Console?

Bene, una volta che l’hai fatto avrai il quadro complessivo dei contenuti contenuti nella Sitemap, e di quelli effettivamente indicizzati, come vedi nell’immagine qui sotto.

verifica stato indicizzazione tramite sitemap search console

E’ normale che non tutte le pagine e i contenuti vengano indicizzati.

Ad esempio nel mio blog le pagine riservate a chi acquista il mio corso di posizionamento SEO sono messe in noindex, e quindi non vengono volutamente indicizzate.

E’ importante controllare che le pagine non indicizzate siano effettivamente pagine che non hanno l’obiettivo di posizionarsi sul motore dei ricerca, e non siano importanti per la SEO.

Indicizzazione siti web su Google: i metodi alternativi

Ti ho già prospettato svariate opzioni per “aiutare” Google ad indicizzare il sito web. Eppure esistono anche altri metodi, di cui ti parlo in questo paragrafo, per ottenere risultati rapidi.

Sappi che lo spider di Google utilizza i link per esplorare il web e trovare nuovi siti internet.

Di conseguenza essere linkati da altri siti web aiuta ad accelerare e migliorare l’indicizzazione, (oltre che, nel caso di link di valore, a migliorare il posizionamento del tuo sito web su Google).

Puoi utilizzare diverse fonti di link per far sì che Google trovi i tuoi contenuti rapidamente.

Essere ospitati su altri blog (“guest posting/guest blogging”), iscrivere il sito internet su directory, linkare dai principali social (ad esempio Facebook, Instagram, Twitter, Google +) e da forum agevolano il lavoro di scoperta di Googlebot.

Anche i link interni servono: se vuoi far indicizzare una nuova pagina del tuo sito fa in modo che questa venga linkata da altre pagine dello stesso.

google: indicizzazione sito con crawler googlebot

Indicizzare un sito su Bing e Yahoo

Hai visto come indicizzare un sito web su Google. Ma vale la stessa logica per gli altri motori di ricerca?

Sebbene Google, infatti, sia il leader del settore, l’indicizzazione su Bing e Yahoo può comunque essere utile, soprattutto per coloro che si rivolgono al mercato oltreoceano, dove questi motori di ricerca hanno una buona percentuale di utilizzo, seppure comunque minore rispetto a Big G.

Ogni motore di ricerca, come Google, ha una pagina dedicata alla richiesta di indicizzazione dei siti web.

Anzitutto crea un account Microsoft.

Fatto questo attiva la Bing Webmaster Tools e clicca in “Dashboard”.

Successivamente scegli “Submit URL”, inserisci la URL e clicca su “Invia”.

Inoltre, ecco il link per la richiesta di indicizzazione su Yahoo e Bing: http://www.bing.com/toolbox/submit-site-url

Recentemente, infatti, i due motori di ricerca hanno fuso il loro indice e si può accedere ai loro servizi con un unico account.

Sulla pagina in questione, dunque, per prima cosa inserisci l’URL del sito e, una volta risolto il captcha, clicca su “Invia”.

Indicizzare categorie, tag e pagine di filtri?

Spesso mi vien chiesto se alcune specifiche pagine andrebbero indicizzate, oppure no.

In particolare, le pagine categoria, le pagine tag e le pagine “filtro” andrebbero indicizzate?

Posto che l’argomento merita un maggior approfondimento e può variare in base al singolo sito o al progetto, ecco la risposta di massima, generica.

Le pagine categoria e tag vanno indicizzate, la risposta è sì. Se le categorie e i tag sono ben pensati e studiati, sono contenitori intelligenti di contenuti correlati tra loro.

Pertanto sono utili al visitatore, e meritano di comparire in SERP.

E le pagine filtro?

Tali pagine sono presenti spesso negli e-commerce, e sono quelle pagine che appaiono dopo che selezioniamo dei determinati parametri.

Per esempio, se in un e-commerce stiamo vedendo tutte le scarpe, e mettiamo la spunta su “mostra solo le scarpe rosse”, quella che otterremo è una pagina filtro.

Sono pagine che presentano gli stessi contenuti della pagina principale, ma in ordine diverso oppure in maniera più limitata.

Le pagine filtro non vanno in genere indicizzate. O meglio, bisogna inserire in esse un met tag che si chiama “canonical”.

Questo tag indica a Google che la pagina filtro si riferisce a un’altra pagina di riferimento.

In altri articoli del blog approfondisco l’argomento del canonical, che merita una guida dedicata.

Indicizzare su 1000 motori di ricerca: serve davvero?

Molte agenzie propongono ai clienti di indicizzare il sito su 1000 motori di ricerca.

Ma a cosa serve realmente?

Tagliando corto, praticamente a nulla.

Quando ricevi proposte di questo tipo, scappa a gambe levate.

In Italia Google domina il mercato con circa il 95% del traffico.

Oltre a Google, può far comodo l’inicizzazione su Bing e Yahoo, magari.

Ma dopo questi 3 motori di ricerca, almeno in Italia, c’è il nulla.

Queste offerte, inoltre, giocano sul fatto che molti potenziali clienti ignorano la differenza tra indicizzazione e posizionamento di cui ho parlato all’inizio dell’articolo.

Ad ogni modo, per non sbagliare, sappi che offerte del genere sono quasi sempre proposte da agenzie/professionisti di scarso valore.

Dovresti aver raggiunto il tuo scopo

Se hai seguito tutte le operazioni indicate in questa guida il tuo sito dovrebbe essere correttamente indicizzato.

Se non lo è, potrebbero esserci problemi particolari dovuti a errori tecnici o inerenti alla qualità del progetto.

4 VIDEO+PDF: Scopri il Mio Metodo di Posizionamento su Google Semplice, Passo Passo e Pratico, per TUTTI i Siti Web

CLICCA QUI E ACCEDI AI VIDEO GRATIS

filippo.jatta@jfactor.it

<p>Filippo Jatta è consulente SEO per liberi professionisti e imprenditori. Dottore magistrale in Organizzazione e Sistemi Informativi presso l’Università Luigi Bocconi di Milano. Dal 2008 aumenta traffico e visibilità online di blog e ecommerce, posizionando siti web in prima pagina su Google. Offre servizi di posizionamento sui motori di ricerca e corsi SEO, sia base che avanzati.</p>

2 Commenti
  • pasquale
    dicembre 15, 2017 at 7:59 pm

    Ciao,ti ringrazio per la disponibilità. Sarei interessato a visionare i 4 video. Grazie a presto

Inserisci un commento