Di cosa parliamo in questa lezione?
Noindex, è questo l’argomento della lezione. Cos’è il Noindex? Come e quando si usa? Il noindex è un suggerimento o una direttiva? Cosa fa esattamente il noindex? La frequenza di crawling di una pagina noindex declina nel tempo? Quando conviene invece usare al suo posto il nofollow tag?… Questi e molti altri sono gli argomenti che tratteremo.
Come saprai nella nostra SEO Academy trattiamo tutti gli argomenti correlati al posizionamento sui motori di ricerca. Se sei nuovo ti consiglio di dare un’occhiata alle precedenti lezioni… abbiamo trattato diversi argomenti che ti saranno utili per comprendere meglio quello di cui parleremo in questo articolo.
Se sei interessato a questa lezione probabilmente è perché hai la necessità di non indicizzare o de-indicizzare dei contenuti e vuoi eseguire correttamente queste azioni in modo da evitare errori che possano riflettersi su visibilità e traffico web.
Allora non perdiamo più altro tempo e partiamo!
Cos’è il Noindex?
Una definizione di Noindex ricorrente nel web è la seguente: il no index è l’istruzione data ai motori di ricerca di non includere una specifica pagina o un sito web nei loro database (chiamati indici).
Più tecnicamente si tratta di un metatag HTML, cioè di una porzione di codice nascosta all’utente ma visibile al bot del motore di ricerca, con la quale vengono fornite a quest’ultimo delle istruzioni e/o informazioni aggiuntive (meta-informazioni).
La direttiva noindex tuttavia non sempre viene seguita dai motori di ricerca i quali interpretano inoltre questa direttiva in maniera tra loro leggermente diversa. Col trascorrere del tempo però la frequenza di crawling di una pagina noindex declina se tale direttiva permane. Possono passare infatti anche 2-3 mesi prima che il crawler ripassi per verificare se la pagina può essere o meno indicizzata.
Per questo possiamo dire che il noindex è una direttiva che Google e gli altri motori di ricerca non applicano in maniera istantanea, ma la visibilità della pagina viene comunque diminuita fino ad arrivare a rasentare l’invisibilità col passare del tempo.
Noindex & Meta tag robots
Il noindex tag fa parte del meta tag robots, tag che ha il compito di indicare specificatamente agli spider dei Search Engines quali pagine sono accessibili e quali pagine o sezioni delle stesse non sono indicizzabili, oltre che a fornire loro informazioni sui contenuti di una pagina web.
La struttura del metatag è semplice e comprende solamente due attributi:
<metaname=”proprietà” content=”valore“/>
dove:
- l’attributo name indica il tipo di informazione contenuta nel tag
- l’attributo content indica invece il contenuto della informazione
Sintassi del meta tag noindex
La direttiva noindex va inserita nella sezione “Head” del codice sorgente HTML di una pagina web. La sintassi è la seguente:
<head>
<meta name=”robots” content=”noindex”/>
< /head>
Nello specifico l’attributo content, oltre alla direttiva noindex, può includere anche le seguenti:
- index (richiesta di includere i contenuti di una pagina nell’archivio di un motore di ricerca);
- follow (richiesta di seguire tutti gli hyperlink o link a altre pagine collegate);
- nofollow (indicazione di non seguire tutti i link presenti all’interno della pagina e passare la propria link equity – approfondimento);
- nosnippet (indicazione di non mostrare lo snippet nei risultati di ricerca – approfondimento);
- noarchive (indicazione di non salvare una copia della pagina web nella memoria cache del motore di ricerca);
- Date (indicazione di non indicizzare una pagina a partire da una certa data). Le precedenti indicizzazioni non vengono cancellate, né è disponibile un metatag per impostare una data a partire dalla quale la pagina non è più visibile fra i risultati del motore, e/o nella sua cache.
Le direttive index e noindex possono poi essere abbinate tra di loro secondo le esigenze ed assumere la seguente sintassi:
…content=”index, follow”/>
Quando e perché si usa il noindex?
La direttiva noindex trova applicazione maggiormente nei seguenti casi:
- pagine e siti web ancora in fase di sviluppo;
- pagine web che si desidera vengano mantenute private (come le pagine di un sito destinate solo ad impiegati o membri di una organizzazione);
- pagine web transitorie;
- pagine di ringraziamento o thank you pages: il comando in questo caso viene dato per impedire che queste pagine vengano indicizzate e che quindi il visitatore vi possa atterrare prima di avere compilato l’optin presente nella nostra landing page;
- pagine con contenuti duplicati, non pertinenti o poveri;
- pagina tag che si posiziona meglio rispetto al contenuto che si vuole posizionare in SERP;
- pagine che non si vogliono indicizzare per prevenire una cattiva User Experience (UX).
Come usare il noindex tag?
La direttiva noindex può essere implementata sia manualmente agendo sul codice sorgente HTML della pagina web, sia tramite dei plugin per i vari CMS (WordPress, Joomla, Drupal ed altri).
Implementazione manuale
Ecco come effettuare una implementazione manuale del comando noindex.
Noindex di una intera pagina:
<head>
<meta name=”robots” content=”noindex”
<title> non indicizzare questa pagina </title>
</head>
#2 direttiva Noindex per bot specifici
La direttiva noindex può essere ristretta ad alcuni bots specificando un differente valore “nome” nel meta tag. Ad esempio se si vuole bloccare il bot di Google (Googleboot) la sintassi da utilizzare sarà la seguente:
<meta name=”googlebot” content=”noindex”>
#3 file robots.text
Il file Robots.text è un file di testo in formato UTF-8 che contiene comandi e direttive che possono bloccare il crawling. Quest’ultimi permettono anche di specificare a quali contenuti, cartelle o file il motore di ricerca potrà accedere o indicizzare.
Il file è parte del protocollo REP (Robots Exclusion Protocol) il quale effettua controlli che possono essere applicati sia a livello globale (attraverso il file robots.text appunto), che di pagina e va sempre posizionato nella directory principale del proprio dominio.
Il comando “Disallow” utilizzato dal file robots per bloccare i contenuti è un’altra indicazione che può essere disattesa dal motore di ricerca. In questo caso viene in aiuto Google Search Console tramite il quale possiamo testare il file robots e vedere quali sono le indicazioni ignorate da Google e decidere di conseguenza cosa fare.
Nell’utilizzare il file robots occorre fare attenzione in quanto se ad esempio non vuoi indicizzare un contenuto, ma questo linka a molte pagine interne, invece che inserirla tra quelle bloccate tramite il comando disallow, sarà opportuno invece utilizzare il meta tag robots impostando il valore a “noindex, follow”.
#4 Noindex di una parte di una pagina
La non indicizzazione di una pagina web può essere fatta usando diverse tecniche non sempre riconosciute dai motori di ricerca, tra le quali troviamo:
Noindex tag
<p>
non indicizzare questo testo.
<noindex>non indicizzare questo testo</noindex>
<!—noindex–>non indicizzare questo testo<!- -noindex–>
</p>
Microformati
I microformati (approfondimento) sono una parte di mark up presente in una pagina web che con le opportune specificazioni possono svolgere le medesime funzionalità.
In questo caso il REP controlla il valore class=”robots-noindex” nel tag HTML.
La sintassi è la seguente:
<p>Do index this text.</p>
<div class=”robots-noindex”>Don’t index this text.</div>
<span class=”robots-noindex”>Don’t index this text.</span>
<p class=”robots-noindex”>Don’tindexthistext.</p>
Come visto in precedenza anche in questo caso sono possibili delle combinazioni tra i valori:
<div class=”robots-noindexrobots-follow”>Text.</div>
Implementazione tramite plugin
Come accennato in precedenza sono disponibili diversi plugin per l’implementazione della direttiva noindex, tra i più utilizzati citiamo Seo by Yoast, All in One SEO Pack, Screaming Frog o Visual SEO.
È probabile però che tu, come ormai quasi la totalità di chi gestisce un sito web, utilizzi già Yoast SEO Tool per finalità SEO. Vediamo dunque come fare attraverso questi pochi e semplici step:
- vai al frontend della pagina o articolo che non vuoi venga indicizzato, quindi dalla meta box di Yoast seleziona il tab “funzionalità avanzate” identificato da una “rotellina”;
- una volta cliccato sull’icona verranno immediatamente visualizzate delle domande la prima delle quali è la seguente: vuoi permettere ai motori di ricerca di mostrare questo post nei risultati di ricerca?
- il plugin di default è settato in modo da fare visualizzare i contenuti, se invece scegli “no” il contenuto ovviamente non verrà mostrato nelle SERP. In caso di contenuti esistenti occorrerà del tempo prima che questi non compaiano più nei risultati di ricerca.
Pagine noindex & links
L’attribuzione del tag noindex a delle pagine toglie valore ai links presenti nelle pagine stesse? In altre parole questi link accumulano ancora Page Rank e possono passare link equity ad altre pagine?
Nell’implementazione tramite plugin vediamo che Yoast automaticamente utilizza il settaggio: “noindex, follow”. I motori di ricerca continueranno quindi a seguire i link presenti in quelle pagine.
Se non si desidera che questo avvenga è opportuno rispondere “si” alla domanda “i motori di ricerca devono seguire i link presenti in questo post?” posta dal plugin in fase di settaggio.
Conclusione
In questa lezione della tua SEO Academy preferita abbiamo parlato del Noindex tag. Ti abbiamo dato tutte le informazioni necessarie per capire cos’è esattamente e quando utilizzare questa direttiva, come infine crearla in autonomia, ma questo non basta.
La SEO è una materia in continuo sviluppo, le innovazioni che via via vengono introdotte richiedono l’acquisizione di nuove competenze. Riguardo alle recenti innovazioni ed al loro sviluppo continueremo a trattare nelle prossime lezioni.
Rimani aggiornato e continua a seguirci, nelle prossime lezioni della SEO Academy parleremo di altre cose molto interessanti…
Serve aiuto con l’utilizzo o l’implementazione del tag noindex? Contattaci! Ti aiuteremo a non far indicizzare la tua pagina o il tuo sito web.
Vuoi migliorare il posizionamento SEO del tuo sito? Vuoi ottimizzare il sito, fare in modo che i tuoi clienti ti trovino su Google e battere la concorrenza? Contattaci! Studieremo la migliore strategia SEO per il tuo sito.
Vuoi migliorare le tue conoscenze in ambito SEO? Contattaci! Valuteremo il corso SEO adatto a te.
Vuoi chiederci info o parlare con noi? Contattaci! Siamo qui per questo.
Articoli correlati
- Readers Rating
- Rated 5 stars
5 / 5 (Reviewers) - Spectacular
- Your Rating