HomeSEOGuida alla Sitemap

Guida alla Sitemap

Creare una sitemap è un’attività che contribuisce alla realizzazione di un sito completo e funzionale, molti webmaster ignorano l’implementazione delle sitemap perché ritengono che non abbia impatto sugli utenti, essendo questa a beneficio dei crawler. Ma un robot che visita il nostro sito è felice di trovare delle indicazioni su come muoversi e quindi con una sitemap si contribuisce ad una migliore navigazione, una più facile indicizzazione e di conseguenza ad un possibile miglioramento della posizione, quindi capirne lo scopo, la struttura e il funzionamento diventa necessario.

Cos’è una Sitemap

Con il termine sitemap ci si riferisce ad un documento che elenca in ordine gerarchico gli url di un sito web.

Inizialmente le sitemap in formato testuale o grafico erano implementate nei siti web per aiutare la navigazione degli utenti, oggi invece sono principalmente utilizzate in formato XML per fornire ai crawler dei motori di ricerca l’elenco delle pagine che si desidera indicizzare.

A cosa serve una sitemap per i motori di ricerca

Grazie alla continua evoluzione dei motori di ricerca e dei relativi software che scansionano il web, le nuove pagine pubblicate vengono individuate e indicizzate con relativa facilità, ma implementare una sitemap a disposizione dei crawler permette di passare una serie d’informazione molto utili ai motori di ricerca, così da facilitare le operazioni di scansione e successiva indicizzazione, infatti con una sitemap comunichiamo tra le tante voci:

  • URL esatto delle pagine contenute in un sito
  • Data ultima modifica di una pagina
  • Periodicità con il quale viene aggiornato il sito
  • Titolo delle immagini contenute in  un URL
  • Numero di immagini contenute in una URL

Attraverso queste informazioni i crawler riescono a capire con facilità la struttura di un sito così da indicizzare le pagine rispettando la gerarchia, stimare una periodicità di scansione ed individuare pagine del sito isolate, che con pochi o nessun link in ingresso risultano difficili da individuare.

Dove posizionare la Sitemap

Le sitemap possono contenere informazioni solo di livelli uguali o inferiori alla propria posizione per essere valide, questo significa che possiamo posizionare la sitemap in qualsiasi directory del nostro dominio, ma gli URL che essa può contenere sono solo quelli contenuti nella directory stessa. Se la sitemap viene archiviata nel dominio principale, ad esempio https://www.manuelemorandin.net/ questa potrà contenere tutti gli indirizzi del sito, ma se dovesse essere salvata ad esempio nella cartella https://www.manuelemorandin.net/directory_1 potrà contenere URL di questa directory e delle sue sottodirectory, ma non potrà contenere URL della directory all’indirizzo https://www.manuelemorandin.net/directory_2 e relative sottodirectory. Per questo motivo è consigliato salvare la sitemap o il suo indice nel livello più alto.

Scegliere il Nome per la sitemap

In questo caso non esiste nessuna specifica sulla scelta del nome ed è possibile scegliere una qualsiasi combinazione di caratteri consentiti, è comunque consigliato utilizzare nomi che ne identificano il senso.

Esempio:

https://www.manuelemorandin.net/sitemap_index.xml // si riferisce all’indice delle sitemap 
https://www.manuelemorandin.net/post-sitemap.xml // si riferisce alle sitemap dei post 
https://www.manuelemorandin.net/page-sitemap.xml // si riferisce alle sitemap delle pagine

Formati di sitemap

Esistono diversi formati di sitemap, per adattarsi alle più svariate esigenze e preferenze, i più noti sono il formato XML, il formato TESTUALE e il formato RSS/mRSS/ATOM.

Il più comune, versatile e potente è il formato XML con un protocollo semplice e collaudato ed accettato dai principali motori di ricerca, il formato TESTUALE permette la creazione di semplici elenchi di URL invece Il formato RSS/mRSS/ATOM sfrutta la creazione delle sitemap estrapolando i dati dal feed RSS se presente,ma con una notevole perdita di informazione.

Protocollo Sitemap.xml

Grazie alla semplicità e versatilità il formato XML è stato adottato come formato principale per la creazione e utilizzo delle sitemap, rendendo così necessario la creazione di un protocollo, detto protocollo sitemap.xml, definisce la struttura di una sitemap composta da tag XML, permettendo di creare un documento con un’architettura  base obbligatoria che può essere implementata con informazioni aggiuntive opzionali.

Caratteristiche di base di una sitemap.xml

  • Rispettare la codifica UTF-8
  • Rispettare la codifica XML
  • Iniziare con un tag di apertura <urlset> e terminare con quello di chiusura </urlset>
  • all’interno del tag <urlset> specificare i nomi dei protocolli rispettati
  • una voce <url> per ogni URL
  • una voce <loc> per ogni tag <url>

Tag XML obbligatori

Una sitemap per essere considerata valida deve contenere obbligatoriamente i seguenti tag:

  • <urlset> </urlset> contiene i riferimenti al protocollo rispettato
  • <url></url>è il tag principale per ogni URL al suo interno sono contenuti tag secondari che completano le informazioni di ogni URL
  • <loc></loc> contiene l’indirizzo esatto e completo di ogni URL che non può superare i 2048 caratteri Esempio di una pagina base solo con tag obbligatori
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url> <loc>https://www.manuelemorandin.net/digital/creare-un-database/</loc> </url>
<url> <loc>https://www.manuelemorandin.net/digital/installare-xampp-locale/</loc> </url>
<url><loc>https://www.manuelemorandin.net/tools/milioni-libri-gratis-webopac-la-cultura-portata-click/</loc> </url>
</urlset>

L’esempio appena mostrato che corrisponde ad un semplice elenco di URL, costituisce la struttura minima per rendere valida una sitemap XML.

Tag XML opzionali

Ogni sitemap XML però può comunicare una serie di informazioni supplementari che se corrispondenti al vero sono gradite dai motori di ricerca.

  • <lastmod></lastmod> contiene la data ed eventualmente l’ora dell’ultima modifica di un indirizzo, il formato da utilizzare è il datetime specificato dal consorzio W3C
  • <changefreq></changefreq> indica la possibile frequenza con il quale il contenuto di un indirizzo viene aggiornato, i valori validi sono always, hourly, daily, weekly, monthly, yearly, never. Questi valori sono da considerarsi un suggerimento e non un comando ai motori di ricerca che stabiliscono la frequenza con cui visitare un sito in maniera indipendente.
  • <priority></priority> permette di indicare la priorità o importanza che un indirizzo a rispetto a URL dello stesso sito, il suo valore è numerico e compreso tra un minimo di 0.0 e un massimo di 1.0, di default questo valore è 0.5.

Dimensioni di una sitemap

Il protocollo prevede un limite massimo di dimensione per una singola sitemap che consiste in 50 MB o in 50,000 URL, una volta superato questo limite per creare una sitemap valida è necessario frazionare gli elenchi in più sitemap così da generare documenti più piccoli.

Per collegare le sitemap tra loro è sufficiente creare un unico documento definito indice delle sitemap.

Indice Sitemap (per raggruppare più file Sitemap)

Con la creazione di più sitemap si rende utile la creazione di un documento che contiene l’elenco di tutte le sitemap contenute così da facilitare il lavoro ai crawler che potrebbero non identificare tutte le sitemap esistenti, per fare ciò è sufficiente creare un indice che rispetta lo schema del seguente esempio:

<?xml version="1.0" encoding="UTF-8"?><?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap>
<loc>https://www.manuelemorandin.net/post-sitemap.xml</loc> <lastmod>2017-04-14T03:03:27+01:00</lastmod>
</sitemap>
<sitemap>
<loc>https://www.manuelemorandin.net/page-sitemap.xml</loc> <lastmod>2017-04-22T12:06:27+01:00</lastmod>
</sitemap>
</sitemapindex>

Implementare protocolli

Il protocollo sitemap.xml integra la possibilità di aggiungere altri protocolli così da implementare se necessario più informazioni. Per implementare un protocollo è  sufficiente aggiungere nel tag il suo riferimento. Esempio: xmlns:example=”http://www.example.com/schemas/example_schema”

I protocolli più comuni sono per immagini e per video.

Sitemap per immagini

Per aumentare la probabilità che le immagini contenute all’interno di un sito vengano indicizzate è possibile integrare in una sitemap le informazioni relative ad esse. E’ possibile creare sitemap dedicate solo alle immagini oppure aggiungere le informazioni a sitemap già esistenti.

Per implementare il protocollo bisogna aggiungere il riferimento al tag : xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1″ che consente di elencare fino a 1000 immagini per pagina.

come per il protocollo standard anche in questo caso esistono dei tag obbligatori per rendere valida la sitemap e altri facoltativi per implementare le informazioni:

Tag obbligatori per sitemap immagini

  • <image:image></image:image> è il tag principale per ogni immagini e al suo interno contiene tutti i tag secondari, può essere ripetuto fini a 1000 volte per ogni tag ogni
  • <image:loc></image:loc> indica l’indirizzo completo dell’immagine, può essere anche differente dall’indirizzo del dominio sul quale è ospitata la sitemap, ma richiede una procedura di verifica pertanto se non strettamente necessario consiglio di tenere le immagini nello stesso dominio

Tag opzionali per sitemap immagini

  • <image:title></image:title>contiene il titolo dell’immagine
  • <image:caption></image:caption> contiene la didascalia dell’immagine
  • <image:geo_location></image:geo_location>contiene la posizione geografica dell’immagine
  • <image:license></image:license> contiene l’indirizzo che rimanda alla licenza dell’immagine

Sitemap per video

Anche per i video è possibile creare sitemap sempre per favorire il processo di indicizzazione e anche in questo caso è possibile creare sitemap dedicate o implementare le informazioni in quelle già esistenti.

Per implementare il protocollo bisogna aggiungere il riferimento al tag : xmlns:video=”http://www.google.com/schemas/sitemap-video/1.1″

Come per i precedenti protocolli anche in questo caso esistono dei tag obbligatori e dei tag facoltativi

Tag obbligatori per sitemap video

  • <video:video></video:video> è il tag principale che contiene i tag secondari per i video
  • <video:thumbnail_loc></video:thumbnail_loc>contiene l’indirizzo con l’immagine di copertina del video
  • <video:title></video:title> contiene il titolo del video che può essere al massimo di 100 caratteri
  • <video:description></video:description> contiene la descrizione del video che può essere al massimo di 2048 caratteri

Tag opzionali per sitemap video

  • <video:content_loc></video:content_loc> l’indirizzo del video
  • <video:player_loc></video:player_loc> l’indirizzo di un determinato player per la riproduzione del video
  • <video:duration></video:duration> la durata del video da 0 a 8 ore
  • <video:expiration_date></video:expiration_date> la data da cui il video non sarà più disponibile
  • <video:rating></video:rating> la valutazione del video
  • <video:view_count></video:view_count> il numero di visualizzazioni del video
  • <video:publication_date></video:publication_date> la data di pubblicazione
  • <video:family_friendly></video:family_friendly> se adatto solo a ricerche con safe search disattivata
  • <video:tag></video:tag> i tag che indicano il concetto chiave del video
  • <video:category></video:category> la categoria di massimo 256  caratteri
  • <video:restriction></video:restriction> se il video ha delle restrizioni geografiche
  • <video:gallery_loc></video:gallery_loc> il link alla galleria dove compare il video se il video appartiene a una galleria
  • <video:price></video:price> il prezzo per scaricare il video
  • <video:requires_subscription></video:requires_subscription> se necessario una sottoscrizione ad un abbonamento
  • <video:platform></video:platform> su che piattaforma può essere riprodotto il video web, mobile, tv
  • <video:live></video:live> se il video è in diretta

Creare una sitemap

Il processo per la creazione di una sitemap non è complesso e sfruttando le utilità di uno dei tanti tool a disposizione diventa un lavoro semplice e in molti casi anche automatico, è necessario però pianificare questo processo in base alle proprie esigenze e al tipo di sito, così da ottenere tutti i vantaggi raggiungibili attraverso l’uso di una sitemap.

Scegliere gli URL

Come prima cosa bisogna definire gli URL che si desidera comunicare ai motori di ricerca, valutando la necessità rimuovere pagine che hanno contenuti duplicati, ad esempio è comune che molti CMS come WordPress creino automaticamente pagine con contenuti duplicati, è il caso delle pagine categoria o tag. questa è la fase più delicata e se ben fatta non è necessario nessun intervento in futuro.

Scegliere il protocollo

Stabilire quale protocollo utilizzare per la creazione del documento in base alle proprie esigenze, come già detto il formato xml è attualmente il più diffuso.

Redigere la sitemap

Produrre fisicamente il documento che contiene gli URL, questo passaggio è possibile farlo a mano con un semplice editor testuale (ma è da pazzi) oppure utilizzare uno dei tanti tool a disposizione.

Al seguente indirizzo è disponibile un elenco con svariati tool per la creazione di sitemap.

Verificare una sitemap

Completato il lavoro è possibile utilizzare uno dei tanti servizi per verificare la correttezza della sitemap, con la maggior parte dei generatori di sitemap è un lavoro superfluo, ma in alcuni casi è bene verificare. La verifica può essere fatta in molti casi attraverso i vari servizi offerti dai motori di ricerca come Google search console e Bing strumenti per i webmaster.

Comunicare la sitemap

Effettuati tutti i passaggi precedenti, bisogna rendere disponibile la sitemap inserendola nella directory del dominio a cui fa riferimento così da essere disponibile ai crawler web.

Per permettere ai bot di individuare la sitemap è consigliato aggiungere l’indirizzo della sua posizione nel file robots.txt, nell’articolo Guida al file robots.txt ti spiego anche come inserire  l’indirizzo della sitemap nel file.

Molti motori di ricerca permettono attraverso apposite pagine la possibilità di inviare la sitemap e facilitare le operazioni di scansione, come ad esempio Google attraverso Search Console e Bing con strumenti per webmaster.

Ora non resta che attendere l’arrivo dei crawler e l’indicazione delle pagine. Buona Fortuna!!


Se hai ancora qualche dubbio sulle sitemap, lascia un commento o scrivimi attraverso il form alla pagina contatti.

Manuele Morandin
Manuele Morandinhttps://www.manuelemorandin.net
Consulente SEO e tecnico informatico, aiuto imprenditori e professionisti a sviluppare on line la propria attività, attraverso il posizionamento sui motori di ricerca, campagne pubblicitari e gestione dei social network.

Consulenza SEO

Ottimizza il tuo sito web tecnicamente e semanticamente.
Con metodi costantemente aggiornati e testati ti aiuto a migliorare l’usabilità e l’utilità del tuo progetto web per aumentarne la visibilità e farti raggiungere dalle persone interessate a quello che offri.
Scorpi tutte le offerte e chiedi un preventivo senza impegno.