Google strumenti per il webmaster: Sitemap.

google-webmaster-tools-logoQuello della Sitemap è forse la funzionalità più interessante introdotta dai cervelloni di Google. Tanto funzionale e valida che, come da recente notizia, anche Microsoft e Yahoo! si sono adeguanti a quello che è diventato uno standard di fatto.

Lo scopo di Sitemap è quello di agevolare lo spider del motore di ricerca andandogli a descrivere quali pagine, e con che frequenza, leggere dal sito. In questo modo, il webmaster – colui che conosce meglio di chiunque altro la struttura del sito – può indicare cosa ha senso indicizzare.

Questo implementa un ragionamento molto semplice da tenere presente per evitare inutili perdite di tempo: se ho un sito di poche pagine, non dinamiche e non articolate non ha molto senso creare una Sitemap; se tuttavia, siamo di fronte ad un sito dinamico con molte pagine, allora ha senso indicare allo spider di Google (e presto anche a quello di Microsoft e Yahoo!) come muoversi.

Dopo questo preambolo puramente teorico, passiamo ai fatti.

Sitemap è un file XML codificato in UTF-8 con una serie di TAG che elencano le pagine da indicizzare e, per ogni pagina, alcune proprietà. Una Sitemap d’esempio potrebbe essere la seguente:

  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  3. <url>
  4. <loc>http://blog.casertano.name/</loc>
  5. <lastmod>2005-01-01</lastmod>
  6. <changefreq>monthly</changefreq>
  7. <priority>0.8</priority>
  8. </url>
  9. <url>
  10. <loc>http://blog.casertano.name</loc>
  11. <lastmod>2005-01-01</lastmod>
  12. changefreq>monthly</changefreq>
  13. <priority>0.8</priority>
  14. </url>
  15. […]     
  16. </urlset>

Apparte le prime due righe che sono standard e vanno prese per quello che sono, i TAG più importanti sono "loc" e "changefreq" che servono ad indicare la pagina da indicizzare e la frequenza con la quale tale pagina si modifica. Il percorso del file dev’essere relativo al sito, quindi va sempre indicato il dominio.

Gli altri TAG sono opzionali ed indicano, in ordine di apparizione, l’ultima modifica del file e la priorità che noi gli diamo rispetto alle altre pagine del sito. Queste informazioni sono opzionali perché lo spider provvede comunque lui stesso a valutare queste informazioni, quindi hanno solo un ruolo indicativo.

I valori che possiamo indicare all’interno dei TAG sono tutti elencati, con la relativa descrizione, nel sito ufficiale dello standard Sitemap, nella sezione dove viene descritto il protocollo.

Una volta preparato il file e averlo messo online sul nostro sito (nella root del sito), andiamo in Google strumenti per il webmaster e da qui facciamo click sul nostro dominio e poi sull’area Sitemap. In questa pagina avremo un link con la scritta "Aggiungere una Sitemap", accedendo a questa pagina ci troveremo di fronte ad un form da compilare:

Google strumenti per il webmaster: Aggiungi Sitemap

Selezioniamo dalla select "Aggiungi sitemap web generale" e poi nel campo proposto successivamente, indichiamo il percorso corretto del nostro file Sitemap. Successivamente non dobbiamo fare altro che cliccare sul pulsante "Aggiungi Sitemap Web" ed aspettare che Googlebot prenda in carico il file indicato.

Avremo a disposizione una pagina in cui tenere sotto controllo lo stato delle nostre Sitemaps (infatti possono essere più di una per sito).

Google strumenti per il webmaster: Sitemaps

Da questa schermata sapremo se ci sono problemi nel formato del file, quando è stato analizzato dallo spider per l’ultima volta e quante pagine il file propone allo spider.

Una cosa interessante di Sitemap, almeno quello di Google, è che è possibile utilizzare anche un qualsiasi file RSS o Atom come Sitemap. Quindi se abbiamo già implementato sul nostro sito o blog un sistema di syndication, possiamo utilizzarlo come Sitemap.

Altra implementazione interessante, è la possibilità di realizzare una Sitemap di Sitemaps: una sorta di indice per tutte le nostre Sitemaps. Si basa sullo stesso principio, a cambiare sono solo i TAG da utilizzare; un esempio di Sitemap Index è il seguente:

  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemapindex/0.9">
  3. <sitemap>
  4. <loc>http://blog.casertano.name/sitemap1.xml</loc>
  5. <lastmod>2004-10-01T18:23:17+00:00</lastmod>
  6. </sitemap>
  7. <sitemap>
  8. <loc>http://blog.casertano.name/sitemap2.xml</loc>
  9. <lastmod>2005-01-01</lastmod>
  10. </sitemap>
  11. […]    
  12. </sitemapindex>

Questo permette, ad esempio, di implementare in maniera automatica nuove Sitemap al nostro sito.

Con questo articolo si conclude il nostro viaggio all’interno degli Strumenti per il webmaster che Google offre. Si conclude al meno per il momento, visto che Google non smette mai di fare ricerca ed innovazione.

In questo viaggio abbiamo visto com’è possibile rendere il nostro sito Google Compliant (e prossimamente anche Microsoft e Yahoo!). Questo permette di fare un passo avanti nella infinita scalata delle indicizzazioni dei nostri siti.

Chiudo questo articolo con una precisazione che è bene tenere sempre in mente:

L’indicizzazione NON è il posizionamento. L’indicizzazione è la fase in cui si dice al motore di ricerca, chiunque esso sia, cosa c’è all’interno del nostro sito: in termini di pagine e contenuti. Finire questa fase in maniera corretta significa che il motore ha acquisito tutte le informazioni necessarie inerenti il nostro sito.

Il posizionamento è il processo col quale si ottimizzano i contenuti in modo da rendere la nostra indicizzazione meglio visibile durante le sessioni di ricerca sul motore di ricerca. Ovviamente un sito non indicizzato non può essere posizionato.

 

Se ti è piaciuto l'articolo , iscriviti al feed cliccando sull'immagine sottostante per tenerti sempre aggiornato sui nuovi contenuti del blog:


Commenti

nome-foto