Tempo di Lettura: 2 minuti
Google Labs ha da poco rilasciato la beta del suo nuovo protocollo XML per le mappe dei siti con lo scopo di estendere le capacità dei robot dei motori di ricerca.
Sitemaps è, in pratica, il nuovo metodo gratuito che Google propone per essere inclusi nell’indice del motore di ricerca, riducendo i tempi del processo.
Il nuovo formato XML è molto simile ad un file RSS e indica ai crawler quale parte del sito viene aggiornata più frequentemente, quali sono le pagine che compongono il proprio sito e come farle indicizzare correttamente, in modo che Google sia sempre aggiornato sui cambiamenti delle vostre pagine.
Nella sua pagina dedicata, viene spiegata la sintassi del file XML e come creare dei file sitemap multipli nel caso un file superi le 50.000 url o sia più grande di 10 MB. Infine, corredo della documentazione, vi è un’ottima sezione FAQ delle sitemap.
A tal proposito è stato creato anche un gruppo di discussione dedicato in cui sono state presentate diverse soluzioni per fornire i file XML necessari al motore di ricerca.
Google stesso ha iniziato con uno script in Python da eseguire sul server per ottenere i file XML richiesti, sul gruppo si stanno presentando soluzioni in PHP o convertitori dal file listing.
In alternativa si possono inviare richieste di indicizzazione a Google anche attraverso HTTP all’indirizzo www.google.com/webmasters/sitemaps/ping?sitemap=sitemap_url usando software come wget o curl si possono indicizzare grossi volumi velocemente, altri metodi a disposizione sono l’Open Archives Initiative protocol for metadata harvesting, RSS 2.0, Atom 0.3; per finire si accetta anche una semplicissima lista di URL una per riga.
per chi utilizza WordPress come piattaforma per il proprio blog, allora vi consiglio di dare un’occhiata a:
. Webdomus.it, partendo dal codice proposto da Social Patterns ha creato uno script per generare una Google Sitemap dei weblog che girano su WordPress 1.0.2 (dovrebbe essere compatibile con tutte le versioni, ma non ho avuto modo di verificarlo) tenendo conto delle diverse priorità di aggiornamento. Per il momento crea solo la mappa (un documento XML) dei post.
– Fullo.net consiglia, invece, un altro bel plugin per wordpress per crearvi la sitemap xml.