30 aprile 2009

Come gestire i robots dei motori di ricerca con robots.txt

scritto daMauro Accornero

Si parla sempre molto di motori di ricerca e di indicizzazione, l’argomento è di grande interesse, essere presenti in google equivale ad essere presenti sul mercato web e tutti vorrebbero essere facilmente rintracciabili. Come in tutte le cose non esistono formule magiche per arrivare primi nella serp del motore di ricerca ma è necessario un preciso e continuativo lavoro per migliorare l’appetibilità del sito in questione.

Anche le imprese più grandi partono con piccoli gesti, lo stesso vale per l’ottimizzazione della pagina web, che ha come fine quello di rendere il contenuto appettibile tanto agli utenti quanto ai robot dei motori di ricerca.

Una prima e semplice operazione che può migliorare la visibilità del nostro sito è la creazione di un file robots.txt.

Questo file ha lo scopo di specificare ai robot quali parti del nostro sito indicizzare e quali no, per fare ciò basta creare un file robots.txt e collocarlo nella root del sito.

La sintassi è molto semplice, come prima cosa definiamo quali robot (o spider) vogliamo vincolare.

User-agent: *

In questo modo specifichiamo che le regole che scriveremo di seguito valgono per tutti i robot.

User-agent: Gogglebot

In questo caso invece specifichiamo che le regole imposte siano imposte solo ai robot di google.

Per una visione di tutti robot presenti nel web è possibile visitare il sito robotstxt.com  che ci offre una lista dettagliata.

Per permettere o meno l’accesso da parte degli spider dei motori di ricerca si utilizzano allow e disallow.

User-agent: *
Allow: /

In questo caso l’accesso è consentito a tutto il sito per tutti i robots

User-agent: *
Disallow: /

In questo caso l’accesso al sito è vietato per tutti i robots

E’ anche possibile escludere solo una parte del sito ai robots

User-agent: *
Disallow: /images/

In questo caso la cartella images non sarà accessibile da nessuno spider.

Si può anche escludere un singolo file ai robots in questo modo

User-agent: *
Disallow: /directory/myfile.html

Occorre ricordare che il file robots.txt va utilizzato esclusivamente per gestire gli spider e non per rendere invisibile un contenuto, in quanto il file robots.txt è visibile da qualunque utente sul browser e non impedisce all’utente di accedere ad eventuali url.

Inoltre esistono particolari sintassi interpretate da alcuni robots ma non da tutti.

Per maggiori informazioni è possibile consultare la sezione di Google dedicata ai files robots.txt e la pagina su wikipedia dedicata al Robot Exclusion Standard.

Tag: ,

28 aprile 2009

Nasce Google for Advertiser

scritto daMauro Accornero

Mi giunge notizia della recente nascita di Google for Advertiser, ennesimo servizio di Google per le aziende. Il servizio permette di organizzare un piano marketing declinabile con publicità su più media (web, cellulare e tv) per la propria attività.

L’idea sembra buona e sicuramente rappresenta una risposta al marketing tramite social network che ha preso piede negli ultimi anni con un servizio dalle ampie possibilità. Per il momento attivo solo su google.com attendo di vedere i primi feedback da parte degli utenti.

Tag: ,

22 aprile 2009

Google lancia Google Analytics API

scritto daMauro Accornero

Ieri Google ha lanciato Google Analytics API, dando a tutti gli utenti la possibilità di creare applicazioni per la gestione delle statistiche dei propri siti.

Per il momento vengono proposte alcuni tool molto interessanti come questa applicazione sviluppata per Android per visonare le statistiche dal proprio cellulare e questo widget sviluppato con adobe air per la visione di Google Analitics dal desktop. Quest’ultima è disponibile in versione trial o a pagamento per la gestione di più siti.

Link all’articolo su Blog ufficiale di Google

Tag: ,