Come verificare il corretto accesso dei Robot dei motori di ricerca al proprio sito
Può accadere che il proprio sito venga improvvisamente cancellato dagli indici di un motore di ricerca, con un ovvio sgomento e terrore da parte del possessore.
L’eventualità purtroppo non è rara e di norma è una conseguenza diretta di una violazione alle linee guida dettate da Google ai webmaster. Le motivazioni possono essere molte, testo nascosto, contenuto inappropriato, redirect e molte altre.
Una delle casistiche che mi ha sempre intimorito di più è il cloaking, che consiste nel proporre agli utenti un determinato contenuto, deviando però i robot dei motori di ricerca su un’altra pagina e alterare così l’indicizzazione.
Normalmente si evita di applicare intenzionalmente questa tecnica, in quanto Google riesce facilmente ad individuare questo genere di trucchi in quanto utilizza anche persone vere per la verifica dei siti oltre ai Robot .
Può capitare però che a causa di un errore umano o di un exploit sul nostro spazio web venga modificato per esempio il file .htacces con un redirect solo per gli spider dei motori di ricerca. Nel caso non ci siano modifiche palesi al sito risulta molto difficile accorgersi di questo problema intanto google avrà tolto le nostre pagine dall’indice.
E’ sempre possibile richiedere a Google di riconsiderare il motivo dell’esclusione dall’indice ma questa operazione richiede qualche tempo. Intanto si potrebbe verificare la corretta risposta del server ai robot dei motori di ricerca con questo semplice tool che ci presenta la risposta del server in base ai diversi user-agent.
La stessa procedura è eseguibile con firefox (vedi un esempio in questo articolo) ed esistono numerosi addon per gestire questo tipo di verifica, ma questa soluzione da browser mi risulta molto comoda e veloce per controlli preliminari.
Per chi volesse approfondire argomenti simili suggerisco questo recente articolo di Davide Casali che parte da un’esperienza reale per descrivere verifica, analisi e soluzioni ad un exploit sul proprio sito web.
Visualizzare le statistiche di Google Analytics con Javascript Parte 3
Abbiamo visto nei precedenti articoli come iniziare ad usare le API di Google Analytics con javascript, nel primo articolo abbiamo visto come realizzare l’autenticazione da parte dell’utente e nel secondo come ricavare i dati relativi agli account.
Proseguendo sui nostri passi non ci resta che vedere come richiamare le singole statistiche relative ad ogni account, per fare questo occorre far autenticare l’utente ed ottenere l’id del profilo di cui si desidera mostrare le statistiche. A questo punto non ci resta che richiedere i dati a Google Analytics per mostrarli all’utente nella nostra pagina.
La procedura in realtà è molto simile ai passaggi effettuati per richiedere i dati dell’account utente, si richiedono i feed e si creano delle variabili che daranno come output le statistiche richieste. La vera differenza sta nel modo di richiedere i dati, in quanto è possibile specificare con precisione quali dati ottenere come nel caso di una query.
function getPageviewsByCityFeed(ProfileId) {
var myFeedUri = scope + '/data' +
'?start-date=2009-01-01' +
'&end-date=2009-05-08' +
'&dimensions=ga:country,ga:city' +
'&metrics=ga:visits' +
'&sort=-ga:visits' +
'&max-results=100' +
'&ids=ga:' + ProfileId;
myService.getDataFeed(myFeedUri, handleMyFeed, handleError);
}
La seguente funzione infatti richiama le API di Google Analytics tramite url passando i valori necessari e specificare quali dati vogliamo ottenere. Come si evince dalla funzione richiederemo lo stato e la città degli utenti che hanno visitato il sito tra il 1° gennaio 2009 e l’8 maggio 2009, ordinandoli per numero di visite e limitando i risultati a 100.
Notiamo anche alla fine della funzione, la variabile contente l’id del profilo, questo valore è sempre necessario per richiedere i dati di un determinato account. Oltre a questo è indispensabile indicare una data di partenza e una di fine per le statistiche da mostrare. Per maggiori informazioni sui parametri e possibili valori è consigliabile visualizzare il documento Dimensions & Metric reference fornito da Google.
I passaggi successivi sono destinati a gestire e impaginare i dati ricavati tramite il ciclo vengono mostrati i dati ricavati e attraverso la funzione tableize vengono inseriti nelle tabelle.
Per vedere il risultato prova l’esempio completo, una volta effettuato il login a google analytics verranno mostrti gli account disponibili e sarà possibile vedere gli stati e le città degli utenti che hanno visitato il sito.
L’esempio è a puro scopo dimostrativo, è utile pensare di utilizzare questo sistema per ottenere le statistiche di Google Analytics sul proprio spazio web per visionare le statistiche in tempo reale.
Prima di lanciarsi e ricreare totalmente Google Analytics sul proprio spazio web consiglio queste librerie per l’utilizzo delle API di Google Analytics che possono senza dubbio velocizzare la realizzazione di eventuali script da integrare nel proprio sito.
Tag: Google, seo, statistiche
Visualizzare le statistiche di Google Analytics con Javascript Parte 2
Abbiamo visto nel precedente articolo come è possibile far autenticare l’utente al proprio account di Google Analytics grazie alle API e a javascript in una pagina statica collocata in un qualsiasi spazio web. Oggi vedremo come richiedere i dati relativi all’account con cui si è effettuato l’accesso.
Tag: Google, seo, statistiche
Visualizzare le statistiche di Google Analytics con Javascript Parte 1
Nelle ultime settimane Google ha presentato le Google Analytics API con relativa sezione su Google Code, dando così la possibilità agli sviluppatori di sperimentarne l’utilizzo. L’approccio è molto semplice e può essere eseguito con diversi linguaggi.
I vantaggi principali dati dall’utilizzo delle API di Google Analytics sono:
- L’aggiornamento in tempo reale delle statistiche
-Accesso ai dati di Google Analytics dal proprio spazio web
-Semplicità di svluppo grazie al supporto fornito da Google
- Possibilità di utilizzo di Javascript
Tag: Google, seo, statistiche
Come indicizzare una pagina in Google in meno di 10 minuti
Sembra la promessa del SEO dell’ultima ora ma in realtà è una procedura utilizzata quotidianamente da molti blog che utilizzano Wordpress , ti sarà infatti capitato più volte di scrivere un articolo su un sito con questo cms e vedere il tuo contenuto nella serp pochi minuti dopo.
Questa procedura si basa sul fatto che Google Blog Search sfrutta i feed RSS/ATOM del sito per capire ogni quaanto questo viene aggiornato e venire a conoscenza dei contenuti più recenti.
In wordpress per esempio è facile rintracciare i feed RSS/ATOM inseriti automaticamente nell’head della pagina e visibili ad questo url.
http://www.nomedeltuosito.com/feed/atom/
Come si nota dal codice il contenuto riportato non sono altro che i nostri articoli con tutte i parametri quali categoria, autore,data di pubblicazione ed ultima modifica.
[...] <updated>2009-04-28T15:40:06Z</updated> <published>2009-04-30T05:00:39Z</published> [...]
Questi parametri permettono a Google Blog Search di capire quando viene pubblicato un contenuto ed è quindi necessario aggiungerlo all’indice.
Alcuni consigli utili per l’utilizzo di questo sistema sono:
1)Assicurati che il robots.txt non blocchi i feed ai tuoi articoli (per maggiori informazioni sui robot.txt leggi questo articolo)
2)Assicurati che ogni nuovo contenuto del tuo sito abbia un feed RSS/ATOM
3)Utilizza il servizio di Pinging di Google Blog Search
Dopo pochi minuti vedremo il contenuto aggiunto indicizzato su Google Blog Search e subito dopo nella Serp di Google.
Ho notato che questa tecnica funziona anche su siti privi di sitemap o la cui indicizzazione non è mai stata curata in particolar modo, occorre però ricordare che con questo sistema si ottiene una rapida indicizzazione che in seguito andrà comunque curata con backlinks, sitemap, ottimizazioni on page e altre pratiche che permettono ai SEO di posizionare in maniera degna il contenuto nella serp di Google.
Sarà infatti possibile rintracciare il contenuto sui motori di ricerca inserendo il titolo dell’articolo ma essendo stato appena indicizzato difficilmente si avrà una posizione ottimale nella serp per determinate keyword che richiede molto più tempo.
