Google. Raggiungere risultati ottimali.

Page 1

Google. Raggiungere risultati ottimali. Matteo Munaretto INNOVE - Via M.Zampieri, 14 Thiene (VI) matteo.munaretto@innove.it Versione 1.0 27 Gennaio 2009

Abstract Google è il motore di ricerca certamente più conosciuto ed utilizzato nella rete. Introduco brevemente in questo elaborato le caratteristiche e il funzionamento di tale motore di ricerca in modo da poter capire come siano ricavate le informazioni e ottenere il massimo dal proprio sito internet utilizzando gli strumenti messi a disposizione da Google come arma vincente per il marketing dell’azienda.

Introduzione L’informazione è ciò che, per un osservatore o un recettore posto in una situazione in cui si hanno almeno due occorrenze possibili, supera un’incertezza e risolve un’alternativa, cioè sostituisce il noto all’ignoto, il certo all’incerto. In altre parole, essa riguarda il contesto in cui i dati sono raccolti, la loro codifica in forma intellegibile ed in definitiva il significato attribuito a tali dati.1

L’approccio standard nel valutare la bontà dell’informazione consta nel classificare un documento rilevante o meno rispetto al bisogno di informazione dell’utente. Questa valutazione avviene per mezzo della precision e della recall che misurano rispettivamente la frazione di documenti rilevanti tra i documenti recuperati e la frazione di documenti recuperati tra quelli rilevanti. Un utente che naviga in internet per ricercare informazioni sarà più interessato ad avere tutti risultati rilevanti nella prima pagina, vale a dire che i documenti recuperati siano più rilevanti possibili per la ricerca effettuta (alta precision). Un professionista quale un avvocato o un analista sono più interessati ad un’alta recall perché cercano informazioni precise e per loro altamente rilevanti e pretendono che sia recuperato dal motore di ricerca come prima voce. I primi motori di ricerca davano la possibilità all’utente di dare un proprio feedback sui risultati ritornati (relevance feedback) permettendo così di affinare notevolmente le ricerche a passi successivi. Questa tecnica, molto potente, non è stata adeguatamente utilizzata perché

Figura 1. Query expansion - “Gli utenti cercano anche...” suggerisce altri termine per completare la richiesta dell’utente 1

http://it.wikipedia.org/wiki/Informazione


l’utente in genere non è disposto a dedicare tempo nell’affinare le ricerche; vuole risposte rilevanti velocemente e nella prima pagina. Altro escamotage introdotto fu la query expansion che consiste nel generare suggerimenti alternativi o ulteriori alla stringa dell’utente per poter meglio indirizzare la ricerca (Figura 1). Alla fine del 1995 il motore di ricerca Altavista aveva indicizzato all’incirca 30 milioni di pagine che tendono a raddoppiare ogni pochi mesi. Queste innumerevoli pagine possono essere viste come un enorme grafo orientato2 dove ogni singola pagina presenta dei link che entrano ed escono rispettivamente verso altre pagine. In media 8-15 link per ciascuna pagina.

La ricerca di informazioni Capire questi collegamenti (link) nel web è molto importante perché è uno dei fattori che incide nel determinare l’importanza di una pagina rispetto a una ricerca. Il PageRank è una tecnica che classifica le pagine sulla rete assegnando ad ogni elemendo di un collegamento ipertestuale un peso numerico. Un valore tra 0 e 1 a ciascuna pagina. Come poi viene formalizzato il muoversi tra le varie pagine in questo grafo è compito delle catene di Markov3 ed altre operazioni che permettono dei salti casuali per evitare di finire in cicli infiniti. I tradizionali motori di ricerca si basano essenzialmente sull’incidenza di alcune parole presenti su una pagina web; Google si serve invece di centinaia di strumenti e algoritmi per esaminare la struttura del web e determinare quali pagine sono più importanti. Google si divide in tre parti distinte: GOOGLEBOT che naviga per la rete alla ricerca di pagine da indicizzare

2 3

http://it.wikipedia.org/wiki/Grafo http://en.wikipedia.org/wiki/Markov_chain

L’INDEXER che ordina ogni parola in ogni pagina e ne tiene traccia in un’enorme base dati. IL QUERY PROCESSOR che confronta la stringa richiesta dall’utente e ritorna il documento più rilevante. L’aggiunta di una pagina a Google avviene solamente tramite la sua pagina http:// www.google.com/addurl/?continue=/ addurl oppure dal GoogleBOT che scruta la rete come citato pocanzi. Altre tecniche sono da evitare perché costantemente studiate ed eliminate da Google stesso. Tra questi per esempio l’includere testo o collegamenti nascosti nelle pagine, il cloaking vale a dire presentare al BOT, che scruta i documenti, del contenuto diverso da quanto viene presentato poi all’utente o ancora reindirizzamenti o doorways. Google bandisce ogni forma di spamming ed elimina nel qualcaso il sito dal proprio motore. Loro stessi citano: [...] Our general advice is: Always focus on the users and not on search engines when developing your optimization strategy. Ask yourself what creates value for your users. Investing in the quality of your content and thereby earning natural backlinks benefits both the users and drives more qualified traffic to your site. [...] L’indexer di Google ignora, non indicizza, parole comuni chiamate stop words (per esempio: e, per, ma, ...), i segni di punteggiatura e di spaziatura multipla e converte tutte le lettere in minuscolo. Cerca invece costantemente di misurare alcune informazioni riguardanti il dominio, la data di registrazione e la sua validità, i DNS, il comportamento degli utenti, il tempo speso nelle pagine nonché cache e preferiti.


Suggerimenti per ottenere risultati migliori

pubblicità e della comunicazione online.

• Un maggior numero di pagine indicizzate da Google per uno stesso sito porta normalmente ad avere un valore di PageRank più elevato. • Cambiare sostanzialmente i contenuti con una certa incidenza ha un impatto notevole nel ranking di una pagina/ di un sito internet. • Controllare la bontà dei collegamenti ipertestuali all’interno delle pagine. • Aggiungere il più possibile il tag ALT nelle immagini, vale a dire la descrizione scritta associata a quell’immagine. • Le parole chiave (META Keywords Tag) sono totalmente ignorate da Google. • Prestare invece attenzione al titolo che si dà alla pagina. • Controllare che sia validato, ordinato e pulito. http://www.thefreecountry. com/webmaster/htmlvalidators.shtml

Google WebSite Optimizer

AdWords

https://adwords.google.com Gli AdWords di Google operano in funzione del budget che si ha a disposizione e sono il metodo più efficace per migliorare il proprio ranking. Ti permettono di inserire gli annunci sulle varie ricerche scegliendo le parole chiave che hanno maggior importanza per il proprio business. Non c’è un limite al budget, si può scegliere per esempio un metodo di pagamento giornaliero e un massimo per ciascun click. Durante la registrazione si viene guidati nel scegliere le parole chiave in base a stime e suggerimenti per poi pagare solamente quando un utente clicca sull’annuncio generato all’interno del motore di ricerca e non solamente quando viene visualizzato. I costi differiscono per stato e moneta corrente. Veloce comprensione del ritorno dell’investimento (ROI) tramite le metriche fornite e di capire quindi i vantaggi della

https://www.google.com/analytics/siteopt/ Questo tool messo a disposizione da Google offre la possibilità di migliorare la visibilità delle proprie pagine confrontandole con differenti versioni dello stesso permettendo così di capire cosa meglio attrae i propri utenti e arrivare ad un contenuto ottimale. Website Optimizer confronta due versioni differenti del sito online e ne valuta quale porta ad un migliore risultato (miglior conversion rate). Si viene guidati nel creare un esperimento per testare i propri contenuti nel modo seguente: • Si sceglie una pagina di prova e un pagina di conversione (conversion page); • Si aggiungono informazioni di test fornite dal tool stesso; • Si mettono le due versioni online anche se l’utente per ora non vede alcuna modifica; • Si possono fare le modifiche di marketing che si ritengono più opportune al contenuto delle pagine; • Aggiungere delle variazioni che si vorrebbero testare all’interno dello strumento e preview della pagina di test all’interno del tool; • Avviare l’esperimento; • Quando la pagina di prova viene aperta in un browser i tag aggiunti nella seconda fase contattano il WebSite Optimizer e visualizzano una combinazione delle variazioni inserite senza che sia diversa se richiesta più volte dallo stesso utente; • Se a questo punto l’utente prosegue verso la pagina di conversione (conversion page) questa configurazione viene tracciata positivamente; • Website Optimizer invia automaticamente dei report sullo stato dell’esperimento e quando raccoglie un sufficiente numero di informazioni presenta i risultati nel vostro account.


Riferimenti [July 12, 2008] “An Introduction to Information Retrieval” Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze Cambridge University Press - Cambridge, England [Février 2007] “Comment Google mangera le monde” Daniel Ichbiah - l’Archipel

Via Maestro Zampieri, 14 36016 Thiene (VI)

P.IVA e C.F. 03517410241


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.