domenica 17 aprile 2011

Come funziona un motore di ricerca?

"In Internet si può trovare di tutto!".

Quante volte avete ascoltato questa frase? O l'avete pronunciata voi stessi? Questo è l'inizio del problema. Si può morire di sete per mancanza d'acqua (nessuna informazione) ma si può morire affogati se ci riversano addosso 100.000 litri d'acqua tutti in una volta!

I Motori di Ricerca sono gli "oracoli" a cui possiamo "chiedere" di cercare un argomento sulla rete per noi, specificando una o più parole per ottenere una lista di tutti i siti che contengono tali parole. Ogni motore utilizza delle tecniche di ricerca specifiche. Per verificarlo, basta fare la stessa ricerca, con motori diversi, ed osservare che si ottengono liste di siti diverse.

Tutti i motori però fanno essenzialmente queste tre cose:

  • cercano le informazioni sulla base di un pattern di parole chiave (crawling)
  • mantengono un indice di tutte le parole (indexing)
  • propongono un elenco di risultati ordinati in base alla rilevanza rispetto al pattern di parole chiave specificate nella ricerca (ranking)

E’ evidente che i motori di ricerca siano "affamati" di contenuti e cercheranno di premiare i siti con contenuti di qualità, perché la fidelizzazione dell’utente sarà proporzionale alla qualità del ranking che il motore riuscirà a proporre.

Nella fase di crawling, i motori di ricerca usano i cosiddetti Spiders, ovvero dei programmi che partendo da una singola pagina Web (solitamente dalla home page) navigano attraverso tutte le pagine ad essa collegate.

Per ogni link trovato nelle nostre pagine, lo Spider aprirà una nuova sessione ed effettuerà ricorsivamente la navigazione accedendo agli altri link presenti, provvedendo a memorizzare le parole trovate e la loro frequenza (il "peso").

Questa attività è propedeutica all'attività di indexing.

Il modo in cui le parole vengono selezionate e pesate può differire a seconda del metodo di indicizzazione usato. Google considera solamente le parole ed esclude gli articoli (a , al, di ,in ....) per velocizzare la ricerca, mentre Altavista indicizza tutte le parole (articoli compresi) per fornire risultati più esatti. Altri motori considerano soltanto le 100 parole con frequenza più elevata. Quindi il vostro sito risulterà posizionato differentemente in base al motore utilizzato per la ricerca.

A questo punto, forse dovremmo domandarci come si arriva a definire "il peso" di una parola presente nelle nsotre pagine. Indipendentemente dai diversi algoritmi adottabili, tutti i motori si basano sull'analisi dei Meta tags. Le parole associabili a specifici Meta tags assumono automaticamente un peso più rilevante rispetto alle altre.

Google, ad esempio,memorizza, per ogni parola, tipo e grandezza del font, nonchè il colore, ed usa tali attributi per ottimizzare la ricerca.Quindi le parole scritte con un font più grande (tipicamente il Titolo ed il Sottotitolo) avranno un peso maggiore rispetto al resto del documento.

I Meta tags sono dei tag html che possono essere usati all'interno di una pagina web per permettere ai motori di ricerca di indicizzare con maggior precisione la pagina stessa. Nel template del mio blog, ad esempio, ho indicato alcuni termini quali technical writer, scrivere, scrittura, manuale, tecnico, grafica, scrittore, ICT, IT, writer, babele, mestiere, artigiano, artigiano di babele, esercizi, manual, modello, model, business, communication, template, layout.

Rispetto a tali termini, Google posizionerà quanto meglio possibile le pagine del mio blog, ogni volta che un utente specificherà un pattern di ricerca contenente una o più parole contenute in tale lista.

Nei prossimi post cercherò di approfondire le tematiche che vi ho presentato oggi. A presto.

Condividi


Articoli correlati per categorie



Nessun commento:

Posta un commento