SEO

Quali sono i componenti principali di un motore di ricerca

Un motore di ricerca è composto da diversi elementi, ma le componenti fondamentali su cui si basa sono cinque:

  • Scheduler: la sua funzione è quella di pianificare quando i crawler dovranno prendere in carico il download di una risorsa presente nell’URL che gli è stata affidata;
  • Spider, crawler o robot: costruisce il Corpus (una raccolta statica di documenti), collezionando i dati in modo ricorsivo (per ogni URL noto analizza la pagina e cerca URL presenti in essa). Il lavoro principale di questo componente è quello di scandagliare un elenco di pagine web e, usufruendo di tecniche specifiche di catalogazione, raccogliere le informazioni e memorizzarle in opportuni repository;
  • Indexer: processa i dati generati dallo Spider, generando indici e metadati che facilitano la fase di ricerca (effettuata dal query processor). L’indexer svolge diverse funzioni, tra cui quella di catalogare e contenere le informazioni sui siti web, che vengono successivamente interpretate attraverso algoritmi e modelli statistici durante la fase di analisi e scansione dell’indice;
  • Parser: estrae la risorsa memorizzata nel repository e ne legge i contenuti, suddividendoli in base alla tipologia. Se la risorsa contiene link ipertestuali, questi ultimi verranno aggiunti al database di URL e memorizzati nel link graph. Durante questa fase, grazie a un sistema di metadati, i dati contenuti nell’indice vengono etichettati con ulteriori informazioni (lingua, genere, tasso di aggiornamento e così via). Tali metadati risultano decisivi per consentire al motore di offrire dati rilevanti;
  • Query processor o Search engine software: accetta richieste e fornisce risposte (può riformulare le query per correggere eventuali errori o per fornire un insieme di risposte eterogenee quando la ricerca non sembra andare a buon fine; classifica i risultati in base al grado di matching con la query, ma anche a un ranking ottenuto facendo link analysis).

L’architettura dei moderni motori di ricerca è in continua evoluzione per cercare di venire incontro alle nuove richieste degli utenti, cioè contenuti sempre più diversificati, multimedialità e interattività. Bisogna sapere che in questo scenario le variabili in gioco aumentano e cambiano repentinamente, perciò è necessario essere aggiornati e attenti alle mutazioni del mercato. Non dobbiamo dimenticare che i motori di ricerca sono anche e soprattutto potenti media il cui obiettivo principale rimane quello di produrre ricavi. Per quanto i risultati di un motore di ricerca possano sembrare autorevoli e obiettivi, la loro organizzazione risente della natura commerciale dell’azienda che lo ha creato e lo mantiene in vita.

Per aumentare il margine dei ricavi, l’azienda Google ha due possibilità: aumentare il numero e la qualità dei clic sui propri annunci pubblicitari (Google AdWords) o ridurre il costo del motore di ricerca. Possiamo renderci conto, quindi, di come sia importante per un sito web essere “economico” nei confronti di Google. Ad esempio, un sito che sia online da cinque anni tende a essere già “conosciuto” da Google, che farà passare il suo spider solo per gli aggiornamenti delle novità piuttosto che per scovare pagine nuove. Un sito pubblicato stamattina dovrà essere scovato da Google e il valore del sito dovrà essere calcolato per la prima volta. Un sito web più “snello”, cioè senza HTML inutile, sarà preferibile per il motore di ricerca, che potrà estrarre i testi con facilità

About the author

admin