I motori di ricerca rappresentano gli strumenti essenziali per garantire il soddisfacimento dei bisogni dell’utente, sempre più assorbito dall’utilizzo di Internet, strumento fondamentale nella vita di tutti i giorni per i motivi più svariati. Per cominciare a prendere confidenza con i principali search engines che popolano il mondo del World Wide Web bisogna abbozzarne una definizione: essi sono dei sistemi automatizzati in grado di esaminare una mole enorme di dati, riconsegnandoli in un elenco organizzato secondo dei contenuti. La grande quantità di informazioni restituite all’utente nel momento in cui vengono interpellati i motori di ricerca viene ordinata da complessi algoritmi matematici. Sono questi ultimi a definire l’importanza di quelle informazioni sulla base di una determinata combinazione di keyword (chiavi di ricerca).
Nello specifico, come lavorano Google, Yahoo! e tutti gli altri?
Il modo in cui i search engines analizzano il web è strettamente connesso ad alcuni elementi. In particolare, ecco i cinque pilastri su cui essi si basano:
- Scheduler: il suo lavoro è quello di pianificare quando i crawler devono effettuare il download di una determinata risorsa nell’Url che gli viene affidata;
- Spider (crawler o robot): ha il compito essenziale di scandagliare un database di pagine web e, sulla base di particolari tecniche di catalogazione, registrarle e classificarle in opportuni archivi (repository);
- Indexer: facilitano il compito di motori di ricerca, creando indici e metadati. Catalogano le informazioni sui siti, successivamente scansionate da algoritmi che le interpretano;
- Parser: estrae una risorsa dal repository e ne interpreta i contenuti, dividendoli secondo differenti tipologie.
- Query processor (definito anche Search Engine Software): ha lo scopo di esaminare nell’indice tutte le keyword che l’utente inserisce, riconsegnando, di conseguenza, una pagina web esclusiva per quella ricerca.
Un’ultima considerazione va fatta sulla differenza che intercorre tra un search engine e una directory. In queste ultime l’inserimento dei siti e dei portali web viene effettuato manualmente dal gestore, mentre, come detto, i motori di ricerca sono dei veri e propri programmi automatizzati che effettuano ricerche su database con milioni di siti web.