Abbiamo appena comprato il CD Remasters dei Led Zeppelin e vogliamo
assolutamente sapere tutto sugli stessi. Da dove cominciamo? Dal tasto ON
del nostro PC!
Un search engine (= motore di ricerca) non e' altro che un 'sistema'
specializzato nel trovare un QUALCOSA nell'immensita' del materiale
presente su Internet. Questo qualcosa puo' essere un determinato file,
informazioni su un argomento, un manuale, un e-mail... e noi dovremo
richiederlo con delle PAROLE.
Ma partiamo dal principio. I motori sono database (=archivi) realizzati
-ed aggiornati- secondo due tipi di procedure.
La prima e' di tipo automatico. Degli algoritmi specializzati
(=spider/agenti/robot) analizzano ogni URL (o meglio la relativa pagina) ed
estraggono i termini piu' idonei (=keyword) ad identificarne i contenuti
(ogni pagina sara' indicizzata con alcune keyword, ogni keyword punta a
svariate pagine). Il metodo e' semplice, veloce ma poco preciso : una
nostra interrogazione puo' restituire una marea di URL per la maggior parte
poco significativi.
La seconda e' manuale. La pagina viene osservata da una persona in carne
ed ossa che valuta con quali keyword indicizzarla. In questo caso
l'interrogazione ottera' URL molto attinenti. Purtroppo, dato il costo e
la lentezza del metodo, questi database contengono relativamente pochi URL
: rischiamo di non trovare le pagine che piu' ci avrebbero interessato.
Per interrogare l'engine inseriamo delle keyword ed il database ci
restituira' i corrispondenti URL. In pratica quando andiamo sull'engine
otteniamo un form (=modulo) dove indicare le parole. Queste potranno
essere legate fra loro da operatori logici OR AND NOT, rappresentati da
simboli come + ( " -. Purtroppo non esistono regole di interrogazione
assolutamente standard ed e' quindi fondamentale leggere le istruzioni/FAQ
di quel determinato engine. Posso pero' darvi un suggerimento: partiamo
usando le tre parole che descrivono meglio quello che stiamo cercando,
'leghiamole' con il simbolo + e scriviamo per prima quella piu'
significativa, ad esempio <"Led Zeppelin" + official + homepage> con
"Led
Zeppelin" piu' significativa. Traducendo abbiamo chiesto gli URL di
pagine contenenti contemporaneamente "Led Zeppelin", official ed homepage.
Alcuni motori permettono ricerche 'ad albero' (=directory): nella prima
pagina troveremo una serie di argomenti che puntano a sottoargomenti etc
etc. Bastera' scendere in profondita' per trovare -forse- quello che
cerchiamo.
2- I principali motori
Il motore per definizione e' YAHOO < http://www.yahoo.com
>, non per niente
e' il sito piu' visitato al mondo... E' mantenuto da 'umani' e per quanto
detto sopra e' preciso ma non vastissimo. Permette ricerche ad albero.
Menzione a parte merita HOTBOT < http://www.hotbot.com
>, considerato quello
con i migliori algoritmi di indicizzazione e con un potente -ma difficile
da usare- sistema di interrogazione.
Esistono anche i META (o MULTI) SEARCH : con un solo form interrogano i
principali motori (non dispongono di propri database), organizzano i
risultati e li presentano in una singola schermata. Il piu' noto e'
METACRAWLER < http://www.metacrawler.com
>
3- La situazione italiana
Esistono degli ottimi search engine che operano sui soli siti italiani (si
fanno ricerche usando parole italiane e si ottengono risultati in
italiano).
Molto interessanti sono i NEWS ENGINE per ricerche nei newsgroup (scansionano i testi dei messaggi). Segnalo per una ricerca classica sulle
parole DEJANEWS < http://www.dejanews.com
> SIFT < http://www.reference.com
>
Per estrarre tutti gli URL che sono state nominati in un certo newsgroup
usate GER < http://ibd.ar.com/ger/ >
Se vogliamo un certo SOFTWARE e' meglio urlare le 'raccolte software': non
permettono ricerche sofisticate ma troveremo sicuramente l'ultimo
aggiornamento di tutto il miglior Share e Free mondiale. I migliori sono
TUCOWS < http://www.tucows.com > SHAREWARE <
http://www.shareware.com > FILEZ
< http://www.filez.com >
Se ci interessa un determinato FILE (potrebbe essere un programma di cui
sappiamo il nome esatto) usiamo FTP SEARCH
< http://ftpsearch.ntnu.no/ftpsearch/
>, in pratica il database del contenuto
dei siti ftp.
Ennesimo tema di ricerca e' quello relativo alle informazioni sulle E-MAIL,
o meglio sui loro proprietari. E' possibile usare chiavi di ricerca come
cognome provider citta' etc etc. Alcuni nomi: IAF < http://www.iaf.net
>
FOUR11 < http://www.four11.com > BIGFOOT
< http://www.bigfoot.com >
Per cercare un determinato host ecco un DOMAIN NAME SEARCH come WUSTL
< http://www.ibc.wustl.edu/ibc/domain_form.html
>. Ad esempio se vi serve il
sito della societa' Nec digitate -nec- ed otterrete -www.nec.co.jp-.
Ci servono delle IMMAGINI per abbellire la nostra homepage? Ecco AV
PHOTOFINDER < http://image.altavista.com
> oppure I-SURF
< http://isurf.interpix.com/ >. Molto validi: presentano delle 'piccole
anteprime' delle varie immagini disponibili, scegliamo la migliore e
scarichiamo solo quella.
Mai sentito parlare di MP3 ? Ecco il relativo motore MP3 by Lycos
< http://mp3.lycos.com >
5- Registrarsi nei motori
Tutti motori danno la possibilita' di auto-indicizzare una pagina mediante
la compilazione di un semplice form. Se vogliamo segnalare ai principali
engine l'esistenza della nostra homepage dobbiamo per forza contattarli uno
per uno? Niente paura, andiamo su Submit-it < http://www.siteowner.com
>,
riempiamo un solo form ed il gioco e' fatto (teniamo presente che bastera'
segnalare la sola pagina principale, tutte le varie sottopagine verranno
visitate ed indicizzate direttamente dagli agenti seguendo i vari link).
Una cosa molto intelligente consiste nell'inserire degli appositi tag META
in tutte le nostre pagine html. Questi tag vengono usati per facilitare il
lavoro agli agenti software/umani dei search engine:
<HEAD>
<TITLE> Titolo della pagina </TITLE>
<META NAME="description" CONTENT="frase di descrizione meta ">
<META NAME="keywords" CONTENT="parole , per , descrivere">
</HEAD>
La pagina in questione sara' indicizzata con le keywords "parole per
descrivere" (separate da virgole!!) e ogni volta che il motore la dara'
come risultato verra' descritta con "Titolo della pagina" (evidenziata e
linkante la pagina) seguita dalla "frase di descrizione meta". Alcuni
motori esaminano anche il 'Titolo della pagina' , assicuriamoci che il
testo abbia attinenza con il contenuto.
Se invece vogliamo che la una nostra pagina sia IGNORATA (= non
indicizzata) dai vari agenti usiamo questi tag: