TIPS&TRICKS - GOOGLE
Indicizzazione su Google
N.B. QUANDO CERCHIAMO UNA INFORMAZIONE SUL WEB BISOGNA ESSERE MOLTO DECISI E ATTENTI, E RICORDARSI SEMPRE CHE SU INTERNET ESISTE SEMPRE L'INFORMAZIONE CHE STAI CERCANDO MA IN MEZZO A TANTA SPAZZATURA!!
GOOGLE HA INDICIZZATO OLTRE 8 MILIARDI DI PAGINE... E IN CONTINUO AUMENTO...
(CONVENZIONE di scrittura sotto: Le query saranno sempre indicate tra parentesi quadre: [query]. Queste parentesi non devono essere incluse quando si digita una query.)
SCELTA DELLE KEYWORD: FONDAMENTALE
PROVATE CON LE KEYWORD OVVIE.
EX: Se cercate informazioni su Picasso usate [Picasso], non [pittori].
PENSATE A QUALI PAROLE POTREBBERO ESSERE SULLA PAGINA CHE CERCATE.
EX: [Hotel Firenze] darà risultati più rilevanti di [un bel posto dove trascorrere il fine settimana].
NON STRUTTURATE LE VOSTRE QUERY SOTTO FORMA DI DOMANDA: è più probabile che troviate una pagina che contenga la domanda piuttosto che la risposta che cercate.
EX: [dove posso fare domanda per ottenere un visto per l'egitto], non vi sarà utile quanto questa query [domanda richiesta visto egitto].
CERCATE DI ESSERE IL PIÙ SPECIFICI POSSIBILE.
EX:[automobili modellino ferrari] vi sarà di più aiuto di [vecchi giocattoli].
Se la ricerca non da i risultati sperati PROVATE A CERCARE DEI SINONIMI delle keyword che state usando.
Cercate di pensare a una frase che potrebbe comparire sulla pagina e inseritela proprio come la potreste trovare.
EX: per cercare il titolo di una canzone che ho sentito in radio dico a Google di cercare tutte le parole che ho sentito in radio e aggiungo la keyword "lyrics" (che in inglese significa "testo" riferito a una canzone).
Se siete bloccati con le keyword, potete utilizzare questo Google Sets http://labs.google.com/sets/, un servizio che vi aiuta a costruire gruppi di oggetti con proprietà comuni.
EX: per dare aria ad una ricerca sulle arti marziali potete inserire keyword come karate, judo, jiu-jitsu, kung fu e kendo e Google vi restituirà una lista di arti marziali con cui potrete sviluppare il vostro lavoro.
OPERATORE AND (può essere omesso) Cercherà tutte le parole da voi inserite dando maggiore importanza a quelle pagine che contengono tutte le parole nell'ORDINE in cui voi le avete inserite.
Quando effettuate una ricerca è importante cercate di pensare a una frase che potrebbe essere contenuta nella pagina che cercate e inserire le parole che compongono quella frase.
Per cercare, ad esempio, il significato di una parola molto specifica a un determinato settore che non conosco e che non trovo sui dizionari specializzati, uso una query come segue: [definizione xxx] oppure [glossario xxx]. Dove xxx è il termine che mi interessa.
Il mio ragionamento è che una pagina che mi spiega il significato di una parola includerà anche la parola "definizione" o "glossario". Se avessi inserito solo il termine è molto probabile che avrei ottenuto solo pagine in cui viene utilizzato il termine nel corpo del discorso.
PAROLE COMUNI: Google ignora le parole ed i caratteri comuni, denominati anche "stop words" , scartando automaticamente termini come "http" e ".com" nonché alcune singole cifre e lettere, dal momento che questi termini non aiutano a restringere il campo di ricerca ma anzi contribuiscono a rallentare i tempi di ricerca. È quindi inutile inserire queste parole all'interno di una query.
EX: query come [iraq guerra golfo] e [iraq la guerra golfo] sono equivalenti.
OPERATORE "+" : anteponendo il + si include la PAROLA COMUNE nella ricerca.
EX: [Guerre Stellari Episodio 1] non cercherebbe il numero "1".
Così [Guerre Stellari Episodio +1] invece cerca anche 1.
UNA QUERY PUÒ AVERE MASSIMO 10 PAROLE. OLTRE IL LIMITE NON VERRANNO CONSIDERATE.
LETTERE MAIUSCOLE/MINUSCOLE O ACCENTI: non fa distinzione tra lettere minuscole e maiuscole poiché considera tutte le lettere come minuscole.
In caso di ricerche importanti è consigliabile provare più modi di scrivere la stessa parola con accenti o altri segni diacritici.
CORRETTORE ORTOGRAFICO verificherà automaticamente la vostra query per vedere se state utilizzando la versione più comunemente utilizzata per scrivere una parola. Se calcola che la probabilità di ottenere più risultati con un altro modo di scriverla sia alta vi chiederà se modificare la query.
Siccome il correttore ortografico si basa sul numero di ricorrenze di tutte le parole su Internet, Google è in grado di suggerire modi di scrivere la parola che non sono presenti sui dizionari comuni.
Alcune persone usano questo sistema per verificare l'ortografia di parole di cui hanno dei dubbi. Se Google suggerirà un altro modo di scrivere la parola inserita, allora ci sono buone probabilità che questa parola sia sbagliata.
OPERATORE OR: (Scritto in MAIUSCOLO) dice a Google di cercare una keyword oppure l'altra: è indifferente.
EX: [Hotel Firenze OR Roma] troverà quindi tutti gli hotel di Firenze e Roma anche se le due città non appaiono nella stessa pagina.
APOSTROFO: Cercare [dell'orto] e [dell orto] comporta risultati diversi.
GOOGLE SUPPORTA SOLO AND E OR E SONO SUPPORTATI PIUTTOSTO MALE.
EX:
[x AND y]
[x OR y]
[x AND (y OR z)]
[(x OR y) AND (z OR w)]
[x AND (y OR z OR w)]
[x AND (y OR z) AND w]
le parentesi quadre non servono; sono state incluse qui solo per chiarezza
A dimostrazione dell'ultima affermazione portiamo ad esempio questa query che, su Google, non funziona:
[(x AND y) OR (z AND q)]
OPERATORE "site:" specifica a Google di cercare solo tra le pagine di un determinato sito.
EX: [guerra golfo iraq site:www.corriere.it] cercherà solo tra le pagine del Corriere della Sera.
Funziona bene su siti che hanno dei grossi archivi che vengono aggiornati raramente e che non dispongono di una funzione di ricerca interna adeguata molto di meno su siti il cui contenuto cambia velocemente.
Questo operatore ha inoltre il vantaggio di trovare documenti male indicizzati da un sito o che non compaiono nel search interno. Addirittura, un documento non più linkato può essere ancora presente negli indici di Google, come pure un documento che è stato cancellato dal proprietario del sito (gli esempi migliori potete trovarli sul sito della Microsoft).
Cancellare qualcosa, che è stato reso pubblico su Internet, è molto molto difficile. Fate sempre attenzione a cosa divulgate: è difficile tornare indietro.
LE VIRGOLETTE: dicono di cercare la query esattamente come è stata inserita.
OPERATORE "-" : Il segno "-" prima di una parola ha l'effetto contrario al "+" indicato prima.
EX: per vedere quali siti linkano un determinato sito ["www.sandrodiremigio.com" -site:www.sandrodiremigio.com]
Le virgolette indicano che anche ".com" (cioè una parola comune va inclusa nella query).
Il segno meno invece dice a Google che "www.sandrodiremigio.com" non deve essere nel sito www.sandrodiremigio.com.
ALTRE RICERCHE:
[fedex xxx]: Per tenere traccia di un vostro pacco che viaggia con la Federal Express senza dover visitare il loro sito.
[ups xxx]: Per tenere traccia di un pacco che viaggia con l'UPS senza dover visitare il loro sito.
[usps xxx]: Per tenere traccia di un pacco che viaggia con la United States Parcel Service senza dover visitare il loro sito.
[patent xxx]: Per consultare l'ufficio brevetti Americano - xxx rappresenta il numero di un brevetto che conoscete
keyword1 keyword2 ["parent directory"]: (in questo caso le parentesi quadre fanno parte della query). Per cercare un software o un mp3.
RICERCA DI RADICI DI PAROLE (stemming):
Per garantire la massima precisione nei risultati, Google non supporta la ricerca di radici di parole ("stemming") né le ricerche con caratteri "jolly" (wild card). In altre parole, Google cerca solo le parole esattamente come digitate nel campo di ricerca. Se si inserisce [googl] o [googl*], il risultato non sarà "googler" o "googlin". In caso di dubbio, provare ad usare sia il singolare che il plurale; ad esempio "linea aerea" e "linee aeree".
Da notare che questo è valido per tutte le lingue tranne l'Inglese; lingua che invece supporta lo stemming.
OPERATORE "*" : I caratteri jolly non funzionano come siamo abituati. Normalmente l'asterisco, e il punto di domanda, sostituiscono uno o più caratteri all'interno di una parola. Ad esempio [port*] troverà "porta", "porte", ma anche "portone" e "portacenere".
Google lo interpreta invece in un altro modo, utilizzando l'asterisco come fosse una parola intera. Per trovare quindi "a caval donato non si guarda in bocca", possiamo usare la query [a caval * * * * in bocca]. Come potete vedere si possono utilizzare più asterischi all'interno di una query.
OPERATORE "~" : prima di una parola dice di cercare anche sinonimi e le parole correlate con la parola che precede.
EX: [cervino ~mappa] troverà anche pagine che includono le parole "passeggiata", "sentiero" e "bussola". Troverà alle volte anche i plurali di una parola e altri varianti grammaticali. La ricerca di prima troverà quindi anche "mappe" e "cartine". NB [solo su parole contenute nel dizionario Inglese]
RICERCA PER CATEGORIE
La directory Google è uno strumento molto utile per effettuare ricerche limitate su un argomento specifico. Ad esempio, per visualizzare solo risultati relativi al pianeta Saturno, è sufficiente selezionare "Saturno" nella categoria Scienze > Astronomia della directory Google. In questo modo si evita che vengano visualizzati risultati relativi alla macchina Saturn, al gioco omonimo o altri risultati che possano essere correlati al termine Saturno.
Le ricerche all'interno di categorie specifiche permettono di restringere il campo di ricerca e di visualizzare rapidamente solo le pagine desiderate.
http://directory.google.com/
PUNTI DEBOLI
Nonostante la grande rilevanza dei risultati di Google, anche questo motore ha i suoi limiti. Oltre a quelli già indicati in precedenza aggiungiamo che:
Google indicizza solo i primi 101KB di HTML di una pagina e circa i primi 120KB di un documento PDF.
Google ha problemi a cercare caratteri speciali come: &, %, #, @, $, £, €, +, -, /, *, =, <, {, [, (, ), ], }, >, :, ;, ! e ?
Solitamente ignora questi caratteri, ma sta cominciando a introdurre il supporto per alcuni come:
I/O.
Le note in formato anglo-sassone: A_, A#, B_, B#, C_, C#, D_, D#, E_, E#, F_, F#, G_, G#.
Si possono usare i caratteri speciali &, + e _ una o più volte nel mezzo o alla fine di uno parola. Ad esempio: A+, a_, C++, net__, page_count, i++++, a&b&c, i&&, "Johnson +& Johnson". Non si può però usare il "+" di fronte ad una parola o numero. Ad esempio +i, "++numero".
OPERAZIONI ARITMETICHE: Inserendo nel campo di ricerca l'espressione da risolvere e premendo invio oppure il pulsante di ricerca, sarà generato il risultato dell'operazione richiesta. Provate ad inserire semplici operazioni matematiche come ((10*2)/2)+2 oppure più complesse come (e^(i pi)+1) e vedrete i risultati.
USARE BENE: intitle, inurl e site.
intitle: limita la ricerca di quanto specificato dopo, ai soli titoli delle pagine web.
EX: intitle:dolomiti -> trova tutte le pagine nel cui titolo, appare quella parola, (sono 171.000, in italiano) che sono molte meno delle pagine raggiungibili con la solo keyword "dolomiti" (960.000). Provare per credere.
inurl: limita la ricerca ai soli URL.
EX: inurl:dolomiti -> trova pagine nel cui URL ci sia quella parola (128.000). Certamente dà risultati piuttosto diversi rispetto alla ricerca dell’esempio precedente e molti meno rispetto alla ricerca con la keyword "dolomiti".
site: limita la ricerca ai soli domini di un certo tipo.
Può essere usato in due modi, esempi:
site:com -> limita la ricerca ai soli domini che terminano per ".com" (24.600.000)
site:dolomiti.com -> limita la ricerca al solo sito "qualcosa.dolomiti.com" dove al posto di "qualcosa" può esserci appunto qualunque cosa (1.200).
TUTTI GLI OPERATORI DI GOOGLE SI POSSONO SOMMARE FRA LORO.
EX: (attenzione agli spazi) intitle:belluno inurl:dolomiti dolomiti piave
trova 342 pagine (in italiano) nel cui titolo appaia la parola "belluno", nell'URL la parola "dolomiti" e ovunque (magari in un punto qualunque della pagina) la parola "piave".