IntersTICe IntersTICe
Configurations La recherche documentaire : Pour participer à la
mise à jour de ce site, communiquer vos informations à
IntersTICe IntersTICe |
Professeur
Philippe Rossignol
Courriel :
Sur les moteurs
de recherche généraux, c'est à dire ceux ayant de
très importantes bases de données, n'importe quelle requête
simple retourne plusieurs dizaines de milliers de résultats. Sauf
chance exceptionnelle, les sites potentiellement intéressants ayant
trait au sujet recherché sont noyés dans des milliers d'informations
inutiles.
Lorsque c'est possible, l'utilisation d'opérateurs restreint considérablement
le champ de la recherche en diminuant le "bruit".
[ Le "bruit" produit par un moteur de recherche est constitué
par tous les résultats inutiles générés par
une requête]
Les mots clefs peuvent être classés en trois
catégories :
- Primaire ou large
- Secondaires ou profonds
- Interdits
Avant de débuter une recherche, la préparation
d'une liste de mots clés est nécessaire dans ces trois catégories.
Réduire les bruits (somme de résultats non pertinents).
Majuscule à bannir, tout en minuscule et sans accents conseillé
sauf si vos connaissez l'orthographe exacte du mot.
Ordre des mots clefs : Le premier est souvent pris en compte
comme le plus important.
Entre guillemet, l'ordre des mots est très important.
LES OPERATEURS :
LIMITATION DE CERTAINS CHAMPS |
||
title:x |
Le mot ou la phrase doit être dans le champ titre ou dans le meta-titre. Note : pas d'espace entre title, les deux points et l'expression. |
· title:café recherche les pages dont le titre
contient chocolat. |
url:x | Le mot doit être dans l'URL ou l'adresse du site. | · url:art.com recherche les pages dont l'URL ou l'adresse contient "art.com", comme www.art.com ou www.art.com/creation.htm |
link:x |
Le mot ou la phrase doivent être dans le lien, mais pas nécessairement dans l'URL. Les liens sont des URL renvoyant à d'autres documents. L'adresse d'une page est une URL; dans cette page, il y a des liens. Attention : omettre le http:// |
· link:ifa.gr recherche les pages ayant un lien vers "ifa.gr". · link:ifa.gr AND NOT |
text:x |
Le mot ou la phrase peuvent être n'importe où dans le texte de la page. Note : cela exclut images, liens et URL. |
· text:"belle marquise, vos beaux yeux me font mourir d'amour" recherche les pages dont le texte contient cette phrase. |
image:x | Recherche les images dont le nom contient x. | · image:lys recherche les images dont le nom contient "lys" comme lys.jpg ou fleurdelys.bmp. |
anchor:x | Recherche les pages ayant des boutons ou des liens contenant le mot ou la phrase dans le texte de l'hyperlien. | · anchor:moteur recherche les liens disant "moteur". Par exemple, un lien moteur renvoie sur www.google.com. Si ce lien s'était appelé engin, anchor:moteur ne l'aurait pas trouvé, même s'il renvoie toujours sur www.google.com. |
host:x |
Recherche les pages sur un hôte déterminé. (Nom de site) Un hôte est par exemple "multimania.com" ou "www.google.com". A ne pas confondre avec le domaine qui est "fr" ou "com". |
· host:multimania.com recherche les pages sur le serveur multimania.com. |
domain:x | Recherche les pages appartenant à un domaine déterminé. | · domain:org recherche les pages appartenant au domaine "org". |
applet:x | Recherche les pages contenant l'applet Java x. | · applet:morph |
RECHERCHE DE PHRASES
|
||
"phrase" | Recherche les pages contenant les mots ou la phrase exacte. | · Expression entre guillemet "voiture de sport" est différent de "voiture de tourisme". |
TRONCATURE
|
||
xxxx* |
Possibilité de demander " tous les mots qui commencent par " * remplace une suite de caractères (jusqu'à 5). Peut être au milieu d'un mot. |
· chocolat* trouve chocolat, chocolatine ou chocolaté. |
OPERATEUR BOOLEEN
|
||
x AND y | Recherche les pages contenant x ET y. | · Dylan AND Thomas trouve les pages contenant à la fois "Dylan" et "Thomas" |
x OR y | Recherche les pages contenant x OU y. | · Dylan OR Thomas trouve les pages contenant "Dylan" OU "Thomas" |
x AND NOT y | Recherche les pages contenant x MAIS PAS y. | · Dylan AND NOT Bob trouve les pages contenant "Dylan", mais pas "Bob". |
x NEAR/n y |
Recherche les pages dont x est éloigné de y d'au plus n occurrences. Pratique pour trouver des termes associés dans le même contexte. |
· Dylan NEAR/5 poète trouve les pages dont "Dylan" est éloigné de "poète" d'au plus 5 mots. |
( ) |
Les parenthèses groupent des actions. |
· Dylan AND (poète OR scénariste) trouve les résultats contenant Dylan ET poète, OU Dylan ET scénariste. |
CASSE
|
||
Dans les requêtes, les mots en minuscules équivalent à des mots en minuscules, en majuscules, ou en minuscules et majuscules mélangées Les majuscules dans les mots équivalent uniquement à des majuscules. Même principe pour les accents. |
· aimé équivaut à Aimé, AIME ou aIMé. · Aimé équivaut à Aimé, AiMé, mais pas aimé. · AIME n'équivaut qu'à AIME mais pas à Aimé. |
Pour certains moteurs de recherche, les expressions booléennes sont remplacées par d'autre signes :
l'opérateur booléen (Possibilité
de lier plusieurs mots d'une requête par) :
|
équivaut à :
|
|
OU |
OR
|
|
|
ET |
AND
|
& ou +
|
SAUF/SANS/ET NON |
AND NOT/NOT
|
&! ou -
|
NEAR/n
|
^n
|
Les Annuaires sont des bases de
données de fiches descriptives de sites Web.
Les moteurs effectues une recherche
sur les pages Web.
Les Méta-moteurs sont des
logiciels ou sites Web interrogeant des annuaires et des moteurs simultanément
et synthétisant les réponses.
Recherche sur un site précis :
Sur Google :
motclé site:www.toto.com (Attention aux espaces : seulement entre
le mot clé et site)
Recherche dans les zones invisibles :
Voilà propose
keywords :
description :
La version " En cache " correspond à la
page telle qu'elle se présentait lors de la dernière consultation
effectuée par le moteur.
Il se peut que la page ait été modifiée depuis cette
date
Configuration des outils de recherches :
Les langues
Configuration des annuaires et moteurs pour le choix des langues
Dates des documents
La configuration de la dernière mise à jour des pages recherchées
Les catégories et les traductions des pages recherchées peuvent être paramétrées
Le nombre de résultat à afficher sur une page
Les interfaces dépouillées " Geeks " (idiots) :
Google : http://www.google.fr/
Voilà : http://www.voila.com/Geek
Altavista : http://www.voila.com/Geek www.raging.com
Meta moteurs :
Kartoo : http://www.kartoo.com/fr/kartoo.html
Metacrawler : http://www.metacrawler.fr/
Copernic
: un outil de base pour chercher sur le Web, combine plusieurs fonctions
de recherche évoluées avec une interface utilisateur intuitive.
Gratuit!
A télécharger et installer :
Copernic
: http://www.copernic.com/fr/desktop/products/agent/download.html
Open Directory
En Français http://dmoz.fr/