AIDE

INDEX

accent adjacence annuaire booléen casse domaine de recherche expression indexation formulaire
genre hit langage naturel majuscule métamoteur moteur moteur spécialisé mot-clé mot-chaîne
occurence pertinence présentation restriction suite de mots test troncature    

AIDE

Cette page reprend la présentation des fiches test réalisées pour présenter chaque moteur.

PRESENTATION

Comment s'y retrouver dans l'océan des millions de pages et références de l'internet ? En 2000, il y aurait environ 20 millions de sites dans le monde et plus de 2,5 milliards de pages dont 10 millions en français ; chaque jour des millions de pages en plus. Des outils de recherche d'information existent ; ils ont répertorié et classé les documents existant, et, en quelques clics, on peut trouver instantanément l'information recherchée.

Malheureusement les outils de recherche sont nombreux et parfois d'une utilisation complexe, chacun utilisant ses propres méthodes pour traquer et présenter l'information !

Voici les caractéristiques des principaux outils de recherche.

GENRE Il existe plusieurs outils :
  • Annuaire : appelé également "catalogue ", c'est l'outil de recherche le plus simple à utiliser, il consiste en un classement thématique arborescent où l'on accède au thème recherché par une série de rubriques et sous rubriques de plus en plus précises. Généralement trois consultations sont possibles : en feuilletant successivement les pages thématiques, par recherche géographique (rare), par un moteur de recherche par mot clé qui permet d'arriver directement à la bonne rubrique. Souvent les annuaires présentent un nombre restreint de sites référencés, pas toujours actualisés. Les meilleurs annuaires jugent la qualité des sites référencés. Les annuaires s'adressent soit au débutant, soit pour une recherche sur un domaine général et thématique.
  • Moteur de recherche par mots-clés : système qui permet de rechercher l'information à l'aide de mots-clés et de commandes logiques dans une base de données indexées. Les recherches peuvent être affinées par l'utilisation de divers opérateurs. Les moteurs permettent de trouver une information précise.
  • Métamoteur: à partir d'une seule requête de mots clés, il interroge plusieurs autre moteurs simultanément et propose les meilleurs résultats obtenus en évitant les redondances!
  • "Compils " de moteurs ne font pas de synthèse : affichent le résultat de chaque moteur
  • Moteurs spécialisés : la plupart des moteurs réalisent des recherches orientées Web, certains polyvalents s'intéressent à d'autres ressources de l'internet. Les moteurs spécialisés concentrent leur activité dans un domaine bien précis : recherche de News, d'adresses E-Mail, de sites FTP (téléchargement de programmes, sharewares, upgrade...etc ) et surtout : images, sons, vidéos...

Ces divers outils peuvent avoir diverses origines :

  • International :outil en anglais, souvent américain
  • International en version française: outil adapté en langue française
  • Francophone : outil en langue française, souvent d'origine québecquoise
  • Français

Remarque : il est devenu difficile de dissocier "moteur" et "annuaire", puisque le plus souvent les annuaires traditionnels proposent un moteur de recherche (ou réciproquement) qui, s'il n'a rien trouvé dans la classification, continue sa recherche comme "moteur traditionnel". Toutefois, dans cette présentation, la spécificité des outils de recherche est mentionnée ( le premier mot indiqué "moteur" ou "annuaire" indique la spécificité la plus forte)

DOMAINES DE RECHERCHE Quelle partie de l'internet est répertoriée ?

Web mondial, européen, francophone, français (certains moteurs proposent un choix)

News: les newsgroups, souvent riches en propositions, sont de plus en plus souvent sollicités. En savoir plus sur les newsgroups.

E-mail : les adresses électroniques sont également parfois recherchées (sans grand intérêt). En savoir plus sur le courrier électronique

Multimédia : vidéos Images Sons (en particulier le Mp3)


Fichiers spécifiques :PDF / Doc / rtf / xls / ppt ... c'est la dernière grande noueaté de recherche de certains moteurs (Google)

Logiciels et sharewares(FTP) : du simple fichier au shareware !

INDEXATION La méthode utilisée pour l'indexation des documents doit être connue :

Document entier: Tous les mots de toutes les pages du document sont indexés. Cette indexation donne un très grand nombre d'occurences dans les recherches, malheureusement souvent imprécises (puisqu'il suffit qu'un seul mot soit présent pour que le document soit indexé) ; par contre dans le cas de recherche d'informations rares ou très précises , cette indexation peut se révéler fructueuse.

Document partiel : l'indexation est réalisée parmi : le titre, le résumé, le début du texte, les mots clés, la fréquence des mots, les liens, les URL, les images, les sons ...etc. Cette indexation donne, en général, des résultats très précis. Désormais les moteurs permettent une recherche à un endroit spécifique d'une page ! (voir l'exemple d'Altavista)

Qui indexe ? Il faudrait aussi tenir compte de la manière dont l'information est connue :
- parfois, l'auteur d'un site le déclare volontairement aux moteurs ;
- le plus souvent des robots passent leur vie à visiter les sites
- les annuaires font intervenir... l'intelligence humaine qui analyse et trie les documents, tel "Yahoo" où le choix des catégories se fait par décision de l'équipe éditoriale.
Malheureusement:
- l'on ne connaît pas toujours les méthodes utilisées ! de plus, d'autres critères peuvent intervenir dans le choix des sites sélectionnés, comme leur "popularité", mesurée soit par rapport au nombre de visiteurs, soit par rapport aux nombres de liens s'y référant.-
-sur les 800 millions de pages web mondiales (pour fin 1999) seulement 42 % sont prises en compte par l'ensemble des moteurs et, chaque moteur ne couvre à lui seul que 10 à 20 % des pages!

AIDE Chaque outil de recherche a sa spécificité : chacun indexe et classe à sa manière, utilise ses propres paramètres de recherche et options, personnalise la présentation de ses résultats. Aussi doit-il expliciter avec clarté et rigueur son fonctionnement... ce qui n'est pas toujours le cas ! L'aide est donc appréciée :

Détaillée Convenable Incomplète Insuffisante Absente

PARAMETRES DE REQUETE

En général, les moteurs de recherche par mots-clés permettent deux types de recherche :

RECHERCHE SIMPLE

ou

RECHERCHE COMPLEXE

Une fenêtre de requête permet de rechercher :
  • 1 mot précis: le mot exact sera cherché. Ex: "fief" mais non " fiefs"
  • 1 mot "chaîne" : le moteur élargira sa recherche aux mots de la famille (quelquefois limité au pluriel ou au genre ou à l'orthographe voisine). Il arrive que le moteur soit capable de trouver des mots synonymes.Ex: Pour "désert", le moteur trouvera "désertique" "désertification" mais aussi "désertion" "déserteur"...
  • 1 suite de mots espacés (espace = souvent "ou") : le moteur cherchera les pages ou au moins un des mots sera présent. Il vaut mieux indiquer plusieurs mots dans la fenêtre de requête pour obtenir de bons résultats. Selon la recherche effectuée, on indiquera soit des mots proches ex: "seigneur" "vassal", soit des mots complémentaires ex: "Clovis" "baptême".
  • 1 expression avec " " : le moteur cherchera l'expression exacte ( ou mots adjacents). Ex : "taux de mortalité infantile"
  • Langage naturel : certains moteurs proposent  de taper une (vraie) question en langage "naturel" avec un résultat parfois étonnant
  • avec les critères : + - qui permettent de rendre obligatoire la présence ou l'absence d'un mot. Ex : +seigneur +vassal
  • avec les critères booléens : les critères "logiques"du mathématicien G Boole permettent d'affiner la recherche ; selon les moteurs, l'on utilisera divers opérateurs : les signes + - , les mots anglais AND OR NOT, les mots français ET OU NON ou SAUF, les signes & | ! , avec éventuellement des parenthèses. Ainsi " abbaye AND Normandie AND NOT Caen" doit permettre de trouver les pages concernant toutes les abbayes en Normandie sauf celles de Caen. La proposition "église OR cathédrale AND gothique" doit permettre de trouver les pages relatives aux édifices religieux gothiques.
  • Troncature : le joker * permet de n'indiquer qu'une partie du mot, souvent le début, pour indiquer au moteur de remplacer * par n'importe quelle lettre. Ex: Analph* doit trouver analphabète, analphabétisme .
  • Adjacence ,avec l'opérateur de proximité, NEAR ou près de, doit permettre de trouver des mots situés à proximité les uns des autres (l'environnement de recherche se situe souvent entre 10 et 100 mots, parfois davantage) ex : "commerce NEAR Maghreb" doit permettre de trouver les pages évoquant le commerce dans les pays du Maghreb.
  • Options de restriction: les moteurs proposent de limiter la recherche à certaines parties du document, au choix, parmi : lieux, dates, titre, lien, résumé, nom de serveur, URL, fréquence cde mots, images, sons, mot- clé,..etc. Attention, chaque moteur utlise une syntaxe particulière. Ainsi , avec Altavista, il faut indiquer : "title : pyramide" pour trouver les pages Web avec pyramide dans le titre . Idem pour "image : pyramide" ...etc

SPECIFICITES

Chaque moteur offre ses particularités dans la gestion des accents et des majuscules si chers à notre langue. Aujourd'hui, de gros progrès ont été réalisés, la plupart des moteurs gèrent correctement notre spécificité. Néanmoins, chaque moteur, ignore ou non la présence d'accents et majuscules dans la requête (appelé "casse" des caractères), et méconnaître le fonctionnement de la recherche, peut amener beaucoup de désagréments. Les outils de recherche ne daignant pas toujours préciser leur réaction, des tests ont été réalisés à partir de mêmes mots avec des casses différentes , par exemple des mots du type : chasse/châsse ; ré /Ré/ Rê ; mercure / Mercure ; corneille / Corneille; ..etc. Les différentes possibilités sont :

MAJUSCULES et MINUSCULES
  • casse ignorée
  • casse respectée
  • casse ignorée si des minuscules sont utilisées
  • casse respectée si des majuscules sont utilisées
ACCENTS
  • casse ignorée
  • casse respectée
  • casse ignorée si les accents ne sont pas utilisés
  • casse respectée si des accents sont utilisés

Egalement est précisé s'il existe des liens directs avec d'autres moteurs, ce qui peut être très utile en cas de recherche infructueuse.

LIENS avec d'autres MOTEURS
  • Non
  • Oui avec ce moteur :...........
  • Oui avec de nombreux moteurs

RESULTATS

La qualité et la précision de la présentation des résultats offrent un confort appréciable pour l'utilisateur:

Présence ou non d'options de choix de présentation, (compacte ou non, nombre de résultats par page) Classement pertinent avec % ou Non . Essentiel pour déterminer la qualité de la recherche.
Présentation de : titre, début, résumé du document, taille, date, langue, pays ..etc. Permet de déterminer rapidement la qualité de la précision de la recherche effectuée (grâce au début ou résumé de la page)
Nombre de résultats par page très variable selon la présentation demandée
Mémorisation des préférences personnelles : permet de retrouver un moteur personalisé
Traduction : possibilité de traduire la page web demandée
 

TEST en HISTOIRE GEOGRAPHIE

Ce test est réalisé dans un but pédagogique avec cette problématique : Un élève de collège/lycée doit faire des recherches d'histoire géographie à partir de mots clés issus du vocabulaire du programme ; il fait une recherche simple. Quels résultats obtient-il?

Procédure

-30 moteurs ou annuaires, essentiellement francophones, ont été testés, en janvier 2002, à partir des mots-clés suivants (toujours en minuscule, sans accent et en recherche simple)

mots clés

exemples de sites clés correspondant exactement à la demande

Remarques
a bataille formigny htttp://www.multimania.com/formigny/ un seul site correspond exactement au thème recherché
b photo omaha beach

http://www.6juin1944.com/ (200 photos) http://sboos.perso.ch/Normandie44/Jour_J/Omaha.htm#Gallerie
http://www.canadianbattleofnormandyfoundation.ca/study%20tour/photo_gallery2.htm
http://home.talkcity.com/passportpl/smeric/omaha.html

Recherche de photos sur le thème d'Omaha Beach, avec, pour les moteurs, le piège de 2 mots en "anglais". Volontairement, les recherches approfondies avec les onglets "images" ou "photos" proposés par certains moteurs n'ont pas été faites.

c texte discours bayeux

http://www.charles-de-gaulle.org/degaulle/discours/d160646.htm
http://www.histoo.com/texte/

La recherche est uniquement axée sur le texte du "discours de Bayeux" de De Gaulle.
d taux de mortalite infantile en afrique

http://www.ifrc.org/what/health/archi/factfr/FACTIMRF.HTM
http://www.ined.fr/population-en-chiffres/monde/afrique.html
http://www.ined.fr/population-en-chiffres/monde/tableaux2001/afriocci01.htm

La phrase entière est proposée afin d'obtenir, au minimum, des statistiques sur la mortalité infantile en Afrique

Appréciation

Points attribués
position
5
au moins 1 site clé en première position
4
au moins 1 site clé dans les 5 premières propositions
2
au moins 1 site clé dans les 15 premières propositions
1

ensemble des résultats permettant une approche sérieuse.

0
absence de référence valable
Total = note sur 20 donne la note attribuée au moteur

Voir les résultats : 30 moteurs sont classés