LDH

Petit Manuel Altavista


Altavista est un moteur de recherches archi-connu sur le web. Son URL est http://www.altavista.telia.com/cgi-bin/telia?country=fr&lang=fr pour la version française. Pas facile à retenir je l'avoue, mais une fois mis dans une liste de liens precieux, il n'y a qu'à cliquer ou appuyer sur une touche.

Pourquoi altavista et pas un autre, me direz-vous? Parce que je l'utilise depuis LONGTEMPS et que je le connais BIEN. J'avoue qu'il se laisse un peu aller... Le temps où le moteur renvoyait a toutes les requêtes des références de pages datant de moins d'une semaine est révolu.

Pour faire des recherches, j'utilise les requêtes simples. Vous n'avez besoin des requêtes étendues que si vous devez faire des ou, ce qui ne m'est encore jamais arrivé. En général, en effet, j'ai plus besoin de faire le tri entre les pages que me renvoie le moteur que d'élargir le champ de recherche.

Pour chercher quelque chose, il faut être le plus précis possible, donc mettre un maximum de mots-clefs. Si on ne donne pas de priorités (voir ci-dessous) l'ordre des mots compte pour l'affichage des résultats.

  • N'oubliez jamais que:
  • Les ponctuations sont ignorées par Altavista, les « soulignés » aussi (underscore). Les uns et les autres sont considérés comme des lettres, donc « 2_1  » constitue un seul mot pour la recherche, et ce mot est le même que « 2.1, », « 2,1 », « 2&1 » etc. (voir le chapitre sur les guillemets ci-dessous pour le concept de mot)

    Les accents sont gérés assez intelligemment: « éléphant » ne renvoie que les pages avec l'orthographe accentuée, alors que « elephant » renvoie les pages avec ou sans accents.

  • Utilisez les guillemets:
  • « ordinateur risc » renvoie les pages contenant à la fois les mots ordinateur et/ou risc, car ils sont séparés par des ESPACES sur la ligne de recherche, ce qui en fait deux mots distincts. Cela multiplie les réponses. « "ordinateur risc" », par contre, renvoie les pages contenant les deux mots accolés. « ordinateur.risc » est équivalent, puisque les ponctuations sont ignorées mais ne sont pas des séparateurs de mots. Seul l'espace tient ce rôle.

  • Utilisez les minuscules ou les majuscules à propos:
  • Si vous mettez vos mots-clefs en minuscules, la recherche se fera sans tenir compte de la casse. Ce n'est pas le cas si vous mettez des majuscules. Je ne sais pas faire une recherche sensible à la casse minuscule d'un mot.

  • Utilisez les priorités:
  • Si au lieu de mettre « metro paris » vous mettez « metro +paris », vous aurez bien entendu les pages contenant le mot metro, mais uniquement si elles contiennent aussi le mot paris. (vous aurez peut-ètre des pages sur paris où le mot metro n'apparaît pas, alors mettez plutôt « +metro +paris », voire « +métro +paris »).

    Vous pouvez aussi mettre un « -bouboule » pour éliminer les pages qui contiennent le mo « bouboule ».

  • Utilisez des mots-clefs le plus précis possible:
« parallel computer »: parallel:880852, computer: 7919748 (ignoré).
« "FPGA technology" »: FPGA technology: environ 400.

Le plus souvent, mettre des mots specifiques du champ sémantique de ce que l'on cherche est bien plus efficace que de mettre des termes génériques communs avec d'autres sujets.

  • Pensez à la langue de vos mots-clefs:
  • Mettre des mots non-ambigus en francais/anglais peut vous aider si vous cherchez des documents en français.

  • Utilisez les restrictions de recherche:
  • Ces restrictions de recherche sont censées vous permettre d'affiner vos résultats:

    • anchor:toto trouve des pages avec le mot « toto » dans le texte d'un lien.
    • applet:Mailer trouve des pages avec une classe d'objet Java « Mailer ».
    • host:motenai.ldh.org trouve des pages dans lesquelles « motenai.ldh.org » figure dans le nom de l'hôte du serveur Web.
    • image:ai.jpg trouve des pages avec un image dont le nom est « ai.jpg ». La recherche se fait sur le nom du fichier, pas sur le nom ALT.
    • link:ldh.org trouve des pages avec un lien sur une page de ldh.org.
    • text:LDH trouve des pages qui contiennent le mot LDH lisible (pas dans un lien ni une image).

    Voilà je pense qu'on a fait le tour. En maîtrisant un peu tout cela, vous pouvez arriver en deux minutes à une liste de réponses de longueur inférieure à 50, peu importe ce que vous cherchez au depart (si vous savez ce que vous cherchez bien entendu).

    Bonne chasse!


    Motenai