Aller au contenu
  • Pas encore inscrit ?

    Pourquoi ne pas vous inscrire ? C'est simple, rapide et gratuit.
    Pour en savoir plus, lisez Les avantages de l'inscription... et la Charte de Zébulon.
    De plus, les messages que vous postez en tant qu'invité restent invisibles tant qu'un modérateur ne les a pas validés. Inscrivez-vous, ce sera un gain de temps pour tout le monde, vous, les helpeurs et les modérateurs ! :wink:

La recherche sur l'Internet


ipl_001

Messages recommandés

Bonsoir à tous,

 

La recherche sur l'Internet

.

S'il est une activité fréquente pour un internaute, c'est bien la recherche d'informations... savez-vous le faire avec efficacité ?

 

 

 

~~

... merci de faire part de vos commentaires dans Formations de base - Revitalisation du sous-forum !

... remarques, questions, désaccords...

Lien vers le commentaire
Partager sur d’autres sites

Bonsoir à tous,

 

Les ressources méconnues de Google -moteur de recherche

.

Pour retrouver le site Web de la recette en chinois du cassoulet de Castelnaudary parmi les centaines de milliards de pages de l'Internet, il faut qu'un moteur de recherche ait détecté la page, l'ait indexée de manière efficace pour la classer afin de pouvoir la restituer.

 

Ce papier ne parlera pas des activités de Google en dehors de son domaine de recherche sur le Web (pas de GMail ni de Google Earth, etc.)

Ce papier n'entrera pas dans le détail de la collecte et de l'indexation mais après quelques généralités permettant de situer les acteurs, exposera les manières de rédiger la requête pour utiliser au mieux le moteur de recherche Google pour en faire un moteur de trouvaille (en s'inspirant d'un document du magazine Sciences et Avenir -numéro spécial "Numérique" de novembre-décembre 2008).

 

~~

 

attach_ok.pngGénéralités sur la recherche Web

Quelques liens :

-> Wikipédia / LesMoteursDeRecherche.com / CCM

-> Referencement2000 / Abondance

Il y a une décennie, le roi se nommait Alta Vista et ses dauphins Lokace, Yahoo!, Voila, Lycos.

Les pages Web étant relativement peu nombreuses, les recherches se faisaient souvent par thème à l'aide d'"Annuaires" (classement par des humains), c'est à dire que les moteurs à partir de mots-clés ou de bouts de phrase étaient alors moins nécessaires.

En 1998, Larry Page et Sergey Brin ont lancé Google qui a rapidement pris possession du domaine en développant tout un nouveau pan d'industrie.

Google est utilisé maintenant par 80 % des internautes. Le chiffre d'affaires 2007 est de 16 milliards de dollars (et son bénéfice net est de 6 milliards de dollars).

Google a créé un vrai marché avec ce qui apparaissait au départ comme bien peu rentable et le domaine est devenu l'exploitation tous azimuts de l'information... regardez la rentabilité de Google !!!

Les moteurs de recherche d'aujourd'hui s'appellent Google, Yahoo! et Microsoft Live Search.

 

Alta Vista avait la suprématie de la recherche, la manière d'utiliser AV était une technique complexe à acquérir (tout un art). Google est arrivé avec une utilisation ultra simple rendue possible par une indexation très sophistiquée.

Le référencement de ses pages Web était quelque chose de complexe pour un webmestre ; c'est maintenant une chose à soigner mais plus simple que par le passé.

On dit qu'il y a des centaines de milliards de pages Web, que Google en indexe 30 à 40 milliards (Yahoo! et Microsoft LiveSearch de 15 à 20) grâce à des robots intelligents qui écument le Web pour en analyser le contenu, les classer, les indexer.

On disait jadis que Google revenait sur une page au bout d'une semaine. Je ne sais pas quel est l'algorithme mais je constate que Google a indexé mes messages avant la fin de la journée !

Google, ce sont 500.000 serveurs dans 50 immenses centres informatiques répartis dans le monde.

 

La batterie de robots Google s'intéresse au type d'adresses, aux titres, aux mots les plus fréquents, à leur position, etc. Ce qui a fait le succès de Google est le classement grâce à la notion de PageRank/popularité tenant compte des pages qui donnent un lien vers la page étudiée... mais ne cherchons pas plus car tout ceci est un secret soigneusement gardé.

 

Avec des centaines de milliards de pages Web et l'excellence du classement, le problème est plus maintenant la manière de poser la question de façon à ne pas se contenter de l'ordre standard d'affichage par popularité mais à filtrer correctement les réponses pour les obtenir les seules pages pertinentes (l'idéal est de passer de la consultation des 3 premières pages de 20 liens à la consultation des 3 à 10 premiers liens).

 

Les fonctionnalités les plus intéressantes de Google sont ignorées de la plupart de ses utilisateurs. Or, quelques astuces transforment cet excellent moteur en une redoutable machine à trouver !

 

attach_ok.pngLes recherches de base

Lien : http://www.google.fr/

Dans le cas le plus simple, la recherche s'effectue sur un seul mot, comme "briquet".

Mais dès que d'autres s'y ajoutent, attention à la formulation. Imaginons une recherche sur Pierre Briquet, médecin français du XIXème siècle.

Formulée avec les mots Pierre et Briquet, elle oriente Google sur des sites relatifs à la pierre à briquet !

Par contre, en plaçant Pierre Briquet entre guillemets : "Pierre Briquet", Google trouve en premier une courte biographie du médecin sur le site Wikipédia.

Les guillemets sont donc indispensables pour la recherche d'une expression exacte.

Avec un peu de sophistication, il est intéressant de jouer avec les signes + et - pour pouvoir forcer ou exclure certains termes. Par exemple CPL +courant -panneau -configuration est un moyen facile pour une requête concernant les systèmes de réseau CPL (courant porteurs en ligne) mais évitant les réponses sur le Panneau de configuration.

 

attach_ok.pngLes recherches expertes

La porte d'entrée des recherches expertes est la page Recherche avancée, accessible au bout de la barre de recherche.

Un formulaire permet d'orienter sa demande en fonction de la langue, du pays ou encore du format de fichier.

Pour retrouver le support d'une présentation en public, on cherchera plutôt des fichiers .ppt (conçus avec MS-Powerpoint). De nombreuses publications scientifiques seront, elles, au format .pdf (Adobe Reader). D'autres documents textes seront recherchés en .doc (MS-Word).

La ligne Domaines sélectionne ou exclut certains types de sites. Particulièrement intéressant pour éviter les sites commerciaux en .com ; par exemple, lorsqu'on s'intéresse aux fleurs et non à la vente fleurs, en choisissant seulement .org, les résultats concerneront essentiellement des institutions, des associations, etc.

La même ligne Domaines permet de limiter la recherche à un site tel www.spywareinfoforum.com si vous savez qu'il y a exactement la page que vous voulez (voir "Les opérateurs").

Similaires permet de rechercher des pages similaires à un site d'intérêt. Si vous cherchez des informations sur votre future voiture depuis le site de Renault, en tapant dans cette case www.renault.fr, vous obtiendrez la liste d'un certain nombre de ses concurents : Peugeot, Citroën, Fiat...

Liens permet d'autres recherches ; www.renault.fr permettra l'accès à tous les sites liés à Renault : les filiales, les concessions, etc.

Ces fonctions sont également accessibles depuis la page d'accueil de Google grâce à des opérateurs spécifiques.

link:www.nomdusite.fr est l'équivalent de la fonction Liens.

related:www.nomdusite.fr est l'équivalent de Similaires.

Lors d'une recherche, les résultats présentent par défaut, un maximum de 2 liens par domaine. Une inscription "Pages similaires" permet également d'activer cette fonction related:... et d'obtenir l'ensemble des pages.

NB : Aux autres fonctions de la Page avancée, correspondent également des mots-clés mais cette fois, insérés dans l'adresse elle-même ; ainsi à la langue anglaise correspond un paramètre &lr=lang_en ; à une recherche dans les sites américains correspond un paramètre &cr=countryUS ; etc. mais laissons ceci aux geeks et utilisons plutôt la page Recherche avancée.

 

attach_ok.pngLes opérateurs

Site: permet de rechercher un terme dans le site. Un outil important pour fouiller dans les grands portails comme celui de l'Union européenne www.europa.eu. Ainsi, OGM site:www.europa.eu trouve tout ce qui se rapporte aux OGM sur ce portail.

Vous pouvez, de la même manière, obtenir un moteur de recherche pour votre site personnel.

Allinurl: retrouve un site dont on a en partie oublié l'adresse. Ainsi allinurl:nouvelobs renvoie sur tempsreel.nouvelobs.com, le site temps réel du Nouvel Observateur.

Define: indispensable pour trouver une définition. Ainsi define:taxonomie donne accès à des définitions de la science du classement des êtres vivants.

 

attach_ok.pngLes fonctions spéciales

Plutôt que chercher une calculatrice ou un convertisseur de monnaie en ligne...

Convertisseur - pour savoir combien d'euros font 10 dollars, tapez dans la barre de recherche : 10 dollars en euros et aujourd'hui, j'obtiens "10 dollars américains = 7,80213779 euros" en même temps que des liens vers des sites Web spécialisés.

De même pour les autres principales unités monétaires.

Calculatrice - même principe que pour la conversion. Pour savoir combien font 12643 divisés par 26, tapez 12643/26 et le résultat s'affiche : "12 643 / 26 = 486,269231"

Traduction automatique - sur la page de résultats, si l'on clique sur [traduire cette page] à la fin du lien pointant vers un site étranger, on obtient une traduction en français des pages de ce site. Attention, il s'agit seulement de se faire une idée du contenu car ces traductions automatiques ne sont pas encore bien au point.

Retrouver les pages disparues - Il arrive que certaines pages soient supprimées par le propriétaire du site. Cependant, elles peuvent encore exister dans le cache, la mémoire de Google. Cliquez sur le lien En cache situé sous le résumé du site dans la liste des résultats... parfois très utile ! pas facile de supprimer les informations du Web !

 

attach_ok.pngQui se cache sous ce site : Whois ?

Important pour savoir à qui l'on a affaire, le Whois est un service qui permet de retrouver, à partir du nom d'un site, le propriétaire, ses coordonnées postales, son e-mail et même son numéro de téléphone.

Trois gratuits :

-> http://www.raynette.fr/services/whois/

-> http://www.gandi.net/whois

-> http://www.ovh.com/cgi-bin/whois.pl

Au fait, vous trouverez aussi là, l'adresse du service abuse !

 

~~

... merci de faire part de vos commentaires dans Formations de base - Revitalisation du sous-forum !

... remarques, questions, désaccords...

Lien vers le commentaire
Partager sur d’autres sites

  • 3 semaines après...

Bonsoir à tous,

 

Savez-vous vraiment chercher sur Internet?

.

 

Tout un site Web : "Les secrets de la recherche sur Internet" par les étudiants bien branchés - HEC Montréal !

 

Voici leurs astuces en 10 points :

 

 

 

-> Savez-vous vraiment chercher sur Internet?

 

 

 

Profitez également de tout leur site, de leurs Astuces supplémentaires et de leur Quiz

 

~~

... merci de faire part de vos commentaires dans Formations de base - Revitalisation du sous-forum !

... remarques, questions, désaccords...

Lien vers le commentaire
Partager sur d’autres sites

Bonsoir à tous,

 

Google -les guides

.

 

Quelques tutorials ont été écrits au sujet de Google et son utilisation : en voici quelques-uns.

 

~~

... merci de faire part de vos commentaires dans Formations de base - Revitalisation du sous-forum !

... remarques, questions, désaccords...

Lien vers le commentaire
Partager sur d’autres sites

Invité
Ce sujet ne peut plus recevoir de nouvelles réponses.
  • En ligne récemment   0 membre est en ligne

    • Aucun utilisateur enregistré regarde cette page.
×
×
  • Créer...