Usages optimisés de Google

Page 1

www.iut2.upmf-grenoble.fr

s e g a s s é U s i m i t op Atelier du jeudi 16 décembre 2010 Pôle Médiactice

Go de og le


Qu’est ce qu’un Principes généraux moteur de recherche ? Les moteurs de recherche sont des logiciels permettant : • • •

de consulter d'immenses bases de données constituées par des robots balayant automatiquement le Web.

Les moteurs excluent le « web invisible » : - contenus d’articles de périodiques scientifiques, catalogues de bibliothèque, bibliothèques virtuelles; - documents sur Internet dont le contenu est sécurisé.

Pôle Médiactice / Atel-TICE-16


Le tri de pertinence des moteurs

Principes généraux

Objectif : classer de façon automatique les résultats de recherche

Critères généraux Par rapport aux pages de résultats - présence dans le titre ou dans le premier tiers de la page - mise en exergue du texte (gras, taille des caractères). - présence dans l'adresse de la page - proximité des mots-clés sur la page Par rapport à la base de données du moteur : - rareté des mots (déterminé par le nombre d'occurrences du mot dans l'index) : des mots rares dans une requête ont un poids plus important que des mots communs - popularité des pages : indice de clic (basé sur l'audience) ou indice de popularité (basé sur le principe de citation).

/

Critères personnalisés Par rapport à la requête de l'internaute : - position des mots dans la requête : sur Alta Vista et Google, l'ordre des mots de la question n'est pas neutre. - correspondance d'expression : similarité entre le terme de la requête et son occurrence correspondante dans un document Par rapport à l’utilisateur identifié : - Géolocalisation : proposer des services proches de la situation géographique de l’internaute, soit par identification de l’adresse IP, soit parce que l’utilisateur a déclaré la ville où il habite - Historique des requêtes : les moteurs adossés à un portail gardent en mémoire toutes les requêtes faites par un utilisateur enregistré, de manière à proposer plus rapidement des résultats déjà consultés.

Pôle Médiactice / Atel-TICE-16


Les étapes de la recherche a. Quel est le type de travail à effectuer ? b. Quel type d’information est recherché ? c. Formuler un sujet de recherche d. Extraire les concepts e. Lier les concepts par une équation de recherche f. Traduire les concepts en mots-clés en veillant aux synonymes g. Choisir le ou les outils de recherche appropriés en fonction de vos besoins

Pôle Médiactice / Atel-TICE-16

Principes généraux


Stratégies de recherche

Principes généraux

par mots-clés

par sources

Objectif : rechercher par mots-clés sur le texte intégral des pages web indexées par des moteurs ou méta-moteurs ; •

Impose : – –

Objectif : chercher sur des sources d’information pertinentes par rapport à la requête ;

soit en amont un travail sur les mots-clés pour bien préciser sa recherche, soit l’utilisation « en aval » de l’environnement terminologique trouvé dans les premières réponses pertinentes ;

Beaucoup moins répandue, implique souvent une réflexion préalable dont la majorité des internautes veut se passer ;

Pour des recherches pros, indispensables à mener en parallèle de l’approche mots-clés.

Qualité inégale, succès plus facile sur des recherches « factuelles »…

Moteurs de recherche généralistes

Pôle Médiactice / Atel-TICE-16

spécialisés


Inc.

Moteur de recherche avec 60 milliard de pages indexées

Applications innovantes et Suite bureautique à distance

Pôle Médiactice / Atel-TICE-16

L’entreprise

Société créée en 1998 par deux étudiants •CA 2008 24 milliard $, R&D 2.8 milliards $ •23000 salariés (salaires augmentés de 10 % en 2009 + 20 % de l’ETP destiné à l’épanouissement personnel)


Part de marché du moteur

L’entreprise

Aux ETATS-UNIS

En FRANCE La part de marché de Google aux USA est en augmentation (78% en 2010)

Bing, lancé par Microsoft en 2009, représente 10 % de part de marché en 2010

La part de marché de Google en France est stable depuis 2007

Pôle Médiactice / Atel-TICE-16


Vers l’abus de position dominante ? Comme Microsoft en son temps, Google est accusé par ses concurrents d’abuser de sa position monopolistique. •

La Commission européenne a ouvert mardi 30 novembre 2010 une enquête formelle contre Google, pour abus de position dominante dans la recherche sur Internet.

L'Autorité française de la concurrence a mis fin le 28 octobre à la procédure contre Google, qu'elle a condamné pour abus de position dominante au mois de juin. Le moteur de recherche a été mis en cause pour ses pratiques publicitaires, à travers sa régie Adwords. Affaire NAVX : Cette start-up française, fondée en 2005, qui commercialise des bases de données de localisation des radars routiers pour GPS, avait déposé plainte au mois de février. Fin 2009, Navx s'était vu refuser la publications de liens sponsorisés pour ses services par Google, qui lui avait signifié que ces liens étaient "contraires à la politique de contenus" du moteur de recherche. Navx a alors demandé des explications à Google – qui édite par ailleurs son propre système de cartes (Google maps) et de navigation (Latitudes).

Pôle Médiactice / Atel-TICE-16

L’entreprise


La galaxie Google

Pôle Médiactice / Atel-TICE-16

L’entreprise


La page de recherche

Le moteur de recherche

Barre des produits Google qui contient des sous-menus : •Applications •Paramètres de recherche •Connexion et déconnexion

Barre de recherche Résultats de recherche Outils et filtres

Pôle Médiactice / Atel-TICE-16


La recherche simple

Le moteur de recherche

Langage de recherche •

Les booléens sont des opérateurs qui permettent d’effectuer des recherches en combinant des mots-clés. – ET : Utiliser le + devant le second motclé – OU : Utiliser « OR » entre deux motsclés – SAUF: Utiliser – devant le second motclé

L’opérateur de recherche « ET » est utilisé par défaut entre les termes de recherche

Accents, casse, mots vides et autres signes sont ignorés par le moteur de recherche

Recherche d’expression exacte : guillemets

Ordre des mots-clés est pris en compte dans la recherche. Source : UNIGE

Pôle Médiactice / Atel-TICE-16


Les fonctions de recherche

Le moteur de recherche

P么le M茅diactice / Atel-TICE-16


La recherche avancée

Le moteur de recherche

Pôle Médiactice / Atel-TICE-16


Les outils lingustiques Les outils linguistiques sont disponibles en cliquant sur le lien à droite du champ de recherche. Ils offrent les possibilité suivantes : • • • •

Traduction des résultats Tapez un mot en français il est traduit et recherché dans les langues sélectionné Traduire le texte suivant Langues disponibles pour l'interface de Google Basculez en un clic dans un interface en langue étrangère Visitez le site Google dans votre domaine local. Recherchez sur un site local de Google 2 autres outils disponibles : - Après avoir installé la barre d’outils Google, passez simplement le pointeur de la souris sur un mot en anglais pour que le Traducteur mot à mot affiche sa traduction dans votre langue. ! - La traduction de textes plus longs peut être faite sur Google translate : http://translate.google.fr

Pôle Médiactice / Atel-TICE-16

Aide à la recherche


La recherche instantanée •

Avec Google Instant, l'objectif est de diminuer le temps alloué à la recherche en rafraîchissant instantanément les résultats au fur et à mesure de la saisie d'une requête.

la technologie est doublée d'un système de remplissage automatique en anticipant la nature de la recherche avec l'ajout de mots-clés grisés.

 Objectif : économiser entre 2 et 5 secondes par requête. Nouveauté (septembre 2010)

Pôle Médiactice / Atel-TICE-16

Aide à la recherche


La loupe Une loupe vient de faire son apparition sur la page du moteur de recherche : •Un clic sur la loupe et une image de la page apparaît ; •Elle permet de visionner l'aperçu d'un site dans une vignette ; •Elle affiche également l'endroit où se trouvent les mots-clés recherchés dans la page ; •Un survol de souris sur les autres adresses affiche alors leurs miniatures. L’outil permet de visualiser rapidement le site pour vérifier son intérêt. Nouveauté (novembre 2010)

Pôle Médiactice / Atel-TICE-16

Aide à la recherche


Les favoris Personnalisez vos résultats de recherche en cliquant sur l'icône en forme d'étoile en regard du titre d'un résultat. •

Lorsque vous êtes connecté à votre compte Google, vos résultats favoris s'affichent chaque fois que vous effectuez la même recherche ou une recherche similaire (ainsi que vos éventuelles dates de consultation des sites dans les résultats de recherche !)

Vous pouvez également afficher la liste complète de vos résultats favoris en accédant à Google Favoris, à partir de la page google.com/bookmarks.

Pour supprimer un résultat de recherche favori, cliquez sur l'étoile jaune en regard de son titre.

 ajouter rapidement et facilement vos contenus Web préférés à vos favoris  Nouveauté (septembre 2010)

Pôle Médiactice / Atel-TICE-16

Aide à la recherche


Les outils pratiques

Pôle Médiactice / Atel-TICE-16

Aide à la recherche


Affiner les résultats Les fonctionnalités proposées permettent : •d'affiner la recherche, en filtrant les résultats, selon différents critères - nature et origine des résultats : vidéos, actualités, blogs, livres, forums - date : résultats récents, moins d'une heure, depuis 24 heures, depuis une semaine, depuis un an, choisir une période •d'afficher des termes associés pour poursuivre la recherche - présentation textuelle - présentation graphique avec la "roue magique", •d'affiner la chronologie, avec une frise sur laquelle on peut zoomer, - d'afficher des extraits plus longs ou des images, - d'avoir une traduction (approximative) dans une autre langue.

Pôle Médiactice / Atel-TICE-16

Options de résultats

Menu principal

Menu secondair e


Filtrage par support Il est maintenant possible de rechercher sur les réseaux sociaux en activant le filtre « En temps réel » D’autres supports d’information sont accessibles : forum et newsgroup (filtre « Discussion »), blogs

Pôle Médiactice / Atel-TICE-16

Options de résultats


La roue magique La roue magique permet de faire des recherches sur des termes associés. La roue magique : - donne au départ une représentation globale des résultats (termes, notions, événements...), - offre plusieurs alternatives (affiner la recherche sur certains points, l'élargir sur d'autres), - invite à se poser des questions, avant de poursuivre la recherche, - permet de préciser un mot ou un concept, - facilite les associations d'idées, invite à explorer des notions connexes et des sujets proches.

Pôle Médiactice / Atel-TICE-16

Options de résultats


La traduction de concept Google permet d’effectuer une recherche multilingue : • •

Le système de traduction est accessible en haut du panneau des options en cliquant sur le lien « Pages en langue étrangère traduites » Attention ! Cette traduction est approximative.  Par exemple, effectuez une recherche sur « test ». Cliquez sur « Pages en langue étrangère traduites » , la fenêtre ci-contre s'affiche.  Plusieurs possibilités sont offertes : > changer la langue d'origine (français), à partir d'un menu déroulant. > ajouter une langue de traduction dans la fenêtre. Par exemple : l'italien.

Pôle Médiactice / Atel-TICE-16

Options de résultats


Les recherches associées Les recherches associées sont un « reflet des recherches des internautes ». • Elle permettent de déterminer des tendances d’opinion, des modes… • En mai, la justice a estimé que Google avait porté préjudice à l'entreprise Direct Energie, dont le nom était associé avec le terme "arnaque".

Pôle Médiactice / Atel-TICE-16

Options de résultats


La frise chronologique Lorsqu'on choisit l'option d'affichage « Chronologie », des dates s'affichent avec un descriptif des informations trouvées sur le Web. •

Vous pouvez naviguer et cliquer où vous voulez dans cette frise, en "zoomant" sur des dates, sur les pics des histogrammes, etc.

Utilisation : –

pour des recherches historiques (ex : la philosophie grecque)

pour des biographies : vie et oeuvre d'un écrivain, d'un peintre, d'un personnage historique, relations éventuellement avec un autre (ex : Matisse et Picasso)

Pôle Médiactice / Atel-TICE-16

Options de résultats


Google répertoire

Les espaces verticaux

http://www.google.fr/dirhp?hl=fr

Un répertoire est outil de recherche qui se réfère à une base de données développée par des humains. – –

les ressources contenues sont évaluées par un sélectionneur Les sites Web intégrés dans le répertoire sont organisés hiérarchiquement par thème, et classés en rubriques et sousrubriques, afin de permettre la recherche par catégories. L’information peut être retrouvée à un ou plusieurs endroits

Deux modes de recherche : 1. Recherche par mots-clés 2. Furetage dans l’arborescence

Pôle Médiactice / Atel-TICE-16


Google scholar

Les espaces verticaux

http://scholar.google.com/

Outil de recherche développé par Google, permettant de rechercher de l’information de niveau académique disponible sur Internet. •

Parmi les résultats proposés, certains ont un accès sécurisé, vous ne pouvez alors que consulter la notice bibliographique, pas le document intégral.

Il est possible de compléter par une recherche en BU et obtenir un document via le service de prêt entre bibliothèques.

Pôle Médiactice / Atel-TICE-16


Google scholar

Les espaces verticaux

Quelle information trouve-t-on ? •

De l’information multidisciplinaire, les sciences et techniques anglo-saxonnes étant sur-représentées

Les communications scientifiques proviennent : – des Archives Ouvertes (ArXiv, HAL…), – des serveurs académiques (.edu, Universités, Grandes écoles…), – des éditeurs scientifiques participants à CrossRef, un système permettant d’ajouter dans les références bibliographiques des liens directs vers le texte en ligne (ACM, Springer, Wiley, Blackwell…) – Des bases de sommaires (IngentaConnect) et collections de périodiques, le fonds des revues de Elsevier avec ScienceDirect (un accord en 2007), – Des catalogues de bibliothèques et d’institutions (WorldCat, SUDOC, INIST…)

Contenu : Articles, thèses, livres, résumés, notices bibliographiques, textes révisés par un comité de lecture, pré-publications, résumés, rapports techniques…  Google scholar indexe une partie du Web Invisible

Pôle Médiactice / Atel-TICE-16


Google scholar

Les espaces verticaux

Les préférences de l’interface : •

Langue de l’interface : quatorze langues dont le français

Langue de recherche : 8 langues dont le français, par défaut pas de limite de langue

Ajout jusqu’à 3 bibliothèques pour bénéficier de la fonctionnalité « Library link » et avoir accès, selon les résultats récupérés, aux différents services proposés par la bibliothèque (ex : SUDOC, WorldCat, …)

Choisir le format pour l’importation des références vers un logiciel de gestion bibliographique

Pôle Médiactice / Atel-TICE-16


Google scholar

Les espaces verticaux

La recherche avancée : • • • • •

Des champs qui remplissent les fonctions des opérateurs booléens AND, OR, NOT Un champ pour la recherche d’une expression exacte Une recherche par auteur, nom de publication et intervalle de dates De sélectionner la recherche du terme dans tout le document ou de limiter au titre De limiter sa recherche de 1 à 7 domaines (Biology, Chemistry…). Attention, fonctionnalité disponible à partir de l’interface en anglais !

Pôle Médiactice / Atel-TICE-16


Google scholar

Les espaces verticaux

Les résultats de recherche proposent quatre types de documents : – – – –

La référence « normale » : lien vers une référence bibliographique + résumé de l’article « Lien direct vers texte intégral » d’un article : il s’agit d’un lien précédé des préfixes [doc], [pdf]... [CITATION] : signale ici qu’il s’agit d’une citation dans un article, n’est pas attachée à un lien [BOOK] : signale un livre, un ouvrage. Les livres sont souvent indisponibles en texte intégral mais il est possible de les localiser dans une bibliothèque à partir du lien « Library search »

Pôle Médiactice / Atel-TICE-16


Google scholar

Les espaces verticaux

Pourquoi utiliser Google scholar ? •

Pour une première approche et une recherche non exhaustive sur un sujet

Pour une recherche croisée et multidisciplinaire

Pour trouver des ressources en texte intégral, en libre accès

Pour suivre l’impact scientifique d’une publication sur le web

Pour trouver un article spécifique dans un journal spécifique

Pour trouver des ressources récentes

En complément des bases de données spécialisées

Pôle Médiactice / Atel-TICE-16


Google patents

Les espaces verticaux

L'outil effectue ses recherches dans le texte intégral de 7 millions de brevets déposés aux Etats-Unis auprès de l'USPTO.

Google va traduire les brevets européens en 38 langues : • En retour, l'OEB donnera à Google un accès à ses brevets traduits, ce qui permettra à Google d'optimiser sa technologie de traduction automatique. •

La technologie de Google sera utilisée pour traduire les brevets délivrés bénéficiant d'une protection en Europe provenant d'Asie, des EtatsUnis, du Canada, de l'Australie, de la Russie et de l'Inde.

Pôle Médiactice / Atel-TICE-16


Google patents

Les espaces verticaux

http://www.google.com/advanced_patent_search • •

Une recherche avancée multi-critères est disponible, permettant d'effectuer des requêtes par numéro de brevet, dépositaire ou date de dépôt. Sur le moteur de recherche Web, la syntaxe "patent" suivie d'un numéro pointe sur le brevet... Exemple : patent 5123123..

Un formulaire de recherche avancée permet de lancer une recherche selon les critères suivants : - numéro du brevet. Opérateur associé : patent: (exemple : patent:1247412) - inventeur du brevet. Opérateur associé : ininventor: (exemple : ininventor:edison) - cessionnaire du brevet. Opérateur associé : inassignee: (exemple : inassignee:fairchild) - classification américaine. Opérateur associé : uspclass: (exemple : uspclass:"99/385") - classification internationale. Opérateur associé : intlpclass: (exemple : intlpclass:"A63B 6308") - date de soumission - date de validation

Pôle Médiactice / Atel-TICE-16


Google code

Les espaces verticaux

www.google.com/codesearch Google permet de rechercher uniquement dans les codes source publics : API, programme en open source  Une grande partie du code concerne les applications Google et Android Options de recherche avancée : •recherche par mots-clés avec gestion des expressions régulières (en abrégé « Regexp ») •recherche par licence •recherche par package •recherche par nom de fichier •recherche par langue informatique : par exemple pour rechercher du code PHP : lang:php mysql_query

Pôle Médiactice / Atel-TICE-16


Google shopping

Les espaces verticaux

Le moteur de shopping utilise les notes données aux sites marchands par les internautes comme critère de pertinence.

Pôle Médiactice / Atel-TICE-16


Google livres

Les espaces verticaux

Permet de consulter sur le Web des ouvrages complètement ou partiellement numérisés.

Si l’ouvrage relève du domaine public, il est possible d’en télécharger librement un exemplaire en format PDF.

Si le livre est protégé, l’information est partiellement accessible : – –

Aperçus de livres (accès à plusieurs pages) Extraits de livres (limités à des passages très courts).

Pôle Médiactice / Atel-TICE-16


Google ebookstore

Les espaces verticaux

P么le M茅diactice / Atel-TICE-16


Le moteur spécialisé

Les applications de recherche

http://www.google.fr/cse/ Une application Google permet d’installer une recherche personnalisée sur un site Web ou sur un blog. Après avoir installé le champ de recherche sur le site Web, il est possible : • de personnaliser l'aspect des résultats pour qu'ils s'intègrent au site d’accueil. •d’inclure un ou plusieurs sites, des pages Web spécifiques

Pôle Médiactice / Atel-TICE-16


Google desktop search

Les applications de recherche

Cette application de Bureau permet d'effectuer des recherches en texte intégral sur le PC : •les e-mails, •les fichiers, •la musique, •les photos, •les chats, •la messagerie électronique Gmail.

Pôle Médiactice / Atel-TICE-16


Usages optimisés de Google Merci de votre attention Passons maintenant aux tests et exercices

Pôle Médiactice / Atel-TICE-16


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.