WordNet
WordNet c'est Quoi ?
- Un dictionnaire informatisé dont l’unité de base est le concept (non le mot)
WordNet est une base de données lexicale pour la langue anglaise basée sur la recherche conceptuelle.
- WordNet peut être vu comme une combinaison de dictionnaire et de thésaurus. Une utilisation courante de WordNet est de déterminer la similitude entre les mots. C'est un réseau de mots liés par des relations lexicales et sémantiques. Les noms, les verbes, les adjectifs et les adverbes sont regroupés en ensembles de synonymes cognitifs (synsets), chacun exprimant un concept distinct.
- Les synsets sont interconnectés au moyen de relations conceptuelles-sémantiques et lexicales. Le réseau résultant de mots et de concepts significativement liés peut être parcouru avec le navigateur en ligne wordnetweb.
Organisation des résultats
- Les concepts sont organisés en 5 catégories : noms, verbes, adjectifs, adverbes, mots, grammaticaux (les mots gr. ne sont pas inclus dans le système)
- Répertorie mots, collocations et idiomes
Bref historique et version
1928
Le Oxford English Dictionary (OED) de Murray est compilé "selon des principes historiques". En se concentrant sur des preuves historiques, l'OED, comme d'autres dictionnaires standard, néglige les questions concernant l'organisation synchronique des connaissances lexicales.
1976
Les linguistes et les psycholinguistes ont exploré en profondeur les facteurs qui déterminent la structure contemporaine (synchronique) des connaissances linguistiques en général, et des connaissances lexicales en particulier - Miller et Johnson-Laird ont proposé que la recherche portant sur la composante lexicale du langage soit appelée psycholexicologie.
Un groupe de psychologues et de linguistes de l'Université de Princeton a entrepris de développer une base de données lexicales dans le sens suggéré par ces investigations (Miller) .L'idée initiale était de fournir une aide à utiliser pour rechercher des dictionnaires de manière conceptuelle, plutôt que simplement alphabétique. On peut dire que WordNet est un dictionnaire basé sur des principes psycholinguistiques.
Juin 1991
WordNet version 1.0 est sorti en juin 1991. Randee Tengi a supervisé une série de versions jusqu'à la v1.5 en mars 1995.
- Dans la Version 1.2 (1992) : 102 000 mots et 52 000 synsets; 100 utilisateur
- Dans la Version 1.5 (1997) : 168 000 mots et 91 600 synsets; 1000 utilisateurs; site
- Dans la Version 1.6 : 94.000 formes nominales, 10.000 formes verbales, 20.000 formes adjectivales et 4.500 formes adverbiales
1998
L'Euro WordNet a été construit sur 3 ans - structure liée à WordNet en langue européenne.
Mars 2005
La version Windows la plus récente de WordNet est 2.1, sortie en mars 2005, avec deux versions disponibles de la conversion: Basic et Full.
Décembre 2006
Version 3.0 pour Unix / Linux / Solaris / etc. a été publiée en décembre 2006. La version 3.1 n'est actuellement disponible qu'en ligne. Certaines modifications ont été apportées à l'interface graphique et à la bibliothèque WordNet en ce qui concerne les recherches d'adjectifs et d'adverbes. La recherche de l'adjectif "Synonymes / Noms associés" a été renommée "Synonymes" et de la même manière, la recherche adverbe "Synonymes / Adjectifs de tige" a été renommée "Synonymes". Une recherche distincte de "noms associés" a été insérée pour les adjectifs, et une recherche distincte "d'adjectif de base" a été ajoutée pour les adverbes.
Sens lexical
Wordnet utilise deux moyens pour définir le sens d’un mot :
- Les synsets
- Les relations lexical
Synsets
Le sens d’un mot est représenté par (i) l’ensemble des mots utilisés pour exprimer ce sens i.e., par un ensemble de synonymes (les synsets) et (ii) une définition.
- Exemple : Pour la recherche du mot color (couleur)
S: (n) color, colour, coloring, colouring (a visual attribute of things that results from the light they emit or transmit or reflect) "a white color is made up of many different wavelengths of light"
- En cliquant sur S:
S: (n) color, colour, coloring, colouring (a visual attribute of things that results from the light they emit or transmit or reflect) "a white color is made up of many different wavelengths of light"
- direct hyponym / full hyponym
- attribute
- direct hypernym / inherited hypernym / sister term
- antonym
- derivationally related form