WordNet
WordNet c'est Quoi ?
- Un dictionnaire informatisé dont l’unité de base est le concept (non le mot)
WordNet est une base de données lexicale pour la langue anglaise basée sur la recherche conceptuelle.
- WordNet peut être vu comme une combinaison de dictionnaire et de thésaurus. Une utilisation courante de WordNet est de déterminer la similitude entre les mots. C'est un réseau de mots liés par des relations lexicales et sémantiques. Les noms, les verbes, les adjectifs et les adverbes sont regroupés en ensembles de synonymes cognitifs (synsets), chacun exprimant un concept distinct.
- Les synsets sont interconnectés au moyen de relations conceptuelles-sémantiques et lexicales. Le réseau résultant de mots et de concepts significativement liés peut être parcouru avec le navigateur en ligne wordnetweb.
Liens aux interfaces WorNet
- Version en Anglais wordnetweb wordnetweb
- Version français en cours de développement wonef wordnet-Wonef
Organisation des résultats
- Les concepts sont organisés en 5 catégories : noms, verbes, adjectifs, adverbes, mots, grammaticaux (les mots gr. ne sont pas inclus dans le système)
- Répertorie mots, collocations et idiomes
Bref historique et version
1928
Le Oxford English Dictionary (OED) de Murray est compilé "selon des principes historiques". En se concentrant sur des preuves historiques, l'OED, comme d'autres dictionnaires standard, néglige les questions concernant l'organisation synchronique des connaissances lexicales.
1976
Les linguistes et les psycholinguistes ont exploré en profondeur les facteurs qui déterminent la structure contemporaine (synchronique) des connaissances linguistiques en général, et des connaissances lexicales en particulier - Miller et Johnson-Laird ont proposé que la recherche portant sur la composante lexicale du langage soit appelée psycholexicologie.
Un groupe de psychologues et de linguistes de l'Université de Princeton a entrepris de développer une base de données lexicales dans le sens suggéré par ces investigations (Miller) .L'idée initiale était de fournir une aide à utiliser pour rechercher des dictionnaires de manière conceptuelle, plutôt que simplement alphabétique. On peut dire que WordNet est un dictionnaire basé sur des principes psycholinguistiques.
Juin 1991
WordNet version 1.0 est sorti en juin 1991. Randee Tengi a supervisé une série de versions jusqu'à la v1.5 en mars 1995.
- Dans la Version 1.2 (1992) : 102 000 mots et 52 000 synsets; 100 utilisateur
- Dans la Version 1.5 (1997) : 168 000 mots et 91 600 synsets; 1000 utilisateurs; site
- Dans la Version 1.6 : 94.000 formes nominales, 10.000 formes verbales, 20.000 formes adjectivales et 4.500 formes adverbiales
1998
L'Euro WordNet a été construit sur 3 ans - structure liée à WordNet en langue européenne.
Mars 2005
La version Windows la plus récente de WordNet est 2.1, sortie en mars 2005, avec deux versions disponibles de la conversion: Basic et Full.
Décembre 2006
Version 3.0 pour Unix / Linux / Solaris / etc. a été publiée en décembre 2006. La version 3.1 n'est actuellement disponible qu'en ligne. Certaines modifications ont été apportées à l'interface graphique et à la bibliothèque WordNet en ce qui concerne les recherches d'adjectifs et d'adverbes. La recherche de l'adjectif "Synonymes / Noms associés" a été renommée "Synonymes" et de la même manière, la recherche adverbe "Synonymes / Adjectifs de tige" a été renommée "Synonymes". Une recherche distincte de "noms associés" a été insérée pour les adjectifs, et une recherche distincte "d'adjectif de base" a été ajoutée pour les adverbes.
Dernière version
La dernière base de données en ligne de WordNet version 3.1 contient 1 555 327 mots organisés en 1 75 979 synsets pour un total de 2 077 016 paires de mots; sous forme compressée, il fait environ 12 mégaoctets.
Quelles sont les relations lexicales majeures ?
Relations lexicales: Le sens d’un mot est aussi déterminé par ses relations sémantiques avec d’autres sens (ex: chien/caniche,doberman etc.)
- Wordnet est structuré par des relations entre synsets et entre mots;
- Les principales relations lexicales utilisées sont les suivantes:
- Synonymie - (Deux mots sont synonymes s’ils sont interchangeables dans certains contextes linguistiques) Les synonymes sont des mots qui ont des significations similaires. Différentes façons d'exprimer des concepts connexes. Utilisé dans différents contextes, il a des implications différentes. Un ensemble de synonymes ou synset est un groupe de synonymes. par exemple: chat, félin, chat siamois.
- Polysémie - La plupart des mots ont plus d'un sens. Homonyme même son et orthographe avec une signification différente, comme, banque (rivière) contre banque (financière). Polysémie différents sens du même mot.
- Métonymie - Utilisez un aspect de quelque chose pour représenter l'ensemble. La plupart des noms collectifs relèvent de cela.
- Hyponymie / Hypernymie - relation ISA. Lié aux catégories de niveau super ordonné et subordonné. Les hypernymes sont les synsets qui sont plus généraux, les hyponymes sont les synsets qui sont plus spécifiques. par exemple: hyponyme (émeu, brid), hyponyme (oiseau, animal), hypernyme (animal, oiseau). relation lexicale entre sens; X est un hyponyme de Y si Un X est une sorte de Y est vrai; relation transitive et asymmétrique qui génère une hierarchie d’héritage; centrale pour l’organisation des noms
- Méronymie / Holonymie - Relation partie / ensemble. Les holonymes sont l'inverse des méronymes. Les holonymes sont des éléments dans lesquels l'élément est contenu. Les méronymes sont des composants ou des substances qui composent l'élément. par exemple: meronym (écorce, arbre), holonym (arbre, écorce). Méronymie : relation lexicale entre sens; X est un méronyme de Y si Un Y a une X (comme partie) ou Un X est une partie de Y est vrai; relation transitive et asymmétrique qui génère une hierarchie d’héritage;
- Antonymy (Antonymie) - contraires lexicaux. par exemple: antonyme (grand, petit). Très importantes pour les adjectifs et les adverbes