Accueil > Claude Simon > Œuvres > Index du vocabulaire des œuvres
Index du vocabulaire des œuvres
dimanche 31 mars 2019, par
Index du vocabulaire des œuvres de Claude Simon.
Du Tricheur au Tramway
Cet index du vocabulaire de Claude Simon remplace celui réalisé en 1993 au sein de l’équipe Hubert de Phalèse (Paris 3 Sorbonne nouvelle) à partir des textes numérisés par Patrick Rebollar et Pascal Mougin, qui est est resté consultable sur le site de l’équipe Hubert de Phalèse jusqu’en 2010.
– À lire pour en savoir plus :
Pascal Mougin et Patrick Rebollar, « Claude Simon, informatiquement », dans Claude Simon 2 : féminin / masculin. Textes réunis par Ralph Sarkonak. Paris : Minard, 1996, p. 183-204. (Revue des lettres modernes).
Cet index a été mis à jour en mars 2019 par Pascal Mougin et intègre les œuvres de Claude Simon publiées depuis le premier index, en particulier Le Jardin des Plantes (1997) et Le Tramway (2001), numérisées par Christine Genin. Comme l’index initial, il a été produit à l’aide de la version 4.30 du logiciel WordCruncher développé par Electronic Text Corporation à la Brigham Young University.
Les entrées correspondent aux différentes formes graphiques – environ 50 000 – repérées par l’automate. À la différence d’un dictionnaire, qui répertorie des unités lexicales – mots et locutions
– et distingue les homonymes, la forme première et les formes fléchies ou conjuguées d’un même mot constituent ici autant d’entrées distinctes, tout comme leurs éventuelles variantes élidées ou tronquées – abréviations, apocopes et aphérèses du style direct, transcription de mots altérés, lexies tératoïdes diverses –, tandis que les formes homographes – [les] avions / [nous] avions – restent confondues.
Chaque forme graphique est suivie de sa fréquence dans l’ensemble du corpus et des références de ses occurrences – titres abrégés des œuvres et numéros de page. Plusieurs occurrences d’une même forme à l’intérieur d’une même page ne donnent lieu qu’à une seule référence. Les formes de fréquence supérieure à 1000 (seuil qui correspond à une distribution moyenne d’une occurrence toutes les quatre pages) ne sont pas référencées.
Un codage manuel spécifique des fichiers-textes a permis le repérage spécifique de la plupart des noms propres – noms de personnages fictifs ou réels, toponymes, titres d’œuvres, noms d’institutions, etc. –, lesquels apparaissent ici en capitales. À la différence du vocabulaire général, les entrées correspondent autant que possible aux usages lexicographiques, à ceci près que les prénoms constituent des entrées à part entière même quand le patronyme est déjà répertorié.
– Télécharger l’index en pdf :