La correspondance inédite du géomètre Gaspard Monge (1746-1818)

La correspondance inédite du géomètre Gaspard Monge (1746-1818)


Transcription en milieu numérique : zéro, une ou plusieurs transcriptions ?

Un des éléments de l’environnement numérique qui remet en question l’établissement des principes de transcription dans la tension traditionnelle  entre fidélité et lisibilité est la  possibilité de mettre à disposition ensemble et simultanément la transcription et une copie numérisée de l’archive.

Les principes de transcriptions varient selon la nature de la discipline, du contenu de la lettre mais aussi des usages envisagés. Il est important de ménager des usages qui ne se limitent pas à l’exploitation scientifique mais aussi des usages culturels, pédagogiques et artistiques.

Ainsi, il s'agit de préparer une informatisation de l’enquête scientifique en envisageant des usages pédagogiques et culturels et l’exploitation du corpus pour répondre à des préoccupations scientifiques de différents domaines.

Établir des principes de transcription  en considérant trois perspectives :

a/ être fidèle restitution du texte dans son intégrité linguistique, syntaxique conservant même ses impropriétés, ses lapsus (sic)

b/ être lisible faciliter la lecture du document et dépasser le déchiffrement

c/ être exploitable en milieu numérique : en envisageant la question de la visualisation, de la documentation, de l’interopérabilité.

Dans la discipline littéraire et dans une perspective génétique, les principes de transcription doivent être établis en prêtant une attention au retour et interventions sur le texte en train de s’écrire et de s’élaborer. Cela conduit à interroger les modalités de transcription et de codification d’un contenu.

Principes de transcription et traitement technique

La transcription est une étape décisive tant au regard de la visualisation que de la préparation du corpus à l’investigation informatisée. L’environnement numérique détermine la coordination entre pratique de transcription et d’encodage. Le principe de fidélité est étendu et détermine la pratique de l’encodage. La grande différence entre édition et éditorialisation réside dans cette pratique d’encodage informatique, de détermination de balises.  Pourtant ces pratiques relèvent des pratiques scientifiques de recensement et de classification des phénomènes et d’établissement de conventions propres à toute démarche éditoriale.

De l’encodage à l’annotation et à l’indexation

Dans l’élaboration d’un module de transcription, le développement technique choisit de se soumettre aux contraintes du principe de fidélité en visant l’élaboration d’un dictionnaire de TAG qui rassemble les besoins des différents projets de la plateforme.

La transcription se double des pratiques d’encodage en se confrontant alors à la question de la visualisation. La transcription doublée de l’encodage et réalisée en ménageant différentes  modalités de visualisation permet d’atteindre tant des objectifs de mise à disposition du corpus comme de sa préparation à l’enquête informatisée en envisageant différents domaines d’investigation. On pourra par exemple choisir de visualiser la transcription sans ou avec balises d’encodage. C’est en déterminant les usages scientifiques prévus, en relevant les différents types de phénomènes et en en dressant une typologie que les balises d’encodage nécessaires sont identifiées.

Avec la pratique de l’encodage coordonnée à celle de la transcription et de l'annotation intervient simultanément à la transcription. L’identification de personne et d’évènement est permise dès ce moment. Les informaticiens soulignent aux scientifiques qu’il faut s’arrêter là où la forme numérisée peut compléter sans avoir besoin d'ajouter une complexité à la transcription.

Normalisation et modernisation de l’orthographe

Le processus de normalisation s'étend aux accents, majuscules, apostrophes, traits d’union, abréviation et s’accompagne d’une détermination des différents phénomènes, de leur signalisation et de leur codification dans les principes de transcription.

Le processus de modernisation se pose peu pour le XXe siècle en revanche pour les siècles précédents établissement des principes en fonction du public et des disciplines envisagées pour l’exploitation du corpus.

La question est aussi de pouvoir homogénéiser l'ensemble des éléments du corpus constitué. Un corpus de correspondance est souvent établie à partir d’autographes mais aussi parfois de copies, et  il semble diffcile de maintenir dans un même ensemble une orthographe ancienne et moderne. 

La modernisation de l'orthographe est aussi nécessaire dans la perspective de l'utilisation des fonctionnaltés offertes par le développement technique comme un moteur de recherche.

Structuration du texte

La tentation d’aérer le texte de l’auteur est fréquente pour servir des fins de lisibilité.

Cela peut être envisagé si l’auteur introduit lui-même des subdivisons mais présenter un texte en continu ne le rend pas illisible et permet de rester fidèle.

Un objectif scientfique peut justifier un traitement éditorial qui intervienne sur la structure du texte. Ainsi, dans l’environnement numérique, la transcription doit donc être perçue comme une tâche à trois volets afin de permettre toutes les observations et manipulation :

- identifier les blocs textuels et illustrations, c’est-à-dire les nommer dans la terminologie de spécialité,

- délimiter les blocs textuels identifiés,

- caractériser ces blocs en fonction de leurs propriétés.

Ces trois opérations indissociables que l’on observe dans de nombreux traitements de données langagières peuvent se faire dans un formalisme XML. La Text Encoding Initiative (TEI) propose à cet égard des solutions issues de nombreuses années d’expérience de linguistes et documentalistes. [1]



Notes

[1] Thomas Lebarbé, « Du corpus littéraire au corpus linguistique : dématérialisation, restructuration, lectures rhizomatiques et analyses linguistiques des manuscrits », Corpus [En ligne], 8 | 2009, mis en ligne le 01 juillet 2010, consulté le 11 février 2017. URL : http://corpus.revues.org/1694

 


Navigation

L’édition de la correspondance de Gaspard Monge en quelques dates - Gaspard Monge (1746-1818) en quelques dates : La mélancolie de Monge

Édition de correspondance et enjeux biographiques :
Les motifs de l'action publique des savants - Interroger ensemble l’engagement révolutionnaire et la pratique scientifique du géomètre - L’idée de progrès : coordination de la pratique scientifique et de l’action publique - L'idée de progrès : un instrument de réforme de la pratique scientifique - L’idée de progrès : ses postures scientifiques et ses deux procédures - Les différentes réceptions de l’application cartésienne, les différences entre les œuvres des mathématiciens - L’idée de progrès : outil de réforme des rapports entre domaines mathématiques, entre mathématiques et techniques

Le corpus Taton 1795-1799 : l'engagement public et révolutionnaire - Panorama chronologique des ouvrages historiques consacrés au géomètre

Des principes d'édition aux principes d'éditorialisation :
Transcription en milieu numérique : zéro, une ou plusieurs transcriptions ? - Principes de transcription - Principes d'annotation appliqués pour l'édition papier - Principes d'annotation

Bibliographie - Inventaires de fonds d'archives

Mots-clés - Actualités du projet - Accès à la correspondance