EcoLiReD

EcoLiReD


Principes de transcription

1. Principes de transcription sur tous les documents

Il y a eu deux phases de protocole. La deuxième phase a commencé au 2 octobre 2024. Elle est notée par une surbrillance jaune. Les lecteurs et les lectrices n'ont pas à reprendre les instructions du protocole 2 sur les lectures déjà faites. En revanche, nous les invitons à les appliquer sur les lectures en cours et à venir.

La transcription doit être la plus littérale possible.

1.1. Instructions de mise en page

Toutes les transcriptions doivent indiquer les retours à la ligne.

Les blancs de ligne (protocole 2) doivent être marqués par un saut de ligne. Voir en figure la touche "entrée". Cette opération est impossible sur e-scriptorium, à suivre seulement pour les correction sur des fichiers au format texte ou sur EMAN.

touche entrée clavier

Les lettrines (protocole 2) : les remplacer par des majuscules. Les encadrer par le symbole paragraphe "§". Ne pas insérer d'espace supplémentaire après le deuxième symbole "§".

ex. : §L§ettrine

Taille et police : ne pas tenir compte des différences de taille entre petites capitales et majuscules ni de police.

Les marginalia et les notes infrapaginales (protocole 2) : les encadrer des balises suivantes :

- pour les marginalia gauche : {{m.g}} en début et en fin de marginalia

ex. : {{m.g}}ceci est un marginalium gauche {{m.g}}

- pour les marginalia droite : {{m.d}} en début et en fin de marginalia

ex. : {{m.d}}ceci est un marginalium droit {{m.d}}

- pour les notes infrapaginales : {{n.i}} en début et en fin de notes infrapaginales

ex. : {{n.i}}ceci est une note infrapaginale{{n.i}}

Note concernant les appels de note (protocole 4) : faire précéder le chiffre en exposant faisant appel à une note marginale ou en bas de page par le symbole chapeau "^".

ex. : Ceci est un appel de note^1 dans le texte. Ceci est un deuxième appel^2 de note dans le texte.

1. Ceci est la note en bas de page correspondant au premier appel de note.

2. Ceci est la note en bas de page correspondant au deuxième appel de note.

Passages en italique : dans le texte original, les passages en  italique doivent être encadrés par le symbole "#" dans la transcription.

 ex. : #ceci est un passage en italique dans le manuscrit#

Nota bene : Si l'italique se trouve à cheval sur deux pages, il faut fermer à la fin de la page courante et rouvrir au début de la page suivante.

Chaque équipe traitant un corpus doit indiquer s'il a fait des transformations ou non sur des caractères : garder les s longs (ſ) ? les lettres u/v, u/n, i/j à garder ou à homogénéiser ?

Iconographie (protocole 3): tenir compte des images, vignettes, bandeaux de séparation, cul de lampe, fleurons, etc en encadrant la mention de cet enrichissement iconographique par une double accolade ouvrante (Mac : touches option et parenthèse ouvrante) et une double accolade fermante (Mac : touches option et parenthèse fermante).

ex1. : {{vignette}}

ex2. : {{bandeau}}

- pour l'équipe STIH pour toute image (enluminures, etc.)

ex3. : {{IMAGE}}

1.2. Instructions de mise en texte

Les coupes non syllabiques en fin de ligne (protocole 2) : les encadrer par un double slash "//".

ex1. : qui //éto-

ient// (Perrault, 1708)

ex2. : ma mère lui //envo-

ye// (Perrault, 1708)

ex3. : vous n'avez qu'à vous //baig-

ner// (Perrault, 1708)

Passages dans une autre langue (latin, grec, allemand, anglais, espagnol, italien, ...) (protocole 3) : les encadrer des balises suivantes :

- pour tout passage en latin : <la> en début et en fin de passage en latin

- pour tout passage en grec : <gre> en début et en fin de passage en grec

- pour tout passage en anglais : <en> en début et en fin de passage en anglais

- pour tout passage en espagnol : <es> en début et en fin de passage en espagnol

- pour tout passage en italien : <it> en début et en fin de passage en italien

ex. 1: <la>ceci est un passage en latin<la>

ex. 2 : <gre>ceci est un passage en grec<gre>

(protocole 6) : remplacer <...> par {...}

<la>passage en latin<la> --> {la}passage en latin{la}

<gre>...<gre> --> {gre}...{gre}

<en>...<en> --> {en}...{en}

<es>...<es> --> {es}...{es}

<it>...<it> --> {it}...{it}

Passages illisibles (protocole 3) : les encadrer des balises <ill>

ex. : <ill>ce passage est illisible<ill>

(protocole 6) : remplacer <...> par {...}

ex. : {ill}ce passage est illisible{ill}

Les passages barrés/annulés : dans le texte original, ils doivent être entourés de crochets dans la transcription.

ex. : [ceci est un passage barré/annulé dans le manuscrit]

Petites majuscules (protocole 6) : mettre {{M}} avant et après une suite de petites majuscules : 

ex. : M{{M}}ONSIEUR{{M}}

Majuscules rehaussées de jaune (protocole 6) : ajouter une étoile "*" avant chaque majuscule rehaussée de jaune.

2. Principes de transcription sur des corpus spécifiques

2.1. STIH

Note : Les modèles TRIDIS et cremma-generic-101 ne résolvent pas les abréviations. Le modèle documentary_best résout les abréviations.

Dans les deux cas, gardez la forme donnée par le modèle. Nous allons homogénéiser le tout dans une étape ultérieure.

Toute correction interlinéaire ou supralinéaire doit être entourée de parenthèses dans la transcription.

ex. : (ceci est une correction interlinéaire/supralinéaire)

Les rubriques : elles doivent être encadrées par le symbole dollar "$". Aucun espace ne doit être inséré après le dollar marquant le début de la rubrique et avant le dollar marquant la fin.

ex. : $ceci est une rubrique$

Nota bene : Au cas où une rubrique partagerait la même ligne que le texte, il faut encadrer de "$" la partie à l'encre rouge.

ex. : de sa mort o de sa vie $Que li veneor

le roi polibum troverẽt l'enfant$

Ensi com li sergãt $tot vif$

Découpage de mot en fin de ligne (protocole 2) : lorsqu'un mot est découpé en fin de ligne, marquer la fin de ligne avec le symbole tiret bas "_" :

ex1. : a ceaus qui tenoient sa compaig_

nie

2.2. CLESTHIA

2.2.1. Mise en texte

Distinguer les caractères suivants en fonction de la graphie moderne : <u>, <v>, <i>, <j>. Ne plus distinguer les caractères <u> vs <v>, <i> vs <j> qu'en cas d’ambiguïté.  Exemple : les noms propres, les cas où plusieurs possibilités de désambiguïsation peuvent se présenter en post-traitement. (protocole 4).

ex1. ambiguïté <u> et <v> difficile à résoudre en post-traitement : « loué »  / « lové »

ex2. ambiguïté <i> et <j> difficile à résoudre en post-traitement :

« maje » : cf Dictionnaire de l’Académie française (1694) dans « juge maje »

« maie » = huche à pain ou pétrin

Conserver les s long <ſ>

Les abréviations (protocole 2) : lorsqu'elles ont été conservées à l'océrisation, il faut les garder, en les marquant avant et après par un double symbole pipe (barres verticales) "||" (Mac : touches option et MAJ et L ; touches option et MAJ et L). Ajouter un espace après le double pipe ouvrant et un espace avant le double pipe fermant. Renseigner la forme développée juste après.

ex1. : mais encore aux || Frãçoys || François, voire à tous
|| eſtrãgers || estrangers de la douceur & libe¬
ralité de nos Princes (Harangue, 1557)

ex2. : voilà || M. || Monsieur le Marquis de Carabas qui se noie. (Le chat botté, Perrault, 1754)

Les mots agglutinés ou à l'inverse sursegmentés (protocole 2) : enla -> en la (changement de protocole pour les relectures à venir et non pour les relectures passées, voir ci-dessous)

Les marquer avant et après par le symbole pipe (barre verticale)"|" (Mac : touches option et MAJ et L). Ajouter un espace après le pipe ouvrant et un espace avant le pipe fermant. Renseigner la forme dessoudée juste après.

ex1. : la chose | quelle | qu'elle voulait

ex2. : ayant considéré | qu'elle | quelle douleur se lui seroit (Le Petit Poucet, Perrault, 1708)

Les homophones grammaticaux et lexicaux (protocole 2) : les marquer avant et après par le symbole "£". Renseigner la forme exacte juste après.

homophones lexicaux :

ex1. : £La au£ Là haut (La Barbe Bleue, Perrault, 1708)

ex2. : mettre en ligne de £conte£ compte (Le Petit Poucet, Perrault, 1708)

homophones ou quasi-homophones grammaticaux :

ex1. : les petits garçons s'£étoit£ étoient cachés

ex2. : lors qu'elle ne croyoit pas £qui£ qu'il fut encore onze heures (Cendrillon, Perrault, 1708)

Nota bene : Pour les homophones grammaticaux portant sur des formes verbales pronominales mettre la lire ouvrante après le pronom et avant la forme verbale homophone.

La didascalie (protocole 2) : les encadrer par des accolades {}. 

ex. : {ceci est une didascalie}

Les coquilles (protocole 2): On recommande de les conserver, car cela permet d'évaluer la qualité formelle du manuscrit du texte imprimé. Mais, pour les besoins de la lemmatisation, on recommande de leur juxtaposer la forme rectifiée. La forme comportant une coquilles sera encadrée par un double pourcentage "%%".

ex1. : en %%linge%% ligne de compte (d'après Perrault, 1708)

ex2. : %%eu%% en ligne de compte (d'après Perrault, 1708)

Passage manuscrit dans un imprimé (protocole 5) : encadrer tout passage manuscrit dans un imprimé des balises suivantes :

ex. : <ms>ceci est un passage manuscrit<ms>

(protocole 6) : remplacer <...> par {...}

ex. : {ms}ceci est un passage manuscrit{ms}

2.2.2. Mise en page

Les titres courants (protocole 2) : éliminer les faux titres apparaissant sur l'entête de la page. Les conserver.

Les réclames : les conserver.

ex. : toutes la compagnie re-

vint

Les alinéas (protocole 3) doivent être marqués par le signe dédié pour les corrections effectués sur les fichiers au format .txt. Voir en figure la touche TAB (double flèche ou simple flèche sur certains claviers) :

touche TAB 

Nota bene : Pour les relectures sur EMAN, sélectionner le contenu pour créer un paragraphe dans le menu de gauche "Structure" et pour l'attribut "Rendition" choisir la valeur "INDENT (INDENTE)" dans la liste déroulante.

Comment citer cette page

Denisa Bumba, "Principes de transcription"
Site "EcoLiReD"
Consulté le 31/08/2025 sur la plateforme EMAN
https://eman-archives.org/Ecolired/principes-de-transcription
Page créée par Denisa Bumba le 22/03/2024
Page modifiée par Denisa Bumba le 13/06/2025