Transcription Transcription des fichiers de la notice - Le courrier du CNRS 16 CNRS 1975-04 chargé d'édition/chercheur Valérie Burgos, Comité pour l'histoire du CNRS & Projet EMAN (UMR Thalim, CNRS-Sorbonne Nouvelle-ENS) PARIS
http://eman-archives.org
1975-04 Fiche : Comité pour l'histoire du CNRS ; projet EMAN Thalim (CNRS-ENS-Sorbonne nouvelle). Licence Creative Commons Attribution – Partage à l'Identique 3.0 (CC BY-SA 3.0 FR).
Français
Approche analogique d'une expertise en écriture, un exemple : l'affaire Dreyfus

Parmi les diverses questions auxquelles tente de répondre une analyse d'écriture, l'identification d'un scripteur constitue l'une des préoccupations essentielles des chercheurs. Le diplomatiste comme l'historien de l'art, le paléographe comme l'expert en écriture cherchent, chacun selon ses méthodes propres, à certifier l'authenticité des actes écrits.

Tout ce qui concourt au fait d'écrire permet de fournir des renseignements sur la véracité et la valeur du document étudié : le support de l'écriture (papyrus,peau d'animal, papier), l'instrument et la façon dont il est utilisé (plume d'oie, plume d'acier, « stylo », machine à écrire ... ), la composition chimique de l'encre constituent autant de données dont l'exploitation peut mener à une connaissance plus approfondie des textes. A ces différents moyens d'investigation s'ajoute un élément essentiel : la manière de former les lettres et les mots. Chacun sait comme il est fréquent, en rècevant une missive d'un ami, de reconnaître d'emblée l'écriture de celui-ci ; c'est ce type d'expérience de reconnaissance des traits pertinents d'une écriture que nous nous proposons de mener avec des moyens optiques.

Dès 1969 des travaux exécutés au laboratoire de physique générale et optique en collaboration avec l'institut de recherche et d'histoire des textes avaient conduit à la mise au point d'une méthode optique de mesure de ressemblance de formes géométriques qui, appliquée au graphisme des lettres de manuscrits hébraïques, a permis d'effectuer une discrimination entre divers scribes ayant fabriqué un même ouvrage. Cette étude fut ensuite conduite de façon à fournir divers moyens de réalisation de lettres-moyennes caractéristiques d'une écriture d'un scribe ou d'une école, voire d'une époque.

Analyse des formes de lettres

Pour traiter le graphisme d'une écriture au moyen d'un calculateur, il convient de décomposer chaque lettre en divers éléments tels que l'angle d'inclinaison des hastes, leur hauteur, les rayons des courbes, etc. ; il faut de plus connaître les facteur·s qui contribuent à donner à l'écriture son aspect général : aérée ou serrée, épaisse ou déliée, évoluée ou grossière, conventionnelle ou personnelle ... Ceci représente un travail fastidieux tant dans le relevé des valeurs de chaque paramètre que dans le traitement des très nombreuses données collectées.

Mais les lettres étant par essence des images faites pour l'œil, voyons comment il est possible de modifier, de mieux connaître, et de traiter celles-ci avec des instruments d'optique.

Une des propriétés essentielles des chaînes optiques est leur très grande capacité de traitement. On peut concevoir aisément le sens de cette affirmation en considérant un appareil photographique classique : celui-ci permet tout aussi bien d'enregistrer la photographie d'un caractère (un a par exemple) que celle de toutes les lettres constituant une page de texte ; dans ce dernier cas l'appareil se comporte comme un système multicanaux qui passe simultanément toute l'information constituée par les données morphologiques des lettres photographiées. Cette qualité des objectifs et autres composants optiques doit être mise à profit pour effectuer des calculs à caractère statistique.

Qu'est-ce qu'un calculateur optique ?

Parler de calcul optique peut surprendre. En effet, on conçoit que dans un calculateur électronique, des composants - électroniques - servent à manipuler l'information transportée par le courant électrique ; le même schéma guide nonobstant la conception des calculateurs optiques : la lumière sert à véhiculer l'information, celle-ci étant traitée par des composants optiques - lentilles, diaphragmes, hologrammes, supports photo-sensibles, etc.-. Toutefois la comparaison entre ces deux types d'instruments ne doit porter que sur leur fondement. Ils diffèrent de façon essentielle dans leur mise en œuvre et aussi dans leur domaine d'application. Nous nous contenterons ·ici de décrire un calculateur analogique approprié à certaines études sur les écritures.

Les textes dont on se propose d'étudier l'écriture sont préalablement enregistrés photographiquement.

Toutes les grandes bibliothèques du monde, de même que les services d'archives sont en mesure de fournir des microfilms ou des microfiches d'excellente qualité, et il est souvent plus facile d'obtenir le microfilm d'un manuscrit ou d'un dossier que de compulser celui-ci là où il se trouve, ne serait-ce généralement que pour des questions d'éloignement géographique. En outre, le travail s'effectuant sur film, il présente l'avantage considérable d'être non-destructif pour le document original.

Considérons un microfilm comme un écran opaque dans lequel se trouve un ensemble de caractères et signes transparents. Quand un faisceau de lumière rencontre cet obstacle, il est diffracté par les parties transparentes et se réorganise en une onde lumineuse dont le profil est modifié. En particulier si le faisceau est monochromatique et si son amplitude est constante sur toute la pupille, on montre qu'il fournit, à l'infini, une répartition de lumière décrite par la transformée de Fourier - nous reviendrons sur cette opération mathématique - de la fonction qui caractérise la forme géométrique des lettres. En optique, il suffit de se placer dans le plan focal d'une lentille 1pour simuler ce qui se passerait à l'infini.

On forme ainsi la transformée de Fourier (encore appelée spectre) de toute fonction bidimensionnelle, simplement en introduisant les données à traiter sous forme d'un film photographique. Le résultat cherché (le spectre) se forme toujours au même endroit, centré sur le foyer de la lentille, et ceci quelle que soit la position géographique des caractères dans le texte. Sans décrire en détail à quoi correspond cette opération, on peut néanmoins indiquer deux propriétés importantes de la transformation de Fourier : - c'est une intégration, linéaire, c'est-àdire que le spectre d'un groupe de lettres (un mot ou un texte) est identique à la somme des spectres de chacune des lettres constituant le groupe, ceci à un facteur près traduisant la position des lettres ; - au lieu de décomposer un graphisme en éléments géométriques, la transformation de Fourier analyse toute forme suivant les fréquences spatiales qui la caractérisent. Par analogie avec les sons qui se dissocient en fréquences temporelles, on peut concevoir comment la formé d'un objet plan est constituée d'une combinaison de fréquences spatiales : les basses fréquences dessinent les graisses, l'allure générale des lettres, alors que les fréquences élevées façonnent les détails fins, notamment le contour et les discontinuités des lettres.

Caractériser une main dans une écriture donnée

Avant d'esquisser une réponse à ce problème, il convient de comprendre comment peut se représenter l'acte d'écrire. Tout individu qui écrit dessine les lettres. Chacune de celles-ci peut être regardée comme la composition d'un sté-
réotype et d'une perturbation. Le stéréotype d'une lettre, c'est le modèle inculqué à la mémoire de l'homme, l'idée même de cette lettre ; la perturbation, c'est la fonction qui permet de passer du stéréotype à la forme manuscrite telle que celle-ci se présente aux yeux du lecteur. Le typographe qui dessine un nouveau caractère ne crée que dans le champ de cette perturbation (il faut que la lettre demeure reconnaissable, lisible), et de même le copiste ne modifie pas, par sa calligraphie des signes, le message transmis. Cette perturbation, que nous appelons facteur de forme, est la combinaison de très nombreux paramètres qui font qu'une écriture est plus ou moins anguleuse, couchée, souple, haute, grossière, etc. Elle provient de tous les éléments qui forment l'environnement du scripteur au moment où le texte est écrit : l'instrument d'écriture, la qualité du papier (ou de tout autre support), la position plus ou moins confortable du copiste, son application, sa fatigue, son état nerveux ... tout ou partie de ce qui compose sa personnalité peut, à des degrés divers, être consigné dans un écrit. Du point de vue mathématique, le modèle qui rend compte de la manière de modifier le stéréotype est une corrélation. Or, les techniques de Fourier permettent aisément le passage du produit de corrélation de deux fonctions (opération généralement compliquée) au produit simple (au sens ordinaire du terme) des spectres de ces deux fonctions. Cette propriété sera largement mise à profit comme on va le constater dans la suite.

De la recherche des invariants

Chacun peut, au gré de son humeur ou de ses besoins, modifier son écriture propre, la coucher ou la redresser, la rendre plus étoffée ou plus nue, lier plus ou moins les lettres, etc ... Et malgré l'infinité des possibilités de variation, généralement le« cachet» demeure, c'est-à-dire que la « main » du scripteur se reconnaît à travers les différents aspects de ses tracés de mots. On constate ainsi que parmi les paramètres qui déterminent le graphisme des lettres, certains permettent de passer d'une écriture penchée à une plus droite ou plus inclinée, de rendre les boucles plus anguleuses ou plus rondes, etc ... , alors que d'autres demeurent fixes (chez un même scripteur) : ceux-ci contrôlent la part propre au scribe dans la morphologie des lettres ; traduits en langage de Fourier, ils constituent des fréquences spatiales. Si, entre les spectres de plusieurs textes écrits par une même personne, on constate que certaines bandes de fréquence
demeurent communes, on peut envisager celles-ci comme étant les constantes de l'écriture d'un individu ; ce sont ces invariants qu'il convient de mettre en évidence dans l'expertise d'un document. Nous avons mentionné précédemment que les fréquences spatiales élevées correspondent aux détails fins dans la morphologie des formes. Il s'en suit qu'une écriture au graphisme enluminé, où les lettres sont riches en fioritures, possède en son spectre beaucoup de hautes fréquences. Cependant, dans un tel document, les caractéristiques du scripteur peuvent fort bien - et c'est généralement le cas - se situer dans une bande de moyennes et de basses fréquences. Si l'on considère l'hypothèse où un même individu transcrit un texte de deux façons différentes, une fois avec une écriture rapide et grossière, une autre fois avec une écriture recherchée et sophistiquée, rien n'exclut a priori qu'une zone de basses fréquences ne demeure stable dans les deux cas. Ainsi, dans ce type d'analyse et pour ce qui concerne l'espace géométrique, on cherchera généralement les invariants dans les parties grossières de l'écriture (graisses, façon de former les lettres) .plutôt que dans les menus détails.

Etude individuelle et étude statistique des caractères

Tout caractère manuscrit étant conçu comme la corrélation d'un stéréotype et d'un facteur de forme, son spectre correspond au produit de la transformée de Fourier du stéréotype par celle du facteur de forme. Ne connaissant pas le stéréotype, il semble impossible de déduire sa perturbation, donc a fortiori de connaître ce qui, dans le spectre d'une lettre, relève du facteur de forme. Mais en comparant entre-elles deux mêmes lettres, deux a par exemple, les différences - tant au niveau géométrique qu'au niveau spectral - sont imputables uniquement aux perturbations subies par le stéréotype. Si l'on considère plusieurs textes, même si ceux-ci sont de contenus très éloignés, ils comportent la même probabilité de posséder, pour un même nombre de lettres, chacun autant de a, chacun autant de b, et ainsi de suite, ceci à condition que les corpus comparés soient des échantillons de taille suffisante et qu'ils soient écrits dans une mênte langue. Ainsi, en français, la fréquence d'apparition sur 1 000 lettres, est de 176E, 81A, SOS, 761, ... 61, 3X, 1 Y, 0,72 Z, 0,41 K, 0,20 W. Les spectres de ces textes sont sonstitués par le produit de deux termes : l'un représente la somme des fréquences spatiales dues à la perturbation de chaque caractère,