Enjeux techniques et scientifiques de l'usage de l'HTR pour les historiens, de la source à la réutilisation des données

Le 21 mars, Pauline Spychala, chercheuse post-doctorale en histoire médiévale et en humanités numériques au sein de l’IHA, a prononcé une brillante conférence intitulée : « Enjeux techniques et scientifiques de l’usage de l’HTR pour les historiens, de la source à la réutilisation des données ».
Après avoir présenté ses sources et les spécificités de ces dernières, la conférencière a expliqué les modalités de mise en place d’une chaîne de traitement d’acquisition semi-automatique de texte. Elle a notamment insisté sur l’importance de l’entraînement des modèles d’HTR afin d’améliorer leur taux d’exactitude. Elle a également souligné le fait que la segmentation doit se penser autour d’un vocabulaire contrôlé et partagé (ontologie SegmOnto).
Pauline Spychala a conclu son intervention en proposant une démonstration de l’utilisation du logiciel HTR e-Scriptorium https://escriptorium.inria.fr/
Les échanges ont permis d’évoquer l’excellent blog Hypothèses conçu par Pauline Spychala et Ariane Pinche sur l’ATR.
Ariane Pinche (15 avril 2024). ATR Étape 1 : Premiers pas avec la reconnaissance automatique de texte. Reconnaissance automatique de texte. https://doi.org/10.58079/11npw