Portrait d'alumni : Chahan Vidal-Gorène, fondateur de Calfa et lauréat du prix Télécoms Innovations 2019
Chahan Vidal-Gorène a été diplômé de l'Inalco en 2017 (arménien, texte et linguistique). Il a remporté en 2019 le prix Télécoms Innovations avec son projet Calfa, une technologie qui permet d'extraire des informations de scans de manuscrits anciens et d'archives manuscrites.
Quel cursus avez-vous suivi à l'Inalco ?
Durant toute ma scolarité à l'Inalco, j'ai suivi plusieurs cursus, dont le plus important est le parcours complet proposé par la section d'arménien, au sein du département Eurasie. J'ai en effet débuté par une licence LLCER d'arménien, avant de poursuivre, au sein de ce département, en Master 1 d'Histoire et Sciences Sociales puis en Master 2 de Textes et Linguistique. La grande flexibilité de la section d'arménien a pu me permettre de m'initier au persan, au russe, et plus récemment au traitement automatique des langues.
Pourquoi avoir choisi l'Inalco pour vos études ?
Il y a probablement un peu de lobbying familial derrière tout ça, mais faire des études de langue et de civilisation a toujours été une évidence pour moi, en parallèle des mathématiques, ma passion. C'est un formidable moyen de comprendre le monde et d'interagir avec lui. L'Inalco constitue pour cela un établissement d'excellence unique.
La section d'arménien de l'Inalco propose d'ailleurs la formation la plus complète pour les études arméniennes en dehors de l'Arménie, études pour lesquelles j'avais une appétence particulière. Et puis, on a droit à trois langues pour le prix d'une : arménien occidental, arménien oriental et arménien classique.
J'ai très vite été séduit par la très grande variété de cours, allant aussi bien de l'histoire-géographie, à la littérature, en passant par de la linguistique de corpus, de la linguistique computationnelle, de l'histoire du droit, de la géopolitique, etc. Ces matières, qui habituellement ne se retrouvent pas dans un seul et même cursus, sont ici accessibles et permettent de se former dans l'interdisciplinarité. Choisir l'Inalco et l'arménien est donc tout à fait naturel pour un jeune bachelier curieux.
Que vous a apporté l'Inalco tant au niveau personnel que professionnel ?
Dire que cela a grandement influencé mon parcours serait un euphémisme. Tant au niveau professionnel que personnel, tout tourne autour du Proche-Orient et de l'arménien. Calfa, la boîte que j'ai fondé, touche au patrimoine oriental et aux langues peu dotées ; mon doctorat à l'École des Chartes concerne la paléographie arménienne, etc.
La section d'arménien a été un super tremplin, à tous les niveaux, et l'Arménie constitue aujourd'hui, au milieu d'une région très active géo-politiquement, un important pôle d'innovations et d'activités économico-scientifiques, et un relais diplomatique, autant de besoins pour lesquels l'Inalco forme parfaitement ses étudiants.
Vous avez remporté le prix TélécomInnovations grâce à votre projet Calfa. Pouvez-vous nous parler de ce projet ?
Chez Calfa, nous travaillons sur l'extraction de texte localisé dans des scans de manuscrits, en collaboration avec des institutions patrimoniales. Nous intervenons ainsi à différentes étapes du processus de numérisation d'un document, du scan à sa valorisation via des outils de recherche et de consultation.
L'histoire de Calfa est intimement liée à celle de la section d'arménien de l'Inalco. À l'origine, il s'agissait juste de créer un dictionnaire en ligne d'arménien classique-français, et c'est ce que nous avons fait. En 2014, avec d'autres étudiants et une professeur, nous nous ainsi sommes lancés dans ce chantier complètement fou, après avoir constaté l'extrême difficulté de trouver des ressources papier pour l'étude de l'arménien classique.
Avec le soutien de la Fondation Calouste Gulbenkian et de la Fondation des Frères Ghoukassiantz, nous avons progressivement étendu l'idée en agrégeant et enrichissant de très nombreux contenus pour faire du site calfa.fr la référence la plus complète en lexicographie arménienne classique : traductions en anglais et en italien, exemples tirés de la littérature arménienne, dictionnaire unilingue, synonymes, étymologie, conjugaison, etc.
Dans ce contexte, avec l'appui du service insertion pro de l'Inalco, j'ai intégré la formation d'étudiant-entrepreneur du Pépite CreaJ-IDF, auquel appartient l'Inalco, afin d'être initié à la gestion de projets et d'entreprise.
C'est à partir de la fin de 2016 que nous nous sommes concentrés sur le développement d'une technologie intelligente de reconnaissance de caractères manuscrits, de l'arménien dans un premier temps (dans le cadre de l'appel à projets Armenian Language in the Digital Age de la Fondation Calouste Gulbenkian).
À partir d'une photo d'un document manuscrit ou imprimé, nous en proposons la version texte, grâce à des techniques d'intelligence artificielle.
Aujourd'hui, Calfa est spécialisée dans le développement d'outils sur mesure pour les professionnels du patrimoine (bibliothèques, centres de manuscrits, etc.), afin de les aider à préserver et valoriser leurs collections. Cela prend par exemple la forme d'une base de données interrogeable avec un moteur de recherche qui permet de retrouver n'importe quelle information localisée dans des milliers de pages manuscrites, aussi facilement que dans un document texte. Nous travaillons aussi avec des entreprises qui souhaitent traiter de grandes quantités d'informations manuscrites ou imprimées. Nous proposons nos services pour n'importe quelle langue peu dotée, le système étant adaptable et entraînable très rapidement. Ces développements sont une belle synthèse interdisciplinaire.
Nous avons d'ailleurs deux importants chantiers en 2020, avec la Bibliothèque Nubar de l'UGAB (https://www.facebook.com/Calfa.fr/videos/2541642792748335/), et la BULAC, pour la valorisation d'archives manuscrites arméniennes (https://bulac.hypotheses.org/19507).
C'est dans ce cadre et sur la base des résultats obtenus que nous avons obtenu le prix Télécoms Innovations 2019 « Accès à la culture et au patrimoine par le numérique » de la Fédération Française des Télécoms.
Cette spécialisation de Calfa dans le patrimoine n'est bien sûr pas totalement due au hasard. Dès mon Master à l'Inalco, la question des manuscrits a joué un rôle central, et j'ai pu constater lors de mes premières années de doctorat, à l'École Nationale des Chartes, la difficile accessibilité et intelligibilité du patrimoine manuscrit arménien antérieur au XXe siècle. Comment le promouvoir et le faire découvrir ? Comment participer à sa pérennisation numérique ? Comment accélérer son étude ? Répondre à ces questions est à l'origine de la réflexion.
Ces enjeux ne sont bien sûr ni limités à l'arménien, ni nouveaux. L'École Nationale des Chartes, experte sur ces questions, a depuis quelques années mis en place deux Master, le premier étant intitulé « Technologies numériques appliquées à l'histoire », et le second « Humanités numériques », dans lequel je suis chargé de cours. Les humanités numériques, dans lesquelles s'inscrit mon parcours et qui associent en effet des expertises très diverses, comme par exemple paléographie, linguistique, apprentissage machine et mathématiques, sont et seront au cœur du traitement des données patrimoniales et en sciences sociales.
Commentaires0
Veuillez vous connecter pour lire ou ajouter un commentaire
Articles suggérés