Les investissements réalisés pour concevoir et proposer une Plateforme Numérique, CorTexT, correspondent à un enjeu fondamental de l’IFRIS et des tutelles qui ont rendu possible le projet, et fortement l’INRA depuis la création de CorTexT. En effet, assurer le développement de recherches portant sur les sciences, les techniques et l’innovation en société suppose de relever des défis de construction, de traitement et d’analyse de jeux de données numériques dont la prolifération est croissante et la variété considérable. Comme l’indique la notion d’Humanité Digitale ou d’Etude Digitale, il est devenu important aujourd’hui de mettre à profit l’étude d’un nombre croissant de bases de données numériques permettant une exploration à grande échelle de la littérature scientifique, de la littérature grise, de la production et de la gestion des données des laboratoires, des brevets, des articles de presse, de la blogosphère… Un vaste chantier passionnant s’ouvre pour les chercheurs en sciences humaines et sociales.
Mais cette profusion de données numériques n’a d’intérêt que si sont mises au point de nouvelles méthodes d’exploration et d’analyse en lien avec les questions que se posent les chercheurs de différentes disciplines des sciences humaines et sociales. Ces méthodes visent à améliorer l’articulation entre approches qualitatives et approches quantitatives, en permettant de gérer de larges quantités de données sans renoncer à la finesse de l’analyse. Elles sont également le fruit d’un travail de conception dans l’usage et mobilisées de façon collective ou individuelle dans des projets de recherche.
Le principal atout de la plateforme numérique consiste en une expérience éprouvée depuis 7 ans de collaborations entre informatique, théorie des systèmes complexes, méthodes de traitement automatique de la langue et bien sûr sciences sociales. Le LabEx SITES permet de poursuivre et d’amplifier ces efforts entrepris depuis la création de l’IFRIS. La plateforme CorTexT est aujourd’hui une marque, un instrument et surtout une équipe de l’unité LISIS.
Principaux éléments marquants
Concernant la plateforme CorText
Les quatre premières années sont celles d’une « accumulation primitive » qui a permis de mettre en place une « infrastructure »: un espace qui permet de réunir des compétences et des outils de constitution et de traitement des corpus complexes. Les réalisations se sont ensuite distribuées suivant trois ensemble complémentaires :
1/ le développement d’un certain nombre d’outils de base qui sont aujourd’hui réunis dans un outil, CorText Manager, qui est accessible en ligne suivant un principe de Science Ouverte. L’avantage de ces outils est qu’ils sont génériques et qu’ils reposent sur des algorithmes originaux permettant de faire des analyses dynamiques et multi-échelles.
2/ des expériences de partenariat sur des projets de recherche en SHS qui mobilisent les outils de la plateforme. Les sujets sont très divers : analyse des formes de « sociabilité électroniques » ; les savoirs sur les maladies orphelines ; les controverses sur les algues vertes ; la structuration de domaines de recherche (nanotechnologies, bioénergies, agroécologie), l’émergence de promesses technologiques comme la biologie de synthèse.
3/ des publications de qualité parues dans des revues scientifiques variées qui rendent compte autant de la variété des usages de la plateforme CorTexT et de la capacité des membres de la plateforme à la faire vivre dans différents contexte: projets de recherche, projet d’infrastructure (projet Européen RISIS) ou partenariat avec des communités de recherche (Projet EMBRIC) ou des agence (ANR, CoMUE Paris-Est).
Equipe CorTexT
- Marc BARBIER, Directeur de recherche INRA, Directeur de la Plateforme
- Bilel BENBOUZID, Maitre de Conférence UPEM
- Philippe BREUCKER, Ingénieur d’études INRA
- Jean-Philippe COINTET, Ingénieur de recherche, Corps des ingénieurs des ponts, des eaux et des forêts (IPEF), SciencePo MediaLab
- Alexandre HANNUD ABDO, Post Doc INRA
- Patricia LAURENS, chargée de recherche, LATTS CNRS
- Nicolas RICCI, Ingénieur d’étude, UPE-IFRIS
- Antoine SCHOEN, enseignant chercheur, LATTS ESIEE
- Lionel VILLARD, enseignant chercheur, LATTS ESIEE
Ils ont contribué à faire CorTexT:
- Audrey BANEYX (Ingénieur de recherche, SciencesPo)
- Andréï MOGOUTOV, Conseiller scientifique et technique, AGUIDEL
- Tam Kien DUONG (Institut Recherche et Innovation / Centre Pompidou)
- Chloé DULOQUIN (Designeuse FreeLance)
- Guillaume ORSAL, Ingénieur d’études INRA LISIS
- Constance de QUATREBARBES (ingénieuse)
- Antoine MAZIERES (Post Doc Marc Bloch Center, Berlin)
- Cristian MARTINEZ (PhD UPEM & ESIEE)
- Nicolas BAYA-LAFITTE (Research Fellow, Université de Lausanne)
- Anis ARABI (Ingénieur)
Pour de plus amples informations sur la plateforme, voir le site internet CorTexT.