Humanités numériques

De Wicri France
Aller à : navigation, rechercher
Visuel rapport Humanités numériques.jpg

Un rapport[1] sur les enjeux et perspectives dans le domaine des humanités numériques (digital humanities) a été publié par l'Institut Français en 2014 par Marin Dacos et Pierre Mounier. Cette publication aborde les enjeux stratégiques concernant le positionnement de la France dans le domaine des humanités numériques et établit une cartographie de la communauté mondiale des digital humanists.

Note : le contenu de cette page s'inspire notamment de ce rapport.

Définition

Les humanités numériques ont aujourd'hui remplacé ce que l'on appelait les « humanities computing » qui recouvraient les sciences humaines assistées par ordinateur. Elles sont aussi appelées « digital humanities » et ont fait leur apparition il y a environ une décennie. Plus globalement, les humanités numériques font partie d'un mouvement de partage, de diffusion et de valorisation des connaissances qui mobilise les outils numériques. Il y a un désir d'inscrire les nouveaux contenus numériques (digital natives) au même titre que les contenus dit traditionnels (obtenus en numérisant des supports classiques, notamment papier).

Une définition a été rédigée par les participants du THATCamp qui s'est tenu à Paris en 2010. Elle est donnée dans le Manifeste des Digital Humanities[2]. Le constat de base énoncé dans le Manifeste est que "les humanités numériques ne font pas table rase du passé", elles rassemblent tout ce qui provient des humanités (arts, lettres et sciences humaines) ainsi que les savoir-faire et les connaissances qui leurs sont propres, d'une part, et le numérique (nouvelles technologies, ordinateurs et réseaux) en mobilisant les outils et possibilités particulières qui en découlent, d'autre part. Elles sont donc par nature transdisciplinaires et associées aux méthodes de recherche liées au numérique dans les sciences humaines et sociales.

Les humanités numériques sont la marque de l'évolution en cours des pratiques de recherche et de la variation des supports. Le monde de la recherche en sciences humaines et sociales connait un bouleversement avec l'ère du numérique et se trouve être en pleine révolution puisque la recherche s'inscrit à présent, avec les humanités numériques, dans un espace dont les frontières sont à redéfinir (voire à inventer). Désormais, les contenus sont dématérialisés et sont accessibles plus rapidement et de manière permanente.

Dans le cadre des bibliothèques, la numérisation des documents disponibles nécessite de faire évoluer les fonctionnements classiques, pour laisser la place aux "learning centers" qui constituent un espace favorable à l'open access.

Métaphore du Chapiteau

Le terme de "chapiteau" met en exergue la multitude de points de vue et de disciplines dans le domaine des humanités numériques. Cette métaphore du chapiteau est, selon Melissa Terras [3] adapté aux "humanités" puisqu'elle rassemble des chercheurs qui s'intéressent aux sociétés humaines. Les humanités numériques proposent ainsi avec les nouvelles technologies numériques plusieurs approches universitaires. Le chapiteau représente également une image d'ouverture à la communauté des digital humanists qui peuvent adopter de nouvelles pratiques dans l'étude des sciences humaines. La structuration de la communauté pose cependant problème en raison du nombre de disciplines que touchent les humanités numériques.

Historique

Literary and linguistic computing

Ce mouvement débute dans les années 1970 avec la création de corpus de références qui peuvent être utilisés pour l'analyse d’œuvres ou de textes (Brown Corpus). Ces corpus sont réalisés dans plusieurs langues : le British National Corpus pour l'anglais ou Frantext pour le français (par l'ATILF). Cette période est marquée par le développement des analyses linguistiques avec la stylométrie, qui conjugue les statistiques et la linguistique en permettant l'identification de style de texte ou d'auteur, puis la lexicométrie, qui étudie l'usage des mots par des moyens statistiques.

Le Brown Corpus est un corpus linguistique de description de la langue anglaise. Ainsi, le Brown Corpus for Use on Digital Computers[4] corpus a été réalisé grâce à un système d'indexation, par l'intermédiaire de machines, de tous les mots de la langue anglaise en fonction du discours dans lequel ils étaient employés. La première version de ce corpus comptait plus d'un million de mots intégrés manuellement dans la base de données.Ce projet a fait partie des premier à intégrer une méthode de normalisation et de standardisation dans la création d'un corpus.

Aujourd'hui une revue Literary and linguistic computing existe toujours, elle a été créée en 1976 par des chercheurs.

Les Humanities computing

Dans les années 1980 et 1990, les technologies numériques ont beaucoup évoluées notamment dans leurs usages dans le domaine des sciences humaines et sociales. Ce terme apparaît au début des années 1980 et porte sur la réflexion concernant l'utilisation de l'informatique pour la recherche. Selon Willard McCarty, on ne se limite plus à une seule discipline, la réflexion devient donc interdisciplinaire.

  • Création de la Text Encoding Initiative (TEI) en 1987 qui deviendra ensuite une norme d'encodage XML utilisable pour toutes les données textuelles numérisées.
  • La TEI mène à l'élaboration de nouveaux outils, méthodes et espaces partagés entre plusieurs disciplines. C'est ainsi que la structuration, la diffusion et l'archivage des corpus fait son apparition. Ainsi, les outils et les méthodes migrent d'une discipline à une autre.

Il y a eu un véritable phénomène d'institutionnalisation, les écoles ont commencé à s'équiper d'ordinateurs, les programmes de certaines écoles anglaises ont mit en place des enseignements en programmation (BASIC), et les enseignants se sont vu proposer des formations technologiques pour apprendre à utiliser les ordinateurs et et ainsi voir l'étendue des possibilités liées au numérique.

Cette période a été marquée par de nombreuses inventions telles que l'e-mail, les listes de diffusion et les CD-ROM et la création de formations universitaires.

Les Digital humanities

Avec l'arrivée du web à partir de la seconde moitié des années 1990, le terme de "Digital humanities" apparaît (plus précisément en 2004 lors de la publication de A Companion to Digital Humanities[5]).

  • La nouvelle problématique est centrée sur la communication en ligne et sur les réseaux sociaux. Désormais, tous les corpus doivent être disponibles en ligne avec les problèmes que cela peut engendrer, à savoir les critères de diffusion et d'organisation des données (de la simple lecture à l'ajout d'informations et de commentaires).
  • Les recherches en sciences humaines sont aujourd'hui immergées dans l'usage du numérique. Le lien est de plus en plus présent avec les sciences du numérique qui est un domaine disciplinaire large qui apporte des avantages aux humanités. À présent les chercheurs sont amenés à travailler avec les outils numériques et le plus souvent en réseau.
  • C'est la méthode de visualisation des supports numérisés ou numériques qui permet le lien entre les différentes spécialités (histoire, sociologie, géographie...), se pose à nouveau la question des frontières.

Centre d’humanités numériques

Il est difficile d'évaluer la supériorité d'un pays à un autre pays dans ce domaine. Pourtant, les Etats-Unis semblent avoir développé d'avantage leurs équipes de recherche, et plus particulièrement avec la création de centre spécialisés en humanités numériques. Ce type de structure représente un "projet phare" pour les universités et dispose d'un financement important et permet ainsi l'accumulation des compétences et des technologies, ce qui favorise la structuration des humanités numériques.

Les centres d'humanités numériques ne dépendant d'aucun département universitaire, et se retrouvent donc souvent isolés. Cependant, il s'agit d'une communauté qui possède ses propres modes de communication et les nouvelles pratiques liées aux nouvelles technologies les incitent de plus en plus à utiliser les médias sociaux pour le partage et la diffusion des données d'où le terme "open" (access, data, peer review, commentary). Avec ces espaces plus ouverts et l'apparition du "publish first, filter later" ce sont les lecteurs qui évaluent désormais la qualité des textes déjà publiés. Les humanités numériques ont amené, par l'intermédiaire du web, les pratiques traditionnelles scientifiques à des mouvements plus actuels que sont les THATCamp.

Le site Centernet[6] créé par Neil Fraistat[7] fonctionne comme un réseau, sur lequel les centres d'humanités numériques vont pouvoir s'enregistrer librement, il en compte d'ailleurs plus de 300 à ce jour.

En Europe

En Europe, des centres d'humanités numériques se sont développés en Allemagne (Cologne et Gottingen), en Grande-Bretagne, en Italie (Rome et Pise), en Espagne et en Suisse qui rattrape largement son retard à Zurich et Bern mais de manière plus importante à Lausanne avec une restructuration de la bibliothèque en learning center et la création d'un centre spécialisé en 2013.

Des associations se sont crées à l'échelle nationale en Allemagne, en Espagne et en Italie (lors de la manifestation THATCamp à Florence) après l'échec de la création d'une association européenne en raison du manque d'implication des partenaires. Ces associations sont pourtant dans une optique d'internationalisation de part la composition des équipes constituées de chercheurs allemands et suisses. Dans le cadre des humanités numériques, des événements sont créés à l'exemple de "Dia de las humanidades Digitales"[8] en Espagne, des colloques en Italie ou des conférences.

Aux États-Unis

Ces centres apparaissent dans les universités qui ne sont pas les mieux classées dans le domaine académique américain. Ceci s'explique en partie par l'environnement de compétitivité qui règne dans le milieu universitaire aux États-Unis. De plus, les centre d'humanités numériques ne sont pas dépendants d'un département au sein des universités, ils sont à l'intersection de plusieurs services, et très souvent en association avec les bibliothèques qui assurent une certaine structuration. Ils sont également liés au département d'informatique de leur université. Il collaborent aussi avec d'autres centres d'humanités numériques dans le but d'obtenir des nouvelles compétences puisque chacun développe le domaine dans lequel il excelle en fonction des départements qui le soutiennent.

Dans le monde

De nombreux centres d'humanités numériques existent au Canada, Japon, Nouvelle-Zélande et Australie. Ces centres fonctionnent d'une manière semblable à celles constatées dans les centres américains. Les centres sont ancrés dans les universités et en partenariat avec les bibliothèques pour la structuration, mais aussi avec les départements d'informatique pour le développement des compétences dans le domaine du numérique. Ces centres évoluent et continuent de se développer grâce aux activités de la communauté grandissante et très présente au niveau international.

Institutions

Les projets liés aux humanités numériques ne sont que temporaires mais les moyens technologiques utilisés nécessitent des infrastructures permanentes pour le partage des données et l'accumulation des connaissances, d'où le lien avec les bibliothèques universitaires.

Cependant, le soutien des bibliothèques ne répond pas à tous les critères liés aux humanités numériques notamment lorsque cela concerne l'accès aux données ainsi que leur pérennité à long terme, nombre de documents ont été perdus en raison de l'obsolescence des formats et des supports numériques utilisés dans les années 1970-1980.

Le terme de "cyberinfrastructure" est employé par l'American Council for Learned Societies(ACLS) en 2006 dans le rapport Our Cultural Commonwealth[9]. Selon l'ACLS, une cyberinfrastructure doit être publique, pérenne, interopérable, valorisant la collaboration entre chercheurs et prenant en charge l'expérimentation. C'est donc un espace hybride entre matériel et non-matériel.

La mise en place de cyberinfrastructures pour les centres de recherche en sciences humaines et sociales est pourtant plus aisée en Europe qu'aux États-Unis, en raison des politiques nationales et européennes.

Parmi les plus anciennes institutions, on compte l'Institute for Advanced Technology in the Humanities (IATH), le Center for History and New Media (CHNM) et le Maryland Institute for Technology in the Humanities (MITH) qui ont été créées dans les années 1990 et jouent un rôle important au niveau international. La prochaine conférence annuelle DH2015, qui sera aussi la 26e édition, aura d'ailleurs lieu pour la première fois en dehors des continents nord américain et européen puisqu'elle se déroulera à l'Université de Western à Sydney.

À l'échelle européenne, deux infrastructures ont été mises en place, Clarin (Common Language Ressources and Technology Infrastructure) et Dariah (Digital Research Infrastructure for the Arts and Humanities). En Allemagne, l'infrastructure Textgrid propose aux chercheurs en sciences humaines et sociales une "boite à outils" constituée de logiciels pour étudier et analyser les corpus. Au Pays-Bas, le projet DANS offre des possibilités d'archivage à long terme et de diffusion des données grâce à un système d'indexation et de structuration sémantique des informations.

Il faut aussi évoquer les structures issues du Programme investissements d'avenir (PIA), lancé en 2009. Les laboratoires d'excellence (Labex) comportent pour la plupart une dimension numérique, et les équipements d'excellence (Equipex) représentent les infrastructures de moyenne échelle financées jusqu'en 2020 et qui sont un appui important dans le domaine des humanités numériques. On peut penser à Biblissima qui a pour objectif de construire une bibliothèque numérique qui donne accès au patrimoine écrit du Moyen-âge et de la Renaissance et qui fournit à la communauté une palette d'outils et de méthodes qualitatives et quantitatives pour la collecte, la diffusion et l'enrichissement des données en sciences humaines et sociales.

ADHO

L'Alliance of Digital Humanities Organizations (ADHO) a été créée en 2005. Son objectif principal est de promouvoir la recherche et l'enseignement numérique dans le domaine des arts, lettres et sciences humaines et sociales.

CHNM

Le Center for History and New Media (CHNM) organise pour la première fois une non-conférence appelée THATCamp (The Humanities and Technology Camp) en 2008.

CLÉO

Le CLÉO est le centre pour l'édition électronique ouverte[10]. Cette structure a été créée en 1999 avec sa première plateforme revues.org. Par la suite, cette plateforme s'est développée avec la mise en place de nouveaux projets comme "Calenda" en 2000 et "Hypothèses" en 2009 et, enfin "OpenEdition Books" en 2013. Désormais, ces plateformes sont rassemblées sous le nom d'OpenEdition. Le CLÉO est en partenariat avec le CNRS, l'EHESS, et l'Université d'Aix-Marseille présente sur trois sites (Paris, Marseille et Lisbonne).

Aujourd'hui, le CLÉO recense plus de trois millions de visites mensuelles et plus de 1 100 personnes formées par l'équipe d'OpenEdition en 2011 et 2012.

Huma-num

Huma-num est une très grande infrastructure qui permet aux sciences humaines et sociales de s'adapter aux évolutions numériques. Pour atteindre ses objectifs, elle conjugue la partie humaine avec des concertations collectives et la partie technologique avec la pérennité des services numériques grâce à la communauté au niveau national et européen. Cette structure met à disposition une grille de services dédiés, une plateforme d'accès unifié aux données et documents numérisés appelée ISIDORE[11] et un système d'archivage à long terme. Elle propose également des formations pour améliorer les pratiques des chercheurs en sciences humaines et sociales.

En France, ce qui structure fortement les humanités numériques, ce sont les infrastructures Huma-Num qui constituent une force du modèle français, intégré au niveau national. On observe que trois types d'activités définissent l'infrastructure, à savoir une activité de structuration des communautés scientifiques en consortium (le consortium Corpus d'auteurs pour les humanités, information, édition, recherche - CAHIER - rassemble les équipes qui travaillent sur des projets de mise en ligne de corpus organisés autour d'un auteur ou d'une thématique) ; le développement d'une "grille de services" qui offre l'hébergement, la diffusion et l'archivage à long terme des sources numérisées (plus de 120 projets hébergés) ; enfin Huma-Num a développé une plateforme de recherche spécialisée dans les données et publications numériques en sciences humaines et sociales avec plus de 2,5 millions de ressources indexées.

OpenEdition

Cette infrastructure est dédiée à la publication et la communication des résultats de recherche, elle est librement accessible et propose quatre plateformes : OpenEdition Books [12] qui compte plus de 1600 ouvrages ; Revues.org[13] qui diffuse près de 690 revues de sciences humaines et sociales ; Calenda [14] qui est un agenda des sciences humaines et sociales et permet aux organisateurs d'événements scientifiques la diffusion de l'annonce, en tout 22 000 programmes ont été partagés depuis 2000 ; et pour finir Hypothèses.org [15] qui est une plateforme dédiée aux carnets de recherche, des sites web pour la diffusion de l'information sur leurs recherches, cette plateforme accueille plus de 660 carnets de recherche, 800 livres et un programme de mise en ligne de 16 000 ouvrages d'ici 2020.

Ce sont au total plus de 200 000 documents qui sont accessibles librement sur internet. De plus, OpenEdition vient apporter des réponses aux problèmes de pérennité des documents, la diffusion en ligne et la valorisation des contenus. Ce site web compte plus de 35 millions de visites annuelles ce qui propulse la publication des sciences humaines francophones dans un espace ouvert, international et multilingue.

Quelques projets français emblématiques

Hyperprince

Il a pour objectif la numérisation et l'encodage en XML-TEI de quatre traductions du texte original en italien du Prince de Machiavel. Il est accompagné d'un thésaurus et d'un index qui permettent d'observer l'évolution du vocabulaire historique et politique de la réception du Prince à travers les siècles. Ce projet a été développé à l'ENS de Lyon.

E-diasporas

Ce projet phare est dirigé par Dana Diminescu qui établit des cartographies des réseaux des sites web publiés par les communautés de migrants. Ce projet a été développé au sein d'un programme scientifique au FMSH (Fondation Maison des sciences de l'homme) et s'appuie sur l'utilisation d'outils développés en France (Navicrawler ou Gephi qui sont des outils de construction d'un corpus web) afin de faire des comparaisons et de créer un dialogue scientifique. Ce projet constitue le rapprochement réussi entre sciences sociales et sciences du numérique.

PhotoNormandie

C'est une base de données de photos numérisées avec une mise à disposition et le partage par l'intermédiaire de la plateforme FlickR. La base est composée de 3000 photos prises par les services documentaires américains. Le site donne des fiches documentaires sur chaque objet et les internautes peuvent librement enrichir la base de données.

Criminocorpus

Ce projet est dirigé par Marc Renneville, depuis 2005. Il a pour objectif de créer un corpus de documents et de données sur l'histoire pénale en France, et propose une revue, un blog, 11 expositions virtuelles, une bibliothèque numérique, une bibliographie, deux éditions historiques de textes de loi et dix chronologies. Ainsi, toute une communauté peut consulter et commenter les documents par le biais d'une plateforme.

Digital Studies

Les digital studies sont une réflexion théorique autour de ce que le monde du numérique apporte aux différentes disciplines. Aujourd'hui, toutes les disciplines académiques sont influencées par les nouvelles technologies numériques et l'analyse de ces évolutions dans le cadre scolaire ou universitaire sont traduites comme des "études numériques".

Les humanités numériques se trouvent même dépassées par les études menées à l'Institut de recherche et d'innovation (IRI), ainsi il s'agirait d'une véritable rupture dans les modes d'apprentissage en raison des recherches contributives (en lien avec des personnes qui ne sont pas nécessairement des chercheurs) et la numérisation. Par conséquent les humanités numériques représenteraient une branche des digital studies puisqu'elles concernent toutes les formes de savoir (savoir-faire, savoir-vivre et savoir théorique). De plus, la technologie numérique touche aussi bien les sciences humaines que les sciences "dures" telles que la physique et les sciences expérimentales.

Aujourd'hui, le réseau des digital studies rassemble de nombreuses écoles et universités dans les pays suivants : Irlande, États-Unis, Équateur, Canada, Japon, Uruguay, Suisse, Angleterre, Allemagne et France.

Un Appel aux digital studies a été rédigé par Bernard Stiegler [16][17] dans le cadre du nouveau monde industriel (2012). Les technologies numériques révolutionnent notre manière d'accéder à l'écriture et donc notre manière de l'éditer, de la diffuser et de la partager et ces données sont accessibles dans l'immédiat par la rapidité que propose internet et les outils web.

Dans ce contexte, huit séminaires ont été organisés entre le 25 mars 2014 et 27 janvier 2015 au Centre Pompidou à Paris. Les comptes-rendus et vidéos des conférences sont disponibles en ligne.[18]

Humanités numériques et bibliothèques universitaires

  • Scholar Lab - Université de Virginie

On peut prendre l'exemple du Scholar Lab[19] de l'Université de Virginie, créé en 2006, où les professeurs, diplômés et bibliothécaires travaillent ensemble sur l'élaboration de projets. Ainsi, étudiants et chercheurs peuvent bénéficier de consultations avec des experts en humanités numériques. Ce laboratoire (Institute for Advanced Technologies for Humanities = IATH) se trouve dans l'une des grandes universités américaines, constituée de 11 écoles dans des disciplines variées. L'IATH a été placé au sein même de la plus importante bibliothèque du campus (l'Alderman Library) pour mettre à disposition un centre spécialisé dans les pratiques et usages des outils numériques afin de les développer dans les recherches en sciences humaines.

À la création de l'institut, en 1992, la bibliothèque et l'IATH se sont formés autour de l'Etext (Electronic Text Center) qui permet d'encoder des données pour enrichir une collection de documents disponible en ligne pour l'enseignement et les étudiants et qui aurait pour objectif de former une communauté d'usagers capables de créer mais aussi d'exploiter les productions scientifiques. La bibliothèque participe également à la conservation des bases de données liées aux projets du laboratoire, ce qui a donné naissance à l'outil Fedora qui permet de gérer des formats de métadonnées.

Le laboratoire peut également offrir des bourses de recherches aux étudiants de l'université et propose chaque année à certains de travailler autour d'un même projet centré sur les humanités numériques. Ce laboratoire constitue un réel centre de recherche et développement dans le domaine des humanités numériques et participe à la création d'outils à disposition des bibliothèques.

  • Emory University

Le centre Emory en digital humanities fonctionne d'une manière assez semblable puisqu'elle offre un soutien pour l'enseignement numérique, la recherche et l'édition pour permettre aux étudiants et chercheurs de gérer au mieux leurs projets grâce à des séminaires et des ateliers de formations. Également rattaché à la bibliothèque, le centre a mis en place des projets expérimentaux pour améliorer le domaine de la recherche en sciences humaines et sociales et développer les services proposés par les bibliothèques. Ainsi dans cette optique, la bibliothèque sert de laboratoire.

Face à l'arrivée des nouvelles technologies numériques, la bibliothèque s'est développée avec la mise en place de projets expérimentaux pour créer un véritable plus pour les étudiants et les chercheurs. La bibliothèque est ainsi vue comme un laboratoire en lui-même en plaçant la structure dans un contexte d'innovation à travers l'apparition des nouveaux outils numériques. Dans un contexte de restriction budgétaire, cette installation permet de faire évoluer la structure et les projets de manière à minimiser les risques. Ainsi, la bibliothèque établit des missions prioritaires en veillant à ce qu'elles soient inscrites en temps qu'expérimentations pour anticiper les besoins des chercheurs et des étudiants à l'avenir pour que la bibliothèque devienne un acteur à part entière au lieu d'être un partenaire auprès du laboratoire spécialisé dans les humanités numériques. À l'Emory University, la bibliothèque et le laboratoire ont mis en place The Voice of the Customer qui permet de recueillir des informations liées aux pratiques des usagers, cette étude s'appuie sur les résultats des usagers et les réponses de ceux-ci lors d'entretiens ou de groupes de réflexions. Pour compléter cette étude, des bibliothécaires se sont rendus sur le lieu de travail de certains chercheurs pour établir des partenariats autour de projets ou les intégrer à la gestion des ressources électroniques. De plus les équipements numériques sont considérés, non pas seulement comme des outils pour accéder à des contenus numériques, mais comme un moyen d'améliorer les services proposés par la bibliothèque pour ensuite créer une relation avec le domaine de la recherche en sciences humaines et sociales.

Notes

  1. Marin Dacos et Pierre Mounier, Humanités numériques - État des lieux et positionnement de la recherche française dans le contexte international, Institut Français, Paris, 2014, pp. 89. Accéder au rapport (en pdf).
  2. Accéder au texte du Manifeste des Digital Humanities sur hypothese.org.
  3. Mélissa Terras, Un regard jeté sous le chapiteau, OpenEdition Press, 2012, traduit par Pierre Mounier.
  4. Accéder au Brown Corpus Manual
  5. Accéder au texte Susan Schreibman, John Unsworth et Ray Siemens, A Companion to Digital Humanities
  6. Accéder à Centernet
  7. Accèder à la page personnelle de Neil Fraistat du Maryland Institute for Technology in the Humanities
  8. Accèder au site
  9. American Council for Learned Societies, Our Cultural Commonwealth, New York, 2006, pp. 44. Accéder au rapport (en pdf)
  10. Accéder au site du CLÉO
  11. Accéder à la plateforme d'accès unifié ISIDORE
  12. Accéder aux livres en sciences humaines et sociales accessible sur OpenEdition
  13. Accèder aux revues numériques dans OpenEdition
  14. Accèder aux événements recensés par OpenEdition
  15. Accéder aux carnets de recherche publiés dans OpenEdition
  16. Accéder à la biographie de Bernard Stiegler sur Wikipédia
  17. Accéder à l'Appel aux digital studies sur le site Digital Studies
  18. Accéder aux comptes-rendus et vidéos sur le site Digital studies.
  19. Accéder au site du Scholar Lab.