academia_eduCe billet résume un billet original de Gary Hall, professeur à Coventry University, paru mi-octobre 2015 sur Media Gift puis sur la plate-forme de blogs de la London School of economics (lire ici le billet original).

Avec plus de 36 millions de visiteurs chaque mois, la popularité massive d’Academia.edu est incontestable. Pourtant, y déposer une publication (ou sur Researchgate) est-il éthiquement et politiquement comparable à la diffuser dans une archive ouverte institutionnelle (type HAL ou Orbi), comme bien des chercheurs semblent le penser ?

Mi-octobre 2015 s’est tenue, comme chaque année, l’Open Access Week, événement annuel en faveur de la diffusion en ligne libre et gratuite des résultats de la recherche. C’est l’occasion rêvée de se demander si le mouvement pour l’accès ouvert ne risque pas, avant même d’avoir pris son envol, d’être débordé par Academia.edu et consorts ? La start-up californienne, fondée en 2008, n’a-t-elle pas saisi l’importance d’agir à l’échelle mondiale et de manière centralisée dans un environnement qui passe très rapidement d’un modèle centré sur les contenus à un modèle de plus en plus basé sur les données ?

Academia.edu présente de nombreux traits communs avec des réseaux sociaux professionnels comme LinkedIn. Les utilisateurs ouvrent un profil sous leur vrai nom, avec photo, CV, rattachement institutionnel, biographie et parcours professionnel. Ces informations sont accompagnées des sujets de recherche et d’une liste de publications, ainsi que, de plus en plus souvent, des textes intégraux des articles eux-mêmes que les autres membres du réseau peuvent télécharger. Academia.edu permet également à ses utilisateurs de s’envoyer des messages, de déposer des versions de travail des papiers sur lesquels ils souhaitent avoir un premier retour de leurs pairs, et de recevoir des alertes. De surcroît, des statistiques détaillées sont proposées : nombre de followers, nombre de pages vues, nombre de téléchargements, et ainsi de suite (lire ici).

Même si Academia.edu se décrit comme « un service de mise en réseau » pour universitaires qui « permet à ses utilisateurs de se connecter avec d’autres chercheurs du monde entier travaillant sur les mêmes domaines », elle se positionne de plus en plus comme une plateforme permettant aux universitaires de partager leurs recherches. 26 281 552 personnes avaient ouvert un compte sur academia.edu à la date du 18 octobre 2015, déposé 6 972 536 articles et déclaré 1 730 462 domaines de recherche. Preuve s’il en faut qu’il s’agit bien d’une plateforme de partage de recherche, Elsevier, juste après son acquisition du réseau Mendeley, a envoyé à Academia.edu 2800 demandes de retrait pour non-respect des règles de copyright (Digital Millenium Copyright Act takedown notices) (lire ici).

Cette popularité du réseau social Academia.edu – son fondateur Richard Price va jusqu’à proclamer qu’il s’agit du plus grand réseau de chercheurs au monde et qu’il pèse plus que tous ses concurrents réunis – soulève bien des questions, notamment en ce qui concerne le mouvement pour l’accès ouvert.

En effet, en comparaison de l’inertie (et parfois de la franche résistance) avec laquelle sont reçus depuis la fin des années 1990, les appels à rendre la recherche disponible en accès ouvert, Academia.edu a réussi, en un temps record, à faire que les chercheurs partagent leurs papiers : cela laisse à entendre que pour beaucoup, la priorité n’est pas tant de rendre leur travail disponible gratuitement et de le disséminer le plus largement et le plus rapidement possible, que de construire réseau, carrière et réputation sur un mode individualiste. Ce n’est pas vraiment étonnant, lorsqu’on connaît la précarité du statut des chercheurs dans bien des pays.

Cela signifie-t-il que toute initiative en faveur de l’accès ouvert serait bien avisée, pour réussir, de faire comme academia.edu et les autres réseaux sociaux et d’aider à développer l’identité numérique et le « marketing » personnel des chercheurs ? Certains projets Open Access l’ont déjà fait, bien sûr, y compris Plos dont les journaux fournissent des indicateurs à l’échelle de l’article, des mesures de citation et d’autres indicateurs d’utilisation. Pragmatiquement, un tel projet purement d’Open Access serait-il capable d’investir suffisamment d’argent public pour concevoir et maintenir un réseau social aussi facile d’utilisation qu’Academia.edu, qui déjà levé 17,7 millions de $ d’investissement privé à l’heure où est écrit cet article ?

Bonne raison pour regarder de plus près le modèle économique d’Academia.edu. A l’inverse de certains éditeurs commerciaux, ce modèle ne se base pas sur le fait que les auteurs ou leurs institutions paient des frais pour que leur recherche soit diffusée gratuitement, modèle couramment désigné sous le nom de modèle « auteur-payeur », ou Article Processing Charges (APC, paiement à l’article publié). Sa rentabilité financière repose au contraire sur la capacité des business angels qui veillent aux destinées d’Academia.edu, à exploiter les flux de données générées par les universitaires qui utilisent la plateforme.

Selon les termes mêmes de Richard Price, PDG d’Academia.edu : « Le but est de fournir des données de tendance à des entreprises de recherche et développement pour leur permettre d’améliorer la pertinence de leurs décisions de 10 à 20 %. Le type d’algorithmes que recherchent les compagnies de R&D, sont des « indicateurs de tendance » des papiers les plus en vue, analogue à l’algorithme des « trending topics » de Twitter. Un tel algorithme peut permettre connaitre quels sont les papiers qui ont le plus d’impact dans un domaine donné, dans les dernières 24h, semaine ou mois, ou sur n’importe quelle période et de vendre cette information. Plus de mille milliards de dollars par an sont consacrés à des dépenses de Recherche et développement : plus de 200 milliards de dollars dans la recherche publique et plus de 800 millions dans le secteur privé (compagnies pharmaceutiques et autres grosses compagnies de RD) » (lire ici).

Bien évidemment, la plupart des universitaires qui font partie du réseau social d’academia.edu travaillent dans l’enseignement supérieur ou dans de grands organismes de recherche publics (dont le financement est d’ailleurs en tension depuis des années dans bien des pays).

De la même manière qu’AirBnB et Uber se développent en utilisant – sans contribuer à les financer – des infrastructures et des investissements publics qui ont été faits par les villes voilà une génération (routes, immeubles, éclairage public, etc) (lire ici), Academia.edu a une relation parasitaire au système d’enseignement supérieur public : les chercheurs donnent gratuitement de leur temps pour aider à construire une plateforme privée, à but commercial, en fournissant gracieusement des contenus, des données et de l’attention. Pour répondre à la question initiale, il est donc clair que publier sur academia.edu n’est ni éthiquement, ni politiquement la même chose que de rendre ses recherches disponibles en les diffusant par le biais d’une archive ouverte institutionnelle (comme Hal, Hal-inria, ArXiv, Orbi, etc.)

Le modèle économique d’une plateforme comme academia.edu est met en lumière combien publication et diffusion de l’information scientifique et technique ont changé depuis les débuts du mouvement en faveur de l’Open Access, dans les années 1990 et au début des années 2000. Sans nul doute, l’argument de ce mouvement, selon lequel les résultats des recherches sur fonds publics doivent être mis à disposition en ligne gratuitement, est extrêmement pertinent dans le modèle basé sur les contenus qui a fait la fortune des très rentables géants de l’édition scientifique que sont Reed-Elsevier, Springer, Wiley-Blackwell ou Taylor & Francis/Informa, avec leurs journaux aux coûts astronomiques et leurs livres à prix d’or, leurs stratégies de « Big deals » saignant à blanc les bibliothèques universitaires, et leurs contrats léonins de cession de droits d’auteurs. Pourtant, cet argument n’est guère pertinent dans le monde centré sur les données des moteurs de recherche et des réseaux sociaux. C’est pourquoi, pour Google, Twitter, Academia.edu et autres empires technologiques à but lucratif, le contenu gratuit est la base même de leur existence. Dans ce monde-là, celui qui contrôle l’accès aux contenus (et de ce fait, peut en tirer un maximum de profit) importe moins que celui qui contrôle les données générées par l’utilisation de ce contenu (et, en les contrôlant, peut en tirer le plus grand profit), utilisation qui est d’autant plus grande que l’accès aux contenus est gratuit.

En conséquent, avant d’aller diffuser tête baissée ses articles sur Research Gate ou Academia.edu les vraies questions à se poser doivent porter sur qui possède et contrôle ces plateformes, ainsi que les boîtes noires des programmes informatiques, des logiciels, des algorithmes qui donnent accès au plus de contenu gratuit possible. Comment sont structurés ces intermédiaires du data management? Quelles données collectent-ils ? De quelles manières peuvent-ils les manipuler ? Qui fait quoi de ces données ainsi que des mesures et des indicateurs chiffrés ? Sont-ils vendus à des publicitaires ou à des compagnies à vocation commerciale ? Partagés avec la NSA ? Et en tant qu’environnement technologiques qui encouragent leurs utilisateurs à faire preuve d’autodiscipline, d’autonomie et d’autogestion, quelle formes de subjectivité et de biais produisent-elles ?

Un monde centré sur les données, est un monde dominé par celui qui concentre le plus de données, les « serveurs-sirènes » chers à Jaron Lamier (lire ici). Ce qui nous amène à la question de la masse critique. Pour faire simple, plus vous pouvez collecter, stocker, traiter, rechercher et manipuler de données, plus vos analyses seront pertinentes. Ce n’est pas parce que Google a les meilleurs algorithmes qu’il domine à 90-95% le marché des moteurs de recherche en Europe, c’est parce qu’il a le plus de données, selon Peter Borvig, son Director of Research. C’est aussi pourquoi de telles compagnies tendent à devenir des monopoles : il est plus difficile pour elles d’atteindre la masse critique nécessaire pour produire des analyses de données monnayables si elles ont des concurrents qui captent une partie significative des données pertinentes.

Aujourd’hui, les infrastructures décentralisées et polymorphes du mouvement de l’accès ouvert (Green, archives institutionnelle ; Gold, modèle auteur-payeur ; platine, type revues.org, financé sur fonds publics), avec écosystème diversifié de journaux, d’archives institutionnelles, de sites webs, de portails sont adaptées pour à la mise en ligne gratuite d’une bonne partie de la recherche, et offrent des modèles d’accès alternatifs aux contenus « fermés » des éditeurs petits et grands, eux-mêmes relativement décentralisés et concurrentiels.

L’importance croissante de pouvoir créer d’énormes sets de données, signifie toutefois qu’une telle infrastructure décentralisée est sur le point d’être progressivement remplacée par ce que Rachel O’Dryer, dans un article récent sur les blockchains (bases de données distribuées) décrit comme une recentralisation des infrastructures. Des quantités de contenus pourront être accessibles gratuitement, mais cet accès se fera désormais par l’intermédiaire de très grosses entités spécialisés et monopolistiques. Résultat des courses : ces compagnies riches et puissantes qui sont capables de capter, analyser et exploiter de très grandes quantités de données vont jouer le rôle de contrôleurs de nos réseaux de médias de et communications : l’inquiétant est que cela inclut nos réseaux de communication scientifiques comme en témoignent les 36 millions de visiteurs qui sont apparemment attirés par la plateforme de partage de recherche Academia.edu chaque mois et la croissance, en France comme ailleurs, du nombre de chercheurs enregistrés.

Et vous, que choisirez-vous de faire ?

Ce billet nous est proposé par Ufolib, qui a fait la traduction et un résumé du texte de Gary Hall. Ce texte original a été d’abord publié sur le carnet de notes en ligne de Gary Hall, Media Gifts. Ces contenus peuvent être distribués, reproduits, transmis, traduits, modifiés, remixés, servir de base à d’autres travaux utilisé et « piratés » sous toutes leurs formes, y compris sans indications d’origine.