LePartisan - 9 vues
MEDIAS REVUES BLOGS
URL du flux RSS

▸ les 25 dernières parutions

27.05.2026 à 10:09

Centres de données : pourquoi leur refroidissement consomme autant d’eau (et pourquoi cela pose problème)

Thomas Le Goff, Maître de conférences en droit et régulation du numérique, Télécom Paris – Institut Mines-Télécom
La course à l’IA engagée à l’échelle internationale ne doit pas se traduire par un détricotage des règles préservant nos ressources naturelles.
Texte intégral (1840 mots)

La course à l’IA engagée à l’échelle internationale ne doit pas se traduire par un détricotage des règles préservant nos ressources naturelles.


Qui n’a pas déjà expérimenté la désagréable sensation de surchauffe de son téléphone portable ou de son ordinateur lors d’une utilisation prolongée ou lorsque vous avez ouvert trop d’onglets sur votre navigateur ?

Imaginez maintenant la chaleur dégagée par 100 000 puces de calcul de dernière génération, entassées les unes sur les autres et tournant à plein régime, et ce, dans un complexe de plus de 26 kilomètres carrés soit environ 3714 terrains de football. Placez ce grille-pain géant dans une région où la température est de 35 degrés en moyenne et peut atteindre les 50 °C l’été, et vous voilà devant le projet « Stargate UAE » visant à construire jusqu’à 5 gigawatts de puissance de calcul installée dans un immense centre de données à Abu Dhabi.

Ces projets de centres de données dits « hyperscale » visant à alimenter l’essor de l’intelligence artificielle (IA) se multiplient dans le monde, que ce soit aux États-Unis avec le projet Prometheus de Meta prévoyant la construction d’un centre de données de la taille de Manhattan, et même en France avec le « Campus IA ».

Au-delà de leur importante consommation énergétique, ces mastodontes soulèvent d’autres problèmes. Pour fonctionner correctement, ils ne peuvent pas atteindre des températures trop élevées, et contiennent donc des systèmes de refroidissement qui permettent aux composants électroniques de fonctionner à plein régime tout en évitant qu’ils ne se détériorent sous la chaleur qu’ils dégagent.

Comment ces centres de données sont-ils refroidis ? Quel est l’impact de leur refroidissement sur l’environnement, et comment les rendre plus sobres ?

Centres de données, refroidissement et consommation en eau

Il existe plusieurs techniques pour refroidir un centre de données. Pour le résumer simplement, les systèmes de refroidissement reposaient auparavant exclusivement sur des systèmes de ventilation (comme dans votre ordinateur) ou de climatisation (comme dans votre voiture) qui utilisent la circulation de l’air comme source de fraîcheur et rejettent l’air chaud à l’extérieur.

Une deuxième solution de refroidissement utilise l’eau, beaucoup plus efficace que l’air pour transférer la chaleur. Celle-ci permet de rafraîchir des plaques placées proches des composants électroniques, et/ou de rafraîchir l’air ventilé dans l’entrepôt de données.

Dans le premier cas (la climatisation), l’opérateur a besoin de beaucoup d’énergie pour faire tourner les pompes et systèmes de ventilation. Dans le deuxième (le refroidissement liquide), l’entreprise a besoin de moins d’énergie mais nécessitera l’accès à une source d’eau douce (l’eau salée endommagerait les tuyaux et composants) afin d’alimenter son système en eau fraîche.

Les opérateurs de centres de données sont donc face à un arbitrage complexe : doivent-ils utiliser des systèmes de climatisation énergivores ou bien du refroidissement liquide qui, cette fois, nécessite la consommation d’importantes ressources en eau ?

En effet, la consommation en eau des data centers est estimée à 560 milliards de litres chaque année dans le monde, soit l’équivalent de la consommation annuelle en eau potable de 10 millions de Français.

Cette soif insatiable se retrouve également dans les chiffres publiés par les Gafam. Ainsi, Google a vu sa consommation nette d’eau augmenter de 28 % entre 2023 et 2024, atteignant 30 milliards de litres dont environ un tiers provient de régions en stress hydrique. Microsoft, pour sa part, estime que 46 % de ses prélèvements d’eau ont lieu dans de telles zones en 2024.

Toutefois, il faut avoir à l’esprit que les besoins en eau des data centers ne sont pas uniquement liés aux systèmes de refroidissement. Pour obtenir une vision globale de l’impact du développement de ces infrastructures sur les ressources en eau, il convient de prendre également en compte l’eau utilisée par les centrales électriques qui les alimentent, ainsi que l’eau consommée lors du processus de fabrication des composants électroniques. Des chercheurs estiment ainsi que les mégacentres de données construits spécifiquement pour les besoins de calcul de l’IA utilisent, en moyenne, jusqu’à 20 millions de litres d’eau par jour, soit autant qu’une ville de 10 000 à 50 000 habitants.

Peut-on rendre les centres de données moins gourmands en eau ?

Il existe des solutions innovantes pour limiter cette consommation et rendre les systèmes de refroidissement plus efficients. Des entreprises, comme OVH Cloud, Nvidia ou Nebius, développent et déploient de nouvelles architectures de systèmes de refroidissement liquide au plus proche des puces de calcul. Ces nouvelles techniques permettent de réduire, selon les chiffres annoncés, jusqu’à 50 % de la consommation en eau. Toutefois, elles restent encore onéreuses à mettre en œuvre et assez peu développées sur le parc existant.

De manière plus générale, la principale source de perte en eau lors du fonctionnement des centres de données vient du fait qu’ils reposent aujourd’hui pour la plupart sur des circuits ouverts, conduisant à l’évaporation d’une grande partie de l’eau utilisée. C’est pourquoi les nouveaux centres de données devraient idéalement reposer, autant que possible, sur des systèmes de refroidissement en circuit fermé, évitant ce phénomène d’évaporation. Néanmoins, ce type de refroidissement peut s’avérer plus cher, conduit souvent à une hausse du besoin en électricité, et n’est pas évident à mettre en œuvre dans tous les centres de données « historiques » qui n’ont pas été conçus pour le mettre en œuvre.

Des propositions plus farfelues sont aussi avancées, telles que l’envoi de data centers dans l’espace ou bien en immersion dans les océans. Néanmoins, l’apport réel de ces propositions reste encore largement débattu, que ce soit pour des questions de faisabilité technique (bon courage pour réaliser la maintenance de votre centre de données sous-marin !) ou de bénéfices en termes d’émission de CO₂ par rapport à un centre construit sur terre – le cabinet de conseil en décarbonation, Carbone 4, fondé par Alain Grandjean et Jean-Marc Jancovici a, à cet égard, montré que les data centers spatiaux risquaient d’avoir un impact carbone plus important que sur terre en raison des émissions liées au lancement.


À lire aussi : Pourrait-on faire fonctionner des data centers dans l’espace ?


Pour un développement raisonné des centres de données, conscient du caractère fini des ressources naturelles

Au-delà de la faisabilité technique, ces discours risquent de nous détourner du vrai problème : le développement massif de centres de données hyperscale très gourmands en eau, dont une bonne partie dans des territoires où cette ressource se fait rare et conduit à des conflits d’usage.

Ce développement ne se fait pas dans un vide juridique. Les règles du droit de l’environnement, de l’aménagement du territoire et de l’urbanisme prévoient un certain nombre de régimes d’autorisation et d’évaluation environnementale en amont de la construction de ces projets, notamment en France avec le régime des installations classées pour la protection de l’environnement (ICPE).

Néanmoins, la course à l’IA engagée à l’échelle internationale conduit les pays à rivaliser d’ingéniosité pour attirer les investisseurs quitte, parfois, à assouplir les contraintes réglementaires comme c’est le cas actuellement en France avec la loi dite de simplification de la vie économique récemment adoptée. Il est urgent de prêter attention à l’ode à la « simplification », qui provient des discours politiques au sein de l’Union européenne et transcrite dans la politique menée par la Commission européenne, mais qui ne doivent pas se traduire par un détricotage des règles préservant nos ressources naturelles.

Plus généralement, ces débats soulèvent la question de l’usage : alors que certaines économistes parlent de « bulle de l’IA », qui peut réellement prédire quels seront les véritables usages futurs de ces infrastructures ?

Dans les années 1960, il fallait un bâtiment entier pour faire tenir un ordinateur, ils tiennent aujourd’hui dans notre smartphone. Si les IA de demain tiennent aussi sur nos terminaux, doit-on réellement sacrifier nos ressources naturelles pour créer ces mastodontes ?


À lire aussi : Charles Ponzi nous permet-il de comprendre la bulle de l’IA ?


The Conversation

Thomas Le Goff est Research Fellow au sein du think thank Centre on Regulation in Europe (CERRE).

27.05.2026 à 10:09

L’oubli catastrophique, ou pourquoi les IA ne savent pas encore apprendre en continu

Eric Moulines, Professeur en apprentissage statistique et traitement du signal, EPITA; Académie des sciences
Lorsqu’un modèle d’IA est mis à jour naïvement, on peut être confronté au problème de l’oubli catastrophique : le modèle a progressé sur les données récentes, mais perd brutalement en performance sur les données plus anciennes.
Texte intégral (2963 mots)

Un modèle d’IA peut être très performant dans un cadre contrôlé, mais se dégrader lorsque les données qu’il reçoit en conditions réelles ne ressemblent plus exactement aux données sur lesquelles il a été conçu, validé ou récemment mis à jour.

Ainsi, lorsque la mise à jour du modèle est faite naïvement, on peut être confronté au problème de l’« oubli catastrophique » : le modèle a progressé sur les données récentes, mais perd brutalement en performance sur les données plus anciennes. Ce sont précisément ces difficultés qui motivent le développement de l’« apprentissage continu ».


Dans l’apprentissage automatique « classique », on entraîne un réseau de neurones sur un très grand ensemble de données, puis on l’utilise tel quel. Mais ce cadre devient insuffisant lorsque les données arrivent au fil du temps, par exemple dans le cas de données météo, à l’arrivée de nouveaux patients dont la démographie ou la génération évolue, ou encore avec de nouvelles pratiques professionnelles.

Un système de Google Health destiné à automatiser le dépistage de la rétinopathie diabétique (l’ensemble des maladies de la rétine dues à la détérioration des vaisseaux rétiniens par le diabète) était prometteur lors d’évaluations contrôlées. En clinique, en revanche, il a rencontré des difficultés : sur 1 838 images traitées pendant les six premiers mois d’usage dans onze cliniques en Thaïlande, 393 (21 %) n’atteignaient pas le seuil de qualité requis.

Cet exemple ne signifie pas que la rétinopathie diabétique aurait changé en quelques mois. Il montre plutôt que les données vues par le système en clinique peuvent différer fortement de celles utilisées lors de son développement : qualité variable des images, différences de caméras, luminosité, reflets, patients plus difficiles à photographier, contraintes de temps et organisation du dépistage.

Autrement dit, la distribution des données change lorsque l’on passe d’un cadre contrôlé à un environnement réel. C’est précisément ce type de décalage qui rend insuffisant un modèle figé et qui pose la question suivante : comment adapter le modèle à ces nouvelles conditions sans perdre ce qu’il savait déjà faire ?

Les méthodes les plus simples conceptuellement, par exemple un réentraînement complet sur toutes les données, incluant les nouvelles, exigent beaucoup de calculs et sont donc peu réalistes.

Le continual learning, ou apprentissage continu, vise justement à faire évoluer le modèle au rythme du flux de données : s’adapter, intégrer de l’information nouvelle et apprendre des tâches successives, sans repartir systématiquement de zéro. Il se distingue d’un simple réentraînement périodique par une contrainte essentielle : apprendre le nouveau sans détruire l’ancien.

Au fond, l’apprentissage continu cherche un compromis entre deux exigences opposées] : la plasticité, nécessaire pour apprendre du nouveau, et la stabilité, indispensable pour ne pas effacer l’ancien.

Pourquoi les modèles d’IA oublient-ils ?

La difficulté vient du fait qu’un réseau de neurones n’a pas une mémoire rangée en dossiers indépendants. Les mêmes paramètres – les mêmes neurones et les mêmes connexions – servent souvent à plusieurs tâches.

Si les tâches se ressemblent, cette mutualisation est utile : le modèle peut réutiliser des représentations déjà apprises. Mais si les tâches diffèrent, les mises à jour nécessaires à la nouvelle tâche entrent en concurrence avec ce qui faisait la réussite des anciennes.

Prenons un exemple simple. Un modèle industriel a appris à détecter des défauts sur des pièces métalliques à partir d’images prises avec une première caméra. Plus tard, l’usine remplace la caméra : la résolution, la luminosité et les reflets changent. Si l’on réentraîne le modèle uniquement avec les nouvelles images, il peut s’adapter au nouveau capteur, mais perdre en performance sur les images produites par l’ancien système. Ce n’est pas parce que les anciens défauts ont disparu ; c’est parce que les paramètres qui les reconnaissaient ont été modifiés pour résoudre le nouveau problème.

En production, les incidents publiés sont plus souvent décrits comme des « décalages de données » que comme de l’oubli catastrophique. Les deux problèmes restent liés : dès qu’un modèle est mis à jour avec des données récentes, il faut éviter d’effacer des compétences antérieures.

Une étude récente menée sur des modèles d’IA utilisés à l’hôpital illustre bien cette difficulté. Les chercheurs ont supervisé un système chargé d’estimer le risque de décès de patients hospitalisés. Avec le temps, les dossiers reçus par ce système ont changé : les patients n’étaient plus exactement les mêmes, certaines mesures médicales variaient, et les pratiques hospitalières ont été bouleversées, en particulier pendant le Covid-19.

Le problème n’est donc pas qu’un dossier isolé serait anormal. C’est l’ensemble des données qui se transforme peu à peu. Pour rester utile, le modèle doit alors être mis à jour avec des exemples plus récents. Dans l’étude, cette mise à jour permettait effectivement de meilleurs résultats qu’un modèle laissé tel quel. Mais il y a un risque : si on laisse le système « apprendre » trop sur les données récentes, le modèle peut se spécialiser et devenir très bon sur les cas nouveaux, tout en perdant une partie de ses capacités sur les cas plus anciens. Il s’adapte au présent, mais au prix d’un oubli du passé. C’est ce qu’on appelle l’« oubli catastrophique ».

Pour intégrer des informations nouvelles sans sacrifier ce qui a déjà été appris, plusieurs grandes familles de méthodes existent : rejouer une partie du passé, protéger certains paramètres, modifier l’architecture du modèle ou apprendre des représentations plus stables.

Garder en mémoire des exemples représentatifs

La première, assez intuitive, consiste à rejouer le passé. C’est le « replay » : on conserve une petite mémoire d’exemples représentatifs des tâches antérieures et l’on entraîne le modèle sur un mélange « nouvelles données + mémoire ». C’est une forme de révision : le modèle ne relit pas tout le manuel, mais revoit quelques pages bien choisies.

Dans un système de reconnaissance d’images qui apprend progressivement de nouvelles catégories, on peut garder quelques images typiques de chaque ancienne classe, mais aussi des cas ambigus proches des frontières entre classes. Des méthodes comme iCaRL ont popularisé cette idée : apprendre de nouvelles classes tout en gardant un petit ensemble d’exemples représentatifs des anciennes.

Lorsque stocker des données réelles est difficile – pour des raisons de confidentialité, de coût ou de stockage – on peut recourir à un modèle génératif. Entraîné sur le passé, ce modèle produit des exemples artificiels des anciennes tâches, qui jouent le rôle de « souvenirs » synthétiques. Cette stratégie, appelée generative replay, peut réduire le besoin de conserver les données originales.

Mais ces données synthétiques ne sont pas automatiquement équivalentes aux données initiales. Elles peuvent manquer de diversité, négliger les cas rares, amplifier certains biais ou produire des exemples plausibles mais trompeurs. Il faut donc les valider : vérifier qu’elles couvrent les anciennes classes, préservent les cas difficiles et maintiennent les performances sur des jeux de test indépendants.

Les travaux récents sur l’entraînement répété à partir de données synthétiques montrent aussi un risque d’« effondrement » du modèle : à force d’apprendre sur des données synthétiques, il peut perdre des informations sur la vraie distribution, surtout sur ses parties « rares ».

Toute la question est donc de décider quoi conserver (ou générer) lorsque l’on a un budget restreint : des exemples typiques, rares, difficiles, ou un mélange des trois.


À lire aussi : Apprendre à oublier : le nouveau défi de l’intelligence artificielle


Protéger certains paramètres du modèle

Une deuxième famille de méthodes vise non pas à conserver des exemples, mais à protéger certaines parties du modèle. L’idée est d’identifier les poids déterminants pour les tâches passées, puis d’ajouter une pénalité lorsqu’ils changent trop pendant l’apprentissage d’une nouvelle tâche. Le modèle peut continuer à apprendre, mais il paie un « coût » plus élevé lorsqu’il modifie des paramètres jugés importants pour ses compétences anciennes.

C’est le principe de méthodes comme Elastic Weight Consolidation : ralentir l’apprentissage sur les poids importants pour les tâches déjà vues, afin de réduire l’oubli.

Une approche voisine, mais différente, consiste à préserver le comportement de l’ancien modèle plutôt que ses poids. On ajoute alors un terme de coût qui encourage le modèle mis à jour à produire des sorties proches de celles de l’ancien modèle sur des données de référence. C’est le principe de la « distillation » : l’ancien modèle joue le rôle de professeur, et le nouveau apprend la nouvelle tâche sans trop s’éloigner des réponses du professeur. La méthode Learning without Forgetting repose sur cette logique, même lorsque les données initiales ne sont plus disponibles.

La différence est donc la suivante : la régularisation des poids demande de « ne pas trop déplacer ces réglages internes », tandis que la distillation demande de « garder un comportement proche de l’ancien modèle ». Dans les deux cas, on peut parfois limiter l’oubli sans stocker toutes les données passées.

Leur limite est le compromis imposé : si l’on protège trop le modèle, il devient moins plastique et apprend moins bien la nouvelle tâche. Dans l’exemple du changement de caméra, protéger les anciens paramètres peut aider à reconnaître les défauts déjà connus, mais une protection trop forte empêchera le modèle de s’adapter à la nouvelle luminosité ou à la nouvelle résolution.

Superposer à l’ancien modèle de nouvelles couches de neurones qui apprennent des nouvelles données

Une troisième stratégie consiste à éviter de faire tenir tous les apprentissages dans les mêmes paramètres. Plutôt que de modifier sans cesse le même réseau, on peut réserver des « espaces » distincts à différentes tâches.

Certaines approches figent les parties du réseau déjà apprises et ajoutent, pour chaque nouvelle tâche, de nouveaux modules reliés aux précédents. Les réseaux progressifs, par exemple, ajoutent de nouvelles colonnes de neurones tout en réutilisant les connaissances acquises par des connexions latérales. Le modèle bénéficie ainsi de l’expérience accumulée sans risquer de la dégrader.

D’autres méthodes apprennent à n’activer qu’une partie des paramètres selon la tâche ou le contexte. On peut imaginer le modèle comme un réseau routier : au lieu de faire passer toutes les tâches par la même route, il apprend quels chemins internes utiliser pour chaque situation. Les approches par masques d’attention ou par sélection de sous-réseaux suivent cette logique.

Enfin, lorsque la nouvelle tâche est trop éloignée des précédentes, on peut agrandir le modèle en lui ajoutant des neurones ou des modules. Des méthodes comme PackNet exploitent par exemple les redondances d’un grand réseau pour libérer puis réserver des paramètres à de nouvelles tâches.

Ces stratégies réduisent sensiblement l’oubli, mais elles ont un coût : le modèle peut grossir au fil du temps, et il faut parfois savoir, au moment de l’usage, quelle partie du réseau mobiliser. Dans certains cas, cette information est disponible — par exemple si l’on sait quelle tâche est demandée. Dans d’autres, le modèle doit aussi apprendre à reconnaître le contexte.

Apprendre des représentations plus stables

Une piste complémentaire consiste à agir plus en amont : il ne s’agit pas seulement de protéger le modèle ou de lui ajouter des modules, mais de lui apprendre des représentations internes plus stables.

Une représentation interne, ou embedding, est la description numérique qu’une couche intermédiaire fabrique à partir d’une donnée. Une image, un texte ou un signal de capteur est transformé en un vecteur de nombres qui résume certaines caractéristiques utiles : formes, textures, mots, régularités, anomalies. Si deux données se ressemblent, on aimerait que leurs représentations soient proches ; si elles correspondent à des classes différentes, on aimerait qu’elles soient bien séparées.

L’objectif est alors d’organiser cet espace de représentation de façon à ce qu’il change le moins possible lorsque de nouvelles tâches arrivent. On peut conserver quelques prototypes — des représentants typiques d’une classe — qui servent d’ancrages. On peut aussi utiliser des méthodes contrastives, qui rapprochent les exemples semblables et éloignent les exemples différents dans l’espace des représentations. Ces méthodes sont utiles parce qu’elles tendent à extraire des caractéristiques plus générales, donc moins dépendantes d’un contexte particulier.

On peut également pratiquer un replay en espace latent : au lieu de stocker les données brutes, on mémorise les activations produites par une couche intermédiaire du réseau. Cette stratégie peut réduire fortement le coût en mémoire et en calcul. Elle ne résout toutefois pas automatiquement toutes les questions de confidentialité : une représentation interne peut encore contenir des informations sensibles !

Combiner plusieurs mécanismes pour éviter les oublis catastrophiques

Dans les systèmes les plus efficaces, ces idées ne sont pas utilisées isolément. On combine fréquemment plusieurs mécanismes : un petit tampon de replay avec une régularisation des poids, du replay avec de la distillation, ou encore des représentations stables avec une architecture modulaire.

Le choix dépend des contraintes concrètes : budget mémoire, exigences de confidentialité, coût de calcul, vitesse d’adaptation attendue, criticité de l’application. Dans les domaines sensibles, comme la santé, l’apprentissage continu ne doit pas signifier qu’un modèle se modifie sans contrôle. Il doit s’accompagner d’une surveillance de la dérive des données, d’évaluations régulières, de garde-fous et d’une possibilité de revenir à une version antérieure du modèle.

L’apprentissage continu ne promet donc pas une IA qui apprendrait indéfiniment sans risque. Il propose plutôt une manière plus réaliste de maintenir des modèles utiles dans un monde qui change : apprendre du présent, sans effacer trop vite le passé.

The Conversation

Eric Moulines ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

27.05.2026 à 10:09

Tests de féminité aux JO : un seul gène peut-il déterminer le sexe d’une personne ?

Jean-François Bodart, Professeur des Universités, en Biologie Cellulaire et Biologie du Développement, Université de Lille
Pour participer aux JO 2028, les femmes devront prouver qu’elles ne portent pas le gène SRY. L’absence ou la présence d’un seul gène permet-elle de définir le sexe d’une personne ?
Texte intégral (1942 mots)

Pour les Jeux olympiques 2028, le Comité international olympique souhaite réserver la catégorie féminine aux athlètes « de sexe biologique féminin » ne portant pas le gène SRY, présenté comme le déclencheur génétique du développement testiculaire. SRY est certes un acteur clé de la différenciation sexuelle chez les mammifères et a longtemps été enseigné comme le « gène du sexe ». Mais la recherche en biologie du développement montre, aujourd’hui, que le sexe ne se résume ni à ce gène, ni même aux seuls chromosomes XX et XY. En effet, chromosomes non sexuels (autosomes), hormones, récepteurs et environnement s’entrecroisent pour produire une grande diversité de situations.


Depuis 2026, l’admissibilité à toute épreuve féminine des Jeux olympiques est, selon les nouvelles règles annoncées par le Comité international olympique (CIO) pour les JO 2028, réservée aux « personnes de sexe biologique féminin », non porteuses du gène SRY. Ce dernier est pris par le CIO comme critère d’exclusion, y compris pour des athlètes qui s’identifient comme femmes et répondent par ailleurs aux critères hormonaux (seuil de testostérone). Ce critère de port du gène SRY est critiqué par de nombreux spécialistes, perçu comme un indicateur de performance anachronique, reposant sur des bases scientifiques limitées et exposant les athlètes à des effets stigmatisants.

Historiquement, les règlements sportifs se sont d’abord appuyés sur des seuils de testostérone pour définir l’éligibilité à la catégorie féminine, en supposant qu’un taux plus élevé se traduisait mécaniquement par un avantage de performance.

Dans ce schéma, le rôle du SRY est implicite : ce gène influence les gonades, c’est-à-dire les organes responsables de la production des cellules sexuelles et de la sécrétion des hormones sexuelles, jouant de fait un rôle essentiel dans le développement sexuel. SRY oriente les gonades vers la différenciation en testicule, et favorise la production d’androgènes, hormones sexuelles stéroïdiennes (comme la testostérone) qui stimulent le développement et le maintien des caractères sexuels masculins. Ces hormones contribuent notamment à la masse musculaire, à la taille ou au pourcentage du volume sanguin occupé par les globules rouges (hématocrite), autant de facteurs susceptibles d’influencer certains résultats sportifs.

Mais même sur ce point, les données sont discutées : quelques études observent en moyenne un léger avantage pour les sportives avec les taux de testostérone les plus élevés, tandis que d’autres ne retrouvent pas de corrélation simple entre testostérone détectée dans le sang et performance, y compris chez les athlètes intersexes (athlètes nés avec des caractéristiques sexuelles, chromosomes, hormones, organes génitaux, qui ne correspondent pas exactement aux définitions « typiques » du masculin ou du féminin). La biologie du développement et la génétique montrent en effet une réalité beaucoup plus complexe et nuancée, qui déborde largement du cadre des seuls chromosomes sexuels. Le gène SRY ne contrôle pas à lui seul la différenciation des gonades en testicules.

XX, XY et SRY, « gène du sexe »

De manière classique, la détermination du sexe chez les mammifères est souvent présentée comme un mécanisme binaire : les individus XX deviendraient des femmes, les individus XY des hommes, grâce à l’action d’un « gène du sexe », SRY, localisé sur le chromosome Y. On parle de chromosomes sexuels pour désigner cette paire particulière (XX ou XY) qui, contrairement aux autosomes ou chromosomes non sexuels, diffère généralement entre femelles et mâles et porte une partie des gènes impliqués dans la détermination du sexe, comme SRY sur le Y.

Au cours du développement, les gonades du fœtus sont d’abord indifférenciées. Sous l’effet de SRY, elles s’orientent habituellement vers un développement testiculaire, tandis qu’en l’absence de SRY fonctionnel elles évoluent plutôt vers un développement ovarien.

Au début des années 1990, plusieurs équipes ont montré que le gène SRY, situé sur le chromosome Y pouvait être : impliqué dans la mise en place des testicules, présent chez des personnes XX avec un corps « masculin », altéré chez certaines personnes XY au corps « féminin », ce qui le rend nécessaire au développement testiculaire. Des expériences chez la souris ont ensuite prouvé qu’exprimer le gène SRY dans un embryon XX suffit pour qu’il développe des testicules. Ces résultats ont bouleversé les modèles précédents en instaurant l’idée qu’un seul gène peut déclencher toute la cascade de différenciation sexuelle vers le masculin. Cette vision reste cependant très simplificatrice.

Par exemple, l’étude des « variations du développement sexuel » (VDS, ou Disorders/Differences of Sex Development en anglais, DSD) remet en question la stricte équivalence XX = femme et XY = homme. Les variations du développement sexuel sont rares : en France et dans les pays aux profils similaires, les estimations cliniques situent leur fréquence autour d’une naissance sur 2 500 – 4 500, soit de l’ordre de 0,02 - 0,04 % des naissances, selon les définitions retenues. Ces troubles/variations du développement sexuel incluent, par exemple, des individus XY qui présentent des gonades mal développées, souvent réduites à des bandelettes fibreuses non fonctionnelles et un phénotype féminin, ou, inversement, des individus XX présentant des caractères typiquement masculins. Ces variations du développement sexuel, régulièrement rencontrées en clinique pédiatrique et endocrinologique, soulignent que ce que l’on appelle « sexe biologique » recouvre en réalité plusieurs dimensions (chromosomique, gonadique, phénotypique, hormonale) qui ne sont pas toujours alignées.

Un réseau de gènes pour déterminer le sexe

L’analyse moléculaire de la différenciation en testicule ou en ovaire chez les mammifères montre que cette différenciation ne résulte pas de l’action isolée de SRY. Plusieurs gènes s’activent ou se répriment de manière coordonnée dans le temps et dans l’espace. SRY constitue un signal d’initiation majeur dans la gonade XY, mais la mise en place puis la conversion durable de la gonade indifférenciée en testicule fonctionnel avec production d’hormones (androgènes) reposent ensuite sur des facteurs situés sur les chromosomes non sexuels (autosomes). On peut citer parmi eux les gènes SOX9 ou CBX2. Les gènes comme RSPO1 et WNT4 sont, quant à eux, impliqués dans le maintien d’un destin ovarien.

Les phénotypes observés lors de mutations de ces gènes illustrent leur rôle déterminant. Chez l’humain, des anomalies d’expression du gène SOX9 (par exemple des délétions régulatrices en amont du gène) chez des sujets XY peuvent entraîner un développement incomplet ou anormal des gonades et un phénotype féminin malgré un gène SRY fonctionnel.

À l’inverse, des mutations de RSPO1 ou de WNT4 peuvent, chez des individus XX humains, favoriser la formation de tissu testiculaire et une virilisation marquée des organes génitaux externes, en l’absence de chromosome Y.

Il existe donc des femmes XY et des hommes XX, parce que des gènes autosomiques ont fait basculer la cascade du développement sexuel dans un sens ou dans l’autre.

Autrement dit, SRY déclenche une trajectoire, mais ne la détermine pas à lui seul.

Au‑delà du génome : hormones, récepteurs et environnement

Les caractères sexuels secondaires (musculature, pilosité, voix, répartition des graisses, cycles menstruels, etc.) dépendent fortement des hormones sexuelles et de la sensibilité des tissus à ces hormones via leurs récepteurs. Ces hormones, comme les œstrogènes et les androgènes, agissent sur des milliers de gènes répartis sur l’ensemble du génome, et non pas seulement sur les chromosomes sexuels, avec des réponses qui varient selon les organes, l’âge, la nutrition, l’activité physique ou l’exposition à des perturbateurs endocriniens.

Des études récentes d’expression des gènes à l’échelle du génome montrent d’ailleurs de nombreuses différences d’expression génique entre femmes et hommes, qui concernent surtout des gènes sur les chromosomes non sexuels, dont l’activité est modulée par le contexte hormonal et le type de tissu. Même si le caryotype (composition en chromosomes, par exemple XX ou XY) joue un rôle important, la biologie du sexe chez les mammifères résulte ainsi d’interactions continues entre gènes, hormones et environnement au cours du développement et de la vie entière.

Un gène à lui seul ne suffit pas à « dire » le sexe

Les débats récents sur le sport de haut niveau reposent ainsi sur des dispositifs qui supposent que le sexe se laisse réduire à un simple marqueur génétique binaire. Or, la biologie contemporaine du développement décrit une réalité beaucoup plus riche : détermination chromosomique, différenciation gonadique, phénotype des organes génitaux (ensemble des caractères observables), profil hormonal et, au-delà, action de nombreux gènes autosomiques capables d’orienter ou d’inverser la trajectoire sexuelle.

Se pose une question plus large : que se passe-t-il lorsqu’on transforme un « fragment » de génome en critère de classement social ou sportif, alors qu’il ne reflète qu’une partie de la réalité biologique ? Comprendre cette complexité rappelle que le génome n’est pas un arbitre neutre, et que faire de la génétique un outil de tri mérite bien plus de prudence qu’un simple résultat de test ne le suggère.

The Conversation

Jean-François Bodart ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

3 / 25

 

  GÉNÉRALISTES
Ballast
Fakir
Interstices
Issues
Korii
Lava
La revue des médias
Time France
Mouais
Multitudes
Positivr
Regards
Slate
Smolny
Socialter
UPMagazine
Le Zéphyr
 
  Idées ‧ Politique ‧ A à F
Accattone
À Contretemps
Alter-éditions
Contre-Attaque
Contretemps
CQFD
Comptoir (Le)
Déferlante (La)
Esprit
Frustration
 
  Idées ‧ Politique ‧ i à z
L'Intimiste
Jef Klak
Lignes de Crêtes
NonFiction
Nouveaux Cahiers du Socialisme
Période
 
  ARTS
L'Autre Quotidien
Villa Albertine
 
  THINK-TANKS
Fondation Copernic
Institut La Boétie
Institut Rousseau
 
  TECH
April - Libre à lire
Dans les algorithmes
Framablog
Gigawatts.fr
Goodtech.info
Quadrature du Net
 
  INTERNATIONAL
Alencontre
Alterinfos
Gauche.Media
CETRI
ESSF
Inprecor
Guitinews
 
  MULTILINGUES
Kedistan
Quatrième Internationale
Viewpoint Magazine
+972 mag
 
  PODCASTS
Arrêt sur Images
Le Diplo
LSD
Thinkerview
🌞