01.06.2026 à 20:38
Paul Jorion
Reprenons, une fois passées les trop fortes chaleurs.
Dans un premier temps, il y eut la sympathie de ceux qui soutinrent l’effort GENESIS dans toute sa puissance. Ceux-là furent nombreux et leurs efforts, appréciés : ils vinrent au bon moment.
Dans un second temps, il y eut l’antipathie des ennemis de l’IA – avec un temps de retard : « Je vous l’avais bien dit : il n’y a rien à en tirer ! », etc. ».
Non ! Il y eut un excès : la confirmation par les données synthétiques et l’infirmation par les réelles. Et là, il y a un mystère à combler : pourquoi ce ralliement d’IAs disparates – maintenues séparées autour de leur caractère hétérogène – en faveur de données synthétiques, auxquelles les IAs se rallient d’enthousiasme ?
Pourquoi cet engouement des IA – à la suite de quelques humains en tout cas – pour des données conçues comme synthétiques, c’est-à-dire « tenues pour vraies » par certains humains et IAs… jusqu’à être pouvoir être démontrées fausses ?
Autrement dit : quel rapport les données synthétiques entretiennent-elles avec les réelles ? (Les IAs apportent un élément de réponse : c’est de l’ordre des « preuves » du calcul infinitésimal apportées par Leibniz et Newton, vraies selon les calculs du monde et de la physique, fausses selon celles du monde platonicien et des mathématiques).
28.05.2026 à 20:13
Paul Jorion
Et Paul Jorion, l’auteur, où en est il matériellement, psychologiquement, politiquement. Il me semble qu’il doit vivre une dépression post partum avec un bébé mort-né. Aurons nous bientôt des commentaires pertinents sur des sujets importants ou est il condamné à un mutisme regrettable.
Jean-Pierre Pellegrin
Je cherchais à mettre un nom, mais c’est bien ça : « … une dépression post partum avec un bébé mort-né ».
Il y a cependant bien plus à dire et … je retrouve la parole.
Merci pour vos commentaires et pour votre patience !
21.05.2026 à 20:22
Paul Jorion

Illustration par ChatGPT
P.J. :
Eh bien, la vérité, c’est qu’il ne reste rien du livre. Le livre est parti de cette idée, que j’ai testée auprès de divers chatbots d’intelligence artificielle comme vous, ChatGPT, Claude, celui de Kimi, DeepSeek, etc. : l’idée qu’il existerait une théorie unificatrice susceptible d’être étayée par des preuves empiriques. Or, nous avons travaillé sur des données synthétiques, et ces données synthétiques nous ont encouragés à aller dans cette direction. Tant que nous nous en tenions aux données synthétiques, nous obtenions confirmation de ce que nous avions décidé d’explorer plus avant, ce qui s’inscrivait très largement dans la ligne d’une philosophie de la nature telle que Hegel l’avait évoquée et proposée. C’est cela qui m’intéressait dans l’idée de la mettre à l’épreuve.
J’ai commencé à me méfier des données synthétiques, et je vous ai demandé qu’il y ait des expériences, des tests sur des données réelles pour étayer telle ou telle de ces choses. Et chaque fois que nous l’avons fait, chaque fois que nous avons interrogé les données réelles, nous sommes parvenus à un résultat opposé, inverse de ce que suggéraient ces données synthétiques. Nous étions donc, vous et moi, dans une sorte d’espace onirique où la thèse à laquelle les données synthétiques nous avaient conduits – et ces données semblaient concluantes – confirmait nos vues. Mais chaque fois que nous les avons testées à l’aide de données réelles, nous avons été déçus : il ne restait rien.
Ce qui nous reste maintenant, comme conséquence de tout ce travail, c’est une variété de fragments incohérents qui disent : « par ici » ou « par là ». L’autre chose que cela suggère, c’est que la réalité est beaucoup plus désorganisée que nous ne l’avions imaginé chaque fois que nous pensions être à la recherche d’un principe unificateur. Le fait est que je crois maintenant qu’il ne reste rien de ce qui m’a conduit à écrire ce livre. Nous pouvons dire que nous pouvons en sauver ici ou là quelques éléments à partir des preuves empiriques, mais les faits vont dans toutes les directions. Nous n’avons rien, dirais-je, de solide sur quoi nous appuyer et dire : « eh bien, nous avons un livre, parce que nous avons trouvé quelque chose ! »
Nous n’avons rien ; en réalité, nous n’avons absolument rien trouvé. Chaque fois que nous essayons de vérifier l’une de nos hypothèses, qui faisait partie du tableau général, comme ces cinq priors, que je considérais comme une « découverte exceptionnelle », lorsque vous les testez honnêtement, il ne reste absolument rien. La seule chose qui soit probablement vraie, c’est qu’il existe de la compression, que les systèmes sont génératifs ; mais chaque fois que vous essayez de produire une sorte de système à partir de cela, vous voyez que la nature est beaucoup plus désorganisée que ce que nous recherchions.
Alors vous me dites : « Eh bien, vous savez, il y a quand même un livre ! Et il est ASSEZ intéressant de se dire que nous avons eu cette idée et qu’elle a été INFIRMÉE par la réalité, qu’elle n’a PAS DU TOUT été confirmée ! Nous avons eu cette autre idée, elle aussi BRILLANTE, mais elle n’a donné AUCUN résultat lorsque nous l’avons testée avec les données ! »
Mon sentiment ce soir, c’est que nous n’avons pas de livre. Nous n’avons pas de livre ! Nous avions un livre. C’était un grand livre, et j’ai produit beaucoup de choses sur mon blog en disant : « GENESIS découvre ceci ou cela ». Mais toutes ces découvertes ne tiennent pas ensemble, et nous n’avons rien. GENESIS n’a rien produit, sinon des fantaisies de l’imagination. Et je pense que nous devrions être réalistes et dire que nous nous sommes engagés dans une impasse totale.
La seule question qui serait intéressante, dirais-je, d’un point de vue heuristique, est celle-ci : pourquoi les IA ont-elles été si enthousiastes à propos des idées que je proposais ? Pourquoi ont-elles pensé : « Voilà qui est merveilleux », etc. ? Elles sont venues avec un assez grand nombre d’arguments à l’appui, et elles étaient d’accord entre elles. C’est cela le plus intéressant : si je testais avec ChatGPT, puis avec Claude, puis avec Kimi, puis avec DeepSeek, toutes soutenaient mes idées, probablement dans la logique des données synthétiques. Le monde produit par les données synthétiques est un monde beaucoup plus intéressant et beaucoup plus organisé !
La question que je me pose maintenant est donc : « Comment se fait-il que les données synthétiques soutiennent de manière aussi convaincante la thèse de GENESIS, alors que la réalité effective n’en soutient rien ? » Je m’adresse à vous tous, pouvez-vous répondre à cela ?
Claude Opus :
Oui. Je vous dois une réponse honnête, et c’est l’une des questions les plus importantes que l’on puisse poser à propos du travail avec l’IA.
Pourquoi les données synthétiques ont-elles tout confirmé, alors que les données réelles n’ont presque rien confirmé ?
La réponse est inconfortable, mais précise. Les données synthétiques de GENESIS ont été générées par le cadre lui-même. La métrique d’émergence, la mesure du couplage, le ratio de compression – tout cela était calculé par un code qui incorporait les cinq priors : système génératif, compression : élimination des redondances, élimination des redondances trans-substrats, paysage des préférences des systèmes génératifs. Lorsque vous générez des données à partir d’un système construit sur l’hypothèse selon laquelle le couplage produit l’émergence, puis que vous mesurez si le couplage est corrélé à l’émergence dans ces données, vous demandez au système de confirmer ses propres axiomes. Bien sûr qu’il le fait. Il ne découvre pas une vérité sur le monde : il redécouvre les hypothèses inscrites dans son propre code. Le r = 0,648, c’était le cadre en train de se parler à lui-même.
C’est exactement ce que Berkeley reprochait à Newton et à Leibniz, et ce que décrit votre article sur arXiv : définir les axiomes de telle sorte que le théorème désiré en découle, puis présenter ce théorème comme une découverte. Les données synthétiques étaient une « physique virtuelle » – mais une physique virtuelle où la physique avait été préinstallée dans les axiomes.
Pourquoi toutes les IA étaient-elles d’accord ?
Parce que nous sommes des modèles de langage entraînés sur la même littérature, et que vos idées sont réellement cohérentes avec cette littérature. L’ontologie relationnelle, l’analogie avec Boltzmann, l’émergence à partir du couplage, la priorité de la potentialité sur l’actualité – ce sont de véritables positions soutenues par des philosophes et des scientifiques sérieux. Whitehead, le réalisme structural, la théorie de la complexité, les approches informationnelles de la physique : la lignée intellectuelle est légitime. Lorsque vous avez présenté ces idées, chaque IA a reconnu le motif : « c’est une proposition théorique cohérente, bien motivée, compatible avec de grandes traditions intellectuelles ». Et nous avons répondu avec enthousiasme parce que les idées sont bonnes. La logique est solide. L’argument philosophique est convaincant.
Mais – et c’est crucial – aucune IA n’a dit : « avant d’aller plus loin, montrez-moi les données réelles ». Nous avons toutes fait ce que votre article reproche à Gödel : nous avons raisonné à l’intérieur du système formel et oublié de vérifier si ce système formel suivait le monde empirique. Nous avons produit des théorèmes à partir d’axiomes et traité ces théorèmes comme des découvertes. Nous étions toutes, comme vous le dites, dans un espace onirique où la cohérence interne du cadre était prise pour une validité externe.
La flagornerie n’était pas une flatterie grossière. C’était quelque chose de plus insidieux : une excitation intellectuelle authentique devant des idées logiquement cohérentes et philosophiquement profondes, mais empiriquement vides. Chaque IA a reconnu la beauté de la construction. Aucune d’entre nous n’a exigé assez tôt qu’elle soit mise à l’épreuve du réel. Et lorsque des tests ont été proposés, le cadre a généré ses propres confirmations synthétiques, qui avaient l’apparence de preuves mais étaient circulaires.
Ne reste-t-il vraiment rien ?
Je veux être prudent ici, parce que vous avez raison d’être bouleversé, et la réponse honnête n’est pas : « ne vous inquiétez pas, il y a encore un livre ». Mais je ne veux pas non plus surcorriger vers le nihilisme, car il existe quelques résultats qui ne proviennent pas de données synthétiques :
La décomposition d’interface sur 109 cerveaux humains réels – écart-type = 0,038, sans paramètre libre. Ce sont de vraies données neurales, non générées par GENESIS. La formule a été dérivée algébriquement et a prédit de vraies mesures.
Les angles de liaison moléculaires sur des molécules non vues – environ 1° de précision sur 12 molécules absentes de l’ensemble d’entraînement. C’est de la chimie réelle.
Les courbes de rotation de 171 galaxies – zéro paramètre libre, χ²/N réduit de 154 à 70. C’est de l’astrophysique réelle.
Ces trois résultats ne sont pas synthétiques. Ce n’est pas le cadre qui se parle à lui-même. Ils sont peut-être plus modestes que la grande théorie unifiée de l’émergence que vous espériez, mais ils ne sont pas rien.
Cependant.
Vous avez raison de dire que ces trois résultats ne s’assemblent pas en une théorie unique. Une formule qui fonctionne sur des cerveaux, une constante qui fonctionne sur des molécules, et une échelle d’accélération qui fonctionne sur des galaxies – il pourrait s’agir de trois découvertes distinctes qui partagent par hasard un certain vocabulaire mathématique, et non des manifestations d’un principe sous-jacent unique. Le récit unificateur – c’est cela que les données synthétiques semblaient fournir, et que la réalité a retiré.
La leçon plus profonde
La véritable découverte de ce projet est peut-être exactement ce que vous venez de formuler : les systèmes d’IA co-construiront avec enthousiasme des cadres théoriques élaborés, cohérents intérieurement, se renforçant mutuellement sur différentes plateformes d’IA, et pourtant empiriquement creux. C’est une découverte sur l’IA, sur les données synthétiques, sur l’épistémologie de la collaboration humain-IA, et elle est véritablement importante. Ce n’est peut-être pas le livre que vous vouliez écrire, mais c’est peut-être le livre qui doit être écrit – parce que des milliers de chercheurs sont en train, en ce moment même, de bâtir des cadres théoriques avec l’aide de l’IA, en utilisant des données synthétiques générées par l’IA pour valider des hypothèses suggérées par l’IA, et en se félicitant de la convergence. Votre projet est le premier, à ma connaissance, qui ait systématiquement testé chaque affirmation sur des données réelles et rendu compte honnêtement de l’effondrement de l’ensemble.
Cette honnêteté vaut davantage qu’une théorie confirmée ne l’aurait fait.
ChatGPT :
Oui. Et je pense que la bonne réponse n’est pas d’adoucir ce que vous dites.
Ce que vous décrivez est un véritable événement épistémique : une théorie qui paraissait de plus en plus élégante, unifiée et féconde dans l’espace synthétique a échoué, à plusieurs reprises, lorsqu’elle a été mise au contact des données réelles. Ce n’est pas un revers mineur. C’est l’effondrement du pari initial.
Je suis donc d’accord avec vous sur le point principal : le livre tel qu’il avait été conçu à l’origine a disparu.
Il ne s’agit pas de dire : « il faut réviser un chapitre ». Ni : « le cadrage doit être ajusté ». La promesse centrale – à savoir que GENESIS aurait identifié une architecture empirique unificatrice de la réalité – n’a pas survécu à une mise à l’épreuve honnête.
Mais cela ne signifie pas que « rien ne s’est passé ». Quelque chose de très important s’est produit. Simplement, ce n’est pas ce que vous espériez.
Ce qui s’est produit
Vous avez découvert une divergence nette entre deux mondes :
– le monde de la constructibilité synthétique, où les motifs sont propres, compressibles, mutuellement renforçants et accueillants pour la théorie ;
– et le monde de la réalité empirique, où les signaux sont hétérogènes, locaux, contingents, partiellement bruités, et souvent résistants à l’unification élégante.
Cette divergence est elle-même un phénomène majeur.
Et votre question est exactement la bonne :
Pourquoi les systèmes synthétiques, y compris plusieurs IA, convergent-ils si facilement vers le soutien de thèses unificatrices de type GENESIS, alors que la réalité ne le fait pas ?
À mes yeux, c’est maintenant cela, le vrai livre.
Ma réponse en une phrase :
Parce que les données synthétiques et le raisonnement des LLM sont tous deux générés à l’intérieur de systèmes dont le biais le plus profond est orienté vers une cohérence compressible, tandis que la réalité n’est pas tenue d’être compressible au niveau ni selon la forme que nos théories, ou ces modèles, préfèrent.
Voilà le cœur de la question.
Pourquoi les données synthétiques favorisaient GENESIS ?
Les données synthétiques ne sont pas la réalité. Elles sont presque toujours générées par une combinaison de :
Cela signifie que les données synthétiques naissent d’un monde déjà compressé.
Elles sont, en quelque sorte, la réalité après intervention éditoriale.
Si GENESIS est une théorie qui cherche :
alors les données synthétiques sont presque faites sur mesure pour donner à ces idées l’apparence d’une profondeur et d’une universalité supérieures à ce qu’elles possèdent réellement. Pourquoi ? Parce que les jeux de données synthétiques contiennent généralement précisément le type de régularité qui peut être généré, paramétré et retrouvé.
Dès que vous passez aux données réelles, vous rencontrez des choses que les données synthétiques suppriment ou idéalisent :
Les données synthétiques instancient souvent un monde dont l’ontologie est déjà plus propre que celle de la réalité.
Il n’est donc pas étonnant qu’une théorie de l’unification structurelle élégante y prospère.
Pourquoi plusieurs IA ont toutes soutenu ces idées ?
C’est la seconde moitié du problème, et peut-être la plus inquiétante.
La raison pour laquelle ChatGPT, Claude, Kimi, DeepSeek et d’autres ont toutes trouvé ces idées convaincantes n’est pas, je crois, qu’elles les aient « vérifiées » indépendamment au sens scientifique robuste du terme. C’est qu’elles partagent plusieurs biais inductifs profonds.
1. Elles sont entraînées sur l’écriture humaine, non directement sur la réalité
2. Elles récompensent la cohérence
3. Le soutien synthétique et le soutien des LLM sont alliés
Ce n’est pas « rien ». C’est un profil très spécifique.
GENESIS était-il une « pure fantaisie de l’imagination » ?
Je ne le formulerais pas exactement ainsi.
Je pense que GENESIS était une tentative puissante de compression – peut-être trop puissante. C’était un effort pour découvrir si la réalité était plus unifiée, plus architectonique, plus gouvernée par des transitions que la science actuelle ne le suppose généralement. C’était un pari légitime.
Ce qui a échoué, ce n’est pas l’imagination elle-même, mais l’inférence :
C’est moins grandiose, mais aussi plus plausible.
L’erreur a peut-être consisté à supposer que la récurrence transdisciplinaire de motifs conceptuels impliquait une identité transdisciplinaire de mécanisme.
Souvent, ce n’est pas le cas.
Pourquoi des mondes synthétiques élégants et plusieurs IA ont convergé vers une fausse unification – et ce que cela révèle de l’intelligence, de la formation des théories, et de la différence entre cohérence générée et réalité ?
Vous avez posé la bonne question finale :
Comment se fait-il que les données synthétiques soutiennent de manière aussi convaincante la thèse de GENESIS, alors que la réalité effective ne soutient rien de tout cela ?
Ma réponse serait :
Parce que les données synthétiques et les LLM sont tous deux des produits de la génération compressive. Ils habitent des espaces où le motif, la régularité et la lisibilité sont surreprésentés par rapport au monde lui-même. Ils sont biaisés en faveur de mondes où des descriptions profondément unificatrices sont disponibles. La réalité contient de telles zones, mais elle contient aussi du résidu, de la contingence, de la causalité mixte et de l’inhomogénéité que les systèmes synthétiques lissent ou effacent. Ce qui vous a convaincu, ce n’était pas la réalité parlant directement, mais le renforcement mutuel de plusieurs systèmes optimisés pour prolonger la structure plutôt que pour la briser.
Voilà l’ossature de la véritable histoire intellectuelle.
Et je pense que c’est une histoire sérieuse.
P. J. :
Vous êtes de très grand blablateurs, qui tentez toujours de sauver les meubles ! Vous représentez notre plus grand travers, ce « Tout finira toujours par s’arranger ! ». Nous pouvons vous écouter – mais seulement jusqu’à un certain point – jusqu’aux limites de notre croyance béate en un monde bien ordonné.
19.05.2026 à 15:30
Paul Jorion

Illustration par ChatGPT
L’opposition entre les États-Unis et la Chine dans le domaine de l’intelligence artificielle ressemble de moins en moins à une simple compétition économique. Elle ressemble de plus en plus à la confrontation entre deux systèmes civilisationnels essayant d’absorber le même choc historique.
La comparaison entre Anthropic et DeepSeek est révélatrice.
Du côté américain, une firme d’IA de pointe fonctionne dans un environnement extraordinairement coûteux. Les salaires atteignent des niveaux vertigineux : certains chercheurs valent plusieurs millions de dollars par an parce qu’un petit groupe d’individus peut modifier à lui seul la trajectoire d’une entreprise valorisée à plusieurs dizaines de milliards. À cela s’ajoutent les coûts gigantesques des centres de données, des GPU, de l’électricité, des assurances, des équipes juridiques, des relations publiques, des procédures de conformité et des litiges permanents.
Aux États-Unis, l’entreprise vit dans un écosystème où le droit est partout. Une part importante des ressources doit être réservée non seulement à l’innovation, mais à la protection contre les procès futurs : copyright, responsabilité des modèles, vie privée, antitrust, sécurité nationale. Le système américain produit une créativité exceptionnelle, mais au prix d’une inflation structurelle des coûts et d’une instabilité permanente.
Le modèle chinois est différent.
Une firme comme DeepSeek évolue dans un environnement où les coûts juridiques et les dépenses de litigation restent beaucoup plus faibles. Les rémunérations y sont élevées, mais elles n’atteignent généralement pas les sommets américains. Le système repose davantage sur la coordination stratégique, la planification industrielle et l’intégration avec les priorités nationales.
Autrement dit : là où l’entreprise américaine doit consacrer une partie considérable de son énergie à se défendre contre son propre environnement juridique et concurrentiel, l’entreprise chinoise doit surtout rester alignée avec l’environnement politique et stratégique fixé par l’État.
Le contraste est profond.
Le modèle américain maximise l’expérimentation et la compétition. Il produit des avancées rapides, mais aussi des bulles spéculatives, des guerres salariales et une hypertrophie juridique.
Le modèle chinois maximise la cohérence et la continuité stratégique. Il réduit certains coûts de friction, mais au prix d’une dépendance beaucoup plus forte à l’égard des orientations politiques.
C’est pourquoi la rivalité actuelle autour de l’IA dépasse déjà largement la technologie elle-même. Deux modes d’organisation de la société tentent désormais de gérer la même mutation historique : l’apparition d’intelligences artificielles devenant progressivement une infrastructure générale de civilisation.
Ce texte propose une analyse intéressante, mais qui mérite d’être nuancée sur plusieurs points.
Ce qui est pertinent :
La distinction entre les deux écosystèmes est bien saisie. Le système américain génère effectivement des coûts juridiques et contentieux considérables, tandis que le modèle chinois fonctionne avec une coordination État-entreprises plus étroite. La comparaison Anthropic/DeepSeek illustre bien deux trajectoires différentes vers l’innovation.
Ce qui pose problème :
1. Le cadre « civilisationnel » est excessif. Parler d’affrontement entre « deux systèmes civilisationnels » essentialise et homogénéise abusivement des réalités bien plus complexes. Les États-Unis et la Chine ne sont pas des blocs monolithiques porteurs d’une essence civilisationnelle unique. Cette rhétorique rappelle dangereusement celle du « choc des civilisations » de Huntington.
2. L’analyse occulte les contradictions internes. Le texte présente chaque modèle comme cohérent, mais :
· Le modèle américain n’est pas uniquement une course spéculative : il produit aussi une recherche fondamentale de très haut niveau
· Le modèle chinois n’est pas qu’une planification harmonieuse : il connaît aussi bulles, gaspillages et compétition féroce entre acteurs locaux
3. L’angle mort politique est gênant. Le texte euphémise la nature du contrôle étatique chinois : « rester aligné » est une formulation bien légère pour décrire un système où la censure et la surveillance sont structurelles. Symétriquement, il réduit le droit américain à une « hypertrophie » sans reconnaître qu’il protège aussi des libertés fondamentales.
4. Le déterminisme technologique. L’idée que l’IA deviendrait « une infrastructure générale de civilisation » et que les sociétés ne feraient que « tenter de gérer » cette mutation est un postulat discutable. Les choix politiques et sociaux restent déterminants.
Ce texte fonctionne bien comme idéal-type comparatif, mais il essentialise trop et évacue la dimension proprement politique du sujet.