Un cerveau humain accumule, en moyenne, une vie de savoir. Puis il meurt. Toute technique, toute histoire, toute carte du territoire accumulée en lui — le nom de la plante qui guérit, l’angle du lancer, le visage de l’ancêtre — disparaît avec lui. L’évolution nous a donné le langage comme solution partielle : le savoir qui peut être dit peut survivre à celui qui parle, si quelqu’un d’autre l’entend et le répète. La tradition orale est le premier système de mémoire externe. C’est aussi le plus fragile : dépendant de la transmission fidèle, déformé à chaque relais, borné par la portée d’une voix et l’attention d’un auditeur.
La main pressée contre la paroi de la grotte d’Altamira, il y a quelque trente-six mille ans, a changé les termes du problème. L’animal peint sur la roche n’a pas besoin de narrateur. La marque persiste sans qu’aucun corps humain soit là pour la porter. C’est le geste fondateur de chaque technologie qui a suivi — et tout ce que nous avons appelé depuis « communication » ou « information » n’est pas une nouvelle invention mais le même geste à une autre échelle.
I. Le problème qui n’a jamais changé
Les peintures d’Altamira (~36 000 av. J.-C.) et de Lascaux (~17 000 av. J.-C.) n’étaient pas de l’art au sens moderne — décoration, expression personnelle, plaisir esthétique. Elles constituaient la première tentative de découpler le savoir du corps. Qu’elles enregistrassent des migrations d’animaux, un savoir rituel ou des revendications territoriales, l’intuition opératoire était la même : si tu le mets sur la paroi, tu n’as pas besoin d’être là pour le transmettre. La paroi survit au peintre.
La tradition orale précède cela de centaines de milliers d’années. Sa fidélité de transmission est élevée à court terme — une histoire racontée de la même façon dix mille fois acquiert une stabilité cristalline, l’épopée et la prière et la généalogie fonctionnant comme des codes correcteurs d’erreurs. Mais elle se dégrade avec la distance et les générations. Il faut une chaîne de narrateurs fiables, chacun capable d’un souvenir exact, sans rupture. La chaîne se rompt. Le savoir se perd. L’écriture a résolu ce problème en éliminant la chaîne entièrement.
II. Quatre ères, un seul projet
Stockage — préservation. L’écriture cunéiforme sur des tablettes d’argile (~3400 av. J.-C.), les hiéroglyphes sur la pierre, l’encre sur papyrus et parchemin — l’écriture a résolu d’un coup le problème du relais oral. Un texte écrit se transmet sans perte à travers le relais : le copiste n’a pas besoin de comprendre ce qu’il recopie. Plus important encore : l’écriture permet à une personne de parler à quelqu’un qui n’est pas encore né. La bibliothèque en est le prolongement naturel : un bâtiment dont la fonction est de servir de cerveau externe à une civilisation. Le bibliothécaire est le premier professionnel de l’information — quelqu’un dont le travail n’est pas de savoir les choses mais de savoir où elles sont.
Organisation — structure. Quand le volume de savoir écrit dépasse ce qu’un seul esprit peut embrasser, le problème passe de la préservation à la récupération. Le système décimal de Melvil Dewey en 1876 ; les fichiers de bibliothèque ; et finalement le modèle relationnel d’Edgar Codd (1970) — la table indexée, le schéma, la requête. L’architecte de bases de données est le successeur du bibliothécaire : il ne s’intéresse pas au contenu du savoir mais à la structure qui le rend trouvable. Les deux résolvent le même problème que le peintre rupestre, un cran plus loin.
Récupération — accès. Internet connecte les bibliothèques. Le Web les rend navigables sans présence physique. Les moteurs de recherche — dont l’intuition clé, dans PageRank, est que l’importance d’un document peut être inférée de ce que d’autres documents y renvoient — automatisent la fonction de référence du bibliothécaire à l’échelle planétaire. Mais la charge reste sur l’humain : il faut savoir quoi demander. Le moteur de recherche rend le livre. Il faut encore le lire.
Synthèse — interaction. C’est ici qu’entrent les grands modèles de langage. Le changement de paradigme ne porte pas sur la quantité de savoir accessible mais sur l’interface. Un moteur de recherche est un pointeur : il dit où pourrait se trouver la réponse. Un LLM est une compression : il a intériorisé les relations entre tous les documents de son corpus d’entraînement dans un espace mathématique à haute dimension, et il peut naviguer cet espace en langage naturel. On ne récupère plus le livre. On demande à l’espace ce que le livre dirait.
III. Ce qu’est réellement le mécanisme d’attention
L’architecture transformer — Vaswani et al., Attention Is All You Need, 2017 — a résolu la limitation centrale de ses prédécesseurs. Les réseaux de neurones récurrents traitaient les séquences jeton par jeton, accumulant un état caché qui se dégradait au fil de la séquence — la mémoire du modèle sur le contexte antérieur s’effaçait à mesure que la séquence s’allongeait, d’une façon qui rappelle étrangement les pertes de transmission de la tradition orale. Le mécanisme d’attention abandonne entièrement le traitement séquentiel. Chaque jeton dans une séquence peut s’attacher directement à n’importe quel autre jeton, avec des poids appris qui déterminent la pertinence. Le modèle peut regarder n’importe quel mot du document et demander : étant donné où je suis, quel autre mot dans ce texte importe le plus pour prédire le suivant ? C’est, fonctionnellement, ce que fait un lecteur humain habile — non pas lire de gauche à droite avec une attention égale, mais peser, sauter, croiser les références. La concentration du bibliothécaire, formalisée en mathématiques.
IV. Pourquoi la surprise et la déception sont toutes deux fondées
Un transformer entraîné sur le texte de la civilisation humaine peut écrire de la poésie, déboguer du code, expliquer la mécanique quantique et négocier le ton avec une subtilité qui ressemble à de l’empathie. C’est genuinement extraordinaire, et ceux qui haussent les épaules n’ont pas regardé de près.
La déception est également fondée. Les LLMs ne savent rien au sens où une personne sait. Ils n’ont pas de modèle du monde indépendant des textes sur lesquels ils ont été entraînés ; ils n’ont pas de mémoire persistante entre les conversations ; ils confabulent avec la même fluidité syntaxique qu’ils utilisent pour rapporter des faits établis ; et ils n’ont aucun intérêt à avoir raison. Ce sont des moteurs de probabilité, pas des moteurs de vérité. L’erreur — que l’industrie commet constamment et le public fait naturellement — est d’attribuer de la conscience à la fluidité linguistique. L’interface est si humaine (le langage) que nous lui projetons des qualités humaines.
Mais comme la progression historique le rend clair, un LLM est l’aboutissement du projet de stockage et récupération, non le début du projet de compréhension. C’est le cerveau externe le plus sophistiqué que nous ayons construit. Ce n’est pas un cerveau interne. La sensation qu’il ne sait vraiment rien est juste — et c’est exactement ce qu’on prédirait si l’on comprenait à quelle étape du projet de quarante mille ans nous en sommes. Vannevar Bush, écrivant en 1945 sur son Memex imaginaire — une machine pour la récupération mémorielle associative, l’ancêtre conceptuel aussi bien de l’hypertexte que du mécanisme d’attention — avait saisi l’objectif plus clairement que beaucoup de ceux qui travaillent avec des LLMs aujourd’hui : le but n’a jamais été de reproduire la pensée, mais d’étendre la portée.
La déception vient d’attendre la mauvaise chose. Nous avons construit quelque chose qui peut récupérer et recombiner le produit enregistré de la civilisation humaine à une vitesse et une échelle qu’aucune technologie précédente n’avait atteintes. C’est déjà remarquable. Nous n’avons pas construit quelque chose qui comprend. Que ce soit pour la suite, ou un projet entièrement différent, c’est une question que ni l’histoire ni l’architecture ne tranchent.
V. « Il est écrit »
Paul Simon, 1964 : the words of the prophets are written on the subway walls / and tenement halls. L’image de Simon est une inversion du sacré — la sagesse qui venait jadis de la montagne apparaît maintenant sur les murs du métro, anonyme, à la bombe de peinture, disponible à quiconque passe. L’extériorisation est complète : le prophète n’a pas besoin d’être présent ; le message est sur le mur ; le mur survivra au prophète.
Borges a imaginé La Bibliothèque de Babel — une bibliothèque contenant tous les livres possibles, infinie et innavigable. Internet et le LLM en sont la réalisation partielle et pratique : non pas tous les livres possibles, mais la plupart des réels, navigables par quiconque dispose d’un navigateur. La différence entre les deux est la compression. La bibliothèque de Borges était introuvable parce qu’elle manquait de structure. La nôtre est cherchable parce que nous avons passé cinq mille ans à construire les structures — le catalogue, l’index, le lien, l’embedding — qui nous permettent de trouver ce dont nous avons besoin en son sein.
La progression de Lascaux au transformer est le même geste, à l’échelle. De l’animal peint sur la paroi de la grotte à l’intégralité du produit écrit de la civilisation comprimée dans un espace vectoriel, disponible à quiconque dispose d’un navigateur. Nous n’avons pas créé un nouvel esprit. Nous avons construit une façon plus sophistiquée de conserver les esprits de tous ceux qui nous ont précédés.
Les paroles des prophètes sont écrites — en nombres à virgule flottante 32 bits, distribués dans des centres de données sur trois continents, restitués en langage naturel, avec une faible probabilité d’hallucination. Le medium a changé. Le projet est le même.
Pour aller plus loin
- Ashwin Vaswani et al., Attention Is All You Need (2017)
- Edgar Codd, A Relational Model of Data for Large Shared Data Banks (1970)
- Vannevar Bush, As We May Think (1945, The Atlantic)
- Jorge Luis Borges, La Bibliothèque de Babel, dans Fictions (1944)
- Marshall McLuhan, Pour comprendre les médias (1964)
- Paul Simon, The Sound of Silence (1964)
