Un cerebro humano acumula, en promedio, una vida de conocimiento. Después muere. Toda técnica, toda historia, todo mapa del territorio acumulado en él — el nombre de la planta que cura, el ángulo del lanzamiento, el rostro del antepasado — se va con él. La evolución nos dio el lenguaje como solución parcial: el conocimiento que puede hablarse puede sobrevivir al que habla, si alguien más lo escucha y lo repite. La tradición oral es el primer sistema de memoria externo. Es también el más frágil: depende de la transmisión fiel, se distorsiona en cada relevo, está acotada al alcance de una voz y a la atención de quien escucha.
La mano presionada contra la pared de la cueva en Altamira, hace unos treinta y seis mil años, cambió los términos del problema. El animal pintado en la roca no necesita un narrador. La marca persiste sin que haya un cuerpo humano presente para transportarla. Ese es el gesto fundacional de cada tecnología que vino después — y todo lo que desde entonces hemos llamado “comunicación” o “información” no es un nuevo invento sino el mismo gesto a otra escala.
I. El problema que nunca cambió
Las pinturas de Altamira (~36.000 a.C.) y Lascaux (~17.000 a.C.) no eran arte en el sentido moderno — decoración, expresión personal, placer estético. Eran el primer intento de desacoplar el conocimiento del cuerpo. Ya sea que registraran migraciones de animales, saber ritual o reclamos territoriales, la intuición operativa era la misma: si lo pones en la pared, no tienes que estar presente para transmitirlo. La pared sobrevive al pintor.
La tradición oral antecede esto en cientos de miles de años. Su fidelidad de transmisión es alta a corto plazo — una historia contada de la misma manera diez mil veces desarrolla una estabilidad cristalina, la épica y la oración y la genealogía funcionando como códigos correctores de errores. Pero se degrada con la distancia y las generaciones. Necesitas una cadena de narradores confiables, cada uno capaz de recordar con exactitud, sin quiebres. La cadena se rompe. El conocimiento se pierde. La escritura resolvió esto al eliminar la cadena por completo.
II. Cuatro eras, un solo proyecto
Almacenamiento — preservación. La escritura cuneiforme en tablillas de arcilla (~3400 a.C.), los jeroglíficos en piedra, la tinta sobre papiro y pergamino — la escritura resolvió de un golpe el problema del relevo oral. Un texto escrito se transmite sin pérdida a través del relevo: el copista no necesita entender lo que copia. Más importante aún: la escritura le permite a una persona hablar con alguien que todavía no ha nacido. La biblioteca es la continuación natural: un edificio cuya función es servir como cerebro externo de una civilización. El bibliotecario es el primer profesional de la información — alguien cuyo trabajo no es saber las cosas sino saber dónde están.
Organización — estructura. Cuando el volumen de conocimiento escrito supera lo que cualquier mente puede abarcar, el problema pasa de la preservación a la recuperación. El sistema decimal de Melvil Dewey en 1876; el catálogo de fichas; y finalmente el modelo relacional de Edgar Codd (1970) — la tabla indexada, el esquema, la consulta. El arquitecto de bases de datos es el sucesor del bibliotecario: no le importa el contenido del conocimiento sino la estructura que lo hace recuperable. Ambos resuelven el mismo problema que el pintor rupestre, un paso más abajo.
Recuperación — acceso. Internet conecta las bibliotecas. La Web las hace navegables sin presencia física. Los motores de búsqueda — cuya intuición clave, en PageRank, fue que la importancia de un documento puede inferirse de lo que otros documentos enlazan a él — automatizan la función de referencia del bibliotecario a escala planetaria. Pero la carga sigue recayendo sobre el humano: tienes que saber qué preguntar. El motor de búsqueda devuelve el libro. Todavía tienes que leerlo.
Síntesis — interacción. Aquí es donde entran los modelos de lenguaje. El cambio de paradigma no está en la cantidad de conocimiento accesible sino en la interfaz. Un motor de búsqueda es un puntero: te dice dónde podría estar la respuesta. Un LLM es una compresión: ha internalizado las relaciones entre todos los documentos de su corpus de entrenamiento en un espacio matemático de alta dimensión, y puede navegar ese espacio en lenguaje natural. Ya no recuperas el libro. Le preguntas al espacio qué diría el libro.
III. Qué es realmente el mecanismo de atención
La arquitectura transformer — Vaswani et al., Attention Is All You Need, 2017 — resolvió la limitación central de sus predecesores. Las redes neuronales recurrentes procesaban secuencias token por token, acumulando un estado oculto que se degradaba a medida que la secuencia se extendía — la memoria del modelo sobre el contexto temprano se desvanecía, de una manera que recuerda extrañamente a las pérdidas de transmisión de la tradición oral. El mecanismo de atención descarta el procesamiento secuencial por completo. Cada token en una secuencia puede atender directamente a cualquier otro token, con pesos aprendidos que determinan la relevancia. El modelo puede mirar cualquier palabra en el documento y preguntar: dado donde estoy ahora, ¿cuál de las otras palabras en este texto importa más para predecir la siguiente? Esto es, funcionalmente, lo que hace un lector humano hábil — no leer de izquierda a derecha con atención igual, sino pesar, saltar, hacer referencias cruzadas. El foco del bibliotecario, formalizado en matemáticas.
IV. Por qué la sorpresa y la decepción son ambas correctas
Un transformer entrenado en el texto de la civilización humana puede escribir poesía, depurar código, explicar mecánica cuántica y negociar el tono con una sutileza que se siente como empatía. Esto es genuinamente extraordinario, y quienes lo encogen de hombros no han mirado con cuidado.
La decepción también está justificada. Los LLMs no saben nada en el sentido en que sabe una persona. No tienen un modelo del mundo independiente del texto con el que fueron entrenados; no tienen memoria persistente entre conversaciones; confabulan con la misma fluidez sintáctica con la que reportan hechos establecidos; y no tienen ningún interés en tener razón. Son motores de probabilidad, no motores de verdad. El error — que la industria comete constantemente y el público comete comprensiblemente — es atribuir consciencia a la fluidez lingüística. La interfaz es tan humana (el lenguaje) que proyectamos cualidades humanas sobre ella.
Pero como deja claro la progresión histórica, un LLM es la culminación del proyecto de almacenamiento y recuperación, no el comienzo del proyecto de comprensión. Es el cerebro externo más sofisticado que hemos construido. No es un cerebro interno en absoluto. La sensación de que en realidad no sabe nada es correcta — y es exactamente lo que predecirías si entendieras en qué etapa del proyecto de cuarenta mil años hemos llegado. Vannevar Bush, escribiendo en 1945 sobre su Memex imaginado — una máquina para la recuperación de memoria asociativa, el ancestro conceptual tanto del hipertexto como del mecanismo de atención — captó el objetivo con más claridad que muchos de los que trabajan con LLMs hoy: la meta nunca fue replicar el pensamiento, sino extender el alcance.
La decepción viene de esperar lo equivocado. Hemos construido algo que puede recuperar y recombinar el producto registrado de la civilización humana a una velocidad y escala que ninguna tecnología anterior alcanzó. Eso ya es notable. No hemos construido algo que comprenda. Si eso viene después, o si es un proyecto enteramente diferente, es una pregunta que ni la historia ni la arquitectura resuelven.
V. “Está escrito”
Paul Simon, 1964: the words of the prophets are written on the subway walls / and tenement halls. La imagen de Simon es una inversión de lo sagrado — la sabiduría que antes venía de la montaña aparece ahora en las paredes del subterráneo, anónima, escrita con spray, disponible para quien pase. La externalización es completa: el profeta no necesita estar presente; el mensaje está en la pared; la pared sobrevivirá al profeta.
Borges imaginó La biblioteca de Babel — una biblioteca que contiene todos los libros posibles, infinita e innavegable. Internet y el LLM son su realización parcial y práctica: no todos los libros posibles, sino la mayoría de los reales, navegables por cualquier persona con un navegador. La diferencia entre ambas es la compresión. La biblioteca de Borges era inbuscable porque carecía de estructura. La nuestra es buscable porque pasamos cinco mil años construyendo las estructuras — el catálogo, el índice, el enlace, el embedding — que nos permiten encontrar lo que necesitamos dentro de ella.
La progresión de Lascaux al transformer es el mismo gesto, a escala. De un animal pintado en la pared de la cueva a todo el producto escrito de la civilización comprimido en un espacio vectorial, disponible para cualquiera con un navegador. No hemos creado una nueva mente. Hemos construido una manera más sofisticada de conservar las mentes de todos los que vinieron antes.
Las palabras de los profetas están escritas — en números de punto flotante de 32 bits, distribuidos en centros de datos en tres continentes, devueltos en lenguaje natural, con una pequeña probabilidad de alucinación. El medio ha cambiado. El proyecto es el mismo.
Lecturas adicionales
- Ashwin Vaswani et al., Attention Is All You Need (2017)
- Edgar Codd, A Relational Model of Data for Large Shared Data Banks (1970)
- Vannevar Bush, As We May Think (1945, The Atlantic)
- Jorge Luis Borges, La biblioteca de Babel, en Ficciones (1944)
- Marshall McLuhan, Understanding Media (1964)
- Paul Simon, The Sound of Silence (1964)
