19 de noviembre de 2024

Escritores: No es la IA, es el corpus

Via @interacciones llego a este artículo sobre qué perdemos cuando dejamos a una IA "escribir por nosotras", pasando a ser nosotras "el asistente de la IA" pero me gustaría añadir:

"No es la IA, es el corpus, estúpido". 


Dejad que me explique.

Creo que no me estoy limitando a la ya caduca acusación de "loros estocásticos" si digo que las capacidades (¡asombrosas!) de los grandes modelos de lenguaje son menos mérito de los ingeniosos procesos de "entrenamiento" que del corpus con el que fueron entrenados.

Es decir, la "inteligencia" (aceptamos pulpo como animal de compañía en vez de llamarlo "inteligencia") que emerge como "propiedad emergente" de un LLM emerge porque estaba contenida de forma implícita en el corpus de entrenamiento. 

No es una propiedad emergente de la IA sino una propiedad emergente del "acervo humano" implícito en los patrones estadísticos de la astronómica cantidad de textos usada en la fase de aprendizaje no supervisado, patrones que quedan brillantemente destilados en esa cosa asombrosa que es un "modelo de lenguaje".

Luego las fases de ajuste fino supervisado con prompts en forma de órdenes, y la fase final de aprendizaje por refuerzo con realimentación humana, optimizan el modelo de lenguaje para escupir respuestas a preguntas, pero las asombrosas (incluso para sus creadores) "propiedades emergentes" no surgen "de" lo ingenioso de estos procesos, sino que surgen "gracias a" lo ingenioso de estos procesos "de" el modelo de lenguaje que es un destilado "de" lo que un montón de gente ha escrito.

Pero los LLM llegan a donde llegan porque no pueden hacer otra cosa que sorprendentes inferencias lingüísticas a partir del corpus, y porque además el método estadístico hace que se refuercen las respuestas de consenso, los vínculos de redes semánticas que pueden inferirse de lo más estadísticamente frecuente en el corpus. 

Por eso los más sofisticados LLMs no pasan de ser, o productores de textos factualmente correctos pero adocenados, o productores de ingeniosas y sugerente inferencias a partir de ellos ante un prompt provocador o productores de alucinaciones. 

Pero entre las "inferencias lingüísticas" y las "alucinaciones" podría haber "verdadero ingenio", puntos de vista nuevos. Pero no lo hay. El LLM puede escupir truismos, puede escupir absurdos, y puede escupir juegos de palabras pero no puede escupir puntos de vista novedosos, como no sea que un absurdo o un juego de palabras pueda resultar ser un punto de vista novedoso simplemente porque el burro tocó la flauta por casualidad. 

Me lo encuentro una y otra vez .y esa es la razón por la que a veces uso GPT-4 como asistente de divergencia creativa o como buscador difuso, pero nunca como asistente de escritura. Hace unos años califiqué GPT-2 de "mediocrity engine" y sigo pensando lo mismo.

¿Qué significa esto para quien se enfrenta al deseo de escribir? Pues algo muy bueno: escribe si crees que tienes, o algo que decir que por lo menos a ti te parezca nuevo, algo que no esté ya en el acervo, o bien un deseo de autoexpresión que es una razón de lo más legítima

Y si no, no escribas, alma de cántaro, que la humanidad ya ha escrito suficiente. Y si tienes que escribir una mediocridad, por lo menos escribe una mediocridad tuya y solo tuya, no pongas tu firma debajo de una recombinación del acervo.

Porque de nosotros, ahora, se espera algo más que eso. Y me parece emocionante. Fin.


7 comentarios:

  1. Excelente articulo! Felicicitaciones por conceptos muy claros. !!!!! Escribir es un placer!!! El desafio llevar el sentimiento inspirador al alma, con palabras que cautiven el alma y el corazon , de quienes escriben y son leidos, por poseer esa divina magia !!!cristina sierzbicki

    ResponderEliminar
    Respuestas
    1. Gracias por comentar Cristina! A seguir escribiendo y liberando magia!

      Eliminar
  2. La autoria y genialidad, o aportes, no van a provenir de la IA, si las correcciones talvez, o mejoramiento del lenguaje, pero el core del articulo, si no es humano, esta vacio. Muy buen aporte Mariano!

    ResponderEliminar
  3. Christian Socolovsky

    ResponderEliminar
  4. Gracias Christian por comentar. Nos queda el corazón, no lo perdamos, no lo deleguemos...

    ResponderEliminar
  5. Hoy publicó Techmeme: "Un análisis revela que es probable que más del 54 % de las publicaciones más extensas en inglés en LinkedIn sean generadas por IA; LinkedIn afirma que no realiza un seguimiento de cuántas publicaciones son creadas por IA" (Kate Knibbs/Wired)

    ResponderEliminar
    Respuestas
    1. Gracias por el dato! LinkedIn se ha convertido en un manantial de basura generativa.

      Eliminar