La IA china ya puede pedir los 100 años de perdón

La IA china ya puede pedir los 100 años de perdón

Esta semana se conoció una carta de Anthropic, la empresa detrás de Claude, al Senado y a la Casa Blanca de Estados Unidos. Allí denuncia que operadores vinculados a Alibaba, dueños de la IA Qwen, crearon unas 25.000 cuentas falsas que le hicieron 28,8 millones de consultas a Claude entre abril y junio, como parte de un presunto plan para destilar las inteligencias artificiales de Occidente. Ya en febrero había acusado de lo mismo a otros tres laboratorios chinos, incluido DeepSeek.

¿Destilar una inteligencia artificial? Arranquemos por simplificar la acusación: Anthropic dice que empresas chinas están extrayendo capacidades de sus modelos para crear los propios. En criollo: le estarían robando parte de su inteligencia. Y quien tiene la llave de estos modelos accede a una tecnología que ya mueve la economía.

Toda la IA generativa se apoya en modelos: Claude Fable 5, GPT 5.6, Gemini 3.5 y tantos otros. ¿Y qué es un modelo? Simplificando: un conjunto de archivos con parámetros numéricos, llamados pesos, que codifican patrones aprendidos durante el entrenamiento. Trabajan con tokens, pedazos de texto o de información. No son exactamente palabras ni conceptos, pero nos sirve imaginarlos así.

Esto no les gusta a los autoritarios

El ejercicio del periodismo profesional y crítico es un pilar fundamental de la democracia. Por eso molesta a quienes creen ser los dueños de la verdad.

Con una licencia pedagógica, imaginemos que a cada par de palabras le asignamos un número que mide cuánto se relacionan. Gato y felino tendrán una relación fuerte; gato y agua, una más débil; gato y tornillo, casi ninguna. La idea general de cómo funciona un modelo de IA va por ahí: una red enorme de relaciones numéricas que permite predecir qué sigue y cómo cambia el sentido según el contexto. Esa maquinaria hace que ChatGPT, Claude o Gemini respondan cualquier pregunta y parezcan, o sean, inteligentes.

La Justicia alemana acorraló a la IA: Google deberá hacerse cargo si su buscador inventa respuestas

Ese conjunto de pesos es la propiedad intelectual y el principal activo de OpenAI, Google, Anthropic o xAI. Cuando alguien usa modelos de estas empresas, paga por consultarlos mediante una aplicación o servicio. ¿Y cómo se calculan esos pesos de los modelos? Ahí entra el entrenamiento: se le da a un proceso de cálculo una cantidad gigantesca de texto, páginas web, redes, diarios, libros, subtítulos, para que aprenda patrones, relaciones y contextos. Así funciona, a grandes rasgos cualquier IA de hoy.

Volviendo a la denuncia: la destilación significa que esas cuentas le habrían hecho millones de preguntas a Claude, y que las respuestas fueron usadas para entrenar otro modelo, de origen chino, que absorbe parte de sus capacidades sin pagar el costo de desarrollarlas desde cero. Anthropic lo denuncia como una intromisión contra la industria estadounidense de IA.

Ahora bien: ¿de dónde sacó Anthropic los textos para entrenar a Claude? Gracias a la causa “Bartz contra Anthropic”, en un tribunal federal de California, sabemos que descargó ilegalmente unos siete millones de libros de sitios piratas. Para evitar el juicio, aceptó pagar 1.500 millones de dólares a decenas de miles de autores y editoriales. La lista incluye autores argentinos conocidos y hasta a mí, con libros técnicos de programación publicados en inglés. Cuando alguien le paga a Claude para resolver algo de programación sobre la temática de mis libros, podría ser que parte de esa solución venga de lo aprendido en ellos. Y acá viene la parte incómoda: mis libros estuvieron dentro del universo de textos con los que Anthropic alimentó esos modelos, sin comprar ni un ejemplar y sin que yo haya recibido un centavo.

Entonces, de ser cierta la destilación china de modelos estadounidenses, ¿le estuvieron robando a un ladrón?

El juez del caso determinó que entrenar un modelo con un libro comprado legalmente sí puede ser un uso legítimo. La causa documenta que Anthropic compraba libros usados al por mayor para deslomarlos, escanearlos y descartar el papel como fuente limpia para entrenar sus modelos. La mayoría de autores y editoriales también rechazan esa interpretación de la propiedad intelectual.

EE.UU. levanta las restricciones de exportación sobre el modelo de IA Fable 5 de Anthropic

Pero acá viene la parte más dura: una vez entrenado el modelo, es casi imposible determinar de dónde salió cada conocimiento. No hay forma simple y directa de saber por qué ChatGPT, Gemini o Claude te dicen lo que te dicen, ni de dónde lo aprendieron exactamente. Esta discusión no es exclusiva de Anthropic: se acumulan demandas contra todas las empresas de IA por piratear contenido. La semana pasada, casi 400 diarios locales de Estados Unidos demandaron a OpenAI y Microsoft por copiar sus noticias sin permiso ni pago para entrenar ChatGPT y Copilot.

Las empresas chinas además juegan distinto: compiten con modelos de pesos abiertos, gratuitos y descargables por cualquiera. Esta semana se “reviralizó” un video de 2023 de Dario Amodei, el CEO de Anthropic, advirtiendo en el Senado sobre el peligro de que todos tengamos acceso a modelos abiertos, como los chinos. El mismo Amodei cuyos modelos Fable y Mythos estuvieron bloqueados por una orden de exportación estadounidense por seguridad nacional.

Del otro lado, Satya Nadella, el CEO de Microsoft, viene repitiendo que si una empresa no puede meter su conocimiento en pesos que pueda controlar, no tiene soberanía y le está regalando su valor a otro. Y Palantir, la empresa de Peter Thiel, publicó este martes un manifiesto sobre soberanía de IA: quien no es dueño de sus modelos y sus datos no es dueño de sus medios de producción. Yo agregaría a los Estados a esa lista.

Por eso el debate ya no es solo copyright: es soberanía industrial, control tecnológico y poder político. El conocimiento acumulado por la humanidad, comprimido y licenciado por un puñado de empresas; gobiernos que quieren la mano en la llave; autores que rechazan que su obra alimente inteligencias sin compensación; compañías que denuncian robos sin mirar hacia adentro.

Cerrando con los chinos destilando modelos occidentales: si consideramos eso un robo, me remito al viejo dicho que determina qué pena le corresponde a quien le roba a un ladrón.