Google Multado: Desafío Competitivo y AI en Noticias

En una saga interminable entre Google y la autoridad de competencia de Francia sobre las protecciones de derechos de autor para fragmentos de noticias, la Autorité de la Concurrence anunció el miércoles una multa de 250 millones de euros contra el gigante tecnológico (alrededor de 270 millones de dólares al tipo de cambio actual).

Según el regulador de competencia, Google ignoró algunos de sus compromisos previos con los editores de noticias. Pero la decisión es especialmente notable porque revela algo más de actualidad: el uso por parte de Google del contenido de los editores para entrenar su modelo de inteligencia artificial generativa Bard/Gemini.

La autoridad de competencia ha encontrado fallas en que Google no notificó a los editores de noticias sobre este uso de su contenido con derechos de autor para la IA generativa. Esto a la luz de los compromisos anteriores de Google destinados a asegurar que mantenga conversaciones justas de pago con los editores por la reutilización de su contenido.

Infracciones de derechos de autor y competencia

En 2019, la Unión Europea aprobó una reforma de los derechos de autor digitales a nivel paneuropeo que extendió las protecciones de derechos de autor a los titulares y fragmentos de noticias. Los agregadores de noticias, como Google News, Discover y el recuadro “Noticias principales” en las páginas de resultados de búsqueda, anteriormente extraían y mostraban estas historias de noticias en sus productos sin ninguna compensación financiera.

Originalmente, Google intentó evadir la ley al desactivar Google News en Francia. Pero la autoridad de competencia intervino rápidamente, considerando que su acción unilateral era un abuso de posición dominante en el mercado que podría dañar a los editores. La intervención básicamente obligó a Google a hacer acuerdos con los editores locales sobre la reutilización de contenido. Pero en 2021, Google fue multada con 592 millones de dólares después de que la autoridad de competencia encontrara incumplimientos importantes en sus negociaciones con editores y agencias locales.

El gigante tecnológico calificó la sanción de “desproporcionada” y dijo que apelaría. Pero posteriormente buscó resolver la disputa, ofreciendo una serie de compromisos y retirando su apelación. Los compromisos fueron aceptados por la Autorité francesa, incluido el paso de información clave a los editores y la negociación de manera justa.

Google ha firmado acuerdos de derechos de autor con cientos de editores en Francia, los cuales entran en el ámbito de su acuerdo con la Autorité. Por lo tanto, su negocio en esta área está muy estrictamente regulado.

Sin apelación

Google ha aceptado no impugnar los últimos hallazgos de la Autorité, a cambio de un proceso acelerado y realizar un pago monetario. 

Sin embargo, su directora general de asociaciones de noticias y publicaciones, Sulina Connal, adoptó un tono molesto, escribiendo en una larga publicación de blog que “la multa no es proporcional a los problemas planteados” por la autoridad.

La publicación del blog sugiere que Google realmente quiere dejar atrás esta saga, con Connal también escribiendo: “Hemos llegado a un acuerdo porque es hora de seguir adelante y, como muestran nuestros muchos acuerdos con editores, queremos centrarnos en el objetivo más amplio de enfoques sostenibles para conectar a las personas con contenido de calidad y trabajar de manera constructiva con los editores franceses”.

Con la inteligencia artificial generativa en el punto de mira, y la carrera competitiva por lanzar herramientas, el cálculo de Google sobre cómo abordar el tema de la reutilización de contenido parece diferente.

Entrenamiento de IA generativa en el punto de mira

El cumplimiento de hoy por parte de la autoridad de competencia francesa muestra que se centró en el uso por parte de Google de contenido de editores y agencias de noticias con fines de entrenamiento para su modelo de base de IA y su servicio relacionado de chatbot de IA, Bard (ahora llamado Gemini).

Encontró que Google usó contenido de editores y agencias de prensa para entrenar a Bard, su herramienta de IA generativa que se lanzó en julio de 2023, “sin notificar a los titulares de los derechos de autor o a la Autoridad”, según su comunicado de prensa.

Sobre este punto, la defensa de Google es doble. En su publicación de blog, escribe que la autoridad de competencia “no cuestiona la forma en que se utiliza el contenido web para mejorar productos más nuevos como la IA generativa, que ya se aborda en el Artículo 4 de la DMCD” [Directiva de Derechos de Autor de la UE]. 

El Artículo 4 de la Directiva de Derechos de Autor establece una “excepción o limitación para la minería de textos y datos”, específicamente para “reproducciones y extracciones de obras y otros materiales de acceso legal con fines de minería de textos y datos”.

Sin embargo, en su comunicado de prensa, la Autorité sostiene que aún no se ha determinado si la exención se aplica en este caso. (Vale la pena señalar que la cláusula pertinente se refiere a “obras de acceso legal”, mientras que Google está bajo un compromiso legalmente vinculante con la autoridad de competencia para notificar a los titulares de derechos de autor sobre los usos de sus obras protegidas y, aparentemente, no lo hizo en este caso).

“En cuanto a declarar si el uso de contenido de noticias para entrenar un servicio de inteligencia artificial entra en el ámbito de los derechos conexos y la protección, esta cuestión aún no se ha resuelto”, escribió la autoridad de competencia. “Sin embargo, la Autorité considera que Google ha incumplido su compromiso #1 al no informar a los editores que su contenido se había utilizado para entrenar a Bard”.

La publicación del blog de Google también menciona brevemente el Reglamento de IA de la UE, sugiriendo que es relevante. Sin embargo, la legislación aún no está en vigor, ya que está pendiente de aprobación final por el Consejo Europeo. 

La próxima legislación de IA también dirá que los desarrolladores deben cumplir con las normas de derechos de autor de la UE. E introduce requisitos de transparencia con ese objetivo, exigiéndoles que establezcan una política para respetar la ley de derechos de autor de la UE; y hacer pública un “resumen suficientemente detallado” del contenido utilizado para el entrenamiento de modelos de IA de propósito general (como Gemini/Bard).

Este próximo requisito para que los fabricantes de modelos publiquen un resumen de los datos de entrenamiento puede, en el futuro, facilitar que los editores de noticias cuyos contenidos protegidos hayan sido ingeridos para el entrenamiento de la IA generativa obtengan una remuneración justa bajo la ley de derechos de autor de la UE.

No opción técnica de exclusión

La Autorité también señala que Google no proporcionó, al menos hasta el 28 de septiembre de 2023, una solución técnica para permitir que los editores y agencias de prensa optaran por excluir que su contenido se utilizara para entrenar a Bard sin que tal decisión afectara la visualización de su contenido en otros servicios de Google. 

“Hasta esta fecha, los editores y agencias de noticias que querían optar por no participar en este caso de uso tenían que insertar una instrucción que bloqueaba toda la indexación de contenido de Google, incluidos los servicios de Búsqueda, Discover y Google News. Esos servicios forman parte específicamente de la negociación de ingresos relacionados con los derechos conexos”, escribió, y agregó: “En el futuro, la Autorité observará atentamente la eficacia de los procesos de exclusión de Google”.

En términos más técnicos, entre julio y septiembre de 2023, los editores de noticias podían insertar una etiqueta “noindex” en el archivo robots.txt para asegurarse de que su contenido no se usara para entrenar el modelo de IA de Google. Este archivo robots.txt se coloca en la carpeta raíz de los servidores web y contiene varias instrucciones para los motores de búsqueda. El rastreador web de Google mira las instrucciones en esos archivos para indexar sitios web. 

Pero una etiqueta “noindex” significa que su sitio web desaparece por completo de Google. En septiembre de 2023, Google agregó más granularidad y creó una regla “Google-Extended” que es diferente de la regla “noindex”. Al optar por no participar en la instrucción Google-Extended, los editores web indican que no quieren ayudar a mejorar los modelos actuales y futuros de Gemini.

Otras deficiencias

La Autorité también sanciona a Google por una serie de otros problemas relacionados con la forma en que negocia con los editores de noticias franceses, encontrando que no les proporcionó toda la información necesaria para asegurar una negociación justa de la remuneración por su contenido. 

En su comunicado de prensa, escribió que la información de Google a los editores sobre su metodología para calcular cuánto deberían pagarles era “particularmente opaca”.

También encontró que Google no cumplió con los criterios de no discriminación, destinados a garantizar que los editores reciban un trato igualitario. Y señaló una decisión de Google de imponer un “umbral mínimo” para la remuneración, es decir, por debajo del cual no haría ningún pago a los editores, con la Autorité describiendo esto como una introducción de discriminación entre editores “en su propio principio”. Por debajo de cierto umbral, todos los editores “se asignan arbitrariamente cero remuneración, independientemente de su respectiva situación”, también señaló su comunicado de prensa.

Además, la Autorité encontró fallas en los cálculos de Google con respecto a los llamados “ingresos indirectos”, diciendo que el “paquete” que propuso no estaba de acuerdo con decisiones anteriores o la sentencia de apelación del Tribunal de Justicia, de octubre de 2020.

También dijo que Google no actuó sobre su compromiso de actualizar los contratos de remuneración de acuerdo con sus compromisos.

Vía | Google hit with $270M fine in France as authority finds news publishers’ data was used for Gemini | TechCrunch