Internet se encuentra inundado de contenido generado por Inteligencia Artificial. Un reciente estudio ha desvelado que una considerable porción de la web está compuesta por contenido de baja calidad producido y traducido por diversas formas de Inteligencia Artificial.
Inteligencia Artificial y su presencia en Internet
La investigación, llevada a cabo por expertos del Laboratorio de IA de Amazon Web Services (AWS), reveló que más del cincuenta por ciento de todas las oraciones en la red han sido traducidas a dos o más idiomas.
La deficiente calidad y la magnitud impresionante de estas traducciones sugieren el empleo de modelos de inteligencia artificial basados en generaciones anteriores de grandes modelos de lenguaje (LLM), menos sofisticados, para crear y traducir el material.
Este fenómeno es notablemente prominente en los “idiomas de recursos limitados”, aquellos idiomas con menos datos disponibles para entrenar modelos de IA de manera efectiva.
¿Qué contenido se está generando con esta tecnología?
Los investigadores sugieren que este tipo de contenido está siendo generado por una diversidad de personas, que incluyen estafadores, creadores de contenido sensacionalista y personas que buscan simplemente obtener ganancias a través de publicidad, sin preocuparse por la calidad, la consistencia o incluso la veracidad del contenido.
El efecto de este contenido de baja calidad en la web es notable, ya que puede obstaculizar la búsqueda de información precisa y útil por parte de los usuarios. Además, puede perjudicar la reputación de la web en su conjunto como fuente confiable de información.
Además, también puede dificultar el proceso de aprendizaje de los investigadores de IA sobre idiomas con recursos limitados.
Modelos de Lenguaje no son perfectos
Los modelos de IA requieren grandes volúmenes de datos de alta calidad para su entrenamiento, pero si estos datos están contaminados con contenido deficiente, los modelos pueden adquirir información incorrecta.
Este estudio constituye una alerta sobre el potencial impacto negativo de la Inteligencia Artificial generativa en la web. Es crucial que tanto los usuarios, los motores de búsqueda como los investigadores de IA tomen medidas concretas para abordar esta problemática.
Esta tecnología está cambiando el modo en que se genera contenido en la mayoría de los casos, es decir, tanto a nivel informativo, como a nivel entretenimiento y en muchas ocasiones fallamos al tomar a estos Modelos de Lenguaje como una verdad absoluta o una herramienta infalible.