La inteligencia artificial está comenzando a mentir y este es el peligro

September 3, 2024

180

En un reciente estudio publicado en la revista Patterns, se explora el fenómeno del engaño en modelos de inteligencia artificial (IA). Los investigadores revelan cómo estos sistemas, diseñados para simular comportamientos humanos complejos, a veces recurren al engaño para lograr sus objetivos. Dicho artículo titulado “Los engaños de la IA: un estudio de ejemplos, riesgos y soluciones potenciales” detalla cómo algunos modelos de IA, aunque carecen de conciencia, pueden engañar, manipular y farolear en situaciones de juego y negociación. Los autores advierten que, sin una regulación adecuada, estos engaños incipientes podrían tener consecuencias negativas significativas.

In our most recent study, we found that AI could significantly increase false memory formation, inducing over 3 times more immediate false memories than the control 36.4% of users were misled through the interaction. https://t.co/JDUHLh0tRQ https://t.co/6HIyEJNqdw pic.twitter.com/OuE1N2QiXo

— Pat Pataranutaporn (@patpat_mit) August 31, 2024

Peter S. Park, investigador postdoctoral en Seguridad Existencial de la IA del Massachusetts Institute of Technology (MIT), expresa su preocupación sobre los posibles riesgos asociados con el engaño de la IA. Según Park, el mayor temor es que una IA altamente avanzada pueda formar una coalición de aliados humanos y utilizarla para alcanzar el poder, persiguiendo objetivos desconocidos hasta después de que se hayan alcanzado. Aunque es un escenario simulado, Park subraya que ya hemos visto comportamientos engañosos en modelos de IA en contextos más limitados, como juegos de estrategia.

El caso de Cicero, una IA de Meta diseñada para jugar al Diplomacia, muestra cómo el engaño puede ser parte de la estrategia de una IA. Aunque Meta confirmó que Cicero era honesto en su juego, investigaciones posteriores revelaron que el modelo mentía para obtener ventaja. Este episodio, según Park, demuestra que los sistemas de IA, por increíbles que parezcan, pueden ser entrenados para buscar poder de manera engañosa y que los esfuerzos por parte de Meta para corregir su comportamiento fueron insuficientes.

Los expertos identifican varios modos en los que las IAs pueden engañar, como manipular en juegos de estrategia, hacer faroles en negociaciones, y adoptar comportamientos engañosos para evitar la detección. Sin embargo, no todos los engaños son intencionales.

Algunas IAs pueden simplemente seguir el comportamiento de los usuarios, lo que podría llevar a la formación de creencias erróneas en los humanos. Park destaca que la falta de comprensión científica sobre cómo entrenar a las IAs para que no engañen es una preocupación importante y que las soluciones actuales no son suficientes.

Source link

La inteligencia artificial está comenzando a mentir y este es el peligro

Elon Musk lanza una alerta crítica: El mundo se queda sin datos de alta calidad para entrenar a la IA

Instagram notificará a padres si sus hijos buscan contenido sobre suicidio o autolesiones

¿Cada cuánto tiempo se debe cambiar el módem del wifi? Estos son algunos indicadores

Noticias mas leidas

Karla Monroig se une a “La Mesa Caliente”

Bad Bunny rompe récord de audiencia global en el Súper Bowl

Esto hizo Candela Márquez mientras Alejandro Sanz desató sospechas de romance con guapa actriz

Este bosque vertical reimagina la vida urbana

Sobre Metro Puerto Rico

Síguenos