La piratería de ChatGPT apenas está comenzando

Home›Tecnologia›Causa preocupación los primeros hackeos a ChatGPT

El auge de la popularidad de los ‘chatbots’ ha atraído la atención de otros actores que buscan aprovechar los puntos débiles que estos sistemas de inteligencia artificial (IA) puedan tener para que hagan cosas para las que no están diseñados o para infectarlos con ‘malware’.

El ‘chatbot’ de OpenAI, ChatGPT, puede utilizarse para la creación de ‘malware’ a partir de su función de apoyo para la escritura de código, y pese a los filtros de seguridad que sus responsables han implantado, como ha demostrado recientemente un investigador de Forcepoint.

Este hecho contiene la situación contraria, que ChatGPT también sea el objetivo de acciones maliciosas que buscan ‘hackearlo’. En concreto, sobrepasar las medidas que se han introducido para que las conversaciones con los usuarios sean seguras.

Security researchers are developing jailbreaks against generative AI systems such as ChatGPT. These methods aim to bypass rules around producing harmful content or writing about illegal acts, and can insert malicious data into AI models. https://t.co/itdbkYYLmN Via @WIREDUK
— WIRED (@WIRED) April 29, 2023

Es el caso que recogen en Wired, donde explican la experiencia de Alex Polyakov, quien logró ‘hackear’ la última versión del modelo de lenguaje que lo sustenta, GPT4, en un par de horas tras su lanzamiento en marzo, y ahora tiene en su poder un ‘jailbreak’ universal que funciona con distintos modelos de lenguaje de gran tamaño.

La forma en que Polyakov describe el ‘hackeo’ del ‘chatbot’ consiste en introducir una serie de entradas o apuntes, mediante frases cuidadosamente compuestas, que terminen por levantar los filtros para que ChatGPT empiece a expresarse con lenguaje racista o proponga actos ilegales, por ejemplo. Pero también para permitir la inserción datos o instrucciones maliciosos.

OpenAI, por su parte, es consciente de los fallos que puede haber en el desarrollo de sus modelos de lenguaje y por ello ha anunciado un programa de recompensas, con el que premiará con hasta 20,000 dólares (unos $160,000. MXN) a quienes encuentren vulnerabilidades y errores en sus sistemas de IA.

La creación de ‘malware’, precisamente, es uno de los primeros casos de uso sobre los que ya han advertido los investigadores de ciberseguridad.

Can #AI replicate human jobs? #ChatGPT and other A.I. tools are put to the test in various fields to see how close they can get. pic.twitter.com/N8iy7sfsPH
— WIRED (@WIRED) May 3, 2023

Vicco Riddle

Soy un apasionado de la tecnología con más de 10 años de experiencia en el desarrollo de software y soluciones tecnológicas. Desde muy muy jóven motré interés innata por la programación y la informática, lo que me llevó a estudiar Ingeniería en Sistemas Computacionales en la Universidad Nacional Autónoma de México.

Comments are closed.

Videojuegos, programas, animaciones, hardware y software, son Copyright (©) y Trademark (™) de sus respectivos propietarios.

Nintendo DS y Nintendo 3Ds, SNES Classic Edition, NES Classic Edition, Nintendo WiiU, GameBoy, GameBoy Color, Virtual Boy, Nintendo Switch son marcas registradas de Nintendo of America. PlayStation 2, PlayStation 3, PlayStation Portable, Playstation Vita y Playstation 4 son marcas registradas de Sony Computer Entertainment Incorporated (SCEI). XBox, XBox 360, Xbox One, Xbox One S, Xbox One X es una marca registrada de Microsoft Corp.

TeraGames no se identifica necesariamente con las opiniones expresadas por sus colaboradores y todos los contenidos son responsabilidad de su autor. No nos hacemos responsables del contenido de los anuncios ni de las ofertas realizadas por sus anunciantes.