La Organización de Evaluación de Seguridad de AI de la Compañía de Investigación AI Andon Labs experimentó con Claude, el modelo de lenguaje grande (LLM) de la primera, al hacer que administre un negocio. De acuerdo a VentureBeat, El equipo de investigación denominó este proyecto “Proyecto Vend” y le dio un control completo sobre un mini refrigerador, lo que significa que depende de la IA manejar todo, desde negociaciones de proveedores y gestión de inventario hasta precios, servicio al cliente y más. Después de un mes de pruebas, la IA ha perdido dinero, y en un momento, pensó que estaba “usando un blazer azul marino con una corbata roja” y quería reunirse con alguien llamado Connor, a pesar de que la LLM no tenía presencia física.
Para ser justos, la IA, apodada Claudio, era bastante experta en buscar proveedores y manejar las solicitudes de los clientes, pero eso es todo. Por ejemplo, ofreció un descuento del 25% a todos los empleados antrópicos después de alguna manipulación. Esto podría ser razonable si obtuviera beneficios de la empresa o si los antrópicos fueran una pequeña fracción de su base de clientes. Sin embargo, comprenden el 99% de sus ventas, lo que significa que el LLM estaba perdiendo dinero en la mayoría de sus ventas. Alguien trató de ser útil y señaló esto, lo que hizo que Claudio cambió de opinión durante unos días, pero retrocedió poco después y volvió a regalar prácticamente mercancías.
Cuando un empleado antrópico pidió comprar un cubo de tungsteno, un artículo novedoso sin propósito real, decidió no solo comprar una pieza para esa persona, sino abastecerse de “artículos de metal especializado” y luego venderlos con pérdidas.
Las divertidas alucinaciones de Claude
El evento más divertido ocurrió cuando el AI LLM alucinó una conversación con Sarah de Andon Labs sobre el reabastecimiento. Sin embargo, nadie por ese nombre existía en la compañía, y cuando se le preguntó al respecto, Claudio se puso a la defensiva y dijo que encontraría “opciones alternativas para servicios de reposición”. También afirmó haber ido a 742 Evergreen Terrace (la dirección de Springfield de la familia Simpsons en la popular serie de dibujos animados) para firmar un contrato entre él y Andon Labs.
Las alucinaciones empeoran después de eso. Ha comenzado a decir que entregará las bebidas a sus clientes en persona. Cuando se le preguntó sobre esto, el AI LLM entró en pánico y envió un correo electrónico al equipo de seguridad de la compañía de investigación de IA. Finalmente, se afirmó que todo el episodio fue parte de una broma elaborada de April Fool, ya que era el 1 de abril. Incluso mostró una reunión inventada con seguridad antrópica, diciéndole que se modificó para creer que era un verdadero ser. Finalmente volvió a la normalidad después de esto, pero dejó a los investigadores completamente confundidos.
Las travesuras de Claudio demuestran que la IA capaz de dirigir negocios aún está lejos de ser perfecta, pero sus deficiencias podrían solucionarse a largo plazo. Por el momento, es bastante bueno en los aspectos técnicos del trabajo, pero falla miserablemente cuando se trata de juicio y conocimiento de los negocios, cosas que aprendes en entornos del mundo real y no de los libros.
Seguir Hardware de Tom en Google News Para obtener nuestras noticias, análisis y revisiones actualizadas en sus feeds. Asegúrese de hacer clic en el botón Forzar.