La startup Anthropic presenta la versión pública de su modelo de inteligencia artificial más potente, ahora denominado Claude Fable 5, que incluye mecanismos de defensa que restringen su uso en áreas de riesgo, como la ciberseguridad. Esto ocurre tras el gran revuelo que causó la versión anterior del modelo, Mythos, a principios de año, debido a su capacidad para detectar fallos en el software.
Hasta ahora, Anthropic había limitado el acceso a Mythos a un grupo de aproximadamente 200 organizaciones, incluido el gobierno de EE. UU. en el marco del programa Glasswing. En abril, la empresa anunció que Mythos había detectado miles de vulnerabilidades en el software. La ampliación de las capacidades de Mythos podría permitir que Anthropic, una empresa valorada en 965 millones de dólares, fortalezca su posición en el mercado y supere a su competidor OpenAI en la carrera por salir al mercado público.
Mecanismos de defensa y limitaciones
Anthropic ha declarado que ha realizado una prueba exhaustiva para garantizar que los usuarios no puedan manipular el nuevo modelo para eludir sus instrucciones o llevar a cabo acciones prohibidas. Dianne Penn, directora de gestión de productos, investigación y laboratorios de Anthropic, informó a Reuters: «Si un estudiante universitario solicita al modelo que encuentre vulnerabilidades de ciberseguridad en el paquete X o en el código, el modelo se negará». En ese caso, Fable 5 volverá a Opus 4.8 para responder.
La empresa Anthropic destaca el rendimiento de Claude Fable 5 en el desarrollo de software y análisis. Según Penn, el modelo Fable 5 será más caro, pero realizará tareas con un menor uso de tokens, lo que reduce el costo total por tarea, según las primeras reacciones de los clientes.
Plan de expansión y precios
Los usuarios que tuvieron acceso a la versión anterior de Claude Mythos sin mecanismos de defensa podrán actualizar a la nueva Claude Mythos 5. Anthropic planea ampliar el acceso con el tiempo a través de un programa de acceso de confianza más «sistemático». Los precios para ambos modelos son de 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida.
Fuente: NDTV
