La startup Anthropic lance la version publique de son modèle d’intelligence artificielle le plus puissant, désormais appelé Claude Fable 5, qui inclut des mécanismes de défense limitant son utilisation dans des domaines à risque, tels que la cybersécurité. Cet événement survient après que la version précédente du modèle Mythos ait suscité un grand intérêt dans le monde en début d’année en raison de sa capacité à détecter les failles dans les logiciels.
Jusqu’à présent, Anthropic avait restreint l’accès à Mythos à un groupe d’environ 200 organisations, dont le gouvernement américain dans le cadre du programme Glasswing. En avril, l’entreprise a annoncé que Mythos avait détecté des milliers de vulnérabilités dans les logiciels. Une mise à disposition plus large des capacités de Mythos pourrait permettre à Anthropic, une entreprise valorisée à 965 milliards de dollars, de renforcer sa position sur le marché et de devancer son concurrent OpenAI dans la course à la sortie sur le marché public.
Mécanismes de défense et limitations
Anthropic a déclaré avoir effectué des tests approfondis pour s’assurer que les utilisateurs ne pourraient pas manipuler le nouveau modèle afin de contourner ses instructions ou d’exécuter des actions interdites. Dianne Penn, responsable du département de gestion de produits, de recherche et de laboratoires d’Anthropic, a indiqué à Reuters : « Si un étudiant en fac demande au modèle de trouver des vulnérabilités dans le paquet X ou le code, le modèle refusera. » Dans ce cas, Fable 5 reviendra à Opus 4.8 pour répondre.
L’entreprise Anthropic met en avant les performances de Claude Fable 5 dans le domaine du développement de logiciels et de l’analyse. Selon Penn, le modèle Fable 5 sera plus coûteux, mais effectuera les tâches avec une utilisation moindre de jetons, ce qui réduit le coût total par tâche, selon les premiers retours des clients.
Plans d’expansion et de tarification
Les utilisateurs qui avaient accès à la version précédente de Claude Mythos sans mécanismes de défense pourront mettre à jour vers la nouvelle Claude Mythos 5. Anthropic prévoit de prolonger l’accès avec le temps via un programme de confiance « plus systématique ». Les prix pour les deux modèles sont de 10 dollars par million de jetons d’entrée et de 50 dollars par million de jetons de sortie.
Source : NDTV
