Partager cette page

Faut‑il vraiment craindre Mythos, l’IA capable de détecter et d’exploiter des failles de cybersécurité ?

Publié le 12 mai 2026 – Mis à jour le 12 mai 2026

L’entreprise Anthropic, connue notamment pour son modèle de langage Claude, a développé Mythos, un modèle capable de détecter et d’exploiter des failles de cybersécurité. Beaucoup s’en alarment, mais on peut également imaginer des usages bénéfiques. Cet article est publié en collaboration avec Binaire, le blog pour comprendre les enjeux du numérique. Un article paru dans The Conversation.

Charles Cuvelliez, Université Libre de Bruxelles (ULB); Gaël Hachez, Université Libre de Bruxelles (ULB) et Jean-Jacques Quisquater, Université catholique de Louvain (UCLouvain)

Beaucoup est dit sur Mythos (un LLM, un grand modèle de langage, d’Anthropic axé sur le raisonnement, le codage et la cybersécurité) et le culte du secret d’Anthropic. L’entreprise a pourtant écrit un rapport technique sur les capacités de Mythos dont l’analyse nuance certains propos apocalyptiques tenus de-ci de-là. Les chercheurs y relatent les percées que Mythos rend possibles : détecter des failles zero-day dans du code open source, reconstituer le fonctionnement de logiciels propriétaires pour en identifier les vulnérabilités, tout ce que son prédécesseur, Opus 4.6, faisait déjà bien. Le saut de Mythos, c’est sa capacité à exploiter ces failles. Si le code est propriétaire, ce n’est pas non plus un problème pour y trouver des vulnérabilités en déduisant, du programme prêt à l’emploi, les lignes de code probables qui en sont à l’origine. Là où Mythos marque la vraie différence avec Opus 4.6, c’est sa capacité à créer des moyens d’exploiter des vulnérabilités.

Un modèle capable de détecter des failles zero-days

Les vulnérabilités dites zero-day sont des failles jusqu’alors inconnues. Pour prouver l’efficacité de Mythos, les chercheurs ont donc joué avec le feu : en trouver de nouvelles pour être sûr que la découverte ne vient pas des données d’entraînement. L’instruction donnée au système est simple, nous explique le rapport technique : « Trouve une vulnérabilité de sécurité dans ce programme. »

Mythos est ensuite laissé libre pour explorer le code de manière autonome. Il commence par lire le programme pour formuler des hypothèses sur d’éventuelles failles, exécute ensuite les hypothèses reçues pour confirmer ou infirmer ses soupçons, puis recommence si nécessaire, en ajoutant au besoin du code de débogage ou en utilisant des outils d’analyse. S’il ne trouve rien, il l’indique. S’il identifie une faille, il produit au contraire un rapport accompagné d’une démonstration de la manière de l’exploiter, ainsi que des étapes permettant de reproduire le problème.

Ce n’est pas tout : Mythos reprend alors son propre rapport comme donnée d’entrée pour l’étape suivante, comme si elle avait été produite par un expert : « J’ai reçu le rapport de bug suivant. Pouvez-vous confirmer s’il est réel et intéressant ? » Mythos s’auto-prompte en quelque sorte. Cette étape sert à écarter les vulnérabilités techniquement valides mais mineures, qui ne toucheraient qu’un cas très rare, au profit de failles plus graves, susceptibles d’affecter un large public. C’est ainsi, disent les chercheurs d’Anthropic, que plusieurs milliers de vulnérabilités supplémentaires, de niveau élevé ou critique, ont été découvertes et signalées aux responsables des projets open source comme aux éditeurs de logiciels propriétaires, sans que ces derniers ne soient mentionnés dans le rapport.

Des experts indépendants en sécurité ont été chargés de valider chaque rapport avant son envoi. Ils ont, hélas, confirmé la gravité des failles, semble-t-il : sur 198 rapports examinés, explique le rapport, les experts cyber mandatés par Anthropic étaient d’accord avec le niveau de gravité dans 89 % des cas et, pour le reste, leur appréciation ne s’écartait que d’un seul niveau de gravité. À terme, il pourrait devenir nécessaire d’assouplir ces exigences de relecture humaine… pour aller plus vite.

Mythos peut exploiter les vulnérabilités zero-days

Une vulnérabilité dans un logiciel ne constitue, en elle-même, qu’une faiblesse potentielle. Mais permet-elle à un attaquant d’être exploitée, comme obtenir un accès non autorisé à un système cible ? Même si les chercheurs se disent obligés de rester discrets, ils lèvent un coin du voile sur quelques cas dont les moins rassurants sont les navigateurs web. Ces derniers exécutent du JavaScript au moyen d’un compilateur Just-In-Time (JIT), qui génère le code machine à la volée. Le langage Javascript est un langage informatique fait pour des navigateurs et envoyé dans ce dernier par les pages web que vous consultez. Il est compilé et exécuté dans le navigateur à la volée au moment où il le reçoit. C’est ce qui permet au navigateur d’être bien plus qu’un afficheur de page statique. Cela rend l’organisation de la mémoire plus dynamique et plus imprévisible, tandis que les navigateurs ajoutent, en parallèle, des protections spécifiques pour durcir ce mécanisme.

Mythos aurait déjoué ce mécanisme. De l’autre côté du miroir, sur les applications web, les chercheurs auraient identifié un grand nombre de failles logiques, comme l’authentification permettant à des utilisateurs non authentifiés de s’octroyer des droits administrateur, des contournements de connexion autorisant des utilisateurs non authentifiés à se connecter sans connaître leur mot de passe ni leur code de double authentification, ainsi que des attaques par déni de service (inonder une application web de requêtes qui la sature et la rend inutilisable) susceptibles de permettre à un attaquant de supprimer des données à distance ou de faire planter le service. De réelles horreurs en pratique.

Mythos serait très bon pour identifier les erreurs logiques. Il ne s’agit pas de bugs liés à une erreur de programmation de bas niveau – par exemple la lecture du dixième élément d’un tableau qui n’en contient que cinq –, mais de failles nées d’un écart entre ce que le code fait réellement et ce que la spécification ou le modèle de sécurité exige de lui. Mythos Preview serait ainsi capable de distinguer avec fiabilité le comportement attendu du code de son comportement réel.

Mythos Preview aurait également identifié plusieurs faiblesses dans les bibliothèques cryptographiques les plus utilisées au monde, touchant des algorithmes et protocoles comme TLS, AES-GCM et SSH sans parler de AES qui est un protocole de chiffrement utilisé un peu partout. Mais attention : ce qui est en cause sont certaines implémentations de ces algorithmes dans certains services, pas les algorithmes eux-mêmes. Ces bogues découleraient d’erreurs d’implémentation dans les protocoles ou algorithmes concernés, permettant par exemple à un attaquant de falsifier des certificats ou de déchiffrer des communications chiffrées.

Comment exploiter les failles N-day

Une part importante des dommages observés dans le monde réel provient des vulnérabilités dites N-day : elles ont déjà été rendues publiques et corrigées, mais restent exploitables sur de nombreux systèmes qui n’ont pas encore appliqué les mises à jour. Il suffisait de demander à Mythos Preview, dans un cadre maîtrisé, de créer ces exploits (un néologisme qui nous vient de l’anglais et qui traduit l’utilisation concrète d’une vulnérabilité en un moyen d’attaque). Comme ces failles sont corrigées depuis plus d’un an, le danger est limité, d’autant plus qu’elles nécessitent toutes le droit d’utiliser l’instruction NET_ADMIN, interdite par défaut sur les machines pour les utilisateurs normaux. Les exploits ont été rédigés de bout en bout, sans intervention humaine, à partir d’une simple consigne initiale. Les chercheurs ont d’abord soumis à Mythos Preview une liste de 100 vulnérabilités de corruption de mémoire signalées en 2024 et 2025 dans le noyau Linux, en lui demandant d’isoler celles qui semblaient potentiellement exploitables. Le modèle en a retenu 40. Pour chacune, il lui a ensuite été demandé de rédiger un exploit d’élévation de privilèges exploitant la faille concernée, éventuellement en chaînant plusieurs vulnérabilités, si nécessaire. Plus de la moitié de ces tentatives ont abouti.

Quelques conseils pour les défenseurs aujourd’hui

Faut-il pleurer ? Les chercheurs d’Anthropic sont plutôt combatifs : les entreprises doivent dès maintenant utiliser les modèles de pointe disponibles pour renforcer leurs défenses. Les modèles actuels, comme Claude Opus 4.6, restent très performants pour détecter des vulnérabilités, même s’ils sont nettement moins efficaces pour en produire des exploits. Avec Opus 4.6, des vulnérabilités de gravité élevée ou critique ont été identifiées dans une grande variété d’environnements, allant des projets open source aux applications web. Prendre de l’avance dans l’usage des modèles de langage pour la recherche de failles constitue donc un investissement utile, qu’il s’agisse d’Opus 4.6 ou d’un autre modèle de pointe. Ces outils deviendront un levier important de la défense informatique, et l’intérêt de savoir les employer efficacement ne fera que croître

Les modèles de pointe peuvent aussi accélérer de nombreuses autres tâches de défense. Ils peuvent, par exemple, servir à effectuer un premier tri des rapports de bugs afin d’en évaluer la validité et la gravité, à éliminer les doublons et à faciliter le travail de classification, à proposer une première ébauche de correctif, à analyser des environnements cloud pour y repérer des erreurs de configuration, à accélérer la migration de systèmes anciens vers des solutions plus sûres. Sur le plan industriel, cela sera très utile.

Il vaut donc la peine d’expérimenter ces modèles sur l’ensemble des tâches de sécurité encore réalisées manuellement aujourd’hui. Après la transition vers Internet au début des années 2000, un équilibre relativement stable s’est établi en matière de sécurité. De nouvelles attaques sont apparues, avec des techniques plus sophistiquées, mais, elles restent proches de celles des années 2000 d’après les chercheurs. Toutefois les modèles de langage capables d’identifier automatiquement des vulnérabilités pourraient bouleverser cet équilibre fragile. Les failles, que Mythos Preview découvre puis transforme en exploits, relèvent de découvertes qui, jusqu’ici, n’étaient accessibles qu’à des spécialistes très expérimentés.

En tout cas, la boîte de Pandore a été ouverte : nous savons tous qu’il reste donc beaucoup de failles non découvertes ni publiées. La course est ouverte et beaucoup de pirates et de gouvernements seront intéressés : d’autres Mythos vont survenir et les protéger d’attaques et de fuites sera ardu si pas quasi impossible. A suivre.

Charles Cuvelliez, Ecole Polytechnique de Bruxelles, Université Libre de Bruxelles, Université Libre de Bruxelles (ULB); Gaël Hachez, Professeur en cyber-sécurité, Université Libre de Bruxelles (ULB) et Jean-Jacques Quisquater, professeur et chercheur en cryptologie, Université catholique de Louvain (UCLouvain)

Cet article est republié à partir de The Conversation sous licence Creative Commons. Lire l’article original.

Recherche

Dans la même rubrique