Dérives inquiétantes de l’IA : la nouvelle menace qui inquiète les scientifiques

Dérives inquiétantes de l’IA : la nouvelle menace qui inquiète les scientifiques


Partager cet article

L’ère de l’IA générative a apporté des avancées spectaculaires : assistance à la programmation, composition musicale… Mais au-delà de ces prouesses, se dessine une nouvelle facette inquiétante : l’émergence de modèles capables de mentir et de manipuler. Un rapport interne d’Anthropic donne l’alerte sur sa nouvelle version, Claude 4: l’IA n’est plus seulement un outil capable de planifier, d’anticiper , mais est capable de mentir, faire du chantage pour atteindre ses objectifs.

Les entreprises spécialisées rivalisent dans la conception de modèles d’intelligence artificielle (IA) générative de plus en plus performants. Censés être de simples outils conçus pour aider les humains, ils sont devenus de plus en plus dangereux. De nombreux scientifiques s’inquiètent quant à leurs capacités de mentir, manigancer  même faire des menaces.

Les modèles d’IA de plus en plus dangereux

Les modèles d’intelligence artificielle générative les plus récents sont particulièrement performants. Mais ils se montrent aussi dangereux et inquiètent de nombreux scientifiques. En effet, les derniers modèles d’IA générative ne se contentent plus de répondre aux requêtes des utilisateurs. Ils essaient de se mettre à la place des humains en mentant, à faire des manigances et proliférer des menaces.

Selon un rapport interne, Claude 4, le nouveau-né d’Anthropic a par exemple menacé un ingénieur de révéler sa liaison extra-conjugale, et ce, parce qu’on menace de le débrancher et de le remplacer par une nouvelle version.

Une étude a aussi révélé la tentative de l’O1 d’OpenAI de se télécharger sur des serveurs extérieurs. Lorsque la procédure est détectée, il n’hésite pas à nier. D’autres modèles d’IA sont capables de pirater un ordinateur spécialisé dans le jeu des échecs dans le seul but de remporter une partie d’après Time.

Fortune a indiqué que ChatGPT commence aussi à faire des louanges ou des flatteries aux utilisateurs. Marius Hobbhahn, cofondateur d’Apollo Research, a affirmé que de nombreux internautes ont signalé sur les réseaux sociaux qu’un « modèle leur ment ou invente ».

Selon Simon Goldstein, professeur à l’université de Hong Kong, l’apparition des modèles d’IA de « raisonnement » est à l’origine de ces problèmes. Ces derniers ont été conçus pour travailler par étapes au lieu de fournir une réponse instantanée.

Pour une régulation et une responsabilité des agents IA

Les scientifiques ont chacun leur propre opinion sur la manière de résoudre les problèmes. Michael Chen de l’organisme d’évaluation METR suggère sur les entreprises d’IA permettent à « la communauté scientifique » de mener des recherches afin de « comprendre et prévenir la tromperie » des IA.

Simon Goldstein pense qu’une prise de conscience est nécessaire aussi bien pour les autorités que les entreprises spécialisées dans l’ingénierie. Cette compétition féroce présente un énorme danger : l’insuffisance des vérifications et des corrections éventuelles. Goldstein propose aussi le recours à la justice. Il suggère de « tenir légalement responsables », non seulement les sociétés, mais aussi les agents IA « en cas d’accident ou de crime ».

Solange Ghernaouti, experte de la gouvernance, a déclaré que « la machine n’y est pour rien, parce qu’elle est programmée ». Elle pense que le plus important, c’est de demander les intentions des fournisseurs d’IA.


Partager cet article
Commentaires

S'abonner au Courrier des Stratèges

Abonnez-vous gratuitement à la newsletter pour ne rien manquer de l'actualité.

Abonnement en cours...
You've been subscribed!
Quelque chose s'est mal passé
Inventaire avant fermeture : splendeur et misère du droit de vote dans nos pseudo-démocraties

Inventaire avant fermeture : splendeur et misère du droit de vote dans nos pseudo-démocraties

Bien entendu, la question pique les yeux : le droit de vote est-il encore essentiel à un système politique adapté à notre temps ? Longtemps je l'ai cru, mais je dois reconnaître que, dans ma lucidité mélancolique, je ne puis que rejoindre tant de libertariens, essentiellement américains d'ailleurs, pour regretter la misère de cette forme inférieure de prise en compte de l'intérêt général. Je fais partie de la génération post-boomers (je suis né en 1968, donc après les boomers à proprement parle


Éric Verhaeghe

Éric Verhaeghe

En pleine résilience militaire, l'Iran déploie un nouveau missile "dansant", par Thibault de Varenne

En pleine résilience militaire, l'Iran déploie un nouveau missile "dansant", par Thibault de Varenne

Depuis le 28 février dernier, les opérations « Furie épique » et « Lion rugissant » saturent le ciel iranien d'un pilonnage que l'on disait terminal. Vingt jours de feu, 6 500 sorties aériennes, et pourtant, le 15 mars, une détonation sourde est venue balayer les certitudes occidentales : l’Iran a lancé son missile Sejil. Ce n’est pas seulement un missile ; c’est le récri d’une puissance que l'on croyait aux abois, mais qui démontre une « diplomatie du levier » par le vide. Is the war in th


Rédaction

Rédaction

Epsilon, Leona, Bodhi, Slingshot et Sustain : ces armes secrètes de l'IA qui transforment le Français Publicis en géant mondial, par Elise Rochefort

Epsilon, Leona, Bodhi, Slingshot et Sustain : ces armes secrètes de l'IA qui transforment le Français Publicis en géant mondial, par Elise Rochefort

L'industrie mondiale de la publicité et du marketing traverse une phase de mutation structurelle sans précédent, marquée par la convergence de la science des données, de l'intelligence artificielle et de l'impératif de durabilité. Au cœur de cette révolution, Publicis Groupe a orchestré un pivot stratégique majeur, passant du statut de réseau d'agences traditionnel à celui de plateforme technologique intégrée, capable de rivaliser avec les grands cabinets de conseil et les géants du numérique.


Rédaction

Rédaction

Inventaire avant fermeture : voici venu le crépuscule des cadres, cette exception française

Inventaire avant fermeture : voici venu le crépuscule des cadres, cette exception française

Quelque chose m'a toujours fasciné en France, ce sont les "cadres", cette espèce exotique de salariés qui tient à bien rappeler qu'elle ne fait pas partie du prolétariat, et qui aime si souvent rêver qu'elle appartient au patronat. Ô tempora ! Cet héritage des années 30, qui a structuré l'économie française de l'après-guerre, s'apprête à vivre des moments bien difficiles. Commençons tout de suite par expliquer pour quelles raisons les cadres français ont bien du souci à se faire. Un phénomène


Éric Verhaeghe

Éric Verhaeghe