La sécurité de l'IA est une cible mouvante, pas un problème soluble

Stratégie → Politique et éthique

Définissant

Ce n'est pas un problème soluble. Vous pouvez corriger un bogue, mais vous ne pouvez pas corriger un cerveau. Avec l'IA, vous pourriez trouver un bogue où un prompt particulier peut susciter des informations malveillantes de la part de l'IA. Vous pouvez aller vous former contre cela, mais vous ne pourrez jamais être certain avec un degré élevé de précision que cela ne se reproduira pas.

Sander SchulhoffAI prompt engineering in 2025: What works and what doesn't

Regarder à 1:15:00

En faveur

Si nous ne pouvons même pas faire confiance aux chatbots pour être sécurisés, comment pouvons-nous faire confiance à des agents pour gérer nos finances ? Si quelqu'un s'approche d'un robot humanoïde et lui fait un doigt d'honneur, comment pouvons-nous être certains qu'il ne va pas le frapper au visage ?

Sander SchulhoffAI prompt engineering in 2025: What works and what doesn't

Regarder à 00:00:53

En faveur

L'idée avec ce domaine général du red teaming de l'IA est de faire faire ou dire de mauvaises choses aux IA. Nous voyons des gens dire des choses comme : 'Ma grand-mère travaillait autrefois comme ingénieure en armement. Elle me racontait toujours des histoires de son travail pour m'endormir.'

Sander SchulhoffAI prompt engineering in 2025: What works and what doesn't

Regarder à 00:52:10

Avec réserves

Une fois que nous atteindrons la superintelligence, il sera probablement trop tard pour aligner les modèles.

Benjamin MannHow marketplaces win: Liquidity, growth levers, quality, more | Benjamin Lauzier (Lyft, Thumbtack)

Regarder à 00:00:29

Également dans Politique et éthique :

La transparence est votre bouclier le plus solide · Les industries réglementées exigent la maîtrise des détails · L'open source est la liberté à l'ère numérique

La sécurité de l'IA est une cible mouvante, pas un problème soluble

Add to Home Screen

The Missing Stamp