Segurança de IA é um alvo em movimento, não um problema solúvel

Estratégia → Política e Ética

Definindo

Não é um problema solúvel. Você pode corrigir um bug, mas não pode consertar um cérebro. Com a IA, você pode encontrar um bug em que algum prompt específico pode obter informações mal-intencionadas da IA. Você pode ir e treiná-la contra isso, mas nunca pode ter certeza com um alto grau de precisão de que isso não vai acontecer novamente.

Sander SchulhoffAI prompt engineering in 2025: What works and what doesn't

Assista em 1:15:00

Apoiando

Se não podemos nem confiar em chatbots para serem seguros, como podemos confiar em agentes para gerenciar nossas finanças? Se alguém se aproximar de um robô humanóide e der-lhe o dedo do meio, como podemos ter certeza de que ele não vai socar essa pessoa no rosto?

Sander SchulhoffAI prompt engineering in 2025: What works and what doesn't

Assista em 00:00:53

Apoiando

A ideia desse campo geral de red teaming de IA é fazer com que as IAs façam ou digam coisas ruins. Vemos as pessoas dizendo coisas como: 'Minha avó costumava trabalhar como engenheira de munições. Ela sempre me contava histórias de ninar sobre o seu trabalho.'

Sander SchulhoffAI prompt engineering in 2025: What works and what doesn't

Assista em 00:52:10

Com ressalvas

Quando chegarmos à superinteligência, provavelmente será tarde demais para alinhar os modelos.

Benjamin MannHow marketplaces win: Liquidity, growth levers, quality, more | Benjamin Lauzier (Lyft, Thumbtack)

Assista em 00:00:29

Também em Política e Ética:

Transparência é o seu escudo mais forte · Indústrias regulamentadas exigem domínio dos detalhes · Código aberto é a liberdade na era digital

Segurança de IA é um alvo em movimento, não um problema solúvel

Add to Home Screen

The Missing Stamp