Lenny Distilled

La conception de produits doit correspondre à la précision de votre modèle

Exécution → Compromis techniques

Définissant
Il y a quelque chose de fondamentalement intéressant ici qui rend la vie amusante. Si le modèle a raison 60% du temps, vous construisez un produit très différent que si le modèle a raison 95% du temps ou 99,5% du temps.
Kevin WeilOpenAI's CPO on how AI changes must-have skills, moats, coding, startup playbooks, more
Définissant
La qualité de votre apprentissage automatique, si vous allez avoir un seul bouton de lecture, doit être littéralement de 100% ou zéro erreur de prédiction, et ce n'est jamais le cas. Donc disons que vous avez un coup sur cinq, quatre sur cinq sont faits, alors vous avez besoin d'une interface utilisateur qui montre probablement au moins cinq choses en même temps à l'écran. Donc vous avez un sur cinq de quelque chose de pertinent à l'écran.
Gustav SöderströmThe science of product, big bets, and how AI is impacting the future of music
En faveur
Vous demandez au juge de faire une seule chose, d'évaluer un seul mode d'échec, donc la portée du problème est très limitée et la sortie de ce juge LLM est réussite ou échec. C'est donc une chose très étroitement délimitée que les juges LLM sont très capables de faire de manière très fiable.
Hamel Husain & Shreya ShankarWhy AI evals are the hottest new skill for product builders

The Missing Stamp

Every episode of Lenny's Podcast, distilled into the insights that matter and the quotes that make them stick.

LENNY WAS HERE__STAMP_DATE__

Lenny, if you're reading this, the stamp's ready when you are. 🧡🔥