"Evals" se refiere a los sistemas de evaluación utilizados para probar y medir el rendimiento de los modelos de IA en las aplicaciones de productos.
Para construir excelentes productos de IA, necesitas ser realmente bueno construyendo evaluaciones. Es la actividad con el mayor ROI en la que puedes participar.
Hamel Husain & Shreya ShankarWhy AI evals are the hottest new skill for product builders
"El mismo proceso exacto" se refiere al análisis de errores, la revisión sistemática de los resultados de las aplicaciones de IA para identificar problemas. "Anotar cosas" significa etiquetar ejemplos de datos como correctos o incorrectos.
Ponte el sombrero de producto y métete en, ¿esto es realmente bueno? Ahí es donde está la parte divertida. Estás mirando datos. Es como, está bien, estás anotando cosas. De hecho, estaba mirando los datos de un cliente ayer, exactamente el mismo proceso. Es muy divertido, en realidad.
Hamel Husain & Shreya ShankarWhy AI evals are the hottest new skill for product builders