如果模型的准确率为60%,您构建的产品会与模型准确率为95%或99.5%时大不相同。
Kevin WeilOpenAI's CPO on how AI changes must-have skills, moats, coding, startup playbooks, more
执行 → 技术权衡
如果模型的准确率为60%,您构建的产品会与模型准确率为95%或99.5%时大不相同。
如果您只有一个播放按钮,那么您的机器学习质量需要达到100%的精度,这是不可能的。因此,如果您有1/5的命中率,那么您需要在屏幕上至少显示5件事情,这样至少会有1/5的内容是相关的。
您要求这个判断者只做一件事,评估一种故障模式,所以问题的范围非常小,LLM判断器的输出就是通过或失败。这是一个非常非常严格限定的任务,LLM判断器能够非常可靠地完成。