每天都看模型评分,但你真的了解吗?OpenAI研究员最新博客,一文读懂LLM评估 新智元报道【新智元导读】在LLM能力突飞猛进的当下,所有研究者似乎都在关注数据、算力、算法等模型开发的各个方面,但OpenAI研究员JasonWei最近发布的一篇博客文章提醒我们... 研究员llm正确性模型评分openaideepmind 科技2024-05-30 14:00