感觉 openai 的原生 gpt-4 变笨了,不清楚别人的大模型有没有进步,而且各个公司都在发布自己的新的大模型,自己一个个试用肯定没时间
所以有没有什么网站/自媒体/机构,定期测试大模型性能并且比较的?
1
ripperts 2023-11-06 09:35:07 +08:00 1
https://opencompass.org.cn/leaderboard-llm
评分这玩意看看热闹就好 |