newsence
來源篩選

@howie_serious: 这张图片值得阅读 5678 遍,读完就理解如何在日常任务中选择三家顶级模型了。🤣 图片配合我的 llm 模型选择规则总结(下方quote 帖)服用,一步选中最适合特定任务的特定模型,帮你减少大量的...

Twitter

这张图片值得阅读 5678 遍,读完就理解如何在日常任务中选择三家顶级模型了。🤣 图片配合我的 llm 模型选择规则总结(下方quote 帖)服用,一步选中最适合特定任务的特定模型,帮你减少大量的时间浪费! --- anthropic 官网更新了图表,标记了sota,更清晰: - 底部 4 行benchmark,包括 MMMLU、GPQA,对应传统的文科和理科能力,都是gemini 3 pro 和 gpt 5.2 占据了 sota。 - 其他的 benchmark 都是 agentic 能力相关,全被 claude 占领了🤣

newsence

Loading

Fetching article data