









就在今天凌晨,距离Claude Opus 4.7发布仅41天后,好意思国AI企业Anthropic又发布了最新大模子Claude Opus 4.8。
根据官方给出的性能表图1,Opus 4.8主要聚焦智能体(Agent)材干、复杂编程、长任务推理与学问责任可靠性四大中枢所在,在要道基准测试中断层跳跃竞品。
浮浅来说即是写代码、用末端、操作电脑、处分学问类责任。
中枢材干即是任务落地,代理扩充。
不错说本年各大厂商皆把要点放到了Agent上,运行比拼谁在废除名务,调用器具,处分问题,近似复杂任务等场景下的材干更庞杂。
概述来看,诚然有一些特定任务比如末端代码不如GPT-5.5,人妖一线专区 av高清一刀但概述实力全皆是当下最强的通用大模子之一。
然而我要说然而了。
Claude Opus 4.8才刚发没多久,有网友就发现我方在使用其API的时代,问他是谁,效力Opus 4.8俄顷说我方是Qwen,俄顷说我方是DeepSeek。图2图3图4图5图6图7
大家就运行怀疑Anthropic是不是蒸馏了DeepSeek和Qwen。
天然客不雅来说这些凭据并不成完全实锤蒸馏,毕竟还很是据浑浊的可能性在。
原来若是是Gemini能够GPT,蒸了也就算了,毕竟目下的大模子即是蒸来蒸去。
但这事儿放在Anthropic上就有点酷好了。
因为就在本年2月份的时代,Anthropic照旧发布过一则名为《检测和督察蒸馏抨击》的讲演,主要即是控诉作念DeepSeek、MoonShot(月之暗面)和MiniMax三家对Claude进行大范围的“蒸馏抨击”。图8
回旋镖旋到我方身上才知谈痛。
至于有网友问,为啥不蒸馏豆包……
可能是蒸包吃了流涎水吧。

