🔬 Anthropic Claude Opus 4.7发布:基准测试超越GPT-5.4和Gemini 3.1 Pro 🔥爆
4月17日,AI公司Anthropic正式发布旗舰模型Claude Opus 4.7,该版本在多项核心基准测试中超越OpenAI GPT-5.4和谷歌Gemini 3.1 Pro,自动化执行能力大幅提升,或将对多个领域的基础工作岗位产生替代效应。基准测试数据显示,Opus 4.7在SWE-bench Pro编程测试中得分达64.3%,较前代提升近11个百分点,领先GPT-5.4的57.8%。与此同时,Anthropic还披露了其训练数据包含由其他模型生成的合成数据,承认采用了"蒸馏"技术——与其此前指控中国AI企业的立场形成鲜明对比,被指"双标"。
* 📎 来源:金融界 - Anthropic发布Claude