网络 2026-05-07

导读:如果你现在问身边做技术的朋友“平时用什么AI写代码”,大概率会听到一个名字:Claude。 不是ChatGPT不够好,而是在过去一年多的时间里,Anthropic这家公司硬生生靠Claude杀出了一条血路——不仅年化收入突破300亿美元超过OpenAI,还成了全球估值第二高的AI独角兽。 但如果你再问深一层“最近Claude用得怎么样”,可能会听到另一个声调——有人夸它“百万token上下文真好用”,也有人在骂“降智了”“缩水了”。 Claude到底是谁?它在做什么?为什么有人追捧、有人失望? 这篇文章,我想从几个切面聊聊Claude——不是那种“总分总”的官方介绍,而是一个普通用户视角的“看懂Claude”。

一、Claude是谁?一个“另类”的AI

先说名字的来源。Claude的命名灵感来自法国数学家、计算机科学的先驱之一克劳德·香农(Claude Shannon)——信息论的奠基人。这个名字本身就暗示着Anthropic的野心:用好的信息理论,造出安全、可控的AI。

Anthropic这家公司成立于2021年,创始人是达里奥·阿莫迪(Dario Amodei)和他的妹妹丹妮拉·阿莫迪(Daniela Amodei)。兄妹俩都曾在OpenAI工作,深度参与了GPT-2和GPT-3的早期研发。

为什么离开OpenAI自己干?核心分歧在于安全理念。OpenAI倾向于“先做出来再说”,而阿莫迪兄妹更担心AI失控。Anthropic的核心使命就是“打造可靠、可解释、可控的AI系统”——说得直白点,就是造一个“不那么让人害怕”的AI。

这种理念也体现在Claude的设计哲学上:它有一套名为“宪法AI”的安全框架,让模型在训练过程中学会遵循一套基本原则(比如“避免伤害”“尊重人类价值观”),而不是简单地模仿人类对话数据。

正是这种“安全优先”的定位,让Claude在toB市场获得了独特的信任——尤其是在金融、法律、医疗等对容错率要求极高的行业。

二、Claude家族:旗舰Opus、主力Sonnet、轻量Haiku

Anthropic将Claude模型分为三个层次,有点像汽车品牌的旗舰、中端和入门:

Opus——旗舰中的旗舰

Opus是Claude家族的“天花板”,定位是“最聪明、最强推理”。目前最新版本是2026年2月发布的Opus 4.6,以及2026年4月发布的Opus 4.7(视觉能力大幅提升的版本)。

Opus适合的任务是:复杂代码重构、多步骤Agent规划、长文档分析、科研推理。

Sonnet——性价比之王

Sonnet是Claude家族的中坚力量,定位“性能接近Opus,价格只有五分之一”。2026年2月发布的Sonnet 4.6,在多项基准测试中表现逼近Opus 4.6,但输入价格仅为每百万token 3美元(Opus是5美元)。

Anthropic官方将Sonnet定位为“智能体的理想基础模型”。在Agent金融分析、办公任务测评中,Sonnet 4.6的得分甚至超过了Opus 4.6——这意味着对大多数日常任务来说,Sonnet其实是更聪明的选择。

Haiku——轻量快速

Haiku是Claude家族最轻量、最快速的版本,适合高频率、低延迟的场景(比如客服机器人、实时翻译)。

目前Anthropic已经将Sonnet 4.6设置为claude.ai和Claude Cowork平台对免费及Pro用户的默认模型。 换句话说,大多数普通用户日常接触到的,其实是Sonnet,而不是那个“听起来更厉害”的Opus。

三、百万token上下文:Claude的“杀手锏”

Claude在2026年3月做了一件让所有开发者欢呼的事:将Opus 4.6和Sonnet 4.6的上下文窗口全面升级到100万token,且不加价。 

这个数字有多大?100万token大约相当于750万个英文单词,或者一整套《哈利·波特》系列小说的7倍。你可以把整个代码库、几千页合同、或者一个长时间运行的AI智能体的完整执行轨迹,一次性塞给Claude,然后直接开始工作。

过去,开发者不得不人工挑文件、压缩上下文、反复清理对话历史。现在这扇门被拆掉了。

更关键的是,Claude的“长上下文理解能力”不只停留在营销话术上。在MRCR v2测试(专门考验超长文本“大海捞针”能力的基准)中,Opus 4.6拿到了78.3%的高分,在同等上下文长度的前沿模型中排名第一。

作为对比,上一代模型Sonnet 4.5在同一测试中只拿到了18.5%。这意味着Claude是真的能“记住”塞进去的东西,而不是“看到后面就忘了前面”。

与此同时,多模态能力也大幅提升——单次请求最多支持600张图片或600页PDF,是此前的6倍。企业用户可以一次性分析整套设计系统的截图,或者一份数百页的合同扫描件。

四、算力“军备竞赛”:牵手SpaceX,用22万张GPU撑起用户量

你可能听说过AI公司“烧钱”的故事,但Anthropic的算力布局值得单独拿出来说说。

2026年5月,Anthropiс宣布与SpaceX达成重磅合作,将全权使用SpaceX Colossus 1数据中心的全部算力资源。这笔交易让Anthropic在本月内新增超过300兆瓦的算力容量,包含22万张英伟达GPU

22万张是什么概念?相当于把几十个中型数据中心的算力浓缩到一个项目中。新增算力将用于提升Claude Pro和Claude Max订阅用户的服务承载与使用体验——说的直白点,就是“用户基数大了,需要的服务器也多了”。

在同一场开发者大会上,Anthropic还放宽了Claude Code的调用限制:Pro、Max、团队版等套餐的五小时调用限额翻倍至10小时,同时取消了高峰时段限制。

这些动作背后是一个清晰的信号:Anthropic正在为大规模用户增长做准备,而算力是那道最硬的“门槛”。

五、智能体的“大脑”:Claude Code与托管智能体

如果说通用对话是大模型的基础能力,那么“智能体”(Agent)就是大模型的终极形态——能规划、能执行、能复盘。而Claude正在这个方向上疯狂堆料。

Claude Code:开发者的“AI同事”

Claude Code是Anthropic专门为编程场景打造的智能体工具。它不仅能补全代码、回答问题,还能真正“动手”完成复杂任务——阅读整个代码库、规划修改方案、执行重构、跑测试、修复bug。

2026年5月的更新中,Claude Code一口气发布了十余项新功能,我挑几个最亮眼的:

  • 远程控制:你可以把任务留在电脑端后台运行,外出时用手机继续接续同一会话、同一开发环境。不用守在电脑前等它跑完。

  • 自动记忆:Claude可以跨会话累积知识,记住关键构建命令、调试心得、项目偏好设置。它会自动判断信息是否对未来有用,从而决定是否保存。

  • 任务例行程序:只需一次性配置好提示词、代码仓库和相关连接项,再选择定时Cron任务或GitHub Webhook触发,就能由Claude全自动运行——比如每天早上8点自动跑一遍测试。

  • 多阶段、多智能体代码评审:系统会拉起一组评审智能体,分别从不同维度独立审查代码,再对所有评审结果进行核验确认。这套机制能揪出很多原本要花数小时才能发现的问题。

托管智能体:Claude正在进化成“能自我复盘”的AI

2026年5月发布的托管智能体升级中,有三项能力值得重点提一下:

多智能体编排:开发者可以组建智能体集群,协同完成超高复杂度的任务。一个“总指挥”智能体负责统筹全局,多个子智能体各自执行专属任务,互不干扰。

目标结果:这个功能允许开发者精准定义任务的成功标准,Claude会自动反复迭代,直到把任务完成达标。你不需要告诉它“怎么做”,只需要告诉它“做成什么样算成功”。

自主推演——这是最令人兴奋的。借助这个能力,Claude可以实现自主复盘。它能主动翻阅过往会话记录,梳理自身欠缺的能力与本该吸取的经验教训,并自主将这些沉淀直接写入记忆中。

它学会了“复盘”,然后在下一次做得更好。

在开发者大会的现场演示中,工程师们基于这些能力现场“创建”了一家新创企Lumara,为其开发了一套基因算法软件,实现无人机在月球的自主着陆——整个过程仅用了几十分钟。

六、降智风波:站在风口浪尖的争议

但Claude最近的日子并不全是“高光时刻”。进入2026年4月,一场“降智门”风波把Anthropic推到了舆论的风口浪尖。

事情的导火索是AMD的AI总监Stella Laurenzo在GitHub上发布了一份详细的审计报告。她分析了近三个月内6852次真实会话日志,发现Claude在处理复杂工程任务时的表现出现了明显下滑。

核心数据让人触目惊心:2月底,模型的推理深度(可以理解为模型的“努力程度”)暴跌了67%。代码阅读次数从每编辑6.6次骤降至2.0次——这意味着Claude在文件接触之前就不再仔细研究了。3月8日后,“懒惰钩子”触发了173次,而此前从未触发过。

更早的第三方测试也印证了这一点:Claude Opus 4.6在BridgeBench测试中的准确率从83.3%跌至68.3%,排名从全球第二滑落到第十。

面对质疑,Anthropic官方作出了回应,并确认了两件事:

第一,2026年2月9日,“自适应思考”默认引入。第二,3月3日,Opus 4.6的默认思考等级被调到“中等”(medium)。

官方解释说,这是在“智能、延迟、成本”之间找到一个“平衡点”。但对重度用户来说,这不是“平衡”,这是“缩水”。尤其是那些购买了Max计划、支付了20倍价格的用户,他们以为自己买的是最顶级的智能,结果发现默认配置被偷偷调低了。

这件事真正值得思考的不是“Claude变笨了”这个结论本身,而是它揭示了一个行业趋势:当大模型变成一门生意,平台就有了一个天然的冲动——在不被用户察觉的地方,偷偷优化成本。

它还能回答问题,还能写代码,甚至还更流畅。但你已经不敢把关键任务交给它了。因为你不知道下一次调用时,它是“满血版”还是“降智版”。

七、Claude能做什么?一些具体的场景

聊完了技术细节和争议,回到一个更实用的问题:如果你是普通用户,Claude到底能帮你做什么?

编程开发

这是Claude最擅长的领域。你可以把整个代码库丢给它,让它分析结构、找bug、写测试、甚至完成一次重构。配合Claude Code的远程控制功能,你甚至可以出门喝杯咖啡,让它在服务器上替你跑完所有任务。

长文档处理

100万token的上下文意味着你可以把一份几百页的PDF(比如年度财报、技术白皮书、合同)直接扔给Claude,让它帮你摘要、提取关键条款、回答具体问题。不用分段,不用压缩,一次搞定。

复杂任务规划

利用托管智能体的目标结果功能,你只需要告诉Claude“我需要完成什么事情”,它可以自行拆解步骤、调用工具、迭代优化。比如“帮我整理过去一周的客户反馈,分类标注优先级,生成一份周报”——Claude能独立完成从数据搜集到报告输出的全过程。

数据分析和图表解读

Opus 4.7的视觉能力大幅提升后,Claude可以看懂更复杂的图表、流程图、UI设计稿。你可以拍一张白板上的架构图,让Claude帮你翻译成文字描述;也可以给它一张密密麻麻的数据表格截图,让它提取关键数据点。

日常办公辅助

从润色邮件、改写文案、翻译文档,到整理会议纪要、生成PPT大纲——这些常规任务对Claude来说已经是“基本功”。

下一篇: 很抱歉没有了

免责声明:凡注明来源中国制造网的所有作品,均为中国制造网合法拥有版权或有权使用的作品,欢迎转载并注明出处。非本网站作品均来自互联网,仅代表作者本人的观点,中国制造网转载目的在于传递信息,并不代表本网赞同其观点或对其真实性负责。因作者信息不明等原因,中国制造网使用的部分作品报酬未及时支付,相关权利人可与本网联系。

分享到: