2026 对于 AI 的一些认知转变

2026年4月1日8 分钟阅读AIClaude CodeCursorChatGPT

AI似乎和之前的几轮泡沫不太一样，它真的在改变我们的生活方式

从“神话”到“人工智障”

2024 年，ChatGPT 把 AI 推到了所有人面前。那段时间，整个行业、媒体、甚至身边不太懂技术的朋友，都对 AI 抱着一种近乎“神话”的想象——仿佛一个无所不知的智能体已经降临。

但当我真正坐下来,把它当成日常工具使用之后,幻觉很快就破了。它确实能回答一些看起来很专业的问题,可一旦碰到常识、碰到需要因果推理的场景,就开始一本正经地胡说八道。我印象很深的一个例子“蓝牙耳机坏了,去医院应该挂牙科还是耳鼻喉科”,大多数模型会煞有介事地分析半天耳鼻喉的结构,然后给你一个看似合理实则荒谬的回答。它没意识到这是个语义陷阱——坏的是耳机,不是耳朵。

这种“看上去很聪明,实际上很蠢”的反差,后来我把它戏称为人工智障时刻。

当我去翻 Transformer 和 GPT 的实现原理,这种感受就更清晰了。所谓的“智能”,本质上是在一个巨大的概率空间里做下一个 token 的预测。它不“理解”问题,它只是根据你给的上下文,匹配训练数据里最可能接续的内容。流畅是真的流畅,可一旦问题落在它训练分布的边缘,或者需要真正的逻辑链条,它就会用流畅的语言把错误答案包装得很漂亮。

那个时候我的判断很简单“智能”还很远。

2025 年 AI 与“大跃进”

进入 2025 年,公司上下掀起了一轮 AI 热。所有产品,不管底层逻辑适不适合,都要“接入 AI”“加上 AI 能力”“做出 AI 卖点”。立项 PPT 里不写 AI 几乎没法过会,周报里不提 AI 像是没干活。

那段时间我有一种非常强烈的“大跃进”感。

人人都吵着要做 AI、用 AI,但真正落地的产出寥寥无几。大部分团队都在做一件事、用 SQL、用普通后端就能解决的功能,硬塞进一个 LLM 的调用,然后宣称“我们做了 AI 化改造”。Demo 演示得很热闹,上线之后用户体感几乎为零,甚至更差——因为它变慢了、变贵了、还偶尔胡说八道。

2025 年下半年,浪潮又上一个台阶,关键词从“AI”变成了“Agent”。人人都在做 Agent,人人都在画“多智能体协作”的架构图。但我真的分辨不出来,这些 Agent 到底解决了什么原来解决不了的问题,还是只是把原来的一次调用拆成了五次调用,然后给中间几步起了拟人化的名字。

热闹归热闹,我心里一直有一个问题没被回答:AI 到底什么时候才会真正改变我做事的方式?

转折点“回答”到“执行”

我很早就和团队说过一个判断进化的下一轮,绝对不会停留在“回答你什么”或者“帮你查什么信息”。真正的拐点,是你告诉它你的需求,它直接替你把事做了。

这才是 AI 应该做的事情。

第一个让我感觉摸到了这条路的产品,应该是 Cursor。它第一次把“程序员脑子里的想法”和“实际生成的代码”用一种很顺滑的方式连接起来。但坦白讲,我用了一段时间 Cursor 之后印象并不好——它给我的感觉是总在瞎写。

对于一个空项目,它会写出一坨又臭又长的代码,结构混乱,过度设计,典型的“AI 味”。
对于已有项目,它经常改一处崩三处,而且改完就“忘”,下一轮对话又把上一轮的约定丢了。

直到 Claude Code 出现,这件事才被重新定义。

Claude Code loop 真正跑通的样子

Claude Code 在产品形态上做了一个看起来很反直觉的选择:不做 IDE 插件,直接做命令行工具。

但正是这个选择,让它在工程上彻底碾压了同期的同类产品。原因我后来想明白了,大概有两层:

第一层是模型本身的代差。 这两年 Claude 系列的代码能力进步非常凶猛,从 reasoning、长上下文、到工具调用的稳定性,基本是行业第一梯队。

第二层,也是我觉得更关键的一层,是它的 Agent loop 设计。 Claude Code 从终端入手,用一个不断循环的 read–plan–act–observe 流程,把整个代码库的状态、命令的执行结果、文件的读写,全部塞回上下文里,让模型在一个持续的反馈回路里工作。它不是“一次问答”,而是一个真正能自主推进任务的循环。

效果上的差别非常明显。Cursor 给我的感觉是一个“很热心但记性差的实习生”,而 Claude Code 更像一个能自己跑流程、自己验收的工程师。它会:

先读一遍项目,搞清楚已有结构
提出一个修改计划,等你确认
写代码的同时写测试
跑测试、看输出、修 bug、再跑
最后告诉你做了什么、改了哪些文件

尤其当它叠加了现在比较流行的 Skills 机制(比如 Superpowers 这类),整件事情变得更有意思了。模型不再是一上来就闷头写,而是先和你对话、澄清需求、列出方案,先想再干。我们人类多年总结出来的方法论——TDD、BDD、code review、增量重构——现在它能按这个节奏自己走一遍,人类只需要在关键节点点头或者打回。

这是我第一次觉得,AI 真的开始改变我做事的方式,而不只是当个高级一点的搜索引擎。

我对 AI 认知的彻底改观

这一年下来,我对 AI 的认知有了非常大的改观。

我现在的判断是:Skills 和 MCP 这类机制,本质上都只是当前阶段的 workaround。 它们之所以存在,是因为模型当前的能力还不足以从零开始处理所有任务,需要人类把领域知识、工具链、规范用一种结构化的方式喂给它。但这只是过渡。

随着模型能力继续上升,我相信未来的 AI 会自己创造工具、自己组合工具、自己定义流程。你给它一个目标,它能动用全部可调用的资源去达成——就像《疑犯追踪》(POI) 里的 Machine,它能在你开口的瞬间,把世界上最相关的资料、最专业的方法、最优的执行路径全部调起来,然后开始干活。根本不需要你写一份 SKILL.md 去教它“遇到这种情况你应该……”。

顺着这条线看下去,很多今天我们习以为常的软件,其实正在快速失去存在的意义:

去水印工具?现在让豆包或者 Claude 处理一张图,几秒钟搞定,效果还更好。
计算器、单位换算、汇率工具?直接拍照发给 AI,它读题、解题、解释步骤,一气呵成。
翻译软件?AI 翻得比绝大多数翻译 App 都自然,而且能跨任意语种,还能保留语气。
各种“小工具类 SaaS”?它们的核心价值——把一个流程封装成按钮——在 AI 面前几乎瞬间蒸发。

软件行业不会消失,但**“工具型软件”这一整个层级,可能会被 AI 自然吸收掉**。未来活下来的,要么是离硬件和现实世界很近的(基础设施、操作系统、机器人),要么是离人和组织很近的(协作、信任、决策)。中间那一大片“把功能做成 App”的层,会被快速压扁。

但我担心的事?

写到这里,我必须把另一面也说出来。

如果我们继续沿着“凡事问 AI、凡事让 AI 干”的路走下去,我隐约有一种不安:我们自己,会不会走上一条退化的路?

人类的认知能力,本质上是用进废退的。我们之所以能思考,是因为我们曾经被迫思考——不会算的题要自己列式子,记不住的电话号码要自己背,迷路的时候要自己看地图、问路、判断方向。每一次“被迫动脑”,都是在给大脑铺神经回路。

而现在,这些“被迫”正在一项一项被消灭:

不用记路了,有导航。
不用算了,有 AI。
不用查资料了,问一句就行。
甚至不用写作和思考了,提示词一发,文字成段地出来。

短期看,这是效率的胜利。长期看,我担心的是我们正在外包掉自己作为人最核心的那部分能力——独立判断、批判性思考、构建观点的能力。当一个人不再需要自己组织语言、不再需要自己权衡得失、不再需要自己面对一个空白的页面发愁,他渐渐就会失去“产生原创想法”这件事的肌肉。

更让我警惕的是,这种退化是悄无声息的。你不会某一天突然发现自己变笨了,你只会发现,你的第一反应都是“问一下 AI”。而当 AI 给出一个答案,你也越来越懒得去质疑它、验证它、推翻它。

到那个时候,真正的问题就不是“AI 有多强”,而是——

当我们离开了 AI,我们还剩下什么?

这是我现在最常想的一个问题。我没有答案,但我知道,保留一部分“自己动脑”的习惯,可能会是未来十年最重要的个人修炼之一。AI 越强,这件事越重要。