Manus 初体验

如果你有过用 agentic AI(cursor etc..)的经验,你就会知道这种体验非常难以描述,因为这不是人类惯常的感受。一个 AI 助手在某些方面如此强大又在某些方面如此弱智,很难找到合理的比喻来形容和它的合作。

和 cursor 合作(我前两天看到有人说2025年 cursor 已经是是程序员的第一工具了)尤其如此。它当然极大提高了生产力,提高的效率倍数再怎么形容也不过份(事实上习惯了之后我已经忘了古代——也就是去年——程序曾经是怎么写的,感觉像是茹毛饮血)。但那个体验非常一言难尽,因为它虽然高效但永远在犯错,很多错误还非常隐蔽。如果一定要比喻,你可以想象你找了一个实习生,工作效率是正常人类的一万倍,但粗心、编程习惯糟糕、写了测试代码之后不清理、对错误不敏感、并且一种错误即使指出了过一会儿还是照犯不误。一方面你觉得这个实习生给你省了很多时间,一方面它又添了很多麻烦,以至于你觉得每时每刻都在和它斗智斗勇。我用 cursor 一天能完成的工作量大概是以前的一个月,但我一天下来通常头痛欲裂,关上电脑眼睛都是花的。

然后上帝(不是)给我们送来了 manus。

用 manus 的体验和 cursor 相比明显有个代差。Cursor 需要你全程微操,它只负责干具体的事,但把事情归拢起来成为一个成品是你的任务。Manus 把这一步也包揽了下来。你告诉它你最终的目标,然后它就开始干活了,最终给你的就是你要的那个东西。——至少形式上是。

这个形式上的「是」确实会给每个第一次实验的人极大的心理震撼。前几天很多没有亲自上手的人说关于 manus 的一切报道都是自媒体炒作。并不是。如果他们的算力跟上邀请码发得更多,热搜上出现狂潮是一定的。

问题隐藏在细节里。它背后的 AI 模型还是那些——现在用的应该是 Claude Sonnet,国内据说要换成阿里千问——所以它只是显得更有主观能动性,具体的活儿质量并不比 cursor 更好或更差(因为底层的大脑就那样)。但它又不像 cursor 一样容许你在每一步介入,于是如果它暗戳戳写了个 bug,它不知道你也不知道。我们人类是怎么避免这种 bug 的?一靠反复自我审查,二靠海量单元测试和端到端测试,三靠同行代码审查。AI 这些都没有。于是那个成品质量就很难深究,有点像学生作业,而且是包装得非常好的学生作业,让你第一眼很想打 A,然后越看越皱眉最后给个 D+ 的那种。

这些问题能不能改进呢?肯定可以,以目前 agentic AI 的发展速度,没准几个月后就是另一番光景。但立足此刻就事论事,只能说它很好玩,还没到让它真的帮你干活挣钱的时候。

但是话说回来体验是真的好啊……我前几天和 cursor 一起写的一个程序,写了两天才大概能用。把同样的需求发给 manus,去洗个澡的功夫人家已经写完了。有一说一,那一刻是有一丝想要跪拜的。