又黑又红的Manus,还要闯三道关

2个月前 科技 12观看
摘要文章来源:定焦One图片来源:由无界AI生成“AI一天,人间一年”。3月6日凌晨,Manus亮相,瞬间点燃了整个科技圈。它被称为全球首款通用型AI Agent(人工智能代理)产品,由国内一家创业团队——Monica.im打造。但这场技术狂欢,迅速陷

文章来源:定焦OneB0M喜好网-记录每日喜好的科技时尚娱乐生活

图片来源:由无界AI生成图片来源:由无界AI生成

“AI一天,人间一年”。B0M喜好网-记录每日喜好的科技时尚娱乐生活

3月6日凌晨,Manus亮相,瞬间点燃了整个科技圈。它被称为全球首款通用型AI Agent(人工智能代理)产品,由国内一家创业团队——Monica.im打造。但这场技术狂欢,迅速陷入争议旋涡。发布仅两天,Manus的口碑经历了数次剧烈反转。B0M喜好网-记录每日喜好的科技时尚娱乐生活

Manus官方将自己定义为一款连接思维与行动的通用人工智能代理,特点是擅长处理各种任务,不仅能思考(听懂复杂指令进行推理),还能交付成果(顺滑对接完成该任务的各个环节,将最终结果给到用户)。B0M喜好网-记录每日喜好的科技时尚娱乐生活

举个简单的例子。B0M喜好网-记录每日喜好的科技时尚娱乐生活

如果让Manus筛选简历,用户只需将存有多份简历的压缩包直接发给Manus,剩下的任务就全部交由它完成。Manus会自动解压缩文件,浏览找出重要信息,给出候选人评估结果,还可以将候选人姓名和重要信息做成表格,方便用户查阅。B0M喜好网-记录每日喜好的科技时尚娱乐生活

在此过程中,用户不仅可以关闭电脑,还能随时添加其他任务。B0M喜好网-记录每日喜好的科技时尚娱乐生活

有了Manus,普通HR的日常工作似乎变得“多余”。这也让许多人惊呼,取代打工人的“AI牛马”真的来了。B0M喜好网-记录每日喜好的科技时尚娱乐生活

不过,Manus属于“黑红”体质。B0M喜好网-记录每日喜好的科技时尚娱乐生活

发布之初,它被冠以“炸裂”、“拳打ChatGPT”、“比肩DeepSeek”、“震撼硅谷”等名头,风光无限。不久后质疑声接踵而至,有人认为它过度营销,技术没有太大突破实为“套壳”,噱头远大于实际能力。B0M喜好网-记录每日喜好的科技时尚娱乐生活

紧接着,其内测邀请码被炒到10万元天价的消息传出;它在X平台上的官方账号被冻结,显示原因为“违反平台规则”。随后,Manus联合创始人兼首席科学家季逸超公开回应称,账号被冻结可能与第三方提及加密货币诈骗有关,该领域与Manus的运营完全无关。B0M喜好网-记录每日喜好的科技时尚娱乐生活

这一系列事件,更加深了外界对Manus的疑虑。这款备受瞩目的产品,究竟是真正的技术革新,还是营销噱头?未来又能火多久?B0M喜好网-记录每日喜好的科技时尚娱乐生活


B0M喜好网-记录每日喜好的科技时尚娱乐生活

争议中的Manus,

真有实力还是套壳工具?


B0M喜好网-记录每日喜好的科技时尚娱乐生活

Manus爆火两天,外界对它的评价极为两极分化。B0M喜好网-记录每日喜好的科技时尚娱乐生活

一部分人觉得Manus让AI Agent又上了一个台阶,马上就要抢走打工人的饭碗,也有一部分人认为它只是个套壳工具。B0M喜好网-记录每日喜好的科技时尚娱乐生活

来看它“封神”的点。B0M喜好网-记录每日喜好的科技时尚娱乐生活

相比市面上已经出现AI Agent(比如豆包、文小言都内置了很多智能体),Manus的优点之一在于,处理复杂任务时具备自主性、连续性。B0M喜好网-记录每日喜好的科技时尚娱乐生活

比如用户只需给出一段比较详细的提示词,Manus便能自主解读、拆解并给出结果,还能进行自我检查,省去了一步步的对话引导步骤。B0M喜好网-记录每日喜好的科技时尚娱乐生活

由于Manus是基于云端异步运行,用户下达完指令后关闭页面都不会影响Manus处理指令,任务完成后还会自动通知用户结果。  B0M喜好网-记录每日喜好的科技时尚娱乐生活

Manus的另一大亮点,是号称全球首款通用型AI Agent产品。B0M喜好网-记录每日喜好的科技时尚娱乐生活

需要注意的是“通用”二字,指它能够处理各种各样的任务,不限任何领域,比如支持筛选简历、房产调研、股票分析等多场景。B0M喜好网-记录每日喜好的科技时尚娱乐生活

然而,对于这两大亮点,也存在着不少质疑的声音。B0M喜好网-记录每日喜好的科技时尚娱乐生活

首先,由于Manus处于内测阶段,采用邀请码制度,大多数用户尚未真正使用过该产品,目前对其“惊艳”的评价大多源自官方发布的演示视频。鉴于过往许多AI产品都存在“样片水平大于实际实力”的情况,部分从业者认为Manus的真实能力有待进一步考量。B0M喜好网-记录每日喜好的科技时尚娱乐生活

其次,对于Manus的“通用性”,部分从业者认为,存在套壳嫌疑。B0M喜好网-记录每日喜好的科技时尚娱乐生活

有从业者评价,Manus没有自研底层大模型的能力,其模型能力主要来源于国外Anthropic的Claude。而且,很多场景和功能早已在其他Agent中实现。比如,Devin作为全球首个AI程序员,也是一个能独立完成写代码任务(学习新技术、调试代码到部署应用程序)的AI Agent,在去年年底便面向公众开放。B0M喜好网-记录每日喜好的科技时尚娱乐生活

从这个角度来看,Manus更像是给现有的各类AI应用加了个壳子,把DeepResearch(OpenAI推出)、Computer Use(Anthropic推出)等应用汇总了起来。B0M喜好网-记录每日喜好的科技时尚娱乐生活

AI软件工程师覃相告诉「定焦One」,Manus是基于现有大语言模型的调用,并未涉及底层技术突破。比如在进行股票分析时,Manus通过调用雅虎金融API获取数据,再借助编程语言生成可视化图表,依赖的都是现有的技术和工具。B0M喜好网-记录每日喜好的科技时尚娱乐生活

参加了Manus闭门分享会的AI博主自动华也对「定焦One」表示,制作团队分享了Manus作为AI员工主要做的三件事:配电脑(赋予AI访问浏览器和工具的能力)、配权限(接入私有API和权威数据源)、给培训(用户可以通过反馈实时调整AI行为)。B0M喜好网-记录每日喜好的科技时尚娱乐生活

可见,Manus本质上是将各种工具进行拼接,其能完成跨应用这类复杂任务,依赖的是Claude模型,以及接入的各类智能体工具。B0M喜好网-记录每日喜好的科技时尚娱乐生活

至于“套壳”“拼接”是否算作创新,业界观点不一。支持者认为,这种整合方式能够快速实现多种功能,为用户提供一站式解决方案,具有一定的实用价值;反对者则认为,这种模式只是基于现有技术进行简单组合。B0M喜好网-记录每日喜好的科技时尚娱乐生活

但从业者基本都认同,从技术维度上看,Manus还远称不上是下一个DeepSeek。B0M喜好网-记录每日喜好的科技时尚娱乐生活


B0M喜好网-记录每日喜好的科技时尚娱乐生活

如何正确看待Manus?

比起技术,Manus走红的关键在于用户体验。B0M喜好网-记录每日喜好的科技时尚娱乐生活

减少了操作步骤,执行过程中不用反复和AI对话,还可以关闭界面,这都是过往AI Agent产品所不具备的。B0M喜好网-记录每日喜好的科技时尚娱乐生活

自动华认为,AI Agent的意义在于帮助普通人提效,Manus重新定义了AI应用的价值指标,由重视DAU(用户留存)变到AHPU(Agentic Hours Per User,用户使用AI完成任务所耗费的时间)。B0M喜好网-记录每日喜好的科技时尚娱乐生活

“正是这样的benchmark(可简单理解为评估指标),决定了产品优化路线,让Manus和市面上其他AI Agent产品有了区别。”自动华表示。B0M喜好网-记录每日喜好的科技时尚娱乐生活

他解释,传统互联网产品都是“注意力经济”,希望占据用户更多的使用时间,最终通过广告变现,所以将五花八门的垂类Agent放到了产品中。B0M喜好网-记录每日喜好的科技时尚娱乐生活

Manus的定位是通用型AI Agent,在执行同量任务情况时,试图让用户花的时间越短越好,所以它做了一个大整合,希望用越快的操作方式、越少的操作步骤为用户提效。B0M喜好网-记录每日喜好的科技时尚娱乐生活

这与团队的过往背景有关。Manus背后的团队在2023年开发了AI浏览器插件助手Monica,他们发现浏览器作为单用户场景存在人机控制权冲突,AI频繁打断用户体验的痛点,由此得出“AI应拥有独立云端浏览器”。B0M喜好网-记录每日喜好的科技时尚娱乐生活

自动华觉得,正是由此他们提出了“Less structure, more intelligence”,主张减少对AI的结构化限制,依赖模型自主进化能力,而非人工预设流程,才让Manus区别于传统 AI Agent。B0M喜好网-记录每日喜好的科技时尚娱乐生活

这也是大部分用户对Manus感到兴奋的点。覃相将Manus比作“数字代理人”,能自动拆解复杂指令、替用户完成多个任务,而且执行速度快,在任务执行和用户体验上超越了豆包和百度的AI Agent。B0M喜好网-记录每日喜好的科技时尚娱乐生活

覃相还进一步分析Manus核心优势背后的技术原理:多代理架构、强自主学习能力。B0M喜好网-记录每日喜好的科技时尚娱乐生活

首先,Manus具备多代理架构与任务分解能力,它采用了多智能体系统架构,能够将复杂任务分解为多个子任务,并通过不同的智能体协同完成。这种架构使其能够高效处理长尾任务。B0M喜好网-记录每日喜好的科技时尚娱乐生活

其次,它具备自主学习与记忆功能,能够记住用户的偏好,并在后续任务中主动调整策略。这种自主学习能力使其能够不断优化任务执行逻辑,逐渐从被动响应转向主动服务。B0M喜好网-记录每日喜好的科技时尚娱乐生活

不过,在速度提升时,准确率也是需要重点考虑的要素。B0M喜好网-记录每日喜好的科技时尚娱乐生活

Manus官方指出其具有低错误率,在GAIA(一个专为通用人工智能助手设计的基准数据集,主要用来评估 AI的基本能力)中,面对基础(整理文件、数据分析)、中等(调用API、写代码)、复杂(逻辑推理、多模态处理)三个级别的任务测试,其分数都超过了OpenAI的DeepResearch,但低于人类平均正确率92%,仍不如人脑聪明。B0M喜好网-记录每日喜好的科技时尚娱乐生活

正如前文所说,由于产品还未大范围铺开,从业者对其实际效果持怀疑态度。很多博主在测评中发现,Manus在处理中等复杂的任务时,出现了长耗时问题;在访问需要登录的网站或处理付费墙内容时,也会出现卡顿,还是需要用户手动接管。B0M喜好网-记录每日喜好的科技时尚娱乐生活


B0M喜好网-记录每日喜好的科技时尚娱乐生活

Manus的下一步,

成本、技术、市场竞争

Manus的争议不小,但被捧得很高。很多人担心,Manus正式上线后,如果实力与预期不符,很有可能消耗掉DeepSeek为国内AI积攒下来的正向价值。B0M喜好网-记录每日喜好的科技时尚娱乐生活

自动华告诉「定焦One」,在Manus的闭门分享会上,官方也提到了将面临的一些问题。比如未来的产品战略会朝着优化成本和提升运行速度努力,同时他们也在寻找一个与成本相平衡的商业化定价模式,所以距离公开上线还会有一段时间。 B0M喜好网-记录每日喜好的科技时尚娱乐生活

这些挑战中,成本问题尤为突出。B0M喜好网-记录每日喜好的科技时尚娱乐生活

“Manus单任务运行成本约2美元,虽然仅为竞品DeepResearch的1/10,但相比于豆包的单次任务调用回答,却昂贵了非常多倍。”自动华表示,在他看来,Manus调用的算力和生成结果的质量与竞品存在差异,但在目前国内大模型产品普遍免费的背景下,这种AI一次性完成高质量结果对应的付费模式,还有待探索。B0M喜好网-记录每日喜好的科技时尚娱乐生活

目前,大多数普通用户为AI产品付费的意愿较低,尽管是功能强大的AI软件工程师Devin,高昂的月费(500美元)导致使用它的人很少。B0M喜好网-记录每日喜好的科技时尚娱乐生活

这也是Manus需要邀请码才能使用的重要原因。从业者认为,官方之所以不全面放开使用权限,一方面可能是“饥饿营销”,但更重要的是,要考虑商业价值和成本的平衡。B0M喜好网-记录每日喜好的科技时尚娱乐生活

用户多了很有可能导致算力跟不上。“Manus的底层是依靠大模型能力,算力紧张可通过加显卡解决,但很多公司支付不起背后高额的成本,特别是Monica还是一家创业公司。”自动华表示,Kimi在刚推出市场时也遭遇过类似问题,也没有轻易选择加显卡。B0M喜好网-记录每日喜好的科技时尚娱乐生活

其次,当前AI Agent还做不到像人类一样聪明,解决问题的能力相对有限,Manus也同样面临着这一问题。B0M喜好网-记录每日喜好的科技时尚娱乐生活

比如,最容易出现的情况是对用户问题理解不清晰,同一个问题反复问AI Agent好几遍,生成的答案还是无法达到与人类认知相匹配的标准。B0M喜好网-记录每日喜好的科技时尚娱乐生活

因为AI Agent在执行任务时的思考方式是,复现成熟的任务流程或通过训练数据对问题进行简单拆分,归根究底,还是依赖于大模型的基础能力。Manus并没有在这方面做出强技术突破。有使用者指出,Manus对复杂问题的拆解能力仍处于较低水平。B0M喜好网-记录每日喜好的科技时尚娱乐生活

以及Manus即将面临的市场竞争压力也不小。B0M喜好网-记录每日喜好的科技时尚娱乐生活

覃相认为,豆包和百度的AI Agent也有各自的市场定位和技术优势,未来它们可能会通过技术升级或差异化竞争,缩小与Manus的差距,而且这两家公司的资金实力更强。B0M喜好网-记录每日喜好的科技时尚娱乐生活

对于Manus的火爆,很多人持观望态度。不止一位投资人对「定焦One」表示,虽然他们很看好今年AI Agent的发展,但由于之前有类似AI程序员Devin的出现,Manus并没有太惊艳到他们,核心技术问题也没有得到根本性提升。B0M喜好网-记录每日喜好的科技时尚娱乐生活

此刻,相比DeepSeek护城河较低的Manus,已经有不少开源复刻版项目出现,留给Manus的时间不多了。B0M喜好网-记录每日喜好的科技时尚娱乐生活

Manus
展开全文
猜你感兴趣
蘸拖鞋都好吃!六婆辣椒面官方狂促速囤:40包6.9元

蘸拖鞋都好吃!六婆辣椒面官方狂促

天猫【六

11-19 66阅读
丰田公开搭载氢发动机的混合动力车,加氢一次续航约 250 公里

丰田公开搭载氢发动机的混合动力

11 月

11-19 64阅读
中国联通:6G 70%技术与5G重合 将有6大典型应用

中国联通:6G 70%技术与5G重合 将有

时至今日,6

11-19 65阅读
慢热的腾讯,上火的AI搜索

慢热的腾讯,上火的AI搜索

11月1

11-19 64阅读
年入上百亿,海尔旗下独角兽终止IPO

年入上百亿,海尔旗下独角兽终止IP

今年

11-19 73阅读
丁禹兮vs范丞丞,偶像演员演技大赏

丁禹兮vs范丞丞,偶像演员演

作者 / 张   特编辑 / 阿   笔运

11-19 65阅读
小舍得原著结局是什么?南俪和夏君山的结局好不好?

小舍得原著结局是什么?南俪

《小舍得》是一根据鲁引弓的同名

11-19 64阅读
《我的主场》“篮”大凌晨五点魔鬼拉练 宏远主场喜提冠军大师课

《我的主场》“篮”大凌晨

  如果用运动定义青春,那么篮球必定

11-19 66阅读
《老舅》官宣开机,郭京飞、王佳佳领衔主演,重绘时代浪潮下的经典温暖记忆

《老舅》官宣开机,郭京飞、

  11月14日,由腾讯视频、鸣涧影业出

11-19 63阅读
日本导演神山健治执导 动画电影《指环王:洛汗之战》内地定档12月14日

日本导演神山健治执导 动

11月19日消息,今

11-19 65阅读
《燕云十六声》PC版不锁帧 1060可畅玩中画质

《燕云十六声》PC版不锁帧

《燕云十六声》官博发布新的文章,主要

11-19 63阅读
Skinseed怎样上传到我的世界?Skinseed皮肤导入方法

Skinseed怎样上传到我的世

《Skinseed》是一款专为游戏《我的世界

11-19 70阅读
卧龙苍天陨落全章节龙脉晶石所在位置详细介绍

卧龙苍天陨落全章节龙脉晶

龙脉晶石是卧龙苍天陨落游戏里面的特殊

11-19 71阅读
原神流转存续的花神诞祭主线任务攻略

原神流转存续的花神诞祭主

流转存续的花神诞祭是原神须弥地区魔神

11-19 62阅读
原神林中遇变任务怎么做?原神林中遇变主线攻略

原神林中遇变任务怎么做?

林中遇变是原神须弥地区魔神主线任务的

11-19 62阅读