全球首款真正意义上的通用型AI Agent,能够独立思考、规划并执行复杂任务,直接交付完整成果的智能助手

Manus

一、工具概览

Manus是由中国团队蝴蝶效应公司(Butterfly Effect)开发的全球首款通用型AI Agent产品,于2025年3月正式发布。其名称来自拉丁语”Mens et Manus”,意为”mind and hand”,即手脑并用,体现了其将思维转化为行动的核心理念。

Manus的设计理念是”知行合一”,基于智能化手段扩展人类能力,成为人类的智能伙伴。与传统AI对话工具不同,Manus可以解决各类复杂多变的任务,能够独立思考、规划并执行复杂任务,直接交付完整成果。

在技术架构方面,Manus采用Multiple Agent架构,运行在独立虚拟机中,可以在虚拟环境中调用各类工具——编写和执行代码、浏览网页、操作应用等。系统集成了29种不同的工具,包括”browser_navigate”、”shell_exec”和”file_read”等,能够高效处理各种复杂任务。

目标用户群体涵盖企业用户、投资者、教育工作者、创业者以及需要提升工作效率的普通用户。无论是处理繁琐的文件批量任务,还是进行深度市场调研,Manus都能提供专业级的解决方案。

二、核心功能深度解析

任务规划与执行能力

Manus通过规划代理、执行代理、验证代理的分工协作机制,来大幅提升对复杂任务的处理效率,并通过并行计算缩短响应时间。系统能够将复杂任务自动拆解为多个可执行步骤,制定详细的执行计划,并独立完成整个流程。

强大的工具调用能力

Manus拥有强大的工具调用能力,能自主完成从任务规划到执行的全流程,如文件处理、数据分析、代码编写、内容创作等。它可以:

  • 代码编写与执行:编写Python脚本进行数据分析,生成HTML代码部署交互式网站
  • 智能网页浏览:自动收集信息,访问多个网站提取关键数据
  • 文件批量处理:处理压缩文件,逐页分析文档内容,生成结构化报告
  • 数据可视化:创建图表、仪表盘和交互式网页展示分析结果

实际应用案例

Manus在简历筛选与招聘支持方面表现出色,能够自动解压压缩文件,逐页分析简历内容,记录关键信息并生成候选人排名表,支持异步处理和动态指令调整。在房产研究中,能够根据安全社区、教育资源、预算等需求,整合房产数据并生成包含安全分析、学校评估和房源推荐的完整报告。

在金融分析领域,Manus能够通过API获取金融数据,编写Python代码进行相关性分析,生成可视化图表及专业报告。

性能表现与局限性

在用于评估通用AI助手在解决现实世界问题方面的能力的GAIA基准测试中,Manus在所有三个难度级别上都达到了SOTA水平。在GAIA基准测试中,Manus表现优于OpenAI Deep Research。

然而,系统也存在一些局限性。Manus需要降低或隐藏LLM调用延迟,单步操作延迟较高。同时需要增加基础设施稳定性和并发服务能力。在某些复杂任务中,可能出现执行到一半因系统负载过高而失败的情况。

三、商业模式与定价

定价策略

2025年3月28日,Manus发布了付费方案,包括Manus Starter和Manus Pro两种版本,均为Beta版本:

Manus Starter

  • 月费:39美元
  • 积分:3900积分/月
  • 最多可同时运行2个任务
  • 专属资源提升稳定性
  • 扩展的上下文长度
  • 高峰时段优先访问

Manus Pro

  • 月费:199美元
  • 积分:19900积分/月
  • 最多可同时运行5个任务
  • 支持高投入模式和其他测试功能
  • 专属资源和优先访问权限

积分是Manus使用的标准计量单位,任务越复杂或越耗时,所需积分越多。根据官网举例,设计并部署一个独特的个人网站这样的复杂任务需要600积分、持续40分钟。

免费版本

目前提供每日300积分的免费额度,同时为所有用户提供一次性1000积分奖励。免费版提供每日50次API调用配额,单任务最长耗时限制为45分钟。

市场现象

由于邀请码机制控制访问权限,二级市场出现高价交易现象,二手平台标价从数百元到数万元不等。官方明确否认参与任何付费渠道,强调未授权第三方交易,并重申将维护公正的发放规则。

四、适用场景与目标用户

最佳使用场景

办公自动化

  • 报告撰写、表格制作、演示文稿创建
  • 简历筛选和候选人推荐
  • 财务报告分析和数据可视化

研究与分析

  • 市场调研和竞争对手分析
  • 股票分析和投资研究
  • 房产市场研究和推荐

内容创作

  • 旅行规划和行程安排
  • 教育内容和演示材料制作
  • 网站和应用程序开发

数据处理

  • 文件批量处理和格式转换
  • 数据清洗和分析
  • 可视化图表生成

适用人群画像

企业用户:需要处理复杂业务流程,提升工作效率和决策质量的中大型企业。

投资者和分析师:需要深入的股票分析和市场情绪洞察,进行投资决策的专业人士。

教育工作者:需要创建教学材料,解释复杂概念,提升教学效率的教师和培训师。

创业者和产品经理:需要整理市场信息,分析竞争态势,制定产品策略的创新团队。

研究人员:需要进行文献调研,数据分析,报告撰写的学术和商业研究人员。

不适合的情况

  • 需要实时响应的客服场景(存在延迟问题)
  • 对数据安全要求极高的敏感业务
  • 简单的日常对话和基础问答需求
  • 预算有限的个人用户(定价相对较高)

五、市场地位与竞品对比

主要竞品分析

vs OpenAI Deep Research: Deep Research的分析更专业、深入,能在4分钟内完成分析报告,而Manus需要30分钟。Deep Research引用的数据和信息源更专业,更像内行人的评述。但Manus在任务执行的多样性和自动化程度方面表现更好。

vs Claude Computer Use: OpenAI Operator和Anthropic Computer Use都是模仿普通人,而Manus是在模仿极客程序员。Manus打开的是命令行终端,在里面用文本编辑器工作,干活过程中不断写代码做自动化,最后的交付件也是代码。

vs OpenAI Operator: 在实际测试中,OpenAI Operator在完成任务时会陷入浏览循环,需要人工干预,而Manus能够更好地完成端到端的任务。

技术差异化优势

Manus采用”less structure more intelligence”的技术哲学,认为当数据、模型、架构、工程等基础要素达到一定高度,各种复杂能力会自然产生。

Manus的优势在于集成了29种工具,在专业平台基础上构建,使用Claude 3.5 Sonnet和经过微调的Qwen模型。

市场表现

Manus的发布在科技圈引起了广泛关注,其演示视频和用例得到了极客和用户的认可。在发布后,A股、港股AI应用方向集体爆发,多股涨停。

据悉,蝴蝶效应公司正与美国风投机构等潜在投资者洽谈新一轮融资,目标估值至少5亿美元,该公司的估值可能会增长约五倍。

六、用户体验评价

积极反馈

用户评价Manus”是第一个真正理解我需要什么并像专业人士一样处理复杂任务的AI”,感觉”不像使用工具,更像与天才助手合作”。

在B2B营销挑战测试中,Manus能够研究理想客户、找到决策者联系方式、创建个性化推广方案、设计交互式落地页并构建60天实施计划。

用户能够在一小时内使用Manus构建完全可玩的游戏,将简历转换为功能完整的专业网站。

存在问题

在实际使用中,有用户遇到了执行失败的情况。例如,在处理订餐任务时,Manus在10分钟后崩溃,第二次尝试虽然找到了合适的菜单项,但无法完成订购流程。

系统在高峰期响应延迟可达30分钟以上,与宣称的”0.1秒级决策”形成技术悖论。

团队正基于首批测试用户的反馈(如模型幻觉、运行速度等问题)加速产品迭代。

社区生态

Manus目前仍处于非公开测试阶段,普通用户注册成功后需输入邀请码使用。由于稀缺性创造的排他性,在AI影响者和技术社区中形成了较强的讨论热度。

对于Manus的评论出现两极分化,有人批评公司”以邀请码为噱头,营销味太重”,但也有人为Manus的创新点赞。

总结评价

推荐指数:★★★★☆

Manus作为全球首款通用型AI Agent,在技术创新和功能完整性方面确实表现出色。其独特的多代理架构、强大的工具调用能力以及在GAIA基准测试中的优异表现,都证明了其技术实力。特别是在复杂任务的自动化执行方面,Manus展现了超越传统AI助手的能力。

主要优势

  • 真正的端到端任务执行能力
  • 优秀的代码编写和自动化能力
  • 强大的数据分析和可视化功能
  • 在权威基准测试中的领先表现

需要改进

  • 系统稳定性和响应速度有待提升
  • 定价相对较高,可能限制普及
  • 某些场景下的任务完成率需要优化
  • 邀请制限制了更广泛的用户体验验证

评分依据:Manus在AI Agent领域确实带来了创新突破,但作为早期产品,在稳定性和用户体验方面还有提升空间。其技术方向正确,市场前景看好,但需要时间来完善产品成熟度。对于有复杂自动化需求的专业用户来说,值得关注和尝试。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索