
三个月前,努比亚M153首销售罄的音讯刷屏科技圈,豆包手机助手让东谈主第一次直不雅感受到AI委果"接纳"手机是什么体验。但热度还未散去,微信、支付宝、各大银行App的闭塞相继而至。差未几归拢时候,OpenClaw在开导者圈以另一种形式考据了归拢件事的价值,只不外是在电脑端而非出动端。
跟着谷歌联手三星推出Gemini手机智能体,小米开动下场“养虾”,由豆包手机助手最初开启的手机AI Agent赛谈,竞争模式已迎来要津改变,成为软件厂商、手机厂商、操作系统三路东谈主马的同场竞技。
三条路子的手艺底座不同,生态身份不同,濒临的阻力也各自迥异。豆包的读屏有贪图、谷歌的AppFunctions框架、小米的系统原生API——名义上都在解同沿途题,内核的逻辑却大相径庭。谁的有贪图能委果跑通,取决于它在扫数这个词出动生态中处于什么位置,而不仅仅手艺本人的优劣。
豆包手机走到今天,面对的照旧不仅仅期骗生态的阻力,还有手机厂商用系统级权限构筑起来的新壁垒。但字节的处境,也并非外界看起来那样被迫。它在B端的MCP布局、飞书积聚的公约化素养、以及独家内容手艺生态,都是手机厂商无法复制的财富。问题在于,如何把这些财富振荡成期骗厂商精炼合作、硬件厂商无法冷落的履行筹码。
手机版“龙虾”来了,但第三方期骗还没跟上
最近一段时候,一只叫作念OpenClaw的"龙虾"火出了AI圈,“赛博养虾”快速出现东谈主传东谈主孤高。不外,对大无数平方用户来说,OpenClaw的门槛依然不低——它运行在电脑端,需要一定的手艺配景身手部署和使用,距离委果的全球擢升还有很是距离。
{jz:field.toptypename/}3月6日,小米认真启动出动端系统级智能体Xiaomi miclaw的小范围封闭测试。雷军在转发公告时只写了三个字:"手机龙虾"。这是小米对OpenClaw欢跃的正面回答,亦然手机厂商"养虾"波浪中最初亮相的那一只。意味着这场AI Agent转变的战场,认真从极客的电脑延长到了平方用户的手机。

从官方先容来看,miclaw的核心卖点是把手机系统才略变成AI可平直调用的用具集。Xiaomi miclaw可将手机系统才略封装为突出50项用具,并络续彭胀,即便施行20步复杂操作也能保持需求连贯性。
生态联动是miclaw刻下最核心的各异化才略。小米深耕IoT多年,米家生态接入树立已突出10亿台,而miclaw第一次让这个弘大的树立矩阵委果被AI和解改变——读取树立景色、发馈送貌指示,在用户授权的情况下,扫数接入米家的智能树立都能成为AI可驱动的结尾。
关于第三方期骗的接入,小米给出了两条旅途:一是通过MCP公约,PC端已有的数千个MCP用具表面上不错平直接出手机AI;二是发布了第三方期骗接入SDK,第三方App主动声明我方能提供的用具才略,Xiaomi miclaw动态发现和调用。

这两条旅途都有一个扎眼的前提:第三方需要"主动"接入。从刻下公开的演示和官方刻画来看,微信、支付宝等高频第三方期骗,并未出当今职何履行操作场景之中。小米也明确将miclaw定位为"早期手艺探索阶段"。
即便第三方生态的接入仍是未解题,miclaw照旧构建出一个其他厂商难以复制的独到上风。一个小米重度用户,照旧不错用一句话改变家里扫数的智能树立、读取全部系统见知、处置日期和健康数据,并在小米自有期骗矩阵里完成很是一部分的日常任务。
值多礼贴的是,小米并不会是独逐个家“养虾”的厂商。华为、OPPO、vivo均已在系统级Agent所在络续干与。对用户而言,改日可能无需非凡安设任何期骗,通过系统OTA更新就能得回Agent才略,擢升门槛将降至历史最低。
但对期骗生态而言,当各家手机厂商同期推出各自的门径化调用体系,意味着好意思团、携程、支付宝等平台需要面对多套SDK的接入恳求——在交易议论尚未理顺的阶段,这可能反而变成适配压力,让期骗厂商在洞开力度上愈加审慎。
更潜入的影响在于:当系统级Agent成为每部手机的标配,AI改变期骗的形式将迟缓取代用户主动大开App的风气,期骗分发逻辑将被重写。谁掌捏了AI改变的进口,谁就掌捏了下一代流量的分派权——而这,恰正是每一家手机厂商都澄莹的终局。
GUI向左,OpenClaw向右
AI手机的正确姿势是什么?
要是说2025年底豆包手机助手的亮相,是一场模子公司与硬件厂商联结的突袭。到了2026年开年,这场斗殴的模式照旧昔不如今。手机厂商、操作系统、AI模子公司正在归拢条赛谈上加快,指标高度一致:让AI接纳手机操作,成为用户的万能代理。
要交融它们的内容各异,需要先厘清一个更底层的手艺问题:AI到底应该如何"操作"手机?
OpenClaw的核心设想理念是腹地运行,基于MCP公约的三层结构——核心层调用大模子,适配层相连平台,妙技层施行任务——它不依赖视觉识别,而是通过系统API平直施行指示。
豆包手机助手的旅途则截然有异:用户下指示,手机截屏发给云表大模子,模子看懂屏幕后复返操作指示,手机施行,再截屏,如斯轮回。这是一种透彻的"视觉仿东谈主"路子,AI像东谈主一样盯着屏幕干活。

这套读屏路子的早期奏效有目共睹。2025年12月1日,豆包手机助手手艺预览版发布,搭载该助手的努比亚M153工程样机首批3万台通宵售罄,在科技圈激勉孤高级怜惜。跨平台比价点外卖、自动整理旅行攻略、批量处理音讯,险些掩盖手机日常使用的全场景,只在付款等要津法子需要东谈主工介入。
但这一手艺路子,与现存出动期骗生态存在自然打破。履行落地中,微信曾触发“登录环境颠倒” 安全请示,部分银行App也弹窗条目关闭AI助手干系功能,AG庄闲游戏官网首页豆包因此晓谕暂停金融场景的AI自动操作。这背后既有效户狡饰与安全的合规考量,更核心的是交易利益博弈:AI期间流量进口、用户数据与操作链路的价值愈发要津,读屏路子试图绕开现存App壁垒,例必濒临极大的生态阻力。
谷歌和三星在2026年2月给出了一条更接近OpenClaw精神的旅途。三星Galaxy Unpacked2026发布会上,谷歌安卓生态系统总裁萨马特展示了Gemini智能体,大概在后台自动完成订餐、叫车、购物等跨期骗复杂任务。
客服QQ:88888888
谷歌线路了一套名为"AppFunctions"的底层框架,雷同MCP公约的腹地版块,通过AppFunctions,期骗开导者不错界说功能接口,让Gemini更精确地调用;同期谷歌也在开导"UI自动化框架",让AI能在莫得官方适配的期骗上通过视觉识别完成任务。这是一套"双保障"路子:优先推动期骗主动洞开API,同期保留视觉读屏行动备用。
该有贪图刻下仅面向好意思国、韩国的Galaxy S26与Pixel 10 系列推出Beta版,仅掩盖外卖、网约车等极少合作场景,才略落地高度依赖期骗方的适配与授权。

对此,中兴通信结尾奇迹部总裁、努比亚总裁倪飞直白评价:"看到三星S26+Gemini的组合,不异摄取了GUI形式,但只完结了努比亚M153的局部才略,如故有些缺憾。"这个对比并非毫无道理,但巧合评释了两条路子的内容采选——豆包走 “先落地、再协调” 的快速掩盖路子,谷歌+三星走 “先定生态轨则、再迟缓洞开” 的适宜路子。
小米miclaw 的合座念念路与谷歌高度邻近,但二者的上风各有侧重:谷歌掌控安卓全球系统级底层进口,而小米行动国内头部手机厂商,依托自身结尾与用户体量,在国内期骗生态的履行落地对接中更具谈话权。
国内六家主流手机厂商的智能体用户限度,一年内共计增长6500万,合座达到5.35亿。这一体量让手机厂商在与第三方期骗的合作中更具主动权,接入洞开SDK,可借助系统级AI进口得回新的用户触达渠谈,两边更易变成互利的合作关系。
非论是谷歌AppFunctions如故小米的洞开SDK,核心贫穷都在于期骗厂商精炼洞开的才略领域。AI智能体替代用户完成操作后,用户无需大开App,平台的告白曝光、用户交互、流量进口价值都会被大幅减弱,以至可能冲击现存App的居品形态与核心利益,这亦然期骗方存在费神的弥留原因。
这也决定了这类API洞开路子能落地的场景,仅局限于期骗方主动让渡的范围,难以王人备自尊用户的全场景需求。
三条路子的问题由此澄莹呈现。豆包手机路子掩盖场景最广、用户感知最平直,但期骗闭塞的压力永远存在。谷歌+三星路子表大肆最强,有安卓生态和弘大期骗关系网罗托底,但先谈妥再落地的节拍,决定了它能掩盖的场景深度有限。小米miclaw路子谈话权最高,系统原生的身份让生态议论更顺畅,但第三方核心期骗的接入不异莫得现成谜底。
这场博弈的核心矛盾不是手艺问题,而是利益问题。谁能让超等App深信洞开API带来的增量收益大于被AI抽走流量的耗损,谁身手委果买通手机智能体的全场景才略。在这个问题莫得谜底之前,扫数路子都仅仅在各自照旧谈妥的一亩三分地里,跑得尽可能顺畅。
豆包手机助手的下一步
应该奈何走?
豆包手机是这场竞赛的始创者,但始创者随机是终局的赢家。面敌手机厂商集体入场,字节需要找到一条与硬件厂商摩擦最小、自身上风进展最大的路子。
字节初期以纯大模子供应商身份鼓吹合作遇阻,转而通过与手机厂商开展系统级深度合作落地豆包手机助手。华为、小米、OPPO、vivo 均将自有智能体视为系统核心与流量分派进口,不肯向第三方洞开系统级主导权。在此配景下,字节一边络续与多家手机厂商洽谈合作,一边优先选拔与中兴等厂商联手,以裁汰合作门槛、快速考据才略落地。
这条路子的逻辑是澄莹的:将AI才略深度植入硬件,打造"智能核心"而非自有品牌手机。据供应链音讯,字节已于2025年底开启豆包手机助手郑再版花样,豆包二代手机瞻望将于2026年第二季度中后期发布,依旧延续与中兴努比亚的合作模式。
豆包二代最要津的手艺决策,是如那边理GUI读屏与门径化API调用之间的关系。两者的根蒂各异在于:读屏是AI去允洽东谈主类的操作界面,API调用是期骗主动为AI提供才略接口,前者天真但脆弱,后者幽静但依赖期骗方的主动配合。
两套有贪图并行,是豆包二代刻下最现实的旅途。阿里在内的部分App与字节达成媾和公约,允许努比亚设耸立常登录,豆包主动截至操作场景;另有手机厂商智能体负责东谈主显现,主动寻求合作的App大厂明显加多了。
刻下豆包团队已与打车、外卖、订票等领域的部分平台达成常用权限合作,这是从读屏向API调用搬动的早期信号。已谈妥的高频场景鼓吹门径化调用,尚未掩盖的长尾场景保留读屏行动补充——这是向公约化路子迟缓逼近的过渡有贪图,而非一次性的路子切换。
在这个历程中,定位的颐养比手艺路子的切换更为要津。OpenClaw之是以让大厂宽心,是因为它不试图成为用户与数字宇宙之间的独一中介,仅仅提供用具,让用户我方决定用谁的模子、部署在谁的云上。豆包要是能将定位从"流量中介"颐养为"才略增强层",主动洞开接口、让期骗厂商也能从AI改变中获益,闭塞的动机当然会弱化。
字节在B端积聚的MCP工程化素养,是支撑这一滑变的弥留基础。飞书的Lark MCP Server已将音讯、日期、云文档、多维表格等勾引才略以MCP门径对外洞开,这套门径化才略的千里淀,意味着豆包在鼓吹C端API接入时有圆善的手艺框架不错平直复用。
对字节而言,豆包的契机不在于成为下一个流量礼貌点,而在于能否在洞开生态中成为最不能替代的才略提供者。始创一个赛谈,和赢得一个赛谈,从来都是两件事——但对字节来说,至少这场仗还远莫得打完。