EN

2026世界杯

2026世界杯

PC加拿大网站 Siri们加快Agent化,将来东谈主类可能会健忘“点击App”这事儿

发布日期:2026-06-08 12:55 来源:未知 作者:admin 浏览次数:

PC加拿大网站 Siri们加快Agent化,将来东谈主类可能会健忘“点击App”这事儿

谷歌在本年的 Android Show(I/O 版)上,说了一句听起来有点夸张的话,Android 正从一个 operating system,改造为一个 intelligence system。

(图源:Google)

有时,以后咱们再也不需要 App 图标了。

这句话翻译成东谈主话,等于手机不再只是被迫等你点开 App 的用具,它开动主动帮你把事情作念完。谷歌给的例子很具体:你把一份购物清单记在备忘录里,Gemini 不错读出来,再去购物 App 里一项项加进购物车;你让它从 Gmail 里翻出某本讲义的信息,它能找到之后平直帮你下单;你给它一张像片,它能在旅行平台上替你搜对应的行程。

(图源:雷科技制图)

不单是是手机,按照谷歌的策画,这项智商最早在三星 Galaxy 和 Pixel 上布局,随后得腕表、汽车、眼镜和条记本上。

但问题来了,当手机开动替咱们「干活」而不单是修起,App 那套咱们用了十几年的逻辑会被改写吗?以下是雷科技的认识。

Siri 们长出「手」后,一切王人将改变

当年的语音助手,用起来的嗅觉等于它只是一个会修起你的小伙伴。比如你对入辖下手机说「把我备忘录里的购物清单加进购物车」,当年的 Google Assistant 会奈何作念?大约率是把这句话当成一个搜索词,灵通浏览器,给你复返几条关联运动,然后任务就扫尾了。

但在用户的角度,细目照旧但愿它能够灵通备忘录、记着清单、切换到购物 App、一项项搜索、一项项加入,鼓胀赋闲双手。无语就在于,它听懂了你的话,却干不了你的事。

(图源:Google)

内容上的原因在于,当年的助手独一「眼睛」和「嘴」,莫得「手」。它能识别语音、能诵读后果、能灵通某个固定的功能,比如设个闹钟、打个电话、查个天气这些,一朝任务需要擢升多个 App、需要中间设施、需要凭据上一步的后毅然定下一步,它就执瞎了。

Android 开发者社区里有东谈主复盘过谷歌早年的两次尝试,一个叫 Direct Actions API,条款 App 必须在前台运行助手武艺操作,等于助手没法我方后台干活;另一个叫 Assist API,给了系统「看屏幕」的眼睛,却没给它「清爽该奈何操作」的脑子,两条蹊径王人不太行。也等于说,其实各人关于语音助手只可回答不颖慧活这件事,早就有怨言。

Gemini Intelligence 念念补上的,正是「手」和「脑」这两块。谷歌把这套智商叫作念 Task Automation(任务自动化),它能在用户授权下,跨多个被选中的 App 完成多设施任务,而且全程保留透明度和用户扬弃权。换句话说,你说一句话,它会读清单、调 App、加购物车,每到要害的、不可逆的要津,比如真要付钱了,再停驻来等你点头阐述。

值得提防的是,谷歌此次开放这个智商亦然相对贯注翼翼的,它配了一个叫 Android Halo 的东西,在你屏幕顶部用很轻的阵势线路「智能体当今正在干什么、程度到哪了」,让你随时能看见、随时能叫停。其实谷歌也很明晰,「替你操作手机」是一件信任本钱极高的事,它不敢全部大包大揽。

(图源:Google)

但率直讲,这一版能作念的事,咫尺还额外克制。任务自动化首批只袒护被精选过的少数 App,智商鸿沟也有限。而且 Gemini Intelligence 敌手机硬件的条款还很高,连不是通盘机型王人能跑得动。从咫尺来看,它更像是一个标的明确、但还在小步快跑的早期形态。

我觉得,当年十几年,咱们和手机的干系是「灵通 App,再找功能」,而 Gemini Intelligence 念念把它改成「提议需求,系统替你调用 App」。这个转向要是成立,影响的就不单是一个助手好不好用,而是整套出动端的交互逻辑。假如一句话就颖慧活,那 App 的图标还有存在的酷爱酷爱吗?

Google AppFunctions 要作念出动端的 MCP?

此次 I/O 上,谷歌同期面向开发者推出了 AppFunctions,而且平直给了它一个副标题:Android MCP。谷歌官方的描绘是,AppFunctions 是一套 Android 平台 API,配套一个 Jetpack 库,让你的诈欺能像一台「端侧 MCP server」一样运作,把我方的用具、干事和数据开放给系统和智能体调用。

MCP 这套条约,当年主要处置的是云表的事,等于让 AI 智能体能措施化地谐和到干事器侧的多样用具。而 AppFunctions 作念的,是把相同的机制搬到了手机腹地。

开发者只消把「创建备忘录」「发送音问」「搜索邮件」「添加购物清单」这些智商,写成一段段自带当然谈话描绘的函数,注册到 Android 系统内置的「智商清单」里,Gemini 这样的智能体就能发现它们、调用它们。更要害的是,通盘过程在蛊惑腹地蔓延,蔓延更低、也更利于秘密。

(图源:Google)

当年智能体念念替你操作一个 App,靠的是一套很愚顽的目的,PC加拿大网站先截屏、OCR 识别笔墨、再找到按钮的位置、模拟点击、等页面变化、出错了再重试。这套经由又慢又脆,App 改个界面就可能全部失灵。AppFunctions 把它换成了,App 主动声明「我能作念什么」,智能体带着授权平直调用这些智商,系统矜重管权限、管调用范畴、管安全不时。

谷歌对将来手机系统的设念念等于,将来的软件会越来越像「一组智商」,而非单纯「一组界面」。也等于,App 的图标可能会肃清,转而酿成一些中枢的智商留在用户手机里,用户也不需要记起这些 app 诀别是干嘛的,只需要说我方的需求。

诚然,AppFunctions 咫尺的情状还相配早期,关于那些还没接入的 App,谷歌的兜底决议是另一套「UI 自动化」框架,也等于让 Gemini 送还到模拟点击的老蹊径上去临时顶一下。这就不得不提到豆包手机助手,它内容上照旧 GUI Agent 那套「看懂屏幕、模拟点击」的逻辑,只是权限拉满,才杀青多样跨诈欺的功能。

岂论是哪种决议,趋势照旧很明晰,App 不会肃清,可 App 图标、首页、传统菜单这些「进口」的权重,可能会缓缓下跌,用户越来越不介意 App 本人,而是愈发敬重 App 的中枢智商。

动动嘴让 AI 干活这事儿,会淹没手机 app 吗?

当年十几年,App 之间打的是一场「进口争夺战」,争的是什么?是桌面第一屏的位置,通盘的家具假想、通盘的 push 示知、通盘的红点,内容上王人是在抢用户的心绪度。

可一朝 AI 成了新的系统级进口,战场就变了。将来 App 要抢的,是智能体的「调用次数」。当用户不再亲手灵通 App,而是把需求抛给 Gemini,那么「Gemini 决定去调哪个 App」这件事,就成了新的兵家必争之地。你念念念念,用户说「帮我订杯咖啡」,系统调的是瑞幸照旧星巴克的 App 看成?或者说,订个货仓、买张机票,系统会保举哪个 App 呢?

(图源:Google)

也正因为利益这样大,谷歌在这条路上跑得这样急,就显得格外耐东谈主寻味,因为它的老敌手苹果,在兼并件事上摔了个大跟头。

早在 2024 年的 WWDC,它就高调演示过一个全新的 Siri,靠 App Intents 框架杀青跨 App 操作,经典的演示场景是:「找出上个月 Sarah 诞辰的像片,把最佳的一张去掉布景,发到她的 Instagram。」一句话,Siri 在多个 App 之间穿梭着把活干完。这套愿景,和今天 Gemini Intelligence 讲的险些一模一样。

百家乐2026世界杯中国官方下载

(图源:Apple)

但后头的故事各人也明晰了,这套个性化 Siri 底本策画 2025 年上线,先是被推迟到 2026,又一谈从 iOS 26.4 延到 26.5,这不立时 iOS 27 王人要来了,这智商也没点脉络。

苹果高管 Craig Federighi 的说明是,底本那套功能建在「V1」架构上,能跑,但质料不达标,必须再行建在新的「V2」架构上。苹果软件工程矜重东谈主和营销矜重东谈主在采访里被追问具体日历,只朦胧地说 2026 会上,那大约率等于 WWDC27 公开了。

其实呢,倒也不可鼓胀怪苹果。跨 App 自动化和生成一段笔墨鼓胀是两码事,它要介意图费解、App 情状在变、还波及信得过权限的情况下,精确地蔓延正确看成,可靠性、准确性,还有敏锐内容的问题,王人是一谈谈坎。

是以,在「让 AI 承袭手机操作」这件事上,靠着 AppFunctions 这套开放给开发者的底层假想,加上三星、谷歌两家硬件先行铺货,更有可能最初跑出一个能用的「Agent OS」雏形。

(图源:Google)

诚然,咫尺 Android 这条路最大的风险,恰正是它的开放,复旧海量的机型和 App 干事,注定了它必须严慎对待每一个智商和要津,也注定了它很难鼓胀放开智商给用户。

那么回到最开动的问题,App 图标确切会因此肃清吗?雷科技(ID:leitech)的判断是,图标不会肃清,但它的权重会缓缓缩短,直到用户照旧不那么介意"我方该在什么工夫去点击哪个熟习的图标蔓延什么任务"这件事。

它未必能在一两年内就改变通盘东谈主的习尚PC加拿大网站,毕竟手机这东西,承载了咱们太多年的肌肉追悼。但至少在方朝上,谷歌照旧替通盘行业把「下一代手机长什么样」这谈题的谜底写在了考卷上。