谷歌AI开始替你动手干活:基于Gemini的自动化功能进入Beta测试
手机不再只是你手中的工具,它开始学会“自己用自己”。
3 月 13 日,谷歌宣布基于 Gemini 的“任务自动化”功能正式进入 Beta 测试阶段。这意味着 AI 助手正在完成一次关键的身份转变——从过去那个只会查资料、回消息的“信息搬运工”,升级为能像真人一样动手操作 App 的“数字代办”。

视觉震撼:看着屏幕自己动起来
与传统的 API 对接不同,谷歌这套自动化功能的实现路径颇为特别:它在一个虚拟窗口中,模拟人类的操作逻辑,直接与 UI 界面交互。
当你对着手机说“打车去机场”,Gemini 会自动唤起 Uber,识别你需要前往哪个航站楼——如果目的地有多个航站楼,它会主动弹出确认选项,然后自动填入地址。整套动作一气呵成,就像有一个隐形人在替你划屏幕。
再比如点咖啡。你只需说“帮我点一杯 Flat White 和一个牛角包”,AI 就会自主打开星巴克 App,在菜单中滑动寻找对应单品,甚至能处理那些需要滚动选择的复杂页面。整个过程你可以全程围观,看着它一步步完成。
安全逻辑:关键节点还得你点头
当然,把手机交给 AI“自己玩”,难免让人捏把汗。谷歌为此设置了一套人工复核机制。
首先是全程可见。AI 的每一步操作都会实时呈现在屏幕上,用户可以随时叫停,甚至手动接管控制权。
其次是“最后确认制”。在提交订单或付款之前,系统会强制停在支付界面,等待用户亲自核对明细、手动点击确认。换句话说,AI 可以帮你跑腿,但掏钱这件事,还是得你来。
笨拙但有用:UI 交互模式打开新边界
目前,该功能优先适配外卖和网约车类应用。谷歌坦言,AI 在识别菜单选项、滚动页面时偶尔还会显得有点“笨”,但这种基于 UI 交互的自动化模式,绕开了 App 深度适配的复杂门槛,反而让 AI 助手的应用边界一下子被拓宽了。
过去,我们穿梭在 App 之间,点餐、打车、订票,每一件事都得亲自动手。如今,一句话的功夫,AI 就能替你跑完这些琐碎流程。
这或许才是“真智能”该有的样子。
以上关于谷歌AI开始替你动手干活:基于Gemini的自动化功能进入Beta测试的文章就介绍到这了,更多相关内容请搜索码云笔记以前的文章或继续浏览下面的相关文章,希望大家以后多多支持码云笔记。
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 admin@mybj123.com 进行投诉反馈,一经查实,立即处理!
重要:如软件存在付费、会员、充值等,均属软件开发者或所属公司行为,与本站无关,网友需自行判断
码云笔记 » 谷歌AI开始替你动手干活:基于Gemini的自动化功能进入Beta测试
微信
支付宝