谷歌研发安卓屏幕自动化技术 智能辅助功能将覆盖生活服务场景

谷歌正在加快推进人工智能助手在移动端的应用深度。

据最新曝光的代码信息显示,谷歌应用17.4测试版中已包含"借助Gemini完成任务"功能的相关代码字符串,该功能内部代号为"倭黑猩猩"。

这标志着谷歌在赋予AI助手更广泛操作权限方面迈出了实质性步伐。

从功能定位看,屏幕自动化是一种新型人机交互模式。

Gemini将能够在用户指令下,通过识别和操作手机屏幕界面,在指定应用中自动完成下单、预约出行、信息填写等日常任务。

这种能力建立在Android 16 QPR3版本提供的技术基础之上,代表了安卓系统对AI应用的深层次支持。

相比传统的语音助手或文本交互,屏幕自动化使AI助手能够直接参与用户的实际操作流程,大幅提升了任务完成的效率和便利性。

然而,谷歌在功能介绍中明确指出了潜在风险。

官方提示称Gemini可能出现操作失误,用户需对其代理执行的操作承担相应责任,因此必须密切监督其运行过程。

这一表述反映出当前AI技术在复杂场景下仍存在可靠性不足的问题。

为此,谷歌设计了人工干预机制,用户可随时终止智能体的操作并手动接管任务,确保关键环节的可控性。

隐私保护成为该功能的另一重要考量。

根据披露的信息,当Gemini与应用交互时,若用户启用了活动记录保存功能,系统截取的屏幕画面将由专业审核人员进行核查,用于优化谷歌各项服务。

这意味着用户的屏幕内容可能被第三方查看,涉及数据隐私的敏感问题。

为此,谷歌明确禁止用户在Gemini对话界面输入登录凭证或支付信息,并建议避免使用该功能处理涉及敏感信息的任务或紧急事务。

这些限制条件实际上划定了功能的适用边界。

值得关注的是,谷歌同步推进的还有代号为"芥末"的数字形象功能。

该功能与Android XR系统中使用的3D虚拟形象技术相关联,可通过指令调用。

这表明谷歌正在构建一个更加立体化的AI交互生态,将屏幕自动化与虚拟形象相结合,探索更加沉浸式的人机互动体验。

从行业发展角度看,屏幕自动化功能的推出反映了AI应用从辅助工具向主动代理的演进趋势。

这种转变既提升了用户体验,也带来了新的技术挑战和伦理问题。

如何在扩展AI能力与保障用户安全、隐私之间找到平衡点,成为行业需要认真思考的课题。

从“建议”到“代办”,技术正在把便捷推向新的高度,也把边界问题带到台前。

推动“屏幕自动化”健康发展,既要鼓励创新提升效率,更要以审慎态度守住安全与隐私底线,通过清晰的规则、透明的机制与可控的设计,让新能力真正成为可信赖的工具,而非新的风险源。