联邦机构对马斯克旗下人工智能系统安全性存疑五角大楼仍批准其用于机密场景引发争议

问题：多部门警示与军方放行并存，暴露政府内部分歧加深。

据知情人士透露，近几个月来，美国多个联邦机构官员围绕马斯克旗下xAI公司的对话机器人Grok在安全性、可靠性等方面提出疑虑，并在内部沟通中发出警告信号。

与此同时，美国国防部本周作出决定，允许Grok进入机密场景使用，并将其纳入部分高度敏感行动的支撑工具。

不同机构对同一产品作出差异化判断，折射出美国联邦体系在新技术工具引入方面长期存在的“各自为政”：既缺少统一门槛，也缺乏跨部门一致的风险评估口径。

原因：标准碎片化、需求牵引与安全治理滞后交织。

一是评估体系不统一。

美国总务管理局（GSA）在1月15日形成的报告摘要指出，Grok-4“不符合联邦政府通用及联邦实验性平台所要求的安全与对齐预期”。

总务管理局发言人随后强调，该评估仅适用于本机构，各机构将依据自身“业务使命与风险承受能力”采取不同标准。

此类表述本身说明，联邦层面的通用准入与强制合规要求并未形成足够约束，导致同一工具在不同部门面对不同“尺子”。

二是部门任务差异带来取舍不同。

军方强调情报处理与决策支持的时效性与规模化需求，可能更倾向于通过限定场景、封闭网络或人员授权等方式“边用边控”；而行政管理与公共服务部门更关注数据合规、可解释性和可持续运维，一旦评估认为存在偏差或对齐不足，通常会更保守。

三是新技术快速迭代带来的治理滞后。

相关产品更新频繁，能力与风险同时变化，传统的采购论证、渗透测试、合规审查往往难以跟上节奏。

一些机构可能基于旧版本测试结论作出谨慎判断，另一些机构则依据最新能力展示与短期任务需要作出“有限放行”，从而进一步放大结论分裂。

四是政策与产业因素叠加。

美国近年持续推动本土关键技术生态与供应链安全，同时鼓励政府机构引入新工具提升效率。

在竞争与安全并重的政策导向下，部分部门可能更愿意将工具纳入体系，再通过内部规则修补风险；但这种路径对涉密环境而言，容错空间更小，争议自然更突出。

影响：从安全风险到治理信誉，外溢效应不容低估。

其一，涉密场景对数据泄露、模型误导与供应链风险高度敏感。

若安全与对齐机制不足，可能带来输出不稳定、误判诱导、敏感信息外泄等风险，即便概率较低，一旦发生也将造成严重后果。

其二，跨部门口径不一削弱政府治理一致性。

行政部门发布的评估警示与军方决定并存，容易引发外界对联邦政府“是否有统一底线”的质疑，影响公众信任与国际合作伙伴对其安全标准的判断。

其三，对市场与产业形成强信号。

军方进入涉密使用的决定，可能被解读为对相关工具“背书”，加速更多部门或承包商跟进；而监管与采购标准若未同步完善，可能引发后续更大的合规与审计压力。

其四，内部博弈或进一步加剧。

不同部门围绕技术路线、供应商选择、预算与责任边界的争论，可能在国会监督、审计追责及舆论压力作用下走向公开化，进而影响联邦层面政策统筹。

对策：以统一门槛为牵引，完善涉密应用的全链条风险闭环。

首先，推动建立跨部门的统一安全基线与分级准入规则。

对涉密与高敏场景，应明确强制性指标与最低合规要求，减少“各自裁量”造成的制度缝隙。

其次，强化第三方评测与持续性红队测试机制。

对话机器人在真实环境中的行为受提示、数据与部署方式影响显著，应将持续测试、对抗演练、更新回归验证纳入常态流程，而非一次性评估。

再次，完善数据与权限隔离。

对涉密使用应明确“可输入、可输出、可留存、可追溯”的边界，采用最小权限原则和严格审计，防止敏感信息被用于训练或被外部接口调用。

最后，厘清责任链条与应急预案。

明确供应商、承包商与使用机构的责任划分，建立故障处置与信息通报机制，确保一旦出现异常输出或安全事件能够快速止损、可追责、可复盘。

前景：美国或将加快收敛分歧，技术引入走向“更严审查+更细分场景”。

综合目前信号看，美国政府内部对新型模型工具的态度将更趋审慎与制度化：一方面，效率与能力需求仍将推动更多部门尝试引入；另一方面，涉密与关键基础领域的门槛预计会进一步抬高，评估标准更可能从“是否可用”转向“在何种边界内可用”。

在国会监督、审计压力与安全事件不确定性共同作用下，联邦层面建立统一框架、收敛部门分歧的动力正在上升。

未来一段时间，围绕安全评估结论、采购合规与使用边界的争论仍可能持续，并成为美国技术治理与国家安全政策博弈的一个缩影。

当技术创新驶入国家安全领域的深水区，如何平衡风险防控与战略需求成为各国面临的共同课题。

美国此次监管分歧不仅折射出现代科技治理的复杂性，更预示着人工智能时代国家安全体系将迎来深刻重构。

这场关于技术红线与军事边界的讨论，或许才刚刚开始。

联邦机构对马斯克旗下人工智能系统安全性存疑 五角大楼仍批准其用于机密场景引发争议