引言:从“唤醒词”到真正的环境智能
今天我们使用的大多数语音助手和智能家居系统,仍然依赖一种非常明确的交互方式:
“Hey X,帮我……”
“小 X,把灯关掉。”
在单人、单设备的场景中,这样的交互尚且可以接受。但一旦进入更真实的使用环境,问题立刻暴露出来。在家庭客厅里,父母、小孩和访客可能同时存在;在办公室会议室,多人线下参会、远程接入、共享设备并行发生;在养老院或医疗机构,患者、护理人员、探视者交替出现。
在这些场景中,“先喊一句唤醒词,再显式说明自己是谁”,显得笨拙而反自然。理想中的环境智能,应该更接近这样一种状态:人走进空间,开始说话或操作,系统自然地知道“现在该服务谁”。
这并不意味着系统“读心”,而是能够基于环境中已有的信息,合理、谨慎地推断当前的服务对象,并自动切换到对应的偏好、权限和上下文。在多用户共享空间中,AI 如何在不要求显式登录或指令的前提下,识别当前交互对象,并在必要时安全地切换身份视角。
一、什么是“无感身份切换”
在工程语境中,“无感身份切换”并不是指一次性、绝对准确的身份识别,而是一个持续、概率性的判断过程。系统需要不断回答三个问题:
1. 现在是谁在与我交互?
2. 这次交互应该归属到谁的上下文?
3. 我是否有足够把握使用个性化信息?
这里的关键不在于“识别率 99%”,而在于在不确定时是否足够克制。真正危险的系统,不是认不出人,而是认错了还自信地继续用错身份服务。因此,“无感身份切换”的目标更接近于:
在高置信度时自动个性化;