当前位置:首页 > 科技资讯 > 正文

苹果唇语识别专利革新AI眼镜交互,破解公共场景使用难题

为提升Vision Pro等头戴设备的市场竞争力,苹果公司近日祭出一项创新技术。根据最新曝光的专利文件,其未来头戴设备将集成唇语读取功能,用户无需发声,仅通过唇部动作即可向设备传达指令。

苹果唇语识别专利革新AI眼镜交互,破解公共场景使用难题 苹果专利 唇语识别 AI眼镜 人机交互 第1张

在这份名为“带有语音输入结构的电子设备”的专利中,苹果详细阐述了该技术:当佩戴者处于不便说话的场合时,内置视觉传感器可捕捉唇部运动并转化为输入指令。此项技术若成功落地,预计将对整个头戴设备领域产生深远影响。

随着小米、阿里等巨头相继入局,AI眼镜市场正迎来新一轮热潮。然而,繁荣背后隐患暗藏。据VR Vision统计,仅在抖音电商平台,AI眼镜的退货率就高达40%-50%。众多用户将其归为“吃灰神器”,除硬件负担外,语音交互体验不佳是主要槽点。

苹果唇语识别专利革新AI眼镜交互,破解公共场景使用难题 苹果专利 唇语识别 AI眼镜 人机交互 第2张

对于智能音箱这类家居设备,语音交互堪称完美匹配。但AI眼镜和XR头显大多用于公共环境,情况截然不同。尽管当前AI大模型大幅提升了语义理解能力,配合降噪技术可精准识别语音指令,但核心痛点在于:许多用户难以克服在公开场合对着空气说话的“社死”尴尬。

公共场合背景音复杂,即使用户提高音量以确保识别,也难免违背社交礼仪。更关键的是,语音交互可能泄露隐私,令用户心生顾虑。早在十年前,腾讯创始人马化腾就曾指出语音助手的类似缺陷:“一个人对着手机说话显得很傻,人多时不好意思,且缺乏私密性。”

苹果唇语识别专利革新AI眼镜交互,破解公共场景使用难题 苹果专利 唇语识别 AI眼镜 人机交互 第3张

AI眼镜本就因拍摄功能陷入隐私争议,叠加语音交互的社交压力,进一步限制了其在公共场景的应用。此外,语音信息虽丰富,但处理起来更耗精力,听觉在上下文联想上也逊于视觉。

厂商并非不知语音交互的短板,但在成本权衡下,它仍是当前最经济的方案。若追求更高性能的语音识别、自然语言处理和远场拾音,成本将急剧上升,导致产品小众化;若控制成本,则无法缓解用户大声说话的心理负担。

苹果唇语识别专利革新AI眼镜交互,破解公共场景使用难题 苹果专利 唇语识别 AI眼镜 人机交互 第4张

此前,智能眼镜主要依赖镜腿触控,但举手操作易疲劳,不符合人体工学。TWS耳机因交互频率低,触控尚可接受。在触控不便、语音受限的两难下,苹果的唇语识别提供了新思路:用户只需微动嘴唇,设备即可无声响应,完美规避公共场合的交互尴尬。

唇语识别技术依托AI视觉模型实现,通过预训练学习不同语言使用者的唇部动作模式,即可准确解析指令。一旦识别率达标,AI眼镜和XR头显迈向大众市场的最大障碍有望消除。

苹果唇语识别专利革新AI眼镜交互,破解公共场景使用难题 苹果专利 唇语识别 AI眼镜 人机交互 第5张

当用户能自在无拘地使用设备,AI眼镜和XR头显便有望从小众玩物蜕变为普及型消费电子产品,开启人机交互新纪元。