服务全球5000家企业,「亮亮视野」还希望用AR+人工智能帮助千万听障人士无障碍沟通

“身份、朋友、沉浸感、低延迟、多元化、随地、经济系统和文明”,这是全球元宇宙第一股Roblox对于Metaverse定义的8个特征。随着Roblox在3月直接上市,元宇宙这条赛道变得异常火热,游戏、社交、AI等诸多领域的公司纷纷入局,媒体、投资人更是持续关注。不过热度归热度,从概念到应用层面关于元宇宙的讨论越来越像是玄学范畴。而在技术层面,AR作为元宇宙的入口之一,正在通过技术融合,让元宇宙的愿景触手可及。

近日,36氪获悉AR+AI企业级服务商亮亮视野,发布了帮助听障人士通过实时语音转文字解决沟通障碍的AR眼镜。对于听障人士而言,无法在工作和生活中及时做出响应、无法有效捕捉信源,比听不到本身带来更多的困扰,这也是他们无法融入社会的障碍。站在听障人士的角度,他们所触达的世界和正常人并不一样,而一副可以实时语义识别的AR眼镜所能为他们带来的便利,可以覆盖Roblox对于元宇宙所阐述的八个特征维度中绝大部分。


亮亮视野是一家全栈型技术公司,在AR领域从事光学和显示模组研发制造、AR整机设计生产、AR软件、算法开发、针对客户复杂业务需求的定制开发、以及基于AR应用场景的SaaS服务,目前在AR+AI的企业级服务领域已经逐渐形成生态闭环。

带着对新品的一些疑问,36氪和亮亮视野就产品研发、技术方案、B端客户服务等多个角度进行了一次交流。

1 听障人士的元宇宙

AR的本质是一种全新的交互方式,AR设备在最贴近视觉感官的位置形成基于图像的交互逻辑。和PC、移动终端、手表等可穿戴设备类似,未来会服务于多数人,并且和手机等移动交互方式长期并存,甚至会慢慢的替代其他交互方式。

 AR+NLP可以将声音转换成眼前的文字


“身份、朋友、沉浸感、低延迟、多元化、随地、经济系统和文明”用这八个元宇宙的特征,去适配AR的交互逻辑所能带给听障人士的体验,除了经济体系没有明确的感受,其余七个都有高度的吻合。

亮亮视野基于长时间的行业调查和应用领域梳理,并在相关技术成熟的时候重新评估论证方案的可行性。对于服务于听障人士的AR产品,前置的调研已经收集了大量需求和数据。作为特殊人群,他们其实有很多明显的痛点:首先他们要承受额外的生活负担,手术加人工耳蜗的费用动辄30-50万,还不包括电池等易耗品的开销;其次在和正常人交流的时候他们需要一直高度注意对方的口型,最多可以分辨出50%的内容,并会一直因此处于焦虑的状态;再次特别是在工作环境中,如果不是面对面的沟通,不能看到对方的口型,在没有他人提示的情况下,他们无法做出响应,也因此造成很多尴尬。

 AR+NLP可以语音语义识别,也可以实时翻译

针对听障人士的实际需求,亮亮视野一直在寻找合理的解决方案。目前AI重要应用领域NLP的发展,使实时的语音语义识别、机器翻译可以达到很高的正确率;边缘侧的AI芯片、5G传输、云端算力保证了实时的双向信息传输;波导片和显示模组的轻量化也提升了长时间佩戴人体工学体验。在以上所述的基础上,亮亮视野通过将新一代智能AR眼镜和火山引擎所提供的云原生AI语音识别、机器翻译服务整合,为听障人群搭建起无障碍沟通平台。

试戴这款产品,并通过和多人交谈可以发现,确实会有重量感,目前还不适合全天佩戴,不过对于习惯佩戴眼镜的人来说两小时之内还是可以接受的。透光性、视场角很好,和带普通宽边眼镜差异不大。提示字幕显示很清晰,不需要特别聚焦,大约会有三到五个字的延时。和距离不等、方向不同的几个人同时对话,字幕显示很流畅,而且字幕会根据上下文有语义谐音方面的实时调整。

 AR+NLP可以语音语义识别,也可以实时翻译

据第二次全国残疾人抽样调查数据显示,我国的听力残疾人约2780万人,而其中学龄、工龄人数占比达60%-70%。亮亮视野创始人兼CEO吴斐介绍称:我们希望将计算机视觉、人工智能技术用于辅助听障人士,在教育中,提高教育质量,解决无法学习的问题;在就业中,消除就业障碍,打开更优质岗位以及岗位晋升的道路;在社会上,拉近听障人群因言语障碍带来的距离,消除沟通隔阂,完善听障人士的无障碍建设,帮助解决公共服务中听障专业人士短缺的社会痛点。

2 产品技术的迭代

从产品的角度来看亮亮视野的AR智能眼镜目前还不能适配全部听障人群,在技术方面有比较大的提升空间。这方面的技术路径是要支持日常佩戴这个方向,即眼镜的重量最终能控制到什么程度。亮亮视野使用系统塌陷理论,针对应用场景的实际需求,重新结构成熟的产品,对其硬件规划进行连续减法。剔除多余的功能,将结构件进行精确到0.1克的打孔等轻量化处理。将最初近九十克的AR眼镜,减轻到五十克这个区间。

 亮亮视野的AR眼镜

此外,亮亮视野在北京市科委重点研发计划中,承担“超表面单片三色光栅波导AR光学模组研制”课题的研究工作,目前已取得技术突破,预计在下半年将加工出大尺寸样品。这项技术微软的Hololens也将其作为研发方向,新产品未来将大幅减轻光学及显示模组的重量。

AR眼镜中光学部分会占到百分之五十左右的成本,采集识别部分占百分之三十,人体工学部分占百分之二十。优化成本也是亮亮视野在技术迭代中的重要考量。其中光学模组还是重中之重,目前使用的阵列光波导片采用冷加工工艺,虽然工艺流程长,但是亮亮视野通过近十年在设计、工艺和供应链方面的持续研发,已经将良品率提升至百分之九十五到九十八,复制产线即可满足不同规模的量产需求。

 亮亮视野的阵列波导视觉模组

3 AR的ToB生态闭环

亮亮视野表示toB、toC更多是从资本、商业的角度来看事物,认为不同的应用间有明显的分水岭。但是站在服务商的角度,是将功能整合成应用,提供给多数人、或是特定人群。亮亮视野扎根在应用场景然中发现突破点,提供合适硬件、软件,整合应用,提供平台化的服务。

 工业应用场景

亮亮视野整合AR+AI技术为工业企业提供细分领域的SaaS解决方案。比如说为航空公司提供AR智慧机务平台,为传统制造型企业提供基于AR的企业运维平台,数字化转型的十四五规划正在加速推进这个过程。

通过SaaS软件,专家可以在远程同时精准指挥多路现场操作,工程师也可以通过交互界面接收每个工序的操作规范,并留存流程中的视频等数据,为工艺的可追溯性提供技术支持。亮亮视野的整套服务,包括多种微服务的功能,基于不同场景、不同硬件,提供定制开发。

 航空应用场景

亮亮视野在与南航合作的项目中,在现场和地勤人员一起完成飞机的完整检查流程,为AR+AI的解决方案掌握第一手资料,结合南航所开放的十余年运营数据,通过智能标注和机器学习,研发出智慧机务平台,在实际使用中可以增效50%以上。

4 AR的进化

AR是一个具有完整体系的产业,有硬件、有软件、有算法、有内容的创作、有各种关键器件的研发,具体的技术路线很可能因为某一个工艺环节的不完善而陷入停滞,被其他的技术路线超越。而且这个领域不是软硬可以明确分工的,无论巨头,还是创新企业都要具备垂直整合能力。

基于应用场景提供专业化产品和服务的公司会有一些先发优势,随着整个产业生态的完善,才会有行业上下游拆分的第二步,在细分领域落地专业性服务的机会会大量出现。现在看AR领域的应用爆发还为时尚早,但是每一个从业公司都在加快研发的节奏。