解密丨博泰车联网——擎AI语音开放平台(上篇)
2021/03/15
BY PATEO
8998
随着人工智能技术与用户消费需求的不断进阶,影响着语音交互越来越趋向人类自然对话的极致体验:

●语音交互从机械的单轮对话,发展到更流畅的多轮对话。
●语音交互具备听觉选择能力, 提升多人对话体验。
●语音交互支持多种方言,并针对细分群体进行差异化设计。

同时,这些趋势也正在为相应产业带来革新与重构。以汽车产业为例,2020年我们听到的“人机交互、智能汽车”声音层出不穷,各车企在自身变革创新的同时,更是借力能为其提供语音交互能力的供应商,在车载语音方面发力铆劲。

但能够提供“三高”——开放性高,流畅性高、质价比高的语音产品公司屈指可数。其中,博泰车联网擎AI语音开放平台算的上一个“最优解”。

作为全球第一个做中文车载语音的公司,博泰车联网也是行业内唯一拥有语音平台的车联网公司。目前,博泰已经构建了全行业唯一结合百度AIG、小米、vivo、科大讯飞、思必驰等专业语音公司,以及小冰等专业语音机器人的语音开放平台,并可以通过定制麦克风阵列,技能,发音人,五分钟定制出人工智能SDK赋能汽车领域。其打造的擎AI语音开放平台历经了6次迭代到擎AI 3.0,已经成为了全面自主可控的语音平台,实现了用户体验行业内领先。

那么,这个擎AI语音开放平台到底为何能以“最优解”般存在,今天我们来一探究竟。

什么是擎AI语音开放平台?

博泰擎AI语音开放平台是一个完整的研发体系,是一个可配置的能力平台,同时它还是一个能够为用户提供智能化、人性化的语音助理。

博泰擎AI平台支持虚拟形象,声音复刻,情感化TTS等多项能力,建立有情感有温度的智能语音助手,能感知用户情绪,识别用户情绪变化,并通过情感化的应答和用户交流。会主动问候、关怀和提醒用户,进而达成可以主动关怀用户,有情感的,个性化语音助理服务。

它不仅拥有语音体验速度快、多轮对话能力强、高噪音环境下识别精准、低分贝语音识别准确率高以及支持超长文本精准识别等行业领先语音体验,还能够支持离线、在线语音服务的融合,能够通过高效的语音识别、多维度的语义处理、个性化的语音交互方式,实现全双工交互的复杂自然语言对话场景。

擎AI语音开放平台具备什么属性?

五大产品特性助力博泰擎AI语音开放平台支持自定义配置与个性化打造。

1. 平台化下实现定制插拔业务:

博泰擎AI语音开放平台具有平台化能力,在实现语音精准高效分发、多技能结果仲裁的同时实现可插拔定制服务与产品迭代升级。

2. 灵活性下实现一对多高效应用:

一对多的灵活特性让博泰擎AI语音开放平台可根据各个项目需求,支持按项目、车型提供不同技能的语音服务,实现一套服务支撑不同业务需求的高效、灵活定制;快速应用到各个车厂项目,支持Linux和安卓系统、车机端和手机端等不同系统不同端的多种集成方式快速赋能AI智能交互体验,提供了具有行业竞争力的车联网智能语音产品。

3. 擎AI赋能智能移动空间实现万物互联:

擎AI语音平台提供超过40多个领域,超过1000多个场景服务,覆盖用户的出行、媒体、娱乐、商务、饮食、住宿、社交等用户日常的方方面面;同时,将车与智能家居设备、电视、手表、传感器、无人机等多IoT终端的万物连接互通。

4. 人性化交互方式

擎AI语音平台产品不仅是一个生活助理,也是生活伴侣。通过用户偏好分析,融合图像识别、手势交互、情绪感知等多感官融合交互方式,实时、贴心地为用户推送生活提醒、推荐各种生活服务。

5. 极致体验

擎AI提供快、准、稳、清的极致用户体验,打造出极致体验的语音产品,超出同行产品。

具体体现在:导航搜索快,30秒内可以达到22次导航POI检索;环境噪音90分贝,说话在45分贝左右,One-Shot的识别率准确率接近100%;语音发长文本消息不仅能够智能断句,并且可以做到说多快就能响应多快;语音交互设计清晰等方面。

以秒为单位保证车机端语音服务可靠性

1)语音识别从用户开始说话到首字反馈时间在800ms以内,用户说话结束到全部识别结果反馈时间在75ms以内;
2)语义解析的反馈时间稳定在150ms以内;
3)CP反馈时间90%稳定在1s以内;
4)设备长时间运行(24H以上)时,唤醒率、识别字准率保持在95%以上;
5)擎AI资源占用上,内存稳定在200MB左右,系统资源占用极低,节省设备硬件成本;

7*24H自动化监控保障语音平台稳定性

擎AI语音平台采用7*24H的自动化监控,针对平台服务的语音识别、语义解析、技能服务、CP返回结果维度的准确率、正确性、响应时间进行实时监控,保障了语音平台的稳定性。

十年深耕,博泰擎AI平台现已具备业界领先的语音多轮交互能力,支持上下文继承,场景切换,多轮挽留,指代消解等特性。使得多轮生态交互过程中更为顺畅和贴近实际的对话模式。擎AI语音平台支持多NLU平台的接入,通过自行开发的中控系统实现了语义仲裁;中控服务能够结合终端提供的场景化数据和用户个性化数据,以及NLU平台返回的语义结果进行综合研判,选择最合理的结果返回给用户,能够最大程度的保持会话的连续性和准确性。

据悉,擎AI下一代产品将基于大数据,采用深度神经网络,持续优化迭代,融合语音、图像、视觉、手势、情绪等多模态交互方式,成为耳聪目明,有情感,懂关怀,自学习,陪伴一起成长的情感伴侣。未来,博泰车联网所有项目的量产车型均会搭载擎AI语音平台。
业务联系

填写此表格即表示您同意博泰就此咨询与您取得联系。

业务合作描述


通过提交此表格,表示您同意博泰根据博泰隐私声明,
收集和使用您的个人信息,同时表示您同意博泰就此咨询与您取得联系。

联系我们 了解详细
选择语言
为了更好的体验,请使用竖屏浏览