您的位置:主页 > 知识资讯 > 知识分享 >

对话式人工智能操作系统DuerOS系统

知识分享 / 2021-05-12 16:30

对话式人工智能操作系统DuerOS系统

利用自然语言来控制家庭场景的设备来为我们服务是一种很令人期待的体验,使用智能语音设备等家庭智能终端来实现智能家居中的设备控制是最优的选择。随着智能家居的普及和发展,家庭购买的智能设备品牌、品类多种多样,不同平台的产品很难实现统一的语音控制,究其原因主要有以下几个问题:1)智能家居中的设备多种多样,在家庭中的设备品类大多都只有一个,单一厂商无法提供完整的智能家居方案控制所有设备;2)由于厂商的账户壁垒,依靠某一品牌的设备控制其他品牌的设备有天然的屏障,专注于做语音控制设备的厂商无法通过语音赋能给其他品牌的设备;3)同一个品类的不同品牌产品,实现的私有协议差别很大,想要实现智能语音控制,必须要针对同一个设备品类定义通用的协议。智能家居场景需要一个完整的解决方案实现各种智能设备的互联互通,当前互联网巨头们纷纷加入,试图通过定制应用层协议来解决与IOT设备互联互通的问题。基于以上问题,提出了一种能够支持语音控制,满足多种设备品类、多种交互场景的智能家居解决方案。课题关注的研究内容及创新有以下几点:1)构建一个基于语音控制的智能家居系统方案。该方案能够适用于各种基于端协议实现的设备控制,通过系统架构设计,让系统支持横向扩展;2)基于OAuth2.0授权协议构建一套三方账户授权方案。支持不同品牌厂商的账户鉴权,同时满足不同设备不同能力的有限开放;3)定义一套通用的设备互联互通协议。该协议能够支持设备发现、设备绑定、设备控制、设备管理、设备场景设定等多个关键流程,同时满足语音控制和手动控制两种使用场景。 
 
基于语音控制的智能家居系统方案相关设计模块繁多,既要包括提供语音控制的主控设备端,又要能够覆盖家居场景的所有被控设备。而且被控设备的端连接方案比较多,例如基WIFI组网、蓝牙(BLE)组网、Zigbee组网、红外遥控等。对当前国内较为流行的DuerOS系统进行了深入剖析,确认使用DuerOS系统作为语音控制的主控端;DuerOS系统。DuerOS是百度SLG事业部研发的一套对话式人工智能操作系统,这是百度全球领先人工智能技术的重要应用之一。DuerOS拥有海量数据,能通过自然语言完成对硬件的操作与对话交流,借助百度强大的信息服务为用户提供完整的服务链条。作为一个开放式的操作系统,DuerOS通过云大脑实时进行自我学习使机器掌握人类的语言能力。搭载DuerOS系统能力的“智慧芯片”,具备低成本、低功耗、高度集成等特点,广泛被应用在智能玩具、蓝牙音箱、智能小家电等多种设备,极大的降低了合作伙伴的使用成本。DuerOS对话式人工智能系统人工智能的发展依赖于超大规模的神经网络,万亿级的参数,上千亿样本的人工智能算法,数十万台服务器和大型GPU集群的计算能力,数十亿和数百亿的数据;DuerOS建立在语音识别、自然语言处理、图像识别、用户画像等世界领先的技术能力之上,是人工智能技术的集大成者。DuerOS能让设备具备人机交流的能力,搭载DuerOS的设备能够让用户以自然语言进行交互,实现设备控制、情感交流、信息查询、链接服务、日程管理等10大类目的250多项功能。借助强大的云端大脑,DuerOS可以不断学习进化,变得越来越“聪明”。可以为不同行业的合作伙伴赋能,广泛适用于音箱、手机、车载、机器人、电视、冰箱、可穿戴等多种设备及场景。借助开放共赢的合作生态理念,DuerOS目前己与国内外多家企业达成战略合作。
DuerOS系统的技术框架DuerOS智能操作系统的整体设计架构分为三层:中间层为对话系统;最上层为智能设备开放平台;最底层为技能开放平台。对话系统作为DuerOS的核心层,涵盖了从语音识别到语音播报再到文字上屏显示的一个完整交互流程,在其背后是支撑交互的自然语言理解、对话状态控制、自然语言生成、搜索等等核心技术,这些技术同时也支撑着上下两层的实现。智能设备开放平台是应用层,主要体现为包括核心接入组件、麦克风阵列、芯片模组等开发套件,以及结构设计、工业设计、音腔设计在内的参考设计方案。技能开放平台作为系统的能力层,主要面向开发者,开发者可以通过平台提供的技能工具,来创建并发布基于DuerOS的技能。三层之间的结合处,分别是对话服务和技能框架两个接口,是当前DuerOS的核心接口,前者体现DuerOS的终端能力,为终端设备提供各项支持请求,后者体现DuerOS的技能开发能力,为第三方开发者丰富的创建方式。
DuerLink协议及轻量级设备接入DuerOS为设备厂商、模组厂商、硬件开发者提供端到端的一站式硬件设备接入方案DuerLink,将语音交互能力赋予各类轻量级设备。DuerLink提供无线网络配置、配对(设备发现与账户绑定)、APP或DuerOS设备控制音箱、音箱控制其它设备等基础功能。让开发者可以方便地将DuerOS的强大语音交互能力移植到自己的轻量级设备中,并研发相应的控制APP。于开发者而言,平台不仅提供了OTA、日志、统计分析、应用配置等运行管理服务,还可以通过DuerOS定制化自定义语音交互服务。