本文摘自飞象网,原文链接:http://www.cctime.com/html/2022-11-22/1636195.htm,侵删。
伴随5G+AICDE技术的不断发展,智慧家庭进入加速发展阶段,一个全新的智慧家庭时代正在来临。在家庭数字化浪潮背景下,科大讯飞积极用AI赋能行业生态,用人工智能助力智慧家庭产业走向新高度。
11月19日,由科大讯飞主办的全球1024开发者节AI+家庭论坛在合肥奥体中心成功举办。本次论坛以“聚力AI 智连万家”为主题,围绕数字时代的新形势、新发展,现场嘉宾分享了智慧家庭领域的最新实践与前沿思考,共话数字化家庭的未来,见证“AI+家庭”的创新前行之路。
会议现场,科大讯飞副总裁朱家泉发表了题为《多模态融合,大屏进入交互新时代》的精彩演讲。
以下是演讲内容分享:
各位现场的嘉宾朋友们,线上线下的合作伙伴和开发者们,大家下午好!
很高兴今天又能在1024舞台上跟大家分享,目前科大讯飞基于大屏交互的合作进展以及取得的新成果。
机遇:大屏交互从语音迈入多模时代时机已经成熟
首先跟大家分享一下电视大屏人机交互发展历程。从1925年第一台电视开始,直到1955年电视才首次出现红外遥控,历经了大半个世纪。讯飞和长虹在2015年才在国内首次做出智能语音遥控电视。从2015年开始,讯飞和业界很多合作伙伴一直都在致力于如何能够提升电视大屏的人机交互体验,我们于2018年开始跟广科院设立联合语音创新实验室,致力于把最好的语音体验提供给中国的电视用户。3年前,2019年的1024大会,讯飞携手诸多合作伙伴一起向业界推出了国内第一个电视大屏语音操控系统iFLYHOME OS。截止到现在,我们有什么具体的新进展呢?
首先来看一组数据,当前讯飞和国内的主流运营商、互联网电视厂商,以及很多的智能终端合作伙伴一起携手合作,把整个iFLYHOME OS推向了千家万户。截止到今年11月,在电视端累计的语音用户数超过2.1亿,日语音交互次数达到1.5亿,累计语音交互次数突破600亿次。正是因为合作伙伴与讯飞的共同努力推动,应该说中国的电视大屏正式迈入了语音交互时代。
但是伴随我们的用户和使用次数的增长,我们也在实际的运营和访谈中发现,当前的语音交互还有很大的不足。对用户来说,从交互体验到应用服务,有很多个性化、特性化和多样化的需求还达不到满足,尤其是很多用户觉得现在的人机交互不够自然,没有情感。另外在服务领域,除了影视服务之外,在教育、康养、健身、家庭办公等多个领域的应用服务也没法提供。诸多的体验和服务的不满足,都是当前我们在人机交互领域还需要进一步提升的关键因素。
从市场环境来看,用户侧,一方面现在摄像头、远场设备,包括正在推出来的儿童陪护机器人,还有健身镜,基于用户多模态的语音交互使用习惯,我们觉得已经逐步养成。讯飞侧,AI技术不断成熟,从语音、视觉、认知三大块方向有超过100多项核心技术,已经开始逐步应用和研发,这种市场环境下,我们觉得中国电视大屏人机交互发展需要迈入一个新时代。
因此,今天讯飞联合中国移动、中国电信、中国联通、广科院等合作伙伴,我们一起在“1024开发者节”这个重大的活动当中,向业界发布科大讯飞iFLYHOME OS 2.0,来助力电视大屏的人机交互,从语音正式迈入多模态新时代。
在业界,讯飞第一个将以虚拟人为媒介的强视觉多模态交互系统搬上电视大屏。它相对于传统的人机交互,在能听、会说、使用效果层面上得到了极大的提升,同时我们也把能聊、会认、安全等更大的创新功能能力叠加到了iFLYHOME OS 2.0当中,使得我们的大屏虚拟人真正能做到“能听会说、能看会认、能理解会思考”。
在能听层面上它有什么样的新的能力提升呢?
我们的2.12亿用户一直有一个问题困扰着语音提供商,那就是方言。中国有诸多的方言体系,虽然讯飞现在在电视端已经支持20多种方言,但是有一个场景始终没法满足,电视的终端是在家庭下,不是私人终端,它是合家欢的终端,使用的场景有孩子、老人、年轻人,每个人在人机交互中的语音使用习惯不同,老年人偏向于方向,孩子偏向于用普通话。但是在业界现在的解决方案中,基本上都是需要用户手动切换识别引擎,讯飞在满足家庭多代同堂的场景下率先提出了混合识别,我们现在支持7种方言的免切换,使得在合家欢的场景下所有的用户都可以用自己熟悉的语言习惯,和我们的电视进行人机交互。
另一个大幅度的能力提升是降噪,一旦把远场识别功能加入了,在客厅环境下它有很多复杂的噪声,包括电视机声音、厨房声音以及家里电器的声音,有人说一用扫地机器人,语音识别就不行了,因为它太吵了。讯飞使用最新的多模降噪技术,把多模态的语音进行合理分离,充分解决了在客厅场景下这种复杂噪音的问题,较传统的降噪有50%的效果提升,94%的平均准确率,使得我们远场交互真正在家庭场景下能够得到使用,使得家庭使用更舒心。
相关阅读 >>
moka发布首个AI原生hr saas产品 “moka eva”
毅能达pos机全国24h客服电话大全已更新2023/2/28(实时/更新)钟薛高发布sa'saa系列冰棍新品,称由AI打造,定
长城播报 直通冬奥|AI+监控:北京启动人工智能技术巡查文物
AI太强,人类危险?马斯克、图灵奖得主紧急呼吁暂停gpt-4模型后续研发
cpu大牛、zen之父jim keller被传将加入三星 研发AI处理器
更多相关阅读请进入《AI》频道 >>