.
【前沿科技】科大讯飞AI技术助力信息无障碍 ——依靠科技来解决信息无障碍问题
注册用户 0 广东
发布:2024-01-07 (12:02:02) 编辑


【前沿科技】科大讯飞AI技术助力信息无障碍 ——依靠科技来解决信息无障碍问题


 摘要:本文对科大讯飞如何充分发挥人工智能(AI)技术优势最大广度和最大深度地降低障碍群体获取信息的难度,更好地服务障碍群体提出解决方案。


 关键词:信息无障碍;人工智能(AI);语音识别;语音合成;语音交互


 依靠科技来解决信息无障碍问题,不仅符合国家战略,而且也能切实、经济、有效地为更大范围的特殊群体提供无障碍服务。这就需要核心技术能够产业化落地、产品设计上融入信息无障碍元素。同时,科技企业在践行社会责任时除了拥有技术与产品外,还应抱有公益情怀。


 一、信息无障碍事业相关背景


 信息无障碍是指任何人在任何情况下都能平等地、方便地、无障碍地获取信息、利用信息。随着互联网在生活中的重要性日益凸显,听障人士和健全人一样享受信息的快捷和方便已成为一种发展趋势。党中央、国务院高度重视无障碍环境建设工作。习近平总书记强调,要重视无障碍环境建设。李克强总理在政府工作报告中提出,要加快无障碍设施建设、支持无障碍环境建设。


 目前,我国残疾人总数约为8500万人,老年人口数量近2亿,且老龄化程度不断提高。实现信息无障碍,不仅关系到让残疾人获得更多的教育、就业机会,也关系到如何应对即将到来的人口老龄化问题。同时,信息无障碍对于缩小数字鸿沟也具有积极作用。因此在人工智能技术日益强大的情况下,如何充分发挥其最大优势,最大广度和最大深度地降低障碍群体获取信息的难度,更好地服务障碍群体,就显得尤为重要。科大讯飞一直致力于利用AI技术帮助障碍群体更加方便快捷地获得信息,共享发展成果。


 二、信息无障碍建设需求


 1.信息障碍原因分析


 (1)语种不同造成的信息交流障碍。随着“一带一路”政策的广泛影响,沿线国家之间的交流日渐增多。“一带一路”沿线国家拥有各自的语言,造成彼此间交流不通畅,而全面的开放和接触带来的翻译需求,仅依靠传统的人工翻译目前已经很难满足。


 (2)多民族语言造成的信息交流障碍。中国有五十六个民族,大部分民族拥有自己的语言和文字。通畅的交流是民族稳定、国家和谐发展的基础。少数民族语言与汉语言之间的互译对增进民族交流、促进民族和谐具有重要意义。


 (3)各地方言造成的信息交流障碍。中国地大物博,仅科大讯飞AI技术助力信息无障碍/165汉语就拥有众多口音,如东北、四川、河南、安徽、浙江、广东等。各地不同的发音习惯造成了相互之间交流不畅。依靠人工智能技术可以实现汉语不同口音之间的顺畅交流。


 (4)听障人士信息获取困难。听障人士很难像正常人一样通过语音获取信息,无法通过语言进行正常交流,这些都给他们的日常生活带来了极大的不便。


 2.信息无障碍场景


 (1)日常交流。随着全球化趋势的到来以及“一带一路”政策的深入推进,中外企业、民间团体之间的交流越来越多,导致翻译需求急增。企业日常办公交流、民间团体互访、个人旅游等场景,翻译精准度要求并不高,但是人工翻译的成本及人力均难以支持。因此可以通过机器翻译、多轮交互的方式来完成沟通。


 (2)公共服务信息交流障碍。智能语音技术在政府办事大厅、机场和高铁服务柜台、旅游景点服务站、货运快递等公共服务场所应用后,能有效提高公共服务信息交流效率。在涉外、民族语言互通方面也有很大作用。特别是对听障人士信息交流方面的作用有更加显著。


 (3)特殊教育信息交流障碍。听障人士在学习过程中会遇到一些困难,以语音文字为主要交流手段的传统教学方式就不能很好地实施。如果能把语音转写技术融入特殊教育教学场景,就可以很好地解决听障人士的教学工作。


 (4)听障人士的文娱交流障碍。听障人士在观看电视节目、网络直播、体育赛事时,因不能及时获得节目内容信息而影响了观看体验。使用语音转写技术后,文字就可以展示在直播页面上,能有效帮助听障人士及时获取节目内容。


 三、科大讯飞AI技术助力信息无障碍


 1.信息无障碍落地应用的前提是跨越技术鸿沟


解决信息无障碍涉及的AI技术有语音识别技术、语音合成技术、语音交互技术等。科大讯飞作为中国智能语音与人工智能产业领导者,长期从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究,并保持了国际前沿技术水平,还积极推动人工智能产品研发和行业应用落地,致力于让机器“能听会说,能理解会思考”。自20世纪90年代中期以来,科大讯飞在历次国内外语音合成评测中,各项关键指标均名列第一。2008年至今,科大讯飞连续在国际说话人、语种识别评测大赛中名列前茅。近年来,科大讯飞还多次在机器翻译、自然语言理解、图像识别、图像理解、知识图谱、知识发现、机器推理等各项国际评测中占据榜首位置。


 科大讯飞是目前我国唯一以语音技术为产业化方向的“国家863计划成果产业化基地”“国家规划布局内重点软件企业”“国家高技术产业化示范工程”。“国家智能语音高新技术产业化基地”“语音及语言信息处理国家工程实验室”也先后落户科大讯飞。科大讯飞被原信息产业部确定为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。


 科大讯飞两次荣获“国际科技进步奖”及中国信息产业自主创新“信息产业重大技术发明奖”。2017年6月,《麻省理工科技评论》发布2017全球50大最聪明公司榜单,科大讯飞首次入榜,并名列全球第六、中国第一;2019年再度入榜。2017年11月,科大讯飞入选首批国家四大新一代人工智能开放创新平台。2017年12月,科技部明确依托科大讯飞建设认知智能国家重点实验室,这是我国在人工智能高级阶段———认知智能领域的第一个国家级重点实验室。




 2.在产品端的实现上,信息无障碍应是必选项


 (1)讯飞听见APP。讯飞听见APP使用科大讯飞最新的语音转写和翻译技术,通过手机拾音器将说话人的声音转写成文字,并展现在屏幕上,让听障人士能通过手机端迅速获取沟通信息。同时,讯飞听见APP还支持翻译功能,让听障人士与外宾交流变得有可能。手机APP的承载形式让听障人士的沟通成本变得非常低。


 同时,为了兼顾残障人士的试用体验,讯飞听见APP对产品界面和功能进行针对性优化,包括转写结果全屏显示、文字大小缩放、页面自动横屏等,大大提升了残障人士的用户体验。讯飞听见APP上线后获得残疾人朋友的认可。讯飞听见APP为听障人士免费提供实时语音转文字服务,帮助听障人士用文字去感受世界,进行日常沟通。获取使用方式很简单,上传残疾人证即可免费申领服务。




 (2)讯飞翻译机。讯飞翻译机能为旅游用户提供实时的公有云翻译服务,采用神经网络机器翻译、语音识别、语义理解、语音合成、图像识别、离线翻译以及四麦克风阵列等多项全球领先的人工智能技术。讯飞翻译机支持语音对话翻译、拍照翻译、离线翻译等翻译模式,特别支持方言翻译,并推出全球上网、口语学习、SOS等服务,为跨语种信息沟通提供了良好的产品支持。


 (3)讯飞听见M1。听障人士在参加会议及多人交流时更加不方便,无法在第一时间获得发言人的准确信息,导致信息不能及时同步,严重延长了决策时间,影响了沟通效率。有时候可能会遗漏或错误理解发言人信息,导致信息不准确,产生信息偏差,对决策产生严重的影响。讯飞听见M1与讯飞听见APP的组合完美解决了多人交流场景的沟通,将所有发言人的信息依次显示在手机APP屏幕上,让听障人士能在第一时间准确获取发言人信息,为其准确决策提供依据。




 讯飞听见M1是一款以专业录音、实时语音转文字及翻译为核心功能的智能硬件。无缝连接讯飞听见APP,支持远程控制硬件设备,扫码分享实时转写内容。可满足会议内容多终端同步、访谈记录快速出稿、外教课程实时翻译等多场景的录音整理需求,全面提升工作效率。讯飞听见M1采用7+1环形麦克风,能清晰准确地记录发言人的信息,在嘈杂的场景下也能达到很高的识别率。支持录音转写,即使无法亲临会议现场,也可以通过会后转写来了解会议详细内容。


 (4) 讯飞听见L1。听障人士在复杂会议场景下进行交流尤为困难。在没有声音帮助理解的情况下,处于培训会、分享会、远程视频会议等场景中,听障人士很难理解发言人的准确信息。讯飞听见L1是一款以多功能视频会议、实时语音转写及翻译为核心功能的高端智能设备,具有语音转写及翻译、文档分享、远程会议白板及远程会议文档分享功能。将会议内容通过声音和文字两个维度表达出来,相比于声音的即时性,文字记录更持久,文字信息获取的准确度更高,从而让听障人士在复杂会议场景下也能和正常人士一样获取信息。同时,讯飞听见L1提供的翻译功能,让听障人士参加外文会议变得有可能。设备部署在公共服务场所的问询台、高铁车站的售票窗口及医院、邮政、政府等服务窗口,能帮助听障人士很好地解决信息沟通障碍问题。讯飞听见L1还能为企业涉外交流、企业培训、产品发布、远程会议、远程汇报、远程面试等多个场景提供专业的转写和翻译服务。




 (5)讯飞听见智能语音课堂系统。自1951年将盲聋教育纳入国家教育体系、设立特殊教育学校以来,聋哑教育运用特殊方式和设备,如口语、书面语和手语相结合的办法以及直观教具、助听器等进行教学,在聋哑人教育方面取得长足进步。同时也存在一些不足,如手语教学表达内容单一、手语交流易出现歧义、完全丧失听力的聋哑人无法借助助听器等。2015年底,讯飞听见推出针对聋哑人教育场景的智能会议系统——讯飞听见智能语音课堂系统,解决特教教学场景下的教学障碍,将老师的教学语言通过系统实时转写成文字,直接用投影大屏幕输出显示,在教学过程中保障特教生能够获取全量文字信息,辅助听力障碍学生对教学信息进行理解,有效提升教学成果。最终效果如下图所示:


 北京联合大学特殊教育学院,一期部署2个教室,2018年扩建到学院内8个教室。2017年6月13日,央视《焦点访谈》栏目播出了一期《认识无障碍,共享有通途》的节目,对讯飞听见系统在构建无障碍信息交流方面的促进作用进行报道。此系统还成功在南京特殊教育师范学院的30个教室进行教学使用,在宁波特教、扬州特教、杭州聋人学校、西安第二聋哑学校、深圳中学、福州职业技术学院、东盛残疾人中心等特教院校成功应用。


 (6)读屏软件产品。2007年,基于科大讯飞提供的核心语音技术,中国盲文出版社主持研发了新式阅读终端——阳光听书郎。这是一款支持电子书朗读、语音菜单导航的多功能便携硬件终端设备。


 2010年6月,保益互动联合科大讯飞、腾讯科技推出盲人版手机QQ。基于科大讯飞的语音合成技术,盲人版手机QQ可以与读屏软件完美匹配,能够朗读手机QQ中的汉字、英文、数字以及表情符,从而让视障人士通过手机QQ与好友进行即时沟通交流。


 2014年,争渡软件正式与讯飞语音云团队达成公益合作,为争渡软件提供讯飞语音的技术接口,让上百万的盲人朋友受益,体验到讯飞清晰的语音服务。


 四、科大讯飞信息无障碍公益活动


 1.盲人聋人信息无障碍需求咨询对接研讨会 2017年1月17日,由中国盲协、中国聋协主办,清华大学无障碍发展研究院、科大讯飞公司联办的“盲人聋人信息无障碍需求咨询对接研讨会”在京召开。科大讯飞公司展示了目前处于世界领先水平的语音技术和人工智能技术以及为实现盲人聋人信息无障碍所做的科研工作。与会的盲人代表、聋人代表畅谈了使用信息产品后的体验感受,表达了盲人聋人在信息无障碍方面的个性化迫切需求。与会专家及代表就目前信息无障碍发展状况、取得成效、盲人聋人群体对信息无障碍需求建议以及信息无障碍科技研发、标准化制定、应对对策和未来展望等进行了充分研讨,并广泛进行了技术交流。


 相关领导表示,中国残联将不遗余力地继续推动政府部门和行业组织制定有关无障碍环境建设的政策与措施,促进各项措施真正落地见效,实现无障碍基本公共服务均等化。同时,携手清华大学无障碍发展研究院、科大讯飞公司等高端智库和科技行业对接无障碍产品与服务,共同推动盲人聋人信息无障碍工作实现新的局面。


 2.《人工智能+共创新世界》 2017年4月14日,“清华大学-东京大学无障碍发展学术研讨会暨无障碍发展研究院年会”在清华大学举办,来自中日两国160余名专家学者、政府工作人员、社会爱心人士以及爱心企业参与了此次活动。中国残联副主席吕世明、清华大学党委副书记邓卫出席,科大讯飞应邀作为企业代表阐述其在无障碍建设事业中的理念及成果,并发表《人工智能+共创新世界》的主题演讲,重点介绍科大讯飞运用自身智能语音及人工智能的技术优势和行业影响力在无障碍领域的应用探索。未来,科大讯飞将充分发挥自身力量,在新建设施的标准落实、已有设施的有效使用和改造、推进信息获取及公共服务无障碍、提高全社会无障碍意识方面,协调社会各界共同参与无障碍环境建设,协同创新,推动惠及亿万人群的公共服务政策有效实施。


 3.“中国政务信息无障碍公益行动特别贡献单位” 2017年12月21日,中国信息无障碍公益行动启动暨中国互联网协会信息无障碍工作委员会的成立大会在京成功召开。科大讯飞成为首批加入委员会的成员单位。此次大会还为政务信息无障碍公益行动突出贡献单位举行了颁牌仪式,向科大讯飞公司颁发“中国政务信息无障碍公益行动特别贡献单位”奖状。


 4.《Web信息无障碍通用设计规范》 2018年7月24日,由中国互联网协会组织的《Web信息无障碍通用设计规范》立项评审会议在京召开,科大讯飞公司作为项目审定的单位成员参与会议,与相关单位一起共同加快深入开展信息无障碍标准制定和信息无障碍建设工作,尽早帮助6亿多的障碍人士融入信息社会,并呼吁更多的企业关注信息无障碍公益事业,积极参与信息无障碍环境建设,让中国互联网更加文明进步。


 5.全国政协第68次双周协商座谈会 2017年6月9日,时任全国政协主席俞正声主持召开全国政协第68次双周协商座谈会,科大讯飞高级副总裁江涛作为行业专家出席会议并就无障碍信息交流建言献策。讯飞听见作为科大讯飞智能语音及人工智能领域代表应用,向在场的委员们展示了人工智能技术在无障碍信息交流方面的应用前景。为了加快人工智能服务信息无障碍,江涛建议:首先,应加快相关配套政策和标准的制定,将人工智能技术纳入信息无障碍技术规范和标准,并尽快建立相关技术支撑体系,确保政策标准的监督和实施;其次,应扶持和鼓励信息无障碍产业的发展,包括:进一步深化政府及重要社会信息门户实行信息无障碍改造,在公共媒体和公共服务设施上的无障碍信息化应用,让视听障碍人群可以更方便地获取信息服务;再次,大力扶持人工智能技术在特殊教育领域的应用,帮助具有视听障碍的学生上课更方便,享受和健全人一样的教学效果;最后,鼓励企业开发面向残疾人的智能家居、医疗保健系统,积极探索人工智能技术在智能家居、医疗保健上的应用,让残疾人的家居生活和医疗保健更加方便、舒适。


 6.“三声有幸”公益计划 在2017年首届全球1024开发者节上,科大讯飞执行总裁胡郁正式对外发布“三声有幸”公益计划。希望借助拥有公益情怀的开发团队将日新月异的AI技术赋予到公益领域,帮助更多人提升幸福感。AI公益案例落地“三声有幸”,扶持了各类公益产品的顺利落地,不仅为关注公益开发的小伙伴们积累了典型案例,而且让越来越多的特殊人群从AI中获益。音书科技CEO石城川是一位聋人,双耳听力阈值不足120分贝,戴助听器也无任何效果。一般情况下,失去双耳听力的聋人也面临着失去说话能力的高风险,聋和哑几乎是同时存在的。2016年,石城川接触到科大讯飞的语音识别技术,注册成为讯飞开放平台的开发者,并创办了音书科技有限公司。通过识别和转写技术进行语言康复,最终可以流畅地与人对话。虽然失去听力,但人工智能技术的出现让他重新拥有了说话的能力。“三声有幸”项目在接触音书科技后,为其提供了资金、市场和品牌等多方面的扶持。第一,生态扶持。音书科技初期的市场估值为2000万,后期经过“三声有幸”公益项目和创业孵化团队的共同评估,同时结合音书科技的公益创业属性和商业BP,对其追加占股投资。第二,市场扶持。3月22日AI大学未来课栈上海栈亮相全新环节———创意集市,音书科技CEO石城川登场并用5分钟的时间分享了自己的成长经历和创业故事,获得了广泛的媒体关注和报道。第三,技术扶持。音书APP目前支持识别的语言包括粤语、普通话、英语在内共7种语言,而用户来自五湖四海,夹杂着各种方言,现有的音书APP无法做到准确识别。了解到该技术的瓶颈后,开放平台免费为其提供技术支持,帮助其完善功能。


 心智互动是一家聚焦失能人群(部分感官及行为能力消失或退化的人群,如老年人、盲人、视障者等)社交娱乐的科技社会型企业。心智互动在2017年8月推出一款针对盲人的手游“听游江湖”。科大讯飞和心智互动联合开发读屏软件,免费开放,让每一个盲人都能使用智能手机,走进互联网的世界。第一,免费的技术服务。中国目前有1700多万视障人士。在开发读屏软件的过程中,讯飞开放平台提供免费的服务,大大降低了开发成本,缩短了开发测试周期。第二,市场扶持。产品落地后,“三声有幸”项目联合心智互动及中国残疾人康复协会、中国盲文出版社、光明天使基金会等组织联合举办新闻发布会,对产品进行多途径多角度宣传。第三,生态扶持。心智互动目前由两位合伙人共同持股,为了后续更好地进行技术支持,经“三声有幸”和创业孵化团队共同评估后,以技术占股的方式对心智互动进行微占股。


 7.AI无界、公益先行——科大讯飞“无障碍联合实验室”在沪正式揭牌 目前,我国有8000多万残障人士,其中听障人士就超过了2000万。听障人士因为无法接收声音,面临着诸多困境,比如无法与人正常交流、工作困难、自我表达存在缺陷等。久而久之,听障人士越来越难正确有效地与世界沟通,挫败感油然而生,渐渐被有声世界边缘化。为解决听障人士的这些困境,2019年7月27日,中国残联无障碍推进办、中国聋人协会、北京联合大学以及科大讯飞公司在上海诺宝中心签署了关于成立“听见信息无障碍研发与应用联合实验室”的合作备忘,并现场举行了揭牌签约仪式。在第十四届信息无障碍论坛的现场,讯飞听见也提供了智能会展的无障碍字幕上屏展示,无论是现场嘉宾发言,还是现场视频案例的播放,现场都能将实时语音转化为字幕,帮助听障人士了解会议信息。联合实验室的成立,更反映出科大讯飞将AI技术致力于公益的决心。各单位的加入,也标志着越来越多的科技力量正汇聚到“AI公益”这条路上。我们将和各方一道,共同为听障人士铸就梦想。我们相信,联合实验室的成立,会将科大讯飞的技术与服务推到更多听障人士的身边。


 信息来源:科大讯飞


 编辑:燕飞


关闭
关闭

账号登录