40469太阳集团影戏pp-56011.com-78118太阳城
当前位置: > 关于讯飞 > 新闻中心 > 讯飞动态 > 正文
关于讯飞

科大讯飞认知智能一连突破,机器阅读晓畅SQuAD测试勇夺第一!

宣布时间:2017-07-31 来源: 点击次数: 作者:

字号:

        最近,一场机器阅读晓畅考试的最新效果新奇出炉——由斯坦福大学发起的SQuADStanford Question Answering)挑战赛榜单更新效果,科大讯飞取哈工大联合实验室,新葡京娱乐备用网(HFL)提交的系统模型夺得第一名,那也是中国本土钻研机构首次得到该赛事的榜首。

 

SQuAD挑战赛最新效果榜单

 

      SQuAD挑战赛是行业内公认的机器阅读晓畅标准水平测试,也是该领域的顶级赛事,被誉为机器阅读晓畅界的ImageNet(图像识别领域的顶级赛事)。参赛者来自全球学术界和产业界的钻研团队,包含微软亚洲研究院、艾伦研究院、IBMSalesforceFacebook、谷歌和卡内基·梅隆大学、斯坦福大学等知名企业钻研机构和高校,赛事对自然语言晓畅的行进有重要的推动作用。

 

阅读晓畅题,机器如何考? 

      阅读晓畅是人类考试中必不可少的项目之一,关于机器,又该怎样去作答和评判呢? 
 
       SQuAD挑战赛经过历程众包的体式格式构建了一个大规模的机器阅读晓畅数据集(搜罗10万个问题),就是将一篇几百词左右的随笔给野生标注者阅读,让标注人员提出最多5个基于文章内容的问题并提供正确答案;随笔原文则来源于500多篇维基百科文章。参赛者提交的系统模型正在阅读完数据集中的一篇随笔今后,回答若干个基于文章内容的问题,然后与野生标注的答案住手比对,得出正确婚配(Exact Match模糊婚配(F1-score的结果。

 

SQuAD挑战赛主页 


      SQuAD背参赛者供给演习集用于模型演习,和一个局限较小的数据集作为拓荒集,用于模型的调优和选型。与此同时,,7874.comSQuAD借供给了一个开放平台供参赛者提交自己的算法,由SQuAD官方运用隐藏的测试集对参赛系统住手评分,并正在SQuAD官方确认后将相关结果更新到官网上。得益于SQuAD供给的大规模下质量的演习数据和习以为常的模型,该挑战赛的榜单一次又一次的刷新。如今,科大讯飞取哈工大联合实验室提交的系统模型取得了正确婚配77.845%和模糊婚配85.297%的效果,位列世界第一。

科大讯飞是如何考到全球第一的?,澳门新葡萄娱乐城3648网址

 

      正在SQuAD官网的效果榜单上,可以或许看到科大讯飞取哈工大联合实验室提交的模型名为“Interactive AoA Reader”,这是讯飞经过络绝探究今后提出的“基于交互式层叠注意力模型”(Interactive Attention-over-Attention Model。恰是这个与众不同的模型,让科大讯飞正在全球自然语言晓畅钻研领域脱颖而出跃居头名。

 

40469太阳集团影戏pp

 

2016年,哈工大讯飞联合实验室公布了本次参赛模型的晚期版本

 

      机器阅读晓畅问题的处置惩罚,传统的自然语言措置责罚(NLP)体式格式是回收分拆任务的方法将其分成问题理会、篇章理会、关键句抽取等一些步骤,但这种方法随意马虎构成级联偏向的蕴蓄,很忧伤到很好的效果。

 

      如今正在机器阅读晓畅发域中,则多回收完好端到端的神经网络建模,消弭了分步骤发作的级联偏向。除此之外,回收神经网络的方法能够大概经过历程大量的演习数据学习到泛化的知识表示,对篇章和问题从语义层面上高度抽象化。

78118太阳城

      讯飞一样也回收了端到端的神经网络模型,但把肉体更多放正在如何能够大概模拟人类正在做阅读晓畅问题时的一些方法。讯飞提出的基于交互式层叠注意力模型,主要思想是凭证给定的问题对篇章住手频频的过滤,同时凭证曾被过滤的文章进一步选择出问题中的关键提问点。这样“交互式”天逐步正确答案的范围,与其他参赛者的做法不太相同,究竟收获了令人瞩目的效果。

 

让机器考阅读晓畅,究竟有什么意义?


        科大讯飞认为,人工智能的发展主要分为运算智能、感知智能和认知智能。机器正在运算智能上有极大的下风,正在感知智能上也曾取得了很大的期望,歧语音识别、语音剖析、图像识别、机器翻译等。而正在认知智能方面,自然语言措置责罚一直是实现人机交互、人工智能的重要技术基石,机器阅读晓畅恰是那一领域的一个钻研中心。一样,让机器实现“能听会讲”到“能晓畅会思考”,也一直是科大讯飞所肩负的义务和倾向。

 

       早在2014年,科大讯飞取哈尔滨工业大学便联合竖立了却合实验室,作为“讯飞超脑”希图的中央研发团队之一,联合实验室致力于正在言语认知谋略领域住手暂时、深切的技术创新,重点突破深层语义晓畅、逻辑推理决定企图、自主学习退化等认知智能关键技术,并盘绕教育学习、人机语音交互、信息安全等领域实现科研成果的规模化应用。

      联合实验室不但能让机器正在阅读晓畅比赛中“考出高分”,还能让机器给考卷的主观题评分。以语文考试的作文为例,正在阅卷之前先生们先置一套通用的打分标准,包含字迹工整度、辞汇丰富性、句子通行度、文采、篇章组织、立意等多个层次,研究人员让机器去学习那套企图后住手阅卷。那每一项标准背后皆需求精密重大的技术支持,比如手写识别、主题模型、野生神经网络等。

 

56011.com

 

       如今,科大讯飞的齐学科阅卷技术正在四六级、部分省分的高考、中考等大规模考试中住手了试点考据,考据结果注解计算机评分结果曾抵达了现场阅卷师长教师的水平,完好满足大规模考试的需求。这项技术应用到正式考试中,便可以或许帮手野生阅卷,减少人员投入,降低野生阅卷中萎靡、情绪等身分的影响,进一步提升阅卷效率和准确性。

 

       此前,哈工大讯飞联合实验室曾前后正在Google DeepMind阅读晓畅悍然数据测试集、Facebook阅读晓畅悍然数据测试集得到世界最好效果,本次正在SQuAD测试集再获全球最好,经办了机器阅读晓畅威信测试集的“大满贯”。机器阅读晓畅技术具有空阔的应用场景,歧正在产品的精准问答、开放域的问答上都邑起到有力的支撑作用,讯飞也正在络绝探讨机器阅读晓畅技术的应用落地。但关于机器阅读晓畅的“能晓畅会思考”的终极目标来说,现在借只是万里长征的最早,对自然语言的更深层次的归纳、总结、推理,一定是未来机器阅读晓畅弗成缺少的部分。

 

闭 闭
56011.com