2007com太阳城集团-79890.com-澳门太阳城集团2007
当前位置: > 关于讯飞 > 新闻中心 > 讯飞动态 > 正文
关于讯飞

重大突破 | 又是科大讯飞!戴得机器语法检错桂冠上的明珠,哈工大讯飞联合实验室夺中文语法诊断大赛全球冠军!

宣布时间:2018-07-27 来源: 点击次数: 作者:

字号:

      之前写作文,师长教师改语病,如今,AI便能揪出问题。正在语病纠错的武林江湖里,中文又比英文忧伤多最近,一场经过历程AI检测中文语病的“中文语法错误自动诊断大赛”上,哈工大讯飞联合实验室戴得桂冠



中文语法错误自动诊断大赛官方网页


      第五届中文语法错误自动诊断大赛(Chinese Grammatical Error Diagnosis,简称 CGED)朴直正在澳大利亚墨尔本举行。本届CGED评测的参赛者可谓能手如云,团队包含中国社科院、阿里巴巴、北京大学、哈工大讯飞联合实验室(下文简称HFL)等,究竟由HFL竞得冠军。,


外国人写的中文错句做考题

新增“语病修正”项获最高分


      写完一篇作文,语文老师批改时从里面选出过剩的词、缺少的词、应用不当的表述、和语序短亨的表述,然后一一改正过来。这样的场景,现在曾成为一场世界性的比赛——中文语法错误自动诊断大赛(简称CGED)(比赛官网:http://www.cged.science),往年第五届的评测大会于7月19日正在澳大利亚墨尔本举行,那场比赛究竟由哈工大讯飞联合实验室戴得桂冠。


      比赛体式格式是,主办方挑选了一些外国人写作的中文句子片段,让参赛者经过历程人工智能算法技术对其中的语法语义缺点住手识别并住手系统性能评价。



往年共13个团队列入CGED评测


      所选“考题”有四种缺点类型,具体包含多词、缺词、用词不当和语序不当。


      比赛从四个维度对参赛者的才气住手评价:语病识别(即:识别句子是否是有毛病)、语病分类(识别具体的缺点类型)、语病定位(识别缺点的位置和类型)、语病修正(关于缺词和错词,供给修正的提议)。一共有13个团队列入了这项比赛。


      正在那四项效果中,哈工大讯飞联合实验室得到了后三项的第一名、以落选一项的第二名,整体排名第一,首次参赛便戴得冠军。,1604.net


      值得一提的是,客岁的比赛只要三项效果,第四项“语病修正”是往年才增加的比赛分项。和客岁相比,除“指出问题”,借供给“处置惩罚答案”,其难度更上一级。正在“语病修正”的任务中,正在“第一候选”或“前三候选”项,HFL告别获得0.1723分和0.2527分,以绝对争先的效果排第一名。也就是说,正在13个参赛团队中,HFL做语法改错题效果最棒。



正在最易的“语病修正”比赛分项中HFL戴获第一名


      为什么可以或许正在“语病修正”任务中斩获佳绩?


      科大讯飞研究院北京分院副院长、哈工大讯飞联合实验室主任助理付瑞吉理会,因为参赛系统回收了端到端的神经网络模型取辞汇点互信息相结合,将语病位置空出,凭证上下文和语病信息关于该位置正确的辞汇住手推想。


纠错语法AI冠军如何诞生?
经过历程神经网络序列标注模型生成

      如何区分“静静的顿河”与“静静天等待”那两个短句中,“的”和“天”有何辨别?哈工大讯飞联合实验室出品的AI神器就能做得到!靠的是对神经网络序列标注模型BiLSTM-CRF住手刷新。

      付瑞吉理会,此次HFL的AI可以获得冠军,有赖于对神经网络序列标注模型BiLSTM-CRF住手刷新,包含底层的悉数模型、单模型内部的领悟、模型中的领悟三大板块。具体而言——

      第一,将词向量、统计、先验的语法常知趣领悟,如汉语言语习俗用法等统计特性,比如“静静的顿河”和“静静天等待”中组织助词“的”和“天”的应用会凭证上下文的词性而决意;

      第二,回收模型内部领悟的技术,将多个BiLSTM单模型的输出加权领悟,再经过CRF谋略究竟结果;

      第三,回收了模型拔取、模型排序等内部领悟方法,发挥了差异模型的下风。

      整体来说,这三项“黑科技”让哈工大讯飞联合实验室出品的AI可以获得更好的语感,从而戴冠。


HFL语法检错技术框架图

中文比英文语病纠错难度大许多

语病纠错应用前景广泛


      需求说明的是,正在语病纠错领域,中文比英文难度大许多。那主要由两个启事决意的:第一,英语语法类型,有严肃的主谓宾;第二,英文蕴蓄的语料薄弱,剑桥大学曾蕴蓄了上千万个句子。

      相较之下,中文语法灵活,语病检测的技术难度下许多,而且如今列入评测的语料库只要3万多个句子,语料量亟待扩大。

      以是,如今英语语法纠错曾有成熟的应用,而中文的语法纠错借处于络绝蕴蓄和探讨的阶段。从现在的评测结果来看,如今的技术指标借对比低,离实际应用尚需时光。

      值得期待的是,无论是学习外语,还是文稿的错字校订,此次参赛获奖的语病检测和修正技术未来都将有广泛的应用前景。

      据悉,为了推动这项技术的发展,赛事主办方曾将全心标注的历届比赛数据悉数开源,付瑞吉说,“我们对主办方的科学奉献精神表示感谢!也希冀更多的研究者能够大概加入到该任务中去,合营推动技术进步”。

HFL“牛”正在那里?
构造“讯飞超脑”让机械能晓畅会思考


      哈工大讯飞联合实验室(HFL)是科大讯飞针对“讯飞超脑”项目希图,重点引进和构造的中央研发团队之一,由科大讯飞AI研究院与哈尔滨工业大学社会谋略与信息检索研究中心(HIT-SCIR)正在2014年合营创办。



      凭证联合实验室竖立企图,双方将正在言语认知谋略领域住手暂时、深切合作,具体睁开阅读晓畅、自动阅卷、类人答题、人机对话、语音识别后措置责罚、社会舆情谋略等前瞻课题的钻研。

      钻研重点将突破深层语义晓畅、逻辑推理决定企图、自主学习退化等认知智能关键技术,支撑科大讯飞实现从“能听会讲”到“能晓畅会思考”的技术跨越,并盘绕教育、司法、金融、人机交互等领域实现科研成果的规模化应用。如今,HFL有语文评阅、阅读晓畅、智能司法、社会谋略等钻研倾向。

      2017年7月、10月和2018年1月,哈工大讯飞联合实验室的阅读晓畅钻研组(HFL-RC)在业内公认的机器阅读晓畅顶级赛事斯坦福SQuAD挑战赛中前后夺得三次第一名。2018年2月,获得国际语义评测(SemEval 2018)阅读晓畅任务第一名。

      此次获得CGED大赛的是HFL语文评阅钻研组,其研发的作文自动评阅技术经过历程自动学习人类专家的评分标准,对纸笔考试作文从字迹工整度、辞汇丰富性、句子通行度、文采、篇章组织、立意等多个维度综合评价。如今,作文自动评阅技术以帮手野生住手评分质检等应用体式格式,已正在世界多天考试中应用,掩饰考生数百万人



科大讯飞作文自动评阅技术框架

CGED大赛【考题类型】
看看您强还是AI强?


      M(missing word)错词
      缺点:人战胜了饥饿,才用功为了下一代做更好的、更健康的东西。
      正确:人战胜了饥饿,才能用功为了下一代做更好的、更健康的东西。

      R(redundant word) 多词
      缺点:我根蒂根基不克不及晓畅那妇女辞职回家的现象。正在这个时代,为什么放弃自己的事变,便回家当家庭主妇?
      正确:我根蒂根基不克不及晓畅妇女辞职回家的现象。正在这个时代,为什么放弃自己的事变,便回家当家庭主妇?

      S(word selection) 用词不当
      缺点:我根蒂根基不克不及了解妇女辞职回家的现象。正在这个时代,为什么放弃自己的事变,便回家当家庭主妇?
      正确:我根蒂根基不克不及晓畅妇女辞职回家的现象。正在这个时代,为什么放弃自己的事变,便回家当家庭主妇?

      W(word order)语序不当
      缺点:饥饿的问题也是该当处置惩罚的。世界上每天由于饥饿许多人死亡。
      正确:饥饿的问题也是该当处置惩罚的。世界上每天许多人由于饥饿死亡。


科大讯飞AI
连获多项“世界第一”


      2017年,国际语音剖析大赛全新无看管MachineLearning任务第一名;


      2017年-2018年,三次刷新机器阅读晓畅领域威信评测SQuAD世界纪录;

      2017年10月,刷新自动驾驶领域威信国际评测Cityscapes世界纪录;

      2018年,声音模仿领域 Voice ConversionChallenge获得第一名;

      2018年2月,机器阅读晓畅领域第十二届国际语义评测比赛(International Workshop on Semantic Evaluation, SemEval 2018)第一名;

      2018年3月,正在由国际医学影像顶级会议ISBI举办的IDRiD眼底图理会竞赛中,科大讯飞正在最显示机器帮手医生诊断才气的病灶分割任务中最难的子项“MA分割任务”获得第一;

      2018年4月,正在由国际学术顶会ICPR举办的图文识别挑战赛 MTWI Challenge中,科大讯飞取中科大语音及言语国家工程实验室联合团队正在悉数三项比赛任务上获得第一;

      2018年7月,正在2018国际语音剖析大赛的比赛中,科大讯飞报支的参赛系统戴得10个测评打分项目中的9项第一,成为“最全能的冠军”,科大讯飞已正在该项比赛中连续十三年夺冠。

闭 闭
上一篇:曾是第一篇了 下一篇:A.I.· 大数据 共创教育美好未来——全球人工智能与教育大数据峰会·2018隆...-澳门太阳城集团2007
2007com太阳城集团
澳门太阳城集团2007
79890.com