搜狗搜索霸榜CLUE任务比赛第一名,彰显NLP技术领域强大实力

近日,搜狗搜刮技巧团队在CLUE(中文说话懂得测评基准)的义务比赛中,击败来自腾讯、华为、美团、阿里、oppo、中科院等有名科技公司和高校,在CLUE总榜、分类总榜、浏览懂得榜单、小模型榜单均获得第一名,刷新业界记录。

“BERTSG”为搜狗搜刮自研模型,“HUMAN”为人类成就(不计入选手)

搜狗搜刮霸榜CLUE义务比赛第一名,彰显强大年夜技巧立异实力

据懂得,国际上常用GLUE作为评估通用 NLP 模型的基准,其比赛排名已成为衡量天然说话懂得技巧程度的重要指标。然而,GLUE基准今朝只能针对英文义务,无法评价NLP模型处理中文的才能。为弥补这一空白,CLUE(ChineseGLUE)应运而生,可谓是“中文版GLUE”,已经成为中文说话懂得范畴最具行业威望的测评基准之一。

今朝,CLUE基于原始的中文文本语料共开设了7个偏向的比赛,由文本相似度、分类、高低文推理、浏览懂得等共11个子义务构成。CLUE欲望集合各大年夜科技企业和科研团队的技巧力量,推动NLP(天然说话处理)基准预练习模型技巧的赓续进步和冲破。

据懂得,搜狗搜刮技巧团队此次在CLUE总榜、分类总榜、浏览懂得榜单、小模型榜单均获得冠军,得益于其在天然语义懂得范畴强大年夜的技巧才能,以及对学术界最新算法的持续跟踪。搜狗搜刮技巧团队的预练习模型采取了多种自研预练习技巧,基于自身海量优质语料构建的练习数据,应用大年夜范围分布式练习平台,练习出了包含从切切参数量级的小模型到数十亿参数的大年夜模型。此外,搜狗搜刮技巧团队还摸索了一套实用语义匹配、分类、和浏览懂得等不合义务的算法,均表示出了优良的后果。

搜狗搜刮NLP技巧成果丰富,加快人工智能持续向实际场景落地

那么,预练习模型的技巧冲破到底意味着什么?我们知道,NLP(天然说话处理)技巧作为人工智能范畴的一个重要成长偏向,其目标是使得计算机具备人类的听、说、读、写、译、问、答、搜刮、摘要、对话和聊天等才能,并可应用常识和常识进行推理和决定计划,最终支撑客服、诊断、司法、教授教化等场景,是以,被业界誉为 “人工智能皇冠上的明珠”。但同时它也具有很高的技巧难度,而今朝技巧难点重要集中在对标注数据依附性较高,导致其难以在标注数据稀缺的义务、说话或范畴内发挥感化。尤其是在中文天然说话模型范畴,更是缺乏大年夜范围高质量的标注数据,是以今朝业界主流采取的一个办法就是采取基于大年夜范围无监督数据的预练习模型,来作为通用说话模型测评的有效弥补,从而促进中文天然说话处理模型的完美成长,最终来加快NLP技巧在家当的应用和落地。

搜狗搜刮在NLP技巧范畴的优势由来已久。除了此次夺冠的预练习模型外,搜狗搜刮技巧团队还在多模态预练习模型也进行了深刻的研究,并在全部搜刮场景中落地从而晋升用户体验。此外,搜狗搜刮在语义懂得、长文本和短文本分类、浏览懂得、问答等NLP技巧范畴更拥有经久领先业界的表示。在此次获得CLUE榜单冠军之前,搜狗搜刮已先后在国际浏览理比赛CoQA等比赛中取得了冠军的成就。

预练习模型技巧已被证实给多个下流义务如文本匹配、文本分类、文本抽取、浏览懂得、机械问答等义务带来大年夜幅的晋升。是以,搜狗搜刮在CLUE义务比赛中的“霸榜”成就,既展示了在预练习模型范畴的丰富成果和技巧冲破,也更周全彰显了搜狗搜刮处于行业领先程度的NLP技巧实力。今朝,搜狗搜刮已经将自研预练习模型应用在搜刮查询懂得、文本语义匹配,内容懂得等方面,有效晋升了搜狗搜刮的应用体验。信赖在将来,搜狗搜刮的相干技巧将有才能在说话翻译、聊天机械人、常识图谱等范畴进行广泛的落地,有助于推动人工智能技巧在国内的成长和应用。