百度CTO王海峰的履历上,又多了个「第一」

11 月 8 日,北京会议中心,百度 CTO 王海峰被授予「光华工程科技奖」,成为 AI 产业界首位获此殊荣的科技工作者。这一情景酷似三年前的全国创新争先奖颁奖现场,当时,王海峰是互联网行业的唯一获奖人。


「光华工程科技奖」创立于 1996 年,是中国工程院主管、两院院士朱光亚等人捐资发起的工程科技类奖项,也是中国社会力量设立的中国工程界的最高奖项


该奖项每两年颁发一次,包括「光华工程科技成就奖」、「光华工程科技特别贡献奖」、「光华工程科技奖」三大奖项,旨在对工程科技及管理领域取得突出成绩和重要贡献的中国工程师、科学家给予奖励,激励他们从事工程科技研究、发展、应用的积极性和创造性。在此之前,中国工程院院士钟南山、李兰娟等多个领域的泰斗级人物也曾站上过这一领奖台

今年 6 月份,光华工程科技奖办公室公布了第十三届光华工程科技奖候选人员名单。经中国工程院九个学部及港澳台地区评审委员会的评审,从 296 位有效候选人中产生了进入理事会终评的 39 位候选人,王海峰便是其中之一。

11 月 8 日,获奖人员名单揭晓,王海峰因在人工智能领域、尤其是自然语言处理领域的卓越贡献荣获上述三大奖项中的「光华工程科技奖」。 


截至目前,光华工程科技奖共评选了十三届,有机械、运载、信息、电子、化工、冶金、材料、能源、矿业、土木、水利、建筑、环境、轻纺、农业、医药、卫生、工程管理等十几个不同工程学科的 304 位科学家及一个团体获奖。其中,王海峰是第一位,也是唯一一位 AI 产业界的代表

为什么是王海峰?

为什么是王海峰?很多人可能有这样一个疑问。

王海峰本、硕、博都毕业于哈尔滨工业大学,师从 ACL 终身成就奖获得者、哈工大教育部语言语音重点实验室主任李生,中国工程院院士、北大信息科学技术学院院长高文等研究者。毕业之后,他先后在微软中国研究院、东芝等国际顶级科技公司任职,并于 2010 年加入百度。

在 2017 年接连被任命为百度 AI 技术平台体系(AIG)总负责人、百度研究院院长之前,王海峰很少出现在聚光灯下。甚至有人评价说他带领的是一支「隐形部队」。而如今,随着百度在 AI 领域的技术实力不断彰显,这支「隐形部队」早已不再隐形,王海峰也越来越多地出现在台前,向大家介绍百度的各项 AI 研究、应用成果。
 

如果从学生时代接触 AI 开始算,王海峰已经在这一领域工作了近三十年。在这三十年的时间里,他创造了很多个「第一」与「唯一」。

全球首个互联网神经网络机器翻译系统

王海峰 1989 年考入哈工大,1993 年进入李生教授的实验室开始做机器翻译研究。在硕士期间,王海峰参与了两个重要的机器翻译项目——CEMT-Ⅲ 和 BT863。其中,BT863 汉英双向机器翻译系统是「863 计划」的一个重要项目,王海峰负责汉译英方向的规则知识库建构以及计算机软件等方面的准备。在比赛阶段,王海峰组的系统在汉译英部分获得了全国第一。


在参与这两个项目的过程中,王海峰对基于规则和统计的机器翻译技术都有所涉猎。当时,这两个方向的机器翻译系统已经开始投入商业化应用,很多人都在努力扩大词典库、积累句法规则数据,在既有方向继续深挖下去。但是,王海峰的视野没有局限于此。

在本科和硕士期间,他就已经开始认识到神经网络这种参照人脑认知模式的计算方法。在博士期间,他开始思考,自己能否去尝试一些更新的东西。当时,王海峰发现,在海外(例如卡内基梅隆大学),已经开始有人将神经网络应用到语音处理之中。但是,当时应用更广的是多层前馈神经网络(BP 神经网络),不能对上下文进行有效建模。针对这个问题,王海峰开始寻求突破。他将循环神经网络的方法引入了机器翻译领域来反映上下文关系,而且取得了很好的效果。

在王海峰读博的 90 年代,即使在世界范围内,将循环神经网络引入机器翻译领域也不算常见,在国内更是首创。

在王海峰等人的努力下,中国机器翻译从规则、统计方法时期的一路跟随,发展到在神经网络时期向无人之地迈出了第一步。而后来的发展也证明,王海峰选择的方向是正确的。

2010 年,王海峰开启了自己在百度的职业生涯。初入百度时,他做的第一件事就是成立了「自然语言处理部」,以服务搜索引擎中产生的相关需求。在此之前,百度在 NLP 方面的研发工作一直在业务需求下进行,并没有构成体系。「自然语言处理部」的成立改变了这种「指哪儿打哪儿」的局面,对原有的工作进行了重新梳理与规划,除分词、专名识别、query 需求分析、query 改写等传统方向得到加强外,也逐步建设了机器翻译、机器学习、语义理解、智能交互、深度问答、篇章理解等新的技术方向。

2011 年,王海峰等人预判出深度学习在产业界将大有可为。于是,2013 年,王海峰作为执行负责人协助李彦宏创建了世界上第一家企业深度学习研究院(IDL)。


这些工作的平稳推进为百度成为全球 AI 头部企业埋下了伏笔。2015 年,王海峰带领的百度 NLP 团队研发了全球首个基于神经网络的互联网翻译系统,领先国内外其它科技巨头公司 1 年多时间。2016 年初,中国举办国家科学技术奖励大会,百度的机器翻译项目获得了国家科技进步二等奖。当时,新华社发文评价称:「中国最高级别的科技奖项花落互联网企业实属罕见。」

在王海峰的带领下,百度在知识图谱和多模态语义理解等重要方向也很早就开始了布局,这些早期工作构成了今天百度大脑的重要基础。如今,百度拥有全球最大的知识图谱,其中包含超过 50 亿实体、5500 亿事实。而且,这些成果并非百度的「私产」,以此为基础构建的百度知识中台现在向企业提供了面向知识应用全生命周期的一站式解决方案,其知识图谱产品目前已覆盖 100 多个行业场景。

ACL 五十多年历史上首位华人主席

在李生教授刚开始 NLP 研究的时代,中国的 AI 研究还是一个独立而贫瘠的孤岛。中国的研究者很难获取国际 AI 研究的一手资料,国外的研究者也对中国的 AI 研究知之甚少。

到了王海峰的时代,情况有所好转,中国的研究者逐渐走向世界舞台,在世界顶级期刊上发表论文,但学术影响力还稍逊一筹。2000 年 ACL 在中国香港举办时,只有微软中国研究院的论文来自内地;到了 2005 年,来自内地的论文也只有三篇。

于是,王海峰想到一个方法:竞选 ACL 主席。

ACL 是自然语言处理领域影响力最大、最具活力的国际学术组织。NLP 领域最有影响力的几个国际学术会议,包括 ACL 年会、EMNLP、NAACL 等,都是 ACL 旗下会议。从 2004 年在 ACL 上发表论文并参会后,王海峰就再也没缺席过这一会议。

王海峰在竞选时向 ACL 做出了几项保证:1)推动 ACL 在中国的发展;2)提升亚洲 NLP 社群对 ACL 的贡献率;3)加强 ACL 同产业界的联系。从王海峰自身的学术成就、影响力以及他「中国科技企业代表」这一独特身份来看,这些承诺都是很有说服力的。最终,王海峰在全球会员投票中成功当选。
 

在 ACL 任职期间,王海峰提名了众多优秀的中国学者进入 ACL 承担职务,包括周明、赵世奇、吴华、刘洋等一大批中国 NLP 人才。

2015 年,随着中国 NLP 方面的学术成果越来越引人瞩目,当年的 ACL 年会在北京举办。这也是国际 NLP 领域的学术盛会第一次来到中国大陆。

2016 年,王海峰当选为 ACL 会士,成为首位获此荣誉的中国大陆科学家。ACL 授予王海峰会士称号的评价是「在机器翻译、自然语言处理和搜索引擎技术领域,在学术界和工业界都做出了重大贡献」。

2018 年,在第 56 届 ACL 年会开幕式上,时任 ACL 主席 Marti Hearst 宣布创建亚太区域分会(AACL)并计划在 2020 年举行首次会议。之后每两年举行一次会议,会议地点将设置在亚太地区(今年受疫情影响已改为线上),由王海峰担任 AACL 创始主席。在 AACL 成立之前,ACL 还在欧洲和北美两个地区设有分会,而距离在 1999 年成立北美分会,已经过去了二十年。

可以说,在中国 AI 走向世界的过程中,王海峰起到了重要的推动作用。

王海峰在人工智能领域的辛勤耕耘在国内外广受赞誉。2018 年,在第八届吴文俊人工智能科学技术奖颁奖礼中,吴文俊人工智能奖颁发了首个「人工智能杰出贡献奖」,而获得这一荣誉的,正是王海峰。
 

在新基建的背景下,以王海峰为代表的工程研究人员构成了中国 AI 的中坚力量。与此同时,他们也在积极地培养下一代人才。

在刚刚落幕的 2020 百度国际大数据竞赛上,王海峰表示,目前百度已与社会各界展开合作,未来 5 年帮助社会培养 500 万 AI 人才,推动整个社会智能化升级。此外,他们还发起了面向青少年 AI 科普教育的「晨曦计划」,希望依托百度在 AI 技术上的经验积累,借助百度的 AI 学习资源,帮助青少年了解人工智能发展现状、前沿研究和应用,使更多青少年能够喜欢 AI,在未来的工作和生活中应用 AI。

参考资料:

《AI 已来:让中国 AI 走向世界的王海峰》
https://tech.ifeng.com/c/80fftk9Lski
http://www.xinhuanet.com/politics/2016-01/16/c_128634682.htm
https://xw.qq.com/cmsid/20201029A0GH0000