恒生研究院高级技术专家林金曙:用自驱力,做发光体

“一场由电力驱动的现代寒武纪生命大爆发,只不过这次演化的重点将停留在尚未成型的机械动物们”,美国斯坦福大学教授杰瑞?卡普兰曾这样形容未来的人工智能世界。

人工智能作为一门学科已经诞生60年,截至目前,它依旧是人类最重大、最具雄心的项目。随着核心算法和应用场景的逐步完善,国内人工智能产业在近年来得到飞速发展,但不置可否的是,目前人们口中所说的人工智能,本质上仍是弱智能时代以数据驱动的智能,距离杰瑞?卡普兰口中的“机器智能”还有不少的距离。

而回顾这些选择,林金曙笑着调侃说,“自己跟大家一样,努力做好一份工作而已”。

要实现这一宏伟目标,需要搭建理论基础的学者,需要专注于前沿算法研究的工程师,也需要专注于数据采集的工程师等。他们的荧荧之光,聚集成海,照亮前路。

在恒生,也同样有着这样一群致力于开辟人工智能在金融领域应用道路的工程师们。

对于他们身上散发的光芒,恒生研究院NLP团队负责人林金曙说:“这种光芒是一种自驱力。只有对人工智能的未来充满希望,才能够感染更多的人,用热情和专注驱动大家来一起实现梦想”。

这期的恒生技术ACE,我们走进林金曙的人工智能世界。

林金曙认为,提到AI,很多人都会首先想到算法工程师。但事实上,对于完成一个AI产品或项目来说,仅有算法工程师是远远不够的,最不可获缺的就是复合型人才。其中包括“IT+AI”、“业务+AI”与“业务+IT”三种。

“做前人未做过的事”

1024恒生技术开放日,林金曙也将作为人工智能技术分论坛的出品人,与各位探讨AI在金融行业的应用,分享技术实践经验。

彼时,林金曙作为恒生人工智能团队负责人,正面临着人手短缺、团队经验不足的境遇,与此同时,业内某头部券商在舆情处理方向和智能客服方向正需要人工智能的落地。

是否要去做前人从来未曾做过的事情,这是在人工智能领域,林金曙面临的第一个挑战。

“当时的竞争对手都非常强,微软、IBM,无论技术还是品牌都是响当当的,我们的团队相当于一个‘创业团队’,怎样获得客户信任,确保方案的先进性和有效性是摆在我们面前的巨大挑战。”

近年来,NLP在降低金融机构文本处理智能客服、投研相关工作量等方面已颇有成果。

林金曙这个名字,对于恒生员工来讲并不陌生。2018年恒生技术功勋人物、恒生研究院高级技术专家、恒生NLP团队负责人…… 无论他有多不愿意重复提及以往的荣光,那个发生在人工智能团队建立之初的故事始终绕不开。

团队初期面临巨大挑战

在这种情形下,可以让人发光的“自驱力”,成为了林金曙带领团队向前走的动力。“困难出现只能想办法,我们一是完善团队,二是联系高校、业内同行,通过整合资源,带领团队成员急速成长,三是咨询内部的金融业务专家,判断如何使相关的技术更好地落地在场景中”。

经过半年的通宵达旦,恒生NLP团队提出的方案最终获得了该金融机构的独家采购,为恒生进军AI领域打响第一枪。

晨曦微光,可以济群。林金曙与人工智能的故事仍在继续。

从0到1的飞跃

第一个项目用林金曙的话来说,是打开了探索人工智能的大门,经过近年来不断地实践积累,对于人工智能在金融领域到底该怎样做这一问题,这位恒生研究院的高级技术专家有了更清晰的回答。

林金曙认为人工智能的四大关键要素为算法、数据、人才、场景。其中,算法经过多年的发展,渐趋稳定,而数据存储技术和数据挖掘技术在近年来的发展则使得数据得以成为智能的基础。人才是技术层面的另一个动因,但倘若没有场景落地,上述三个技术要素就是空壳。在金融领域发展人工智能也需要“因地制宜”寻找到有价值的场景。

自然语言处理被誉为“人工智能皇冠上的明珠”

搭建好用、快捷的智能产品CPU

林金曙在采访中多次强调了自驱力三个字,而这实际也与他自身的经历息息相关??大学毕业从通讯行业转战至金融IT,从大数据再到人工智能。

“其实我对我们团队的定位非常清晰,我们需要为客户提供好用、便捷的智能产品,帮助他们解决业务痛点,提高生产效率、提升用户体验”,林金曙补充道。

Gartner数据显示,在金融服务以及保险行业对人工智能的投入中,约有20%的预算投入到了自然语言处理(NLP)中,在人工智能各方向中位列第三。对NLP的投入通常在一年左右产生可观的商业价值,这也进一步增强了金融机构对NLP的热情。

发光的团队

与AI自研产品一同壮大的,还有团队的规模。

因此,在专业的培养上,这位负责人看重对团队成员的长期培养,并积极让业务与技术融合在一起。而在个人品质方面,林金曙认为,在人工智能领域,每向前踏一步都是前人未走过的路。因此,自驱力、创造力和逻辑也同样重要。

自驱力、创造力和逻辑也同样重要

业务与技术的融合

“在面试的过程中,我经常问面试对象遭遇过什么挫折。当一个人受到挫折,他还有自驱力走出来的时候,其实代表着他有强大的信念和抗压能力。做AI会碰到太多难题,需要自己想办法解决,我也会特别看重面试者的逻辑和解决问题的能力,在这方面,我通常会问一些奇怪的问题。例如‘为什么会有三毛钱’,‘为什么四大文明古国都在亚热带’等”。

而在人工智能具体细分赛道上,林金曙的选择是自然语言处理,后者也被誉为“人工智能皇冠上的明珠”。

经过一步步的踏实向前,林金曙从无到有搭建起了恒生公司的NLP团队,目前团队成员有三十余人,包含了算法工程师、AI架构师、数据工程师等。

以“IT+AI”为例,可细分为AI平台研发工程师和算法工程师。前者负责建立AI平台,通过推动自动化实现来帮助数据科学家处理一些“杂活”,例如数据预处理、数据管理、数据可视化的展现等,从而让数据科学家聚焦于业务分析和模型分析;后者主要负责算法的实现。

在采访的最后,我问林金曙他觉得AI工程师到底是一类怎样的人群,他说:“总有人觉得AI冷冰冰的,但事实上它是机器和人之间的一个桥梁,而我们这些在中间的工程师们,也是用自己的能量让技术发光的第二道桥梁。”

“就像人脸识别一样,在金融领域,我们目前的公告、财报、票据等,同样也可以利用图像识别的方式,快速鉴别、分析、产生结论,我们依然需要自主驱动,继续再往前走一步。”

“人工智能最为重要的一个部分就是认知智能,这其中就包括自然语言理解。在中文领域的中文分词、实体识别(机构名、人名)、词法分析、句法分析、语义分析、事件抽取等非常复杂。谷歌在2018年发布的BERT模型大幅度刷新了NLP领域的11个方向精度,可以说是近年来最有突破的一项技术。我们基于金融领域数据结合最新算法,生产金融领域专用模型,更好地赋能金融业务系统。”

落实在恒生,恒生公司应用NLP的产品已覆盖智能资讯、智能投研、智能风控、智能营销、智能监管、智能投顾等领域。其中,恒生智能客服已为诸多金融机构提供服务;在智能风控方面,恒生研究院的债券预警模型通过使用宏观、政策、市场、财务等数据以及NLP技术提供的特色事件数据,可以实现较好的预警效果。

对于未来,林金曙表示,将继续在图像识别和业务可解释方向继续钻研学习。

“这个其实也是自己走过的弯路得到结论,之前做大数据发现单有技术的思维是不够的,还需要有产品的思维。除此之外,金融领域与其它行业的属性完全不同,技术为业务服务,同时需要极强的解释性,我们采用AI处理基本数据结合金工模型,所以在一开始我们团队就在恒生内部进行调研,挖掘可实践的场景(债券违约、财务造假等)。”

用技术连接世界

恒生技术ACE

集结恒生技术人的王牌力量