人工智能的突破点
7月9日,2020世界人工智能大会(WAIC)正式拉开帷幕。当天下午,2020世界人工智能大会科学前沿全体会议召开,作为今年WAIC唯一一场聚焦前沿科技的大会,邀请了世界范围内最顶级的AI专家探讨技术趋势。
其中,“人工智能的未来挑战与突破”圆桌论坛由AAAI2021大会主席、香港科技大学教授杨强教授主持,对话嘉宾包括第四范式创始人兼首席执行官戴文渊博士、香港科技大学张潼教授、新南威尔士大学的Toby Walsh教授、札幌市立大学校长中岛秀之以及英国帝国理工学院数据科学研究所所长郭毅可。
“人工智能的未来挑战与突破”圆桌论坛现场
戴文渊:在我看来AI最大的突破就是深度学习。当今人工智能已经被用于各个领域,在中国也可以看到很多行业的AI应用。10 年前第四范式已经开始尝试让 AI技术落地,首先应用的是互联网领域,让 AI 帮主搜索引擎精准地投放广告。AI应用到在线广告之后,广告效果提高了800%。
Toby Walsh:人工智能对于人类的智能来说是一个非常有益的补充,但是它跟人类的智能有很大的不同。比如我们刚才看到的案例,加了一点噪音之后,一个猫就会被识别为公共汽车。所以我们人类应该感到非常的自豪,我们的识别方法和机器识别不一样,非常先进。
另外一个局限性,就是微感受。让机器能够更好的理解这个世界,理解语音,理解文本,理解图像。但在一些推理方面进展不大,我们还有很多事情可以做。其实还有很多人类下意识、潜意识的东西并无法被机器所习得,所以这也是现在研究的一个领域。 当然,我对于现在人工智能方面的进展很有信心,我觉得未来还任重而道远。
张潼:关于现在AI或机器学习的突破 ,我觉得落地最好的地方就是简单的任务,简单环境,有大数据支持。比如说打游戏这种非常明确的结构化的环境,在这种情况下AI很强,已经带来了巨大的突破。 另外在一些类似的确定性高的环境中,AI的表现也不错,如语言的识别。当然它也有一些局限性。最近几年,它开始学习很多没有加标签的数据。比如说在自然语言方面,代表性的工作就是BIRD、GDT可以用于学习很多没有加标签的数据,它可以应用到很多的任务中,甚至将来可以被运用到超能力的任务当中去,可以加到有标签的数据当中。
在计算机视觉方面也有很大的突破,可以看到很多没有加标签的数据、任务,这些技术很有用。不用去给所有的数据加上标签才能用于人工智能领域,这是我看到很有前景的领域,接下来几年是发展的重点。
Toby Walsh:我们现在太懒惰了,有的时候会让我们的机器来接管我们的部分工作。但是如果机器做了所有的事情的话,我们真的会变的一无是处。对于我们的挑战是保证机器不会彻底取代人类,不会接管人类所有的事情,我们还必须要有掌控。
本次讨论有 3 个主题:
- 探讨当前人工智能的突破点在哪里?
- 人工智能所面临的挑战和局限性有哪些?
- 展望未来,共同探讨未来可能有哪些伟大的成就。
郭毅可:现在AI有了新的进展,AI方面的发展是关注于认知,模式识别,图像识别更加精确,过去 10 年终我们看到的进展有两个方面,第一是自动特征的提取,这就是卷积神经网络的进展,可以发现自动的识别一些物体的特征,基于这些进展出现了很多新的模型,代表性现在可以学到很多不同的物品,抽象代表性的特征可以被学习到。
在线学习也是非常大的进步,包括识别领域,比如AlphaGo等。我们处于一个数据驱动的AI时代,所有人都觉得越多越好。对于认知方面的人工智能能力,当然可以达到某种智能程度,但现在任务远远没有完成,这只是一个序幕。当你认识一个东西的时候,要真正的理解这个东西,然后还要推理,然后基于某些模型获得决定。
但人类完全不是一个光从数据驱动决定的模式,人工智能也是如此。所以,我们的人类的智慧不仅仅是「识别」而已,孩童可以在早年的时候习得这个能力,但成人的智慧是结合我们已知的知识进行推理,现在很多的进步都是在这个领域,是一个非常积极的象征。 人工智能要做正确的事情,正确到底是什么意思呢?我们这个机器又如何能够识别哪些是正确的,哪些是不正确的事情呢?现在有很多的工作都在这个领域当中做,在很多的虚拟的环境当中,机器都能够做出正确的选择。但是在真实的世界当中,正确和不正确之间的边界是很模糊的。
所以如果觉得人工智能的领域已经到来的话,有点天真了。人工智能现在是所谓的识别一些事物,要真正的认识一些事物是下一代的领域。
人工智能所面临的挑战和局限性有哪些?
杨强(主持):正如郭 毅可提到了很好的关于「正确」和「不正确」的问题, 我们如何让人工智能领会错误和正确之间的区别?接下来要讨论的是「人工智能所面对的一些短板」,也许这些短板能够激励我们推动下一个十年的人工智能的发展。
比如说我们希望能够将常识注入到人工智能里面,让它在进行逻辑推理的时候变的更加好的话,这是非常难的事情。
例如,人工智能“举一反三”的能力真的是好的吗?在隐私方面,获取别人的数据其实是需要面对风险的,如果放不愿意分享数据,这也是对人工智能的一个挑战。所以请各位讲讲,你觉得人工智能一个大的挑战是什么?
所以,我们认为需要让普通开发者或者JAVA工程师,也能够开发AI应用。然而JAVA工程师会说他没办法做到,因为人工智能太难了。这也是为什么过去五年我们把很多的时间都花在了自动机器学习(AutoML)的研究上,它是一个学习框架,能够让普通开发者去学习构建足够好的AI应用。我们必须要努力发展低门槛的AutoML技术,这是第一个挑战。
第二个挑战是,即使有足够多的数据科学家、即使可以通过普通人开发AI技术,如果缺乏高质量的数据,AI 也无法实现。这就需要通过迁移学习把数据中的知识从一个领域迁移另一个新领域,保证AI在新领域的应用及效果。AI基于数据得出的一些结论被应用是可以被大家接受的方式,前提是这些结论并没有记录个人具体的数据。最近几年我们在迁移学习隐私保护领域取得了比较大的突破,联邦学习在隐私保护的基础上赋能数据共享,能够把知识从一个领域迁移到另外一个领域,同时也不会导致隐私暴露。今年年初,第四范式先知率先通过了欧盟GDPR认证,成为国内第一款通过该认证的AI平台产品。
在理论方面有更大的进展,可以更好的理解如神经网络的运用模式。希望在接下来的十年中会有更多的进展,更好的理解神经网络的利用。可以让机器学习更容易应用落地,可以采用与解决不同的问题。只要加上一些黑河的参数调整,可以降低使用这些工具的阻碍,降低门槛用到不同的设备,高能设备。云计算、(iH)、边缘计算,或者是手机上还有其他一些设备。这是我觉得未来非常有前景的一些技术领域,可以让AI更具可获得性,更方便于应用落地。
第三个挑战是成本问题,顶尖的互联网公司需要有很多服务器来支撑AI业务,很少有公司能够承受这么大的成本。所以我们也必须要去花费一些精力研究如何降低服务器的成本费用。AI不仅是硬件系统,还有软件系统,是硬件和软件深度融合的体系,软件设计必须要基于硬件的特点,硬件设计也必须结合软件的需求,并且做进一步的优化。
中岛秀之:现在AI的形式是:深度学习的发展让AI有了很大的进步,但是对于机器学习本身来说,它还是有很多的限制。第一个是一定要有数据,你先要有数据才能够获得分析和信息,我们对于AI应用是有很多的知识和积累的。要把应用和现在的基础领域结合起来。AI 的挑战方面,要加强深度学习的能级。在这方面技术还有待改良和增进,需要把这些技术能够在更高领域的任务上能够进行应用。
7年前,开始将AI技术应用到金融等行业,做更好的营销、销售预测及反欺诈、反洗钱等业务应用。5年前,我们又将AI应用到零售行业和能源行业。今天,AI应用随处可见,或许明年我们看到的 AI 应用会是今年十倍多。我们对此充满信心。
Toby Walsh:第一个挑战是: 语言是一个基础的引擎,让机器能够听懂我们的指令和人类的语言是非常重要的,它没有语义层面上理解人类的话,只是表面理解,我觉得人类的语言是机器的智能体现。
第二个是「常识」,可能最有名的一个例子就是:你可以去某个城市的某所学校,问该校学生一些学校相关的历史问题,学生可能会非常清楚,但是如果让AI做的话,有一些东西会混淆,因为他缺乏这样一个基本的常识。
第三点就是有关于情感的问题,有的时候就是人的智力能够感受到的这些情感,并不是AI能够做到的一个问题。机器没有办法产生感情,没有办法产生通情或者和人的相关的互动和交互,这是一个比较大的挑战。
郭毅可:我认为未来十年或者是五年,AI会有很多进展。特别是在基础或者理论方面,AI可以发挥重要的领域就是医疗,医疗系统将变成数据驱动,有很多超级设备应运而生,用于某一些医疗事件。我们未来的医疗很大程度上是数据驱动,另外它还会个性化。那时我们的医疗成本会很高,十五年以后在AI的帮助下会带来巨大的突破。
张潼:我非常同意的一点就是:我们没有办法做自然语言和语义的识别。但如果需要人工智能去推动相应的发展其实不太可行,一般来说,我们真正的目标是希望AI 能够做普通的任务、常见的任务,而不是一些专业特定的任务。比如希望能够将常识注入人工智能里面,
所以从根本上来说,如果能够同时解决数据工作和知识工作的话,我觉得我们能够做到更好的突破。
还有一个是关于隐私,如何在不同机构使用人工智能,智能体之间如何协作,也是很重要的问题。判断未来什么是最重要的,还有解决公平的问题, 正如杨强教授刚才提到的,如何能让AI做正确的事情,有正义观是非常重要的,这也是具有更广泛的社会意义的问题。
还有一个任务,即使我们有一个单个的任务,有不同的域名、域场和不同的、相应的环境,AI不可能在不同环境下胜任同样的任务,这也是我们现在做的事情。这一点是有关于域场、域名适应的过程。这也是我们的一个挑战,对于我们来说虽然普通任务、通识任务是挑战,未来十年当中单个任务的适应是非常重要的事情。 有的时候在图像识别当中有些系统可以做很好的训练图像识别,但是放到室外的场景应用,你就要做一些相应的适应,同样的无人驾驶也是如此。
这个方面,其实也涉及到控制理论还有其他的一些自动化理论等等,观察能够获得的数据。我们觉得如果你要解决这样一系列的挑战,根本上最大的挑战就是知识和数据的融合。我们应当双管齐下,同时关注数据和知识的融合,这样才能更好的做建模,能够有更好的逻辑。
中岛秀之:目前为止数据能够应用的 场景还是比较有限的,未来它应当是以一种更加智能的方式进行更好的应用,而且人和AI能够有更好的沟通和交互。我们更好的给AI赋予价值系统和价值观,这是非常重要的,对于我们的日常生活也是非常重要的。但是对于AI来说的话,它是没有办法更好的理解,所以我们需要训练AI,更好的让它有这样的价值观。
展望:AI 未来五十年
郭毅可:我非常同意刚才各位讲者所提到的这些挑战,但是我认为从根本上来说就有一个挑战,如何能够识别知识和数据的一个互动?如何通过观察来获得相应的数据和知识。很多时候涉及到常识的问题,包括迁移学习。 比如说你学习到一些知识,你如何能够举一反三,触类旁通。还有就是有关于这个小数据的一个学习,你都必须要让这个数据和知识之间交融,通过学习知识会不断增加,但是你必须清楚这方面的知识,如何将数据和知识结合起来、融合起来非常重要。
杨强(主持): 最后一个问题,更有意思一些。展望未来五十年,其他的知识加上AI,我们会有怎样的进步呢?比如说马斯克在做神经连接,想把一个芯片放到人脑当中去提升人们和AI机器之间的一个连接。我们今天有5G技术,之后很有可能会有更加强大的通讯工具,我们有量子计算也是呼之欲出了。所以,现在会有一些新的外部知识能够帮助人工智能更好的发展,我想要听一听大家的意见。
还有现在我们在这样的一个基础之上,就可以规约不同的数据。 从根本上来说,如何能够打造一个系统,保证知识和数据互相丰富,互相融合,是非常重要的一个挑战,也是我们一直想实现的目标。
此外,如何能够在特定的挑战当中获得相应的建树,这也是未来十年当中所要做的一个工作,如果说我们能够做到这一点,很多行业的应用就会变的非常的简单。这样的话,我们的人工智能能够使用的范围更广,而且使用安全性更高。
杨强(主持):请各位嘉宾为大家分享下,您认为当今人工智能的突破点在哪里?有哪些实战经验可以分享?
张潼:在将来的十年,我之前也谈过,解决单域的问题,AI可以从一个专才变成通才,还有范式的进步,你可以更鲁棒的学习,更好的处理量化问题、量子问题,这在我看来是最急迫的、亟待解决的问题,让整个系统更加鲁棒,易于使用,使用起来更加安全。
但无论如何,在未来50年当中应当有一个更好的沟通系统,让人把我们的价值赋予给相应的人工智能。我不知道其他的技术能否帮助我们,但是我觉得赋予价值观是非常重要的一件事情。
戴文渊:第一个挑战是AI认知门槛,这是企业在AI应用中面临的普遍问题。如今人工智能应用越来越多也越来越重要。很多企业在数字化转型的过程中希望使用 AI 来解决一些人工的问题。但核心问题是,这些AI应用需要数据科学来构建,传统企业是很难解决这个问题的。现在数据科学家数量远远不够,就算是MIT的数据科学家也不能解决所有企业的所有需求。
戴文渊:我相信应该是5G和IoT。现在AI从人类身上学,很多标签数据是通过人点击网页及软件,让机器去学习做某些事情。有了5G、IoT之后,AI可以从它们那儿学习。全球人口数量为几十亿,而IoT有万亿级,5G加上IOT的发展会带来更多数据,便于人工智能进行更好的场景学习,为AI发展带来更大的飞跃。
以下为本场对话实录:
另外一点,我们未来还要纳入知识,希望加上一些推理能力。但是我觉得最近可能很难,因为我们还不知道怎么做。当前,所谓的协调学习、合作学习现在有很多局限,现在有很多的客户端自己学习、自己进化,这会很大程度上提高联合协作的能力,可以看一看最后能够进化出来怎样的AI能力,这是我预计在将来几十年可以看到的进展。
杨强(主持):张潼谈到很有意思的领域,5G和互联网的发展,我们看到越来越多的物品之间会相互的交流、沟通、协调,在某些限制的条件下,隐私性的限制或者因为某些商业领域,他们没有办法相互之间打通,另一方面也要兼顾到隐私还有其他的一些考量,这是一个全新的市场,由AI创建的市场和人类共生、共存, 所以我们把它叫做协作式学习。这是我们现在做的一件事,激动人心。