AI开启“泛在智能”时代：《2020腾讯人工智能白皮书》重磅发布！_AI科技

原标题：AI开启“泛在智能”时代：《2020腾讯人工智能白皮书》重磅发布！

2020年是足以被载入史册的一年。

在经历了炒作、狂热、泡沫之后的人工智能，在全球新冠疫情的肆虐下，与产业发生了前所未有的紧密结合。

我们看到疫情之下，远程测温、口罩识别、云办公、云课堂，无接触配送服务的大量涌现，AI在医疗、教育、交通、工业、非接触服务等领域快速响应，在疫情之中扮演了关键角色，提高了抗疫战争的整体效率。

而后疫情时代，国家出台新基建计划赋予AI全新的使命与角色，通过传统产业与AI的深度融合，助力实体经济向数字化智能化转型，催生新的业态。在国家政策支持和抗疫压力的双重牵引下，各行各业已经充分认识到加速数字化、网络化、智能化转型已是必然趋势。

2020年已临近尾声，即将到来的2021年以及近未来，将成为全球经济重建和社会转型的重要时期，而其中人工智能必将成为核心驱动力。在此背景下，未来人工智能产业将如何发展？会带来哪些机遇与挑战？企业如何才能更好地抓住机遇实现智能化转型？

或许重新梳理2020年人工智能产业的发展与变化能够找到问题的答案。

近日，腾讯研究院发布了《2020腾讯人工智能白皮书》对人工智能在产业趋势、技术发展、抗疫应用、行业赋能、制度保障等方面进行了深度总结和梳理。

接下来带着对人工智能产业发展的疑问和好奇心，我们一起来解读这份报告。

泛智能时代开启

人工智能技术与产业发展正在迈向“泛在智能”时代，未来中国不再有纯粹的传统产业，每个产业或多或少都将开启数字化进程。人工智能已“泛”起巨浪，人人都将席卷在这巨浪之中。

透过2020年人工智能产业变革，白皮书得出了这样的结论。

所谓泛在，即广泛存在。“泛在智能”，一是泛于基础设施建设，在“新基建”的春风下，智能技术将逐渐转变为像网络、电力一样的基础服务设施。如图，2015年国家产业政策首次提及人工智能，随着政策的不断升级，为人工智能产业发展提供了极为有利的条件和机遇。

未来作为新一轮产业变革的核心驱动力，人工智能算法、算力、数据三位一体的基础设施可面向全行业全领域提供通用的AI能力，促进社会经济转型升级。

二是泛于越来越多元的应用场景和更大规模的受用，更多的传统产业或慢或快接入智能技术，与技术公司共同探索未来新模式，同时人们会在生活里感受到无所不在的智能应用，技术的普惠精神进一步得到体现。

当然，在泛化过程中必然会遇到同样广泛的问题，对此白皮书中指出，与其他数字技术之间更加紧密的连接能够为人工智能提供更有利的技术支持，另外，安全和制度保障同样不可或缺，三个层次相互作用相互作用，将共同加速人工智能在更广维度的扩展。

浪潮之下，AI技术的升级与落地

“泛在智能”的“智”来源于人工智能技术的不断升级和成熟。本轮以机器学习，尤其是深度学习为主题人工智能浪潮被认为是当前人类所面对的最为重要社会变革技术之一。

机器学习

机器学习是门“全能”的基础学科，它涉及统计学、神经网络、优化理论、脑科学等众多领域。同时，它在现实生活中的应用场景也十分广泛。作为人工智能领域的底层技术，机器学习也是腾讯AI Lab多年来的研究重点，其研究主题覆盖强化学习、自动机器学习、深度图学习、小样本学习等多个方向。

其中，强化学习的研究大多立足于游戏环境，如围棋、电子游戏《王者荣耀》和《星际争霸》等，并且已经通过与顶级玩家比拼的方式取得了多个亮眼的里程碑。

业界普遍认为，若AI能在复杂的游戏环境中，学会人一样实时感知、分析系、理解、推理、决策到行动，就可能在多变、复杂的真实环境中发挥更大的作用。因此，世界顶级科技公司均在推进此类研究，如Google、DeepMind、Facebook以及OpenAI等。除此之外，腾讯AI Lab还在探索该技术在现实应用场景中的落地，如农业方面。

虽然机器学习的研究和应用，已经取得了很好的进展。但是还有若干问题制约其影响力的发挥，特别是在真实世界的应用方面。白皮书中指出，机器学习后续需要攻克的方向还包括两点：

提升小样本学习效率：大量带标签的训练数据是决定机器学习模型性能的关键。但现实场景中，一些数据的标签很难获得。怎样用少量的数据，仍然可以训练出良好模型，是一个亟待研究的问题。
发展离线强化学习：强化学习在游戏中取得惊人效果得益于游戏模拟其可以实时产生大量的与模型交互的数据。但在现实场景中，我们只能得到少量的人工交互数据，或者从模拟器所得的大量虚拟交互数据。怎么利用这些数据做好离线强化学习，目前尚无良好的解决方案。

计算机视觉

2018年，计算机视觉技术占中国人工智能市场规模的34.9%，位居第一，在投融资规模中更是一枝独秀。随着近几年技术的不断成熟，其市场规模进一步扩张。根据艾媒数据显示，2018年中国计算机视觉市场规模为155亿元，较2017年增多了87亿元，复合增速超100%。

市场对于技术的推进作用是巨大的，目前，计算机视觉已经在人脸识别、工业视觉、OCR以及内容理解等领域获得重大突破，面对不同场景需求，计算视觉准确度不断提升。

但随着技术落地速度的加快，落地领域的拓宽，为了促进技术和社会应用的深度融合，白皮书指出，计算机视觉还需要在以下方面得到进一步突破。

一是技术融通，加强高阶认知智能开发。人工智能技术正从语音、文字、视觉等单模态智能朝着多模块智能发展，如何从端到端打通各个模态之间的关系形成可以真正多维度交互的智能机器，增强对功能属性、物理关系、因果逻辑、动机预测等的认知进行逻辑推断，让感知智能升级为认知智能。

二是进一步提升对抗攻击和防御技术能力。包括深入研发隐蔽性较强的可以用于物理场景的攻击方式；提升攻击的迁移性，即较高的攻击成功率能够迁移到不同的深度模型上；研究有较强通用性的防御方法，提升模型对于不同攻击方式的防御能力。

三是辨别深度合成，鉴伪技术遏制AI滥用。大量人脸编辑检测算法在人脸鉴伪上取得良好性能，一定程度上遏制了AI技术的滥用。但整体而言，目前的检测算法尚处于初级极端，存在不少局限性，数据集质量有待提升，可解释性、可迁移性等多个问题有待深入，以得到一个通用、高效、高精度的人脸编辑检测框架。

语音技术

语音技术的市场规模仅次于视觉技术。相应的，语音应用市场也在高速增长。

2018年达到了159.7亿元，近五年的年均复合增长率预计将达34.32%，2023年国内市场规模将达到664亿元。目前语音技术已广泛服务于通信、家庭服务、家电等多个行业，典型应用包括智能客服、智能穿戴、以及智能家居等。

业内专家认为，语音技术的链条日臻完善，边界在逐渐扩大，现有研究中，更加注重端到端的建模方法，以及领域的通用性。回溯近几年发展，可以看出在多模态需求的不断扩大下，语音技术实现了从单模态到多模态的交互、语音环境适应性也在持续提升。

未来，多模态、多场景需求如何得到更好的满足，白皮书指出需要从技术、业务两个方向进行努力。

技术方面：解释更多的“复杂性”

鲁棒性仍需提升，在对多种领域变化（如表达方式、噪声环境、通道失真）的鲁棒性方面与人类水平相比，进一步逼近。
语音及歌声合成，包括语言合成风格应更加多元、歌声合成效果更加自然动听。
多模态交互，主要是多模态融合能力提升，以便适用于不同交互方式与应用场景的多元需求。
成本与效率问题，需要更灵活轻量的采集与生成，通过少量的、少标注的语料去更快、更高质量的完成各类语音任务。

业务方面：场景应用与数据反馈相结合

挑战重点场景，进一步扩大语音技术的应用范围。在智能家居、智能政务、智能出行等经典场景的应用下，进一步探索ARVRMR等场景的应用方面；
语料数据是语音训练的一大门槛，随着数字生产要素的市场化机制的不断探索，开放性数据多带来的生产力，有望为语音技术的训练、迭代带来更大突破。

自然语言处理

自然语言处理是人工智能重点技术之一。比尔盖茨曾说“语言理解是人工智能皇冠”上的掌上明珠，谁掌握了更高级的自然语言处理技术，说就能在日益激烈的人工智能军备赛中占得先机。

目前，自然语言处理技术助力需要研发的方向，包括以下几点：

文本理解精度提升：如问答系统中对知识库的构建和查询、搜索引擎对查询词的理解和扩展，信息流推荐中关于内容的理解和分类，电商用户评论的情感理解和判断等。
机器翻译准确性增强：特别是长文本翻译、篇章翻译、特殊领域文本翻译等。
对话系统的智能化：用于智能音箱中，使其具备更精准的回答、定制风格与人设、完成更多的任务；或者用应用于心理咨询、智能客服、在线教育、虚拟主播、弹幕回复等更多业务场景中。
文本生成的实用性：实际业务需求中有着各式的文本生成任务，如对联生成、诗词生成、歌词生成、句子改写、体育比赛或游戏竞解说词生成等。

近几年，在神经网络技术和深度学学习的推动下，自然语言处理技术得到了大幅度的提升。例如从word2vec模型、到Elmo，再到Google提出的BERT模型，文本理解和语言表示被推向了一个新高度；从seq2seq+attention框架在机器翻译得到巨大进展，到GPT-2/GPT-3模型的提出等等。白皮书中指出，着眼未来的技术研发，还需要从以下几个方向做进一步探索：

提升文本理解的精度及深度
人提高文本生成质量
增强帝梓元和多语种场景的应用效果
探索更丰富的语义表达方式
强化知识表达泛化能力
优化语言生成的对话的度量

疫情之下，AI加速产业落地AI+医疗行业

新冠疫情的爆发，让我们看到了人工智能技术在医疗、城市治理、服务业、制造业等领域的潜在价值，同时也加速了人工智能在各行业的应用和落地。

在医疗行业中，人工智能技术被广泛应用于医疗影像、医药筛选、远程问诊等多个场景下，有效缓解了医疗资源的压力。如在医学影像方面，AI图像识别帮助患者更快完成检查流程，更早获得诊断结果；帮助医生大幅缩短读片时间，提升工作效率降低误诊率；帮助医院提升医院的整体诊疗水平，降低人工成本与压力。

此外，基于图像识别、计算机视觉、自然语言处理等技术，AI在药物研发和远程问诊中也发挥了重要作用。透过这场疫情，报告指出，未来人工智能将与医疗行业深度融合，进一步推动传统医疗机构运作方式的变革。具体来说，主要体现在以下几个方面：

公共卫生应急体系建设：运用大数据、人工智能、云计算等数字技术，在疫情监测分析、病毒溯源、防控救治、资源调配等方面发挥支撑作用。
个人健康管理：通过深度学习等技术对海量健康数据进行分析，实时动态监测用户健康状态，从而提供精准的健康监测方案。
基层医疗卫生机构：人工智能将服务于早筛、诊断、临床等多个应用场景，助力缩小城乡医疗水平差异，解决基层医护人员不足、医疗水平不足的问题。
药物研发：人工智能将服务于药物研发，以缩短药物筛选周期，提升其生产、销售、使用的全链价值。此外，它还将用于药物智能销售、精准用药，促进个性化诊疗的发展
医疗保险类服务：可用于风险控制、医保控费、福利管理等领域发挥数字化、智能化作用，促进医疗生态圈中的多方协同。

AI+城市治理

疫情之下城市治理暴露出短板，也让人工智能在智慧政务、疫情监控、社区防疫等方面帮助城市治理突破了原有的治理模式，使智慧城市建设加速前行。例如：

在社区防疫方面：腾讯优图联合腾讯海纳推出体温筛查功能。针对封闭式小区出入口，开放式重点区域，腾讯优图AI识别技术可辅助社区人员在线申请电子出入证；同时集成该技术的热成像摄像头、热成像门禁等设备，可实现身份是被、测量体温等余预警记录上报。

此外，在车辆初入管理和行为预警、预警疫情风险、人群聚集警告、健康告知与申报承诺等多个方面，腾讯AI都可以有效地发挥作用。

在智慧政务方面：腾讯推出“防疫健康码”，民众通过微信小程序申请覆盖自身健康信息的二维码，获得电子出行凭证。在保证疫情期间安全复工复产发挥了关键作用。除了自然语言处理、计算机视觉技术在其中的应用外，人机交互的语音交互几乎是也发挥了重要作用，如腾讯推出的“AI政务联络机器人”，可与辖区居民联络，完成政务信息的传递工作。

在监控疫情方面：计算机视觉技术在红外体温检测和人群迁徙态势感知中得到了广泛应用。AI全自动红外测温仪利用普通摄像机识别并锁定人脸，而后通过红外测温仪采集红外数据，并计算出人体温度，具备非接触、大面积、快筛查的优点。

随着人工智能技术与5G、云计算、大数据等新一代技术的深度融合，未来AI将进一步推动智慧城市的发展与升级，如：

政府决策更加科学化：人工智能技术在疫情监控、风险分析预警等方面的优势，将辅助政府优化决策。
城市管理更加可视化：计算机视觉技术在防疫中的可视化方式，让城市管理更加直观。
社会服务更加智能化：主要体现在政务机器人的出现和应用，随着技术的逐渐成熟，人机交互将不仅局限于语音交互、脑机交互、情感交互也将逐步成熟落地。

智慧零售、自动驾驶、数字化内容，AI开启经济转型新机遇

疫情之下，无人零售、无人值守、物流运输等商业的非接触式服务需求大涨，迫切需要AI技术进行业务支撑。“零售+AI”正在从单点走向聚合，通过智能物资调配，智能营销推荐、智能配送实现全产业链“非接触”配置。主要体现在以下几个方面：

一是打通线上线下终端：对于零售商而言，通过线上线下渠道的整合，将二者的优势相结合实现最大化，是未来发展的最佳路径。深度合成技术可以提升线上购物体验，品牌可以使用虚拟模特展示服饰效果，或者鼓励消费者自己进行数字建模，预览服装上身效果。

二是优化商品管理：库存水平和生产压力之间的矛盾逐渐成为零售企业的商品管理方面的一大难题。基于AI技术构造门店商圈客流画像和偏好合理调配门店商品，根据顾客购物动线和停留检测，优化商品陈列，提高坪效，基于深度学习对门店和商品销量做出预测，从而合理筹备库存和分配库存。

三是更加有效的用户分析：线上端，通过各种渠道进行用户触达，再利用AI技术完成商圈洞察、社区洞察、人群画像、品牌舆情等用户分析，形成线上分析矩阵；线下端，AI通过把握客户从进店到离开的全过程，对顾客进行实时分析、可为每一位消费这构建全方位数字画像。

四是更快速、精准地物流配送：通过深度学习等技术，AI建立高效的供应链系统，形成基于消费者、门店销售、客户一体化的智能供应链智能管理体系，把用户端潜在需求的判断联动到供应链、物流仓储系统，实现供应链管理智能化。

五是智能客服系统：人工智能对于这类工作的适用性极高，在购物过程中开展智能客服，从售前到售后的各个环节，可极大提升服务效率和满意度。

总的来看，人工智能技术使打通线上线下，连接单点智能场景成为可能，用消费新体验来释放新兴消费的潜力，让实物消费和服务消费得到回补，成为消费市场的新增长点。

自动驾驶商业化加速

在新基建和新冠疫情的双重推动下，越来越多的国内外厂商开始试水自动驾驶领域，相关行业应用案例也在不断涌现。目前，自动驾驶汽车已经在外卖和物资配送、物流、城市消杀作业等方面发挥作用。

此外，自动驾驶出租汽车、自动驾驶卡车和物流车、固定路线运营、最后一公里配送等商业化场景也在国内外落地。

白皮书指出，AI将在自动驾驶领域，尤其是仿真测试平台发挥关键作用。自动驾驶技术的发展离不开测试，需要通过大量测试来验证技术的安全性和成熟度。

但就目前而言，一方面监管政策对测试牌照、测试道路等有着严格的限制；另一方面实际道路测试还面临着测试成本问题。这些都不利于自动驾驶技术的发展迭代。

由于实际道路测试的诸多现实，仿真技术和仿真测试将成为推动自动驾驶行业发展的新引擎。目前国内外自动驾驶厂商都在加大布局仿真平台的建设。

数字内容创新

换脸、人脸合成、语音合成、视频合成、数字虚拟人等诸多“深度合成”技术的应用，为数字内容带来了重塑。深度合成依赖于人工智能技术，可以从大量数据中自主学习深度学习算法。随着其技术的不断发展，目前的主要研究方向包括：

深度学习合成技术朝着综合性的方向发展：综合运用人脸替换、人脸再现、人脸合成、语音合成等技术制作更复杂的视频合成。
面部合成之外的全身合成：可用于学习源人物的舞蹈动作映射到目标人物之上。
3D合成成为下一阶段的重点。如虚拟歌手、主播、教师等。

基于以上研究，深度合成技术在泛娱乐和数字内容领域的应用创新也将会持续涌现。就目前而言，其主要应用场景包括：

一是为影视创作和制作开拓新空间。

二是带来全新的娱乐方式：如FaceAPP、ZAO等图像、视频合成应用，可以让实现风格迁移，让用户通过人脸融合，“虚拟地参与”电影演出等。

三是升级电商体验和内容营销：通过深度合成技术让用户体验“虚拟试装”，用AI虚拟形象代替网红模特等。

四是带来更多的数字虚拟人：数字虚拟人融合了人脸合成、语音合成、自然语言处理等多种AI能力。目前业内已开始大力开发游戏直播、演唱等领域的AI虚拟形象。

虽然深度合成技术在内容创意、营销、社交、娱乐等诸多领域有广泛的应用场景。但其技术的发展也带了了“伪造”和“欺骗”的可能。面对新技术可能产生的负面挑战，政府和监管者应当包容审慎，避免阻碍技术有益的、创新性的应用。

加强制度保障，构建可持续发展的AI

围绕人工智能实用性和伦理问题的争议从未停息。例如疫情期间，健康码、面部测温等多次引起大众有关隐私和效率问题的讨论。从长期发展来看，技术和市场固然重要，但现阶段更需要构建人工智能治理体系，保障其健康和可持续发展。

报告中指出，未来对AI技术的良好治理需要注重考虑三点：

构建多层次的治理体系，采取敏捷灵活的治理方式。多层次的治理体系比单一维度的立法和监管更能适应人工智能快速发展迭代、日益复杂化的特征。此外，为避免过于严格和过于细致的法律要求，可以采取事后监管、事后追责等轻监管的方式。

立法和监管需要充分考虑国际竞争、技术的经济社会价值等视角，推行先行先试。在全球竞争中心日益转向人工智能等新技术的大背景下，过早或过度的监管都可能削弱已过在AI领域的竞争力。另外，前沿科技领域有必要出台更包容的新技术政策和立法，推行先行先试，给与适度宽松的发展空间。

推动人工智能治理的跨学科参与和国际合作。AI研究与发展需要吸纳不同种族、性别、文化和社会经济阶层以及不同领域人员的思考和顾虑。监管也需要采取多利益相关方共同参与的模式，广泛听取行业主体、专家和公众意见。在全球化背景下，可持续发展的AI需要各国在AI技术、产业、伦理、治理等方面加强合作，构建包容、安全可持续发展的AI。

腾讯助力AI产业发展，开启公益挑战赛

透过报告我们可以看到，人工智能已经走过了技术爆发的阶段，正在逐渐深入到产业，走进我们生活的方方面面。

在AI与产业深度融合的关键时期，AI公司们不再是以往的旁观者，而是出演关键角色。多年来，腾讯优图实验室坚持技术研究和产业落地两条腿走路，在不断打磨算法的同时，探索AI的落地场景和应用价值。

近日，腾讯优图再次携手联合国儿童基金会、深圳市信息无障碍研究会、桃花源生态保护基金会，共同发起了腾讯Light?公益创新挑战赛。

本次比赛以“AI，让美好现在发生”为主题，分别以未成年人网络保护、“适老化”无障碍设计、野生动植物保护三大公益场景为赛题，邀请参赛者使用AI技术打造公益小程序，助力解决三大赛道的痛点问题。

过去几年，腾讯优图在科技公益方面已经做了很多探索尝试。谈及未来的科技公益的探索与落地，吴运声表示，未来优图将开放积累多年的AI能力，也希望更多的开发者和公益界的有志之士加入进来，努力用技术去做一些改变。

雷锋网雷锋网雷锋网