万亿新基建,人工智能的落地与这项AI数据最高标准紧密相关

近两年来,人工智能市场继续快速增长。IDC认知/人工智能系统研究主管David Schubmehl表示,希望利用人工智能、深度学习和机器学习的供应商需要迅速采取行动,在这个新兴市场中占据一席之地。德勤在《全球人工智能发展白皮书》中预测2025年世界人工智能市场将超过6万亿美元,2017-2025年复合增长率达30%。

艾瑞报告数据显示,在政策、经济等利好消息的刺激下,中国人工智能市场异常火热。受此影响,其独特的数据需求带动了以数据清洗和标注为主的AI数据服务行业的快速发展;同样,物联网技术的发展使线下业务的数据被大量采集起来,数据量呈指数级发展;人工智能下的智能安防、智能驾驶、智能家居等应用场景的需求剧增,作为AI的底层技术支撑,AI数据服务行业尤为重要。

过去我们在谷歌上搜索一个单词或者图片,经常可能会被误导,很大一个原因就是数据质量不高。2018年初,谷歌的一款人工智能APP出现将一名亚洲男性识别为女性等关键错误,最后导致了该APP下架。

谷歌发言人对此表示:导致这种原因的结果是因为目前图库所存的图片不够多,历史画作无法对应现实世界的真实性。今天,在不断发展的人工智能、机器学习技术和商业模式创新基础上,AI数据服务行业对数量和质量的要求也有了显著提高。

追求AI数据质量的人工智能时代

作为人工智能的三大决定性影响因素,算法、算力和数据,在过去的几年时间里也纷纷取得了突破。机器学习、深度神经网络等算法理论的升级,让人工智能在核心技术方面取得重要进展;GPU、并行计算等异构计算及AI芯片、5G的普及,成为人工智能计算能力的重要支撑;此外,全球数据的快速增长催生AI数据产业蓬勃发展,在AI数据的加持之下,新一代人工智能的发展也成为热点。

艾瑞数据显示,2019年中小型数据供应商份额比预期缩小了20.8%,头部效应逐渐显现。随着应用端的业务复杂度增加、需求多样化,数据服务领域势必面临竞争和洗牌,AI数据领域正向着专业化、高质量的方向发展。

作为人工智能的三要素之一,“数据”从本质上决定了人工智能的落地水平。通常来说,数据标注得越准确,数量越多,模型效果越好,最后的AI产品效果就越好。

据了解,数据准确率=验收合格数量/全部数量。在数据标注行业发展初期,数据标注准确率只有70%-80%上下,随着行业的不断沉淀,当下整个行业数据标注准确率一般是在95%左右。

当前,中国经济发展已从高速发展时代走向高质量发展阶段,科技赋能正发挥着重要的推动力量。围绕AI数据产业的升级和发展,云测数据总经理贾宇航表示,目前人工智能行业已经从感知智能上升到认知智能,需要处理更深入的信息等能力。

“新基建”背景下,高质量AI数据助推人工智能快速升级

2019年以来,国家层面高度重视新型基础设施建设,不断加快并完善 5G 基建、特高压、城际高速铁路和城市轨道交通、新能源汽车充电桩、大数据中心、人工智能、工业互联网等领域的建设布局。

“新基建”不同于“铁公基”,是结合新一轮科技创新和产业变革的契机,面向国家战略转型升级提出的网络型基础设施建设,可全面促进信息技术的市场化应用,推动数字产业形成和发展,催生新产业、新业态、新模式,最终形成数字产业链和产业集群。“新基建”对传统产业进行全方位、全角度、全链条的基础改造,有利于推动产业结构优化升级,实现对经济发展的放大、叠加、倍增效果。

从传统基建到“新基建”,这一变迁反映出我国经济动力的重大转变。作为后疫情时代的最大确定性,新基建的重要方向人工智能技术将紧密拥抱产业,推动各行各业发展迈入新征程。而高质量的AI数据之于人工智能的意义,就在于可以最大程度上提升AI产业落地的效率和稳定性,进而反向推动新基建的落地。

以人工智能+家居为例。在AI技术的加持下,家居已经迈入智能时代,达到了技术重塑、产品重塑、场景重塑与体验重塑的新高度。加上疫情推动宅经济发展的情况,智能家居已步入上升快车道。

就现阶段而言,随着人工智能和传统行业的融合不断加深,AI数据的量级以及复杂程度也将会大幅提升。

在高质量AI数据的助力下,人工智能技术对真实场景世界的理解将更进一步。同时,5G、新基建、IoT和VR/AR技术的发展推动万物互联的实现,与人工智能技术相结合,创造出更多元的应用场景,服务于人类的生活。未来,具备底层技术创新和落地能力的企业将更受市场的重视和青睐。

新观察