数据标注的未来:人工服务智能

导读:数据标注的未来:人工服务智能 在人工智能迅速兴起和发展的背景之下,作为人工智能的上游产业,数据标注以更为迅猛的速度快速成长起来。这其中,一方面是因为人工智能对于数据要求的不断增长,另一方面也是数据标注自身人才需求量大、吸纳人才能力强的原因共...

数据标注的未来:人工服务智能

在人工智能迅速兴起和发展的背景之下,作为人工智能的上游产业,数据标注以更为迅猛的速度快速成长起来。这其中,一方面是因为人工智能对于数据要求的不断增长,另一方面也是数据标注自身人才需求量大、吸纳人才能力强的原因共同导致的。

在数据标注行业发展的前期,数据标注一度被称为“人工智能背后的人工”,这一描述从某种程度上也符合了数据标注前期发展的特点。然而随着人工智能的迅速发展,这样的描述早已经不能够适用数据标注目前的发展特点。

数据标注行业也已经开始进入到人机协作的阶段,数据标注市场需求量很大,需要更加专业的人及高效的机器协助,机器标注所占的比重会不断提升,AI 技术与数据互补,通过 AI 技术提升数据效率,数据反过来服务于技术。

为降低人工成本,提高效率,不少互联网技术公司及第三方数据服务商在开发自己的标注工具。去年 10 月,Google 发布了用于完整图像标注的人机协作接口 Fluid Annotation,利用它标注图像中每个对象和背景区域的类标签与轮廓,可将标注数据集的创建速度提高三倍。数据标注众包平台也不断涌现,京东众智、百度众测、figure-eight、亚马逊的 Mechanical Turk 等。

未来,机器标注、人工辅助将成为可以预见的发展趋势。这对“数据标注村”来说或许并不是一件好事。但无论何时,机器都不可能完全取代人工。现阶段人工标注的准确度要高于机器,机器只能跑出有一定比例的正确结果,更精确的结果仍需要人工来标注,且发挥的作用更关键。

此外,在质检环节,人的作用也无可替代,标贝数据校对采用人工为主的处理方式,采用遵循“一审、二校、三验”流程,机器会抽检、验收一部分数据并给出预处理结果,最终的结果要靠精细化的人工校对。

数据标注的人机结合,对数据标注行业的人才无疑提出了更高的要求。不可否认的是,目前数据标注行业仍旧缺乏相应的人才培养标准和准入机制。AI优评作为行业人才中心,联合国家职业资格培训鉴定实验基地统一核发的《人工智能技术服务-数据标注与审核》高新技术能力证书,为行业输送优秀的人才,并直接对接到就业单位,为行业的发展做出了自己的贡献和努力。