人工智能成功的关键是人类监督和经过熟练训练的数据的结合

来源:CPDA数据分析师网 / 作者:数据君

我们正处在为未来创新树立先例的关键时刻

虽然该行业似乎正在努力实现完全自动化,但人工智能需要训练有素的人类专家的指导。事实上,如果没有经过成功训练的数据和专家以及多样化的人类监督,人工智能的未来可能会弊大于利。

这是人工智能成功的基础

培训数据是确保人工智能项目实现其承诺的重要基础,再到特斯拉,人工智能系统都获得了数据,以开发和改进它们的机器学习算法,但如果用于教授程序的信息不丰富、不健壮,程序本身就无法正常运行。换句话说:进质量等于出质量,数据训练是一个过程,在此过程中,人类注释者检测、选择和标签对象跨图像、视频和3D模型渲染。人工智能算法然后处理这些标注的数据,并使用它做出明智的决定,尽管概念简单,但96%的人工智能程序在数据质量方面遇到了问题,其中有8 / 10的项目直接失败。除了制造效率低下的产品之外,未经训练的数据还可能导致危险的偏见,为医疗保舰环保、自动驾驶汽车和虚拟现实等行业的关键决策提供信息。

这些漏洞比许多提供商愿意承认的要普遍得多

人工智能(Watson AI)为关键诊断和治疗决策提供信息,然而当产生不安全的建议时,这种基于假设患者数据的解决方案被发现无效,这些不同的错误是由相同的固有缺陷引起的:不完整的训练数据。围绕该技术的高科技炒作常常使人工智能提供商无法承认需要人为干预以确保错误不会持续存在。虽然依赖较孝不那么多样化的数据集可以节省时间和金钱,但这些捷径造成了结构性缺陷,威胁到人工智能的成功。

为什么人工智能需要人在循环中

尽管公开对话主要关注的是人工智能篡夺人类,但这项技术无法在没有人类监督的情况下发挥作用,事实上,人工智能只有在将其先进的技术能力与一个多样化的、专家在回路中的人工团队相结合的情况下才可靠,因此才会成功,在数据训练过程中,人类负责标记不同的数据集。例如,在自动驾驶汽车行业中,人在环中的团队会看到一系列街道、高速公路和十字路口的可视资产。然后,每个注释者选择并标记图像中的对象,如行人、路牌和摩托车,训练机器学习算法,以便以后检测和理解这些对象。

cpda数据分析师

只有人工智能标记初始数据集

可能会错过重要的对象,导致人工智能“司机”错过现实世界中的行人,人不仅是必要的标签数据正确,但在创建数据集本身,如果训练数据集的内容没有人为的监督,那么在这个初始阶段也可能引入偏差,想象一下,如果一辆无人驾驶汽车的训练数据集中没有雪地驾驶,后来又在现实世界中遇到了这种情况,那么它的潜在弱点会是什么。

人工智能成功的关键是人类监督和经过熟练训练的数据的结合,而不是纯粹的自动化

随着人工智能在我们的日常生活中变得更加普及和普遍,我们现在灌输的做法将决定我们未来技术的有效性,通过确保数据集是高质量的,以及他们的人工智能与一个多样化的人在环中的团队协同工作,供应商可以确信他们的解决方案将会成功。