独家披露:VC数千万抢投1位北大学霸 让数据标注比PS简单 效率升10倍

记者 | 古典典

在AI行业有句行话:“有若干智能,就有若干人工。”

在贵州的农村或山西的家当园,成千上万人的工作是做AI的“师长教师”。他们被称作“数据标注员”,日常工作是给车道线打点,或是给人脸拉框,将各种各样的生活场景数据“投喂”给AI。2019年,中国数据标注家当的范围达到了30.9亿元,但在外界的印象里,这依然是一个劳动密集型家当。

“数据比如是AI行业成长运行的石油,如今的问题是石油的供给不稳定。AI的成本须要降下来,如许AI应用才能在各个行业落地。”2018年,此前在网易工作的赵剑与此前在阿里工作的章越参加了AI创业的行列,从最上游的AI数据入手,创办了曼孚科技。

曼孚科技主打的产品是数据办事SaaS平台“SEED”,可以将企业标注成本降低30%,部分场景的标注效力达到本来的近10倍;此外,公司研发的AI数据中台体系,可以与AI练习平台无缝对接,晋升AI算法迭代的效力。

今朝,SEED平台可以处理计算机视觉、语音交互、天然说话处理等范畴的数据,办事的客户涵盖阿里巴巴、百度、字节跳动、网易等科技企业,以及高校和传统制造企业等。曼孚科技已于近日完成了数切切元的天使轮融资,本轮融资由立元创投领投,老股东伽利略本钱持续加码,春泥本钱担负独家财务参谋。

注:赵剑承诺文中数据无误,为内容真实性负责。铅笔道作客不雅真实记录,已备份速记灌音。

改变AI的上游

曼孚开创人赵剑对创业有一种执念。在北大年夜读书时,他已经有了两次创业经历:做了外国留学生交友平台“Laowai In Beijing”和托福白话点评软件“众余toeking”。2015年卒业后,他进入网易从事市场营销的工作,但一向没有放下创业的妄图。

2018年,他终于比及了机会。那时,创投圈热烈地评论辩论着5G、区块链和AI,技巧创业者纷纷入局。赵剑按捺不住,找到了在阿里做架构师的高中石友章越,同怀创业妄图的两小我坐下来开端选赛道。

做5G,两小我都没有硬件背景;做区块链,两小我认为技巧立异的空间有限;最后,他们选择了AI。AI行业有三大年夜板块??算力、算法和数据,赵剑和章越最终放弃了须要大年夜量烧钱的算力和算法,选择进入尚处于初期成长阶段的AI数据行业。

他们发明,AI的进步,尤其是有监督进修算法的进步,须要进修大年夜量的标注数据,是以催生了数据标注行业。在不少人工智能家当园,如许的场景数见不鲜:几百个数据标注员坐在一排排屏幕前,给车道线打点,或是给人脸拉框,把复杂的生活场景数据源源赓续地“投喂”给AI。行业内风行这么一句话:有若干智能,就有若干人工。作为行业上游,数据标注经常给人“人工智能富士康”的刻板印象。

依附密集劳动力的数据标注,成品往往差能人意。“很多企业培训数据标注员就是放个视频,新人可能没真正学会就上岗了,导致的成果就是交付的时刻良品率低。”除此之外,曼孚科技开创团队还发明,甲方的项目需求往往不是持续的,数据标注团队经常会有空档期,这一时代企业就要包袱不菲的人力成本。

基于AI数据行业以上的各种问题,曼孚开创团队明白了在AI范畴的创业偏向,即经由过程开辟一套完全的数据标注SaaS体系,改进人力密集型的AI数据标注行业,然则本钱市场的表示与预想中的有些不合。

“AI数据办事行业处于成长的初期,本钱市场对这个范畴的研究并不深刻,别的,因为SaaS体系的开辟周期较长,导致投资回报周期比较长,国内本钱市场对该行业处于持续不雅望的状况。”

固然国内市场尚未意识到SaaS平台的价值,但在大年夜洋另一端的美国,数据标注公司Scale于2019年融资1亿美元,跻身独角兽;数据标注巨擘Appen花3亿美元收购了竞争敌手Figure Eight,此外还稀有十家同业获得了数切切美元的融资。赵剑认为,科技公司对AI标注数据集的请求越来越精细,场景越来越垂直,需求量越来越大年夜,SaaS数据处理平台的重要性会凸显出来。

在创业的早期,曼孚开创团队见了十几位投资人,一次次地去复述本身的项目构思,终于碰到了伯乐??伽利略本钱。当时赵剑对伽利略的开创合股人说了一句“数据决定AI,AI改变世界“,让对方印象深刻。“ 当时我们的产品解决筹划主如果用于无人驾驶的,我们认为无人驾驶是将来AI的核心应用范畴,这和伽利略本钱的断定是一致的。”

拿到了数百万元种子轮融资后,赵剑在2018年开端补强团队,来自google的产品合股人蒋筱萌在这个阶段参加公司。

可以做项目治理的SaaS

公司成立后,曼孚科技开创团队先做了一个多月的市场调研。和科技公司的算法团队聊了一圈后,他们发明甲方不仅须要标注效力对象,也须要更好的项目治理对象。根据客户的需求,曼孚科技开创团队开端研发公司的核心SaaS产品??SEED数据处理平台。

SEED平台

2019年10月,SEED平台上线。它借鉴了PS的部分功能,但在交互体验上更友爱,标注员更轻易上手。标注员在应用SEED后,在部分场景下,单人标注效力可以晋升近10倍。

SEED在项目治理上也更进一步。“乙方标注的过程对于甲方就是个黑盒子。他给你承诺一个月标完,但最后可能拖了两三个月才能交付。”为了改良迁延现象,团队在SEED中设置了可视化的治理与协同模块,并给介入项目标人员分出账号权限。

在晋升效力的同时,SEED平台还能为企业用户降低90%的治理成本。

“ 国内无人机头部企业在看过我们的产品后,直接撤了本身的数据标注团队。他们认为我们的项目治理做得很细,用我们的产品成本能降下来。”赵剑对本身的产品信念实足。

最开端,曼孚科技开创团队经由过程BPO的情势找到了第一批科技公司客户,包含阿里巴巴、百度、字节跳动、网易等。跟着SEED的口碑逐渐建立,其他行业的客户也找到了曼孚科技,包含传统车企、高校等等。

跟着客户的增多,客户需求也越来越多元。高校和研究院的经费不如科技公司充分,更偏向于把SaaS产品买下来,让学生去标注;一些AI科技公司对数据安然很敏感,会请求本身架设办事器。对于稀有据安然请求的客户,曼孚科技可以供给SaaS平台的私有化安排,或者混淆云的解决筹划。

苏宁金融研究院指出,将来5-10年内,人工标注仍将是AI数据标注的主流,占比跨越75%。人工标注的成本与范围很可能成为限制AI技巧成长的关键身分。曼孚开创团队表示,“AI的成本须要降下来,才会有更多行业去做AI。我们做SaaS就是为了把数据这一块的成本降下来。”

今朝,SEED平台可以处理计算机视觉、语音交互、天然说话处理等范畴的数据,平台经由过程义务建立、履行标注、数据质检等环节搭建起了一套项目治理体系。SEED平台正在完美语音场景,目标是成为覆盖全场景的AI数据中台。

现如今,在主动驾驶范畴,SEED平台在3D点云处理技巧上已经积聚了必定的业内有名度。曼孚科技的下一个目标是成为主动驾驶范畴的头部办事商,并在将来两年拓展海外营业。

“美国同业的价格是我们的1.5-2倍,我们有很大年夜的成本优势。”赵剑泄漏,国外科技巨擘在开展中国营业时会带来很大年夜的数据标注需求。“特斯拉的无人驾驶要在中国做本地化的适配,就须要对中国的路况数据做标注处理。”

与种子轮融资时的艰苦状况比拟,获得了用户承认的曼孚科技,在本钱市场上也见到了曙光。近日,曼孚科技完成了数切切元的天使轮融资,本轮融资由立元创投领投,老股东伽利略本钱持续加码,春泥本钱担负独家财务参谋。