AI时代的GitHub,这个陆奇看好的方向,终于有人做了

允中 发自 凹非寺

量子位 报道 | "大众,"号 QbitAI

面向AI时代生计成长,什么最重要?

数据、数据,照样数据。

特别是中小企业、转型中的广大年夜传统企业,数据、优质数据,寻找并治理数据,更是刚需中的刚需??就像互联网开辟时代里对代码共享和治理的需求那样。

所以假如有面向AI时代打造一个数据偏向的GitHub,是不是契合刚需痛点?

这不,还真有AI创业团队这么做了。

并且看好的人中,还有个叫陆奇的big name.

GitHub for Data

出品者, 格物钛

一家AI数据托管和数据协作SaaS供给商,开创团队也都是一线技巧工程师,深谙当前痛点地点。

一方面,AI数据预备与工程义务所消费的时光占到了大年夜多半AI项目标80%以上。在AI练习中,假如没有足够的高质量练习和测试数据集,则很难练习出高质量的AI模型。

是以,面对AI开辟过程中的高额隐性成本,供给高质量、场景化的真值数据,已经成为AI家当链的核心诉求之一。

另一方面,人工智能依附大年夜量的数据作为“思虑”和“决定计划”的基本。以往企业对数据开放的立场广泛较为保守敏感,然而伴跟着各类AI应用处景落地的技巧难点逐渐浮出水面,以无人驾驶范畴为例,很多驾驶场景具有稀缺性,仅凭一家之力构建包含所有的交通场景的数据集将消费巨额的数据采集成本,并且很难在短时光内一步到位。

于是格物钛的目标,就是欲望可以加快打破工资壁垒,让更多优质、宏大年夜数据用开源共享的方法,实现合作共赢。

就像GitHub在代码范畴发挥的基本举措措施感化一样,AI数据范畴,如今紧缺如许的基本举措措施。

并且跟着AI落地深刻,另一个近况和事实愈加清楚明白:

AI落地的实际世界中,只有一小部分机械进修体系由机械进修代码构成,但其所需的周边配套基本举措措施,宏大年夜而复杂。

个中,数据、数据集,就是最关键的一环。假如进一步聚焦于国内,还会发明适配AI项目落地的真值数据,更是稀缺。

有统计显示,如今国内有近60万AI开辟者,但面对的近况是:

  • 开源数据集广泛海外化,匹配性有限;
  • 下载解析难度大年夜,效力低;
  • 数据参差不齐,质量难包管;
  • 最核心的是针对中国本土化的数据匮乏。

这也进一步造成70%以上企业,数据共享难、数据版本治理纷乱、数据可视化标签转换难,缺乏非构造化数据专业治理的共享协作平台。

所以摆着格物钛面前的,只剩下一个问题:

How?

寻集令

顾名思义,寻找数据集。

分两步走。

第一步,跟AI业内前锋公司合作。

合营打造集合主动驾驶、互联网泛娱乐、新零售、聪明城市和在线教导等AI贸易落地最急切的 AI公开数据集生态联盟

俗话说就是开个头、打个样,看到价值,就会有更多企业和组织参加。

在寻集令宣布会上,元戎启行、新石器、速腾聚创、觉非、爱驰汽车,酷家乐等等都“站”台支撑。

格物钛方面称,星星之火可以燎原,欲望从寻集令第一枪开端,打造中国最具范围化的非构造化数据集平台。

类型上,周全覆盖图像、视频、语音和文本类型。

资本上,兼具公开数据集以及AI头部企业数据集资本。

范畴上,则从贸易落地最紧急的主动驾驶、互联网泛娱乐、聪明工业、新零售、线上教导和直播等开端。

此外,欲望这个数据集平台,可以成为GitHub一样受开辟者迎接的社区,并且供给更多极致的数据集治理体验,包含安然等等题中之义的请求。

实际上,固然国内一向缺乏如许的数据集开源平台,但并不料味着业内没有测验测验。

之前立异工厂结合国内头部AI公司提议AI Challenger大年夜赛,百度、腾讯、华为、字节跳动等公司也都稀有据集为核心资本的挑衅赛。

只是始终,缺乏一个“全职”展开这件事的人。

而数据集之重要,AI从业者都应当很清楚。

比如假设没有ImageNet,那这波AI中兴应当还不会如斯狂飙突进,是李飞飞李佳等华人科学家在数据集上的尽力,加快催化了海潮中兴。

别的,数据集也能推动产学研加倍慎密地合作,资本假如能更便利被应用,或许就会有更多力量参加个中,也就更有机会赞助实现该范畴算法的晋升和优化。

说白了,公开共享数据集,就像是提议了一场打擂,产学研范畴的各方高手,既是自我检测算法,也能赓续让数据集地点场景,获得更高更强的推动。

所以从这个角度,或许也不难想见,为啥能获得陆奇的支撑。

在奇绩创坛的Demo Day上,这个项目就被重点介绍过,并且陆奇还亲自“站”台为寻集令作了致辞。

总而言之,功德一件,且终于有人做了。

谁做的?

最后也介绍下格物钛背后的开创团队,核心成员都是技巧出身。

开创人及CEO 崔运凯,Uber无人驾驶团队早期员工,经久从事人工智能研究和产品化, 经历Uber无人驾驶从50到1500人的成长。Uber无人驾驶部分最年青的Tech Lead,第一个华人Tech Lead。

其他两位结合开创人, 陈麒任,Snapchat早期员工,聊天体系、游戏体系的核心开辟者和技巧负责人。有多年分布式体系软件开辟经验。主导开辟snap游戏平台,是snap的将来重要盈利方法。

王广宇,阿里巴巴本地生活办事公司(饿了么),高等产品专家。携程度假事业部本地领导平台产品负责人,完成平台从0到1,从1到100的搭建,实现了平台的年3倍增长,为公司带来过亿的营收。

格物钛此前获得了红杉中国、真格基金、云启本钱以及风和本钱的投资,还入围了首届奇绩创坛。

? ?

本文系网易消息?网易号特点内容鼓励筹划签约账号【量子位】原创内容,未经账号授权,禁止随便转载。

参加AI社群,与优良的人同业

量子位 QbitAI ? 头条号签约作者

?'?' ? 追踪AI技巧和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~