十大针对机器学习的文本注释工具与服务,你会选用哪个?

今朝,从搜刮引擎与情感分析,到虚拟助手与聊天机械人,机械进修应用处景中的很多研究范畴,都须要经由过程文本注释对象与办事来供给精确性。在AI研究与开发行业中,发明或创建可注释的数据对于项目团队而言,是一项昂贵而艰苦的义务。是以,人们经常把那些持有大年夜量高质量已注释数据的团队,戏称为“家里有矿”。不过荣幸的是,业界有着很多可用于文本注释的对象和办事,可以或许赞助我们获取所需的数据,进而实现包含实体提取、词性标注、以及情感分析在内的各类操作。

下面,我将和您一路商量今朝十大年夜针对机械进修的文本注释对象与办事。您可以根据本身项目标实际情况,从中做出选择并试用。

1. Tagtog

Tagtog是一款由波兰软件公司开辟的对象,可用于主动化或手动注释文本。Tagtog既支撑原生的PDF注释,又包含了可用于主动化文本注释的预练习NER(Named Entity Recognition,定名实体辨认)模型。除了Tagtog对象,该公司还拥有来自各个范畴的专家收集,可以或许为文本注释供给专业的办事。

2. LightTag

LightTag对象可以或许便利企业和项目成员在内部平台上,标记其文本数据。在套餐设计方面,尽管该对象的入门包是免费的,然则不合级其余对象包,有着不合的售价,以及每个月可供给注释的数量限制。个中,免费版的数量是每月1000个注释。

3. Lionbridge AI

专门从事说话学研究的Lionbridge,不只拥有百万用户范围的社区,并且可以或许支撑三百多种说话。平日,它可以或许供给的文本注释办事包含:文本提取、情感分类、实体注释、定名实体辨认、以及说话成分分析等。此外,Lionbridge还供给了一种可以自定义数据注释软件,以便应用户团队将其授权并应用到各类文本注释的项目中。

4.Scale

总部位于旧金山的Scale,是计算机视觉和NLP(Natural Language Processing,天然说话处理)数据注释办事的供给商。经由过程将人工干涉与Scale平台相结合,该公司供给了诸如OCR转录、文本分类与比较等文本注释类型的办事。

5. KConnect

很多AI研究人员和开辟团队往往会碰着的一个问题是:若何才能拜访到那些附属于高度专业化范畴的AI练习数据。KConnect团队就致力于赞助注释者用户快速、有效地对医疗范畴的数据进行分类和注释。具体而言,KConnect为医疗类信息供给了语义注释、文本分析、以及语义搜刮等办事。

6. Clickworker

总部位于美国和德国Clickworker,是一家众包公司。它拥有宏大年夜的从业团队,可以或许履行各项义务。他们在文本注释范畴所供给的办事包含:情感分析与分类。

7. ParallelDots Text Annotation API

ParallelDots可以或许供给文本注释类对象和多种API。他们的解决筹划包含:情感分析、情感分析、关键字提取器、以及定名实体辨认等。

8. Appen

作为一种以浩瀚情势实现AI练习数据的办事,Appen拥有来自各个国度的大年夜量供献者。它所供给的文本注释办事涵括了:情感注释、意图注释、以及定名实体注释等方面。

9. Dandelion API

源自意大年夜利的Dandelion API供给了丰富的主动化文本注释对象。尽管它是该范畴相对较新的创业公司,然则其对象可被用于实体提取、情感分析、以及文本与内容分类等不合场景中。

10. Dataturks Text Annotation Tools

借助着数据注释内部API、以及上千家合作外包公司,Dataturks可以或许供给各类图像和文本注释的对象。具体而言,它的文本标记功能包含:文本分类、定名实体辨认、以及词性标记等。

借助上述各类先辈的文本注释对象,信赖您的团队可以或许构建出属于本身的自定义工作流程和数据注释平台,并可以或许知足特定应用处景的项目需求。

原文标题:10 Best Text Annotation Tools and Services for Machine Learning,作者: Limarc Ambalina

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】