IBM在自然语言处理方面的创新帮助企业更好地理解业务语言

在 IBM,我们专注于开辟和扩大企业天然说话处理 (Natural Language Processing,NLP) 功能,旨在赞助企业深刻洞察、答复问题并做出更明智的决定计划,即使他们只有很小的数据集或者缺乏专业常识。

固然人类说话对孩子来说很轻易控制,但即使是最先辈的机械,这也极其复杂,教人工智能懂得人类意图最具挑衅性的工作是它须要大年夜量的数据、大年夜量的时光和专业常识。

当您问问题时,您到底想说什么?您想达到什么目标?您到底想获得什么信息?人类的说话充斥了细微的差别,导致有很多方法来表达特定的意图。对于聊天机械人等大年夜部分人工智能而言,这切实其实是个问题,当碰到复杂的语法时,它们会掉足,因为它们只存眷具体的单词,而不会接洽更广泛的高低文语境。

懂得Watson Assistant新的加强功能,看看我们天然说话懂得新模型是如何脱颖而出的。

为了赞助企业应对这一挑衅,IBM在IBM Watson Assistant中推出了改进后的天然说话懂得(Natural Language Understanding,NLU)新模型,用于意图分类。在基准测试中,与贸易筹划比拟,新的意图检测算法更为精确。(1)

IBM 研究院赓续改进天然说话处理功能,并融入到 IBM Watson 中。

此外,我们还在 IBM Watson Assistant 和 Watson Discovery 中引入了新的天然说话处理加强功能,今朝已经供给 beta 版。这些新功能是在 IBM 研究院(IBM Research)的带领下开辟的,目标是进步人工智能的主动化程度,以及天然说话处理的精度。

浏览懂得才能(Reading Comprehension)这一功能,它返回包含在较长段落中的具体事实或者简短谜底。今朝,Watson Discovery 可以或许肯定与查询相对应的最佳“段落”。浏览懂得从企业文档集中检索大年夜量候选段落,搜刮当前问题的谜底并返回响应的谜底。浏览懂得应用高低文情景懂得功能来懂得查询,应用大年夜量的说话模型从当前的文档中提掏出具体的谜底,然后用户会收到一个信念分数,该分数表示体系对每个谜底的置信度。

这种功能异常合适金融行业的组织。例如,假如您正要做出放贷决定,可能须要从复杂的文档中找出精确的事实,这些文档平日是由人工进行浏览和审查的。之前,Watson Discovery 会返回建议的段落。而采取浏览懂得,用户将获得精确的谜底(例如,“当前贷款的利率是若干?”“2.9%”),这节俭了他们手动搜刮大年夜量文档的时光。此功能现已在 beta 版中开放给部分 Watson Discovery 用户。

FAQ 提取(FAQ Extraction)今朝供给 beta 版,是一种新鲜的谜底检索技巧,它在网页上爬行以检测常见问题和问答,应用这些内容经由过程 Watson Assistant 供给简洁、最新的谜底。

FAQ 提取旨在与 Watson Assistant 的 Search Skill 协同工作,在文档中寻找最终用户问题的谜底。这种功能使得最终用户在与人工智能虚拟坐席交互时更轻易找到他们须要的谜底。

例如,企业可能很难跟上赓续变更的公共指导,即许可重返工作场合或者实体店重开的规定。假如没有 FAQ 提取如许的机制,将须要大年夜量的资本才能使人工智能客服解决筹划保持最新状况。相反,Watson Assistant 只需知道官方 FAQ 内容的 URL 就能跟上最新信息。

摸索Watson Discovery和Assistant中的天然说话处理新功能。

最后,Watson NLP 解决筹划如今还支撑 10种其他说话。IBM Watson Discovery 如今支撑波斯尼亚语 (Bosnian)、克罗地亚语 (Croatian)、丹麦语 (Danish)、芬兰语 (Finnish)、希伯来语 (Hebrew)、印地语 (Hindi)、挪威语 (Bokm?l)、挪威语 (Nynorsk)、塞尔维亚语 (Serbian) 和瑞典语 (Swedish)。而 Watson 天然说话懂得 (NLU) 如今支撑丹麦语 (Danish)、挪威语 (Bokm?l)、挪威语 (Nynorsk)、芬兰语 (Finnish)、捷克语 (Czech)、希伯来语 (Hebrew)、波兰语 (Polish) 和斯洛伐克语 (Slovak) (关键字)。

这些进步基于 IBM 研究院的天然说话处理立异渠道。本年事首?年代,我们宣布将采取一些为 IBM 研究院 Project Debater 供给支撑的核心天然说话处理技巧,包含高等情感分析(习惯用语懂得)、总结、主题聚类和关键点分析等,并在 Watson Discovery 等 IBM 的天然说话处理产品中实现了贸易化。

这些立异可以赞助企业进一步懂得并从其营业数据中获取真正的价值,从而可以或许做出更明智的决定计划,并为客户和员工供给更高效的深度看法。

有关IBM将来偏向和意图的声明仅为了解释目标和目标,如有更改或者撤回,恕不另行通知。

参考材料:(1) 2020年 11月,对话型人工智能软件公司 Jio Haptik 科技揭橥了一篇技巧论文,将其产品的机能与谷歌、微软和RASA的同类产品进行了比较。除了 IBM Watson Assistant 之外,其他贸易解决筹划的机能取自 Arora 等公司进行的 2020 基准测试研究。IBM 在 IBM Watson Assistant 上运行了与 Arora 等公司申报的雷同的机能测试,目标是用于本分析。