了解 Microsoft Azure 认知服务:语言服务是什么以及它们能做什么
介绍
Microsoft Azure 认知服务让您的应用程序更加智能。它们为您的应用程序添加了人工智能元素。当我们说“智能”时,我们指的是应用程序如何提取文本背后的情感。例如能够识别照片中的人物、搜索到的结果随着时间的推移越来越与您的应用程序用户相关,甚至以人类说话的方式处理文本。
您无需了解任何有关机器学习的知识就可以完成所有这些操作。
Microsoft Azure 认知服务包含五个类别:视觉、语音、搜索、决策和语言。本指南将探讨最后一个类别,即语言。阅读本指南时,您将了解认知服务的语言类别的功能、组成它的不同 API 或服务,并且您将看到每个 API 的独特功能及其示例用法。
语言认知服务
Microsoft Azure 认知服务:语言服务组由五项单独的服务组成。
它们是:
- 语言理解 (LUIS) - 允许您的应用程序从自然语言文本输入中理解用户的意图。
- QnA Maker - 允许您构建问答服务。
- 文本分析 - 允许您构建从文本中提取情感、关键短语和语言检测的服务。
- 翻译文本 - 允许您的应用将文本从一种语言翻译成另一种语言。
- 拼写检查 - 允许您的应用检查多种语言的拼写。
单独使用或组合使用时,这些认知服务 API 可让您在应用程序中添加对语言、人类说话和写作方式的深度理解。
在接下来的部分中,我们将探索每个语言 API,以进一步了解它们可以做什么以及如何将它们应用于实际应用程序。
语言理解(LUIS)
您是否曾想过与应用程序进行对话 - 真正的对话,您输入自由格式的文本,应用程序就会理解您的意图?那么语言理解 (LUIS) 认知服务正适合您。
LUIS 利用认知服务提供的多个预构建的自然语言处理机器学习模型。这些模型允许 LUIS 以及你的应用预测应用程序用户输入的文本的含义并识别相关信息。
特征
理解 LUIS 特性的最好方式就是了解它的构成要素:
您的应用程序建立在端点、模型、意图、话语和实体之上。
意图是用户希望应用程序执行的操作。
话语是用户输入的用于调用意图的短语。
实体是话语中发现的任何重要项目。通常,实体对于意图定义的任何操作都很有用。
您的应用程序查询 LUIS 端点以获取有关对话数据的信息。
该端点是已发布的 LUIS 模型的结果。
该模型由三部分组成:意图、话语和实体。
定义意图、将示例话语映射到这些意图,然后识别这些话语中的关键短语的过程是创建 LUIS 模型的一部分。
- 发布模型会导致应用程序查询的端点。
LUIS 附带几个预建模型,或者您也可以创建自己的模型。
随着您的模型被使用,LUIS 会根据使用模式为您提供工具,使其变得更加智能。
总之,LUIS 提供了一种强大、可定制且可扩展的方式来创建支持对话的应用程序。
实际应用
对话应用程序的经典示例是聊天机器人。
想象一下,有一款应用程序可让您从任意数量的餐厅订餐。您可以在该应用程序中添加聊天机器人,这样用户就无需手动浏览和选择菜单项即可订餐。
意图的示例可以是 LookupMenu 或 PlaceOrder。
LookupMenu的语句可以是“查找 Jack's Pizza Shop 的菜单”。此处的实体可以是“Jack's Pizza Shop”。
当你的代码发送文本“查找 Jack's Pizza Shop 的菜单”时,LUIS 将返回信息,表明它认为用户的意图是查找菜单,而实体是“Jack's Pizza Shop”。而且,由于 LUIS 是基于机器学习构建的,它最终会认识到“查找 Jack's Pizza 的菜单”具有相同的意图。
问答制作器
认知服务 QnA Maker 采用半结构化数据(如常见问题解答或产品手册),并允许用户从中提出问题。
当您的应用使用用户的问题查询 QnA Maker 端点时,它会使用其数据集中的最佳答案进行响应。QnA Maker 的响应甚至包含文本,就像机器人回答了问题一样。
特征
为半结构化数据创建 QnA 知识库完全通过 Azure 门户完成。无需任何编程经验即可创建知识库。
创建知识库时,您需要将 QnA maker 指向半结构化数据源。该数据源可以是网页、PDF、DOC、Excel 或 TXT 文件。这些都应该通过面向公众的 URL 提供。
如果需要,QnA Maker 将抓取数据源中找到的任何链接,以创建尽可能完整的数据集。源越结构化,结果就越好。
创建知识库后,您可以查看哪些类型的问题会导致某些答案,并根据需要应用任何修复。这包括手动添加新问题和答案。
实际应用
假设您的公司刚刚推出了一款全新产品,其中包含一份安装说明手册。您可以创建一个集成 QnA Maker 的网站,让用户可以就产品的安装过程提出问题。
QnA Maker 首先会根据产品的使用手册创建一个知识库,然后,在您通过 Azure 门户调整问题和答案后,您的网站将包含一个搜索框。
用户无需翻阅说明书,只需输入“如何更换电池”即可。然后 QnA Maker 将发出相应的响应。
文本分析
认知服务文本分析可确定文本短语是具有积极情绪还是消极情绪。它还可识别同一短语中的关键谈话要点、确定短语使用的语言,并挑选出命名实体,例如人员或组织。
特征
一次对文本分析 API 的调用即可让您的应用获得有关传入短语的大量信息。
文本分析将确定短语中的情绪、关键谈话要点、语言和命名实体 - 所有这些都来自对端点的一次调用。如果您不需要所有信息,可以单独查询每个函数。
文本分析 API 已基于现有的自然语言处理机器学习模型构建。您无法更改或自定义它。
使用文本分析 API 的“情绪”部分时,它将返回 0 到 1 之间的分数。接近 0 的分数表示负面情绪,而接近 1 的分数表示正面情绪。分析最好针对短文本(一两句话)而不是长段落进行。
关键短语提取 API 会返回在给定文本短语中找到的重要术语列表。它最适合传入大量文本。
语言检测 API 将评估传入的短语并返回其认为该短语所用的语言。它还将返回置信度分数。如果传入的短语包含多种语言,语言检测 API 将仅返回其最有信心的语言。
最后,命名实体识别 API 会解析文本中的人物、地点和事物。它可以识别各种实体,例如人物、组织、日期和温度等数量。
实际应用
假设一家公司使用文本分析 API 来监控提及该公司名称的推文。
通过各种 API 运行每条推文,该公司可以轻松创建一个存储库,记录公众的情绪是正面的还是负面的。他们还可以从推文中提取短语,了解人们提到它们的原因。可以用这些术语构建词云。确定人们发推文的语言将是一件轻而易举的事情,再次构建上下文。最后,通过命名实体识别,该公司可以建立一个存储库,记录他们提到的其他事物。例如,如果推文总是将公司与其他公司或假期一起提及。
翻译文本
认知服务的翻译文本 API 允许您的应用近乎实时地将一种语言翻译成另一种语言。
此 API 还能够音译文本。音译意味着以不同的字母显示输入的文本。
当然,它可以检测传入的短语是用哪种语言编写的。这样,如果您只需要这样做,则不必使用文本分析 API 的语言检测功能。
特征
文本翻译 API 支持 60 多种语言。它可用于近乎实时地翻译文本。
它还可用于将单词从一个字母表音译到另一个字母表,以帮助显示。它可以识别传入短语的语言,并提供在双语词典中查找单词的方法。这样,您的应用就可以向用户展示单词的替代翻译和用法示例。
实际应用
回想一下 QnA Maker 使用的示例,该公司创建了一个机器人,允许任何人输入有关设置产品的自然语言问题,然后机器人会返回使用说明书中的相关部分。
添加文本翻译 API 将使该 QnA 机器人更上一层楼。现在,自然语言文本输入可以翻译成说明书的母语。搜索后,说明书中的答案可以翻译成用户查询的语言。
拼写检查
Bing 拼写检查 API 不仅仅是一项确定单词拼写是否错误的服务。它还可以解析给定的短语,根据上下文确定拼写是否正确。换句话说,它可以标记拼写正确但使用不当的单词,例如混淆 two 和 to。
特征
Bing 拼写检查 API 可让您的应用执行简单的拼写检查。输入一个短语,它会检查每个单词以确定其是否拼写错误。
然而,还有一个更强大的功能,即在上下文中执行拼写检查。
它可以识别公司或知名人士的名字是否拼写错误。它还可以识别“two”和“to”之间是否有混淆,即拼写正确但使用错误的单词,也称为同音异义词。最后,它可以自动将专有名词大写,并识别不会标记以进行更正的俚语。
实际应用
任何文本输入应用程序都会受益于基本和上下文感知的拼写检查。
概括
认知服务的语言服务组由五种 API 组成,功能强大。这些服务基于机器学习,为您提供了坚实的基础,您可以在此基础上构建任何需要自然语言处理的应用程序。而且,您无需亲自了解机器学习,即可构建自然语言处理应用程序。
这些 API 包括:
- 语言理解 (LUIS) 服务,它解析传入的短语以获取底层意图和关键实体。
- QnA 制作器可以解析半结构化数据,然后回答有关该数据的自由形式的自然语言问题。
- 文本分析,您的应用可以通过单个 API 调用找到情绪、语言、关键短语和实体。
- 翻译器 API,可以对 60 多种不同语言进行近乎实时的翻译。
- 拼写检查 API 的作用不只是标记拼写错误的单词。它还会考虑单词使用的上下文,从而使拼写检查更加有用。
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~