理解知识图谱
介绍
知识图谱是一项突破性的发展,它彻底改变了我们从不断生成和收集的大量数据中提取有用和有见地的信息的能力。您很可能已经使用知识图谱很长时间了,但却不知道这一点;事实上,Google 搜索广泛使用知识图谱来帮助用户找到问题的答案、了解有用的联系,并帮助区分具有相同名称的不同对象。粗略地说,知识图谱是一种数据结构,它收集不同的事实,并将它们组织成一个相互关联的实体网络(例如,人物、城市、主题),以便人类和机器轻松理解和处理。
对于数据科学家来说,知识图谱是一座蕴含预测性和可操作性见解的金矿。在本指南中,您将了解什么是知识图谱、它如何在我们熟知和喜爱的许多技术中使用,以及如何将机器学习有效地应用于知识图谱。
理解知识图谱
您可能还记得计算机科学课程中讲过,图是一种由节点/顶点和连接/边组成的数据结构。知识图谱基本上就是这样,顶点是知识对象,边表示某种联系,例如家庭联系或原籍国。例如,知识图谱可能包含皮埃尔·居里和玛丽·居里通过“婚姻”联系在一起的事实。它可能知道其他对象之间的更多关系,例如玛丽·居里的论文导师。
最著名的知识图谱之一是 Google 搜索知识图谱。每当搜索识别出查询与某个对象有关时,它就会在右侧显示相关且常见的信息。例如,搜索 Python,我们会看到描述该语言的简介,以及其他相关信息,例如发布日期。
其他知名企业也维护着知识图谱:
- Facebook:其知识图谱跟踪用户、页面和群组。
- LinkedIn:拥有会员、所从事的工作、职称、技能、公司和地理位置的知识图谱。
- Airbnb:维护一个包含丰富的房屋、场地和餐馆分类的知识图谱。
- 微软:为 Bing 搜索引擎维护知识图谱,类似于谷歌的知识图谱。
- 亚马逊:维护其网站上的众多产品的知识图谱。
- Uber:Uber Eats 维护着与食物相关的知识图谱,有助于根据食客的查询了解他们的意图。
- eBay:采用名为 Akutan 的知识图谱来支持其产品描述的自然语言理解 (NLU)。
利用知识图谱进行机器学习
在知识图谱上使用机器学习的标准方法是利用嵌入。这种方法的工作原理如下。首先,要知道传统上,机器学习对向量或数字数组进行操作。例如,图像通过其像素 RGB 值编码为向量,或房屋通过其价格、GPS 坐标、卧室数量等进行编码。嵌入获取一个对象并为其生成一个向量。例如,它可能获取英语词典单词并为每个单词生成一个向量。
这种方法也是机器学习应用于知识图谱的主要方式之一。图谱中的对象以利用图谱结构的方式嵌入。例如,两个相连的对象可以在坐标空间中紧密嵌入在一起。一旦嵌入完成,利用机器学习处理数据就变成了一个简单的传统机器学习问题。
结论
知识图谱有助于解决一个极其重要的问题,即让数据和数据中的关系对人类透明。此外,它们同样可以帮助机器学习算法使许多任务变得更容易。知识图谱肯定会一直存在,如果你有兴趣创建知识图谱,你可以使用的一个流行框架是Grakn。无论你是否选择进一步研究知识图谱,你现在都知道谷歌搜索是如何如此有效的。
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~