图数据库初学者-为什么图形技术是未来

图形技术的世界已经发生了变化(而且仍在变化),因此我们重新启动“图数据库初学者”系列,以反映图形技术世界的新内容——同时帮助新手跟上图形范式的发展速度。

你已经听说过图数据库技术,你想知道所有的热点是什么。

从愤世嫉俗者的角度来看很容易:它们只是另一种短暂的趋势——今天在这里,明天就走了——对吧?这难道不是所有科技术语的表达方式吗?

你可以怀疑,甚至质疑,但是把你的愤世嫉俗留在家里。相反,我邀请你们踏上一段探索新世界的冒险之旅。

图形范式远远超出了数据库和应用程序开发;这是一种对连接的可能性的重新想象。就像任何新的解决问题的框架一样,从不同的维度来处理挑战通常会在可能的解决方案中产生数量级的变化。

所有这些都说明:图形技术是一个正在兴起的潮流,你的开发团队和业务都不能错过。图数据库是未来的趋势,即使你只是一个初学者,开始使用它也不会太迟。就让我们一探究竟吧。

封面

在这个图数据库初学者博客系列中,我将带你了解图形技术的基础知识,假设你对这个领域的背景知识很少(或者没有)。本周,我们将介绍基本定义以及这些区别的重要性。

我们为什么要关心图数据库技术

当你独自一人的时候,新技术可能会很有趣,或者用于个人项目,但当你在工作的时候,情况就完全不同了。

从专业角度来说,你必须在一个充满预算、时间表、企业标准和竞争对手的世界中运作。在这个世界上,对新技术的唯一测试就是它能更好地工作(而且比你现有的任何东西都好)。

图数据库符合这一要求,原因如下:

  • 性能:你的数据量在未来肯定会增加,但是以更快的速度增加的是数据之间的连接(或关系)。大数据肯定会变得更大,但互联数据将呈指数级增长。在传统数据库中,随着关系的数量和深度的增加,关系查询会逐渐停止。相反,即使数据逐年增长,图数据库的性能仍然保持不变。
  • 灵活性:使用图数据库,你的IT和数据架构团队以业务增长的速度快速适应变化,因为图形数据模型结构和模式会随着你的解决方案和行业的变化而变化。你的团队不必预先对你的领域进行详尽的建模(然后在某些执行人员要求更改之后对数据库进行详尽的重构和迁移);相反,你可以在不危及当前功能的情况下添加到现有结构中。使用图数据库模型,你是一个口述更改和负责;而RDBMS数据模型规定了它对你的要求,迫使你适应它的表格式的世界观。
  • 敏捷性:使用图形技术开发完全符合当今敏捷的、测试驱动的开发实践,允许图数据库支持的应用程序随着业务需求的变化而发展。

你的敏捷团队现在有了一个数据库,可以满足你的日常需求。

什么是图数据库(一个非技术性的定义)

为了理解图数据库技术,你不需要理解图论中的神秘数学魔法。相反,它们比关系数据库(RDBMS)更易于理解。

图由两个元素组成:节点和关系。

每个节点表示一个实体(一个人、一个地方、一个东西、一个类别或其他数据块),每个关系表示两个节点如何关联。例如,蛋糕和甜点的两个节点会有一种从蛋糕指向甜点的关系。

考虑另一个例子:Twitter是一个连接3.3亿月活跃用户的图数据库的完美例子。

在下面的图中,我们在一个图数据库中表示了一小部分Twitter用户。每个节点(标记为User)属于一个人,并与描述每个用户如何连接的关系相连接。正如我们在下面看到的,Peter和Emil互相关注,Emil和Johan也一样,但是尽管Johan关注Peter,Peter却没有反过来关注他。

用图数据库表示的Twitter用户

如果你理解了这个例子,那么你已经掌握了构成图数据库的基本知识。

图数据库是如何工作的(用一个容易理解的方式解释)

与其他数据库管理系统(DBMS)不同的是,关系在图数据库中具有最高优先级。在图形世界中,连接的数据与单独的数据点同等重要(有时更加重要)。

这种连接优先的方法意味着关系和连接持久化在数据生命周期的每个环节:从理念,设计逻辑模型,实现在一个物理模型,使用查询语言和操作在一个可伸缩的持久性,可靠的数据库系统。

与其他数据库系统不同,这种方法意味着应用程序不必使用外键或额外处理(如MapReduce)来推断数据连接。

结果:与使用关系数据库或NoSQL存储生成的数据模型相比,你的数据模型更简单,但更有表现力。

什么使图数据库独一无二

很多数据库都有类似的特性,但是图数据库有一些特性使它们独一无二。下面是你需要了解的图数据库技术的两个最重要的特性:

  • 图的存储:一些图数据库使用原生图形存储,专门设计用于存储和管理图形。其他图形技术使用关系数据库、柱状数据库或面向对象数据库作为存储层。非原生存储通常比原生方法慢,因为所有的图形连接都必须转换成不同的数据模型。
  • 图形处理:原生图处理(又称无索引邻接)是处理图中数据的最有效方法,因为连接的节点在物理上相互指向数据库中。非原生图形处理引擎使用其他方法来处理创建、读取、更新或删除(CRUD)操作,这些操作没有针对处理连接数据进行优化。 谈到当前的图数据库技术,Neo4j在图形存储和处理方面都是最原生的。如果你有兴趣了解更多关于原生图数据库与非原生图形技术的区别(以及为什么它很重要),那么请阅读本初学者系列后面的原生和非原生图形技术。

结论:图能处理的场景比你想象的要多(他们无处不在)

现实世界是紧密相连的,而图数据库的目标是用一种直观的方式模拟那些有时一致、有时不稳定的关系。这就是图形范式与其他数据库模型的不同之处:它更真实地映射出人类大脑如何映射和处理周围的世界。

而且,一旦你开始在一个地方(例如,你的推荐引擎)看到相互关联的数据图,你也开始在其他地方看到它们(例如欺诈检测工作或主数据管理)。很快,你就会顿悟:图表无处不在。

毫无疑问,图形技术正在崛起。

你的竞争对手很有可能至少正在评估或研究图数据库的部署。

学会利用今天的图数据库,你的企业将在未来保持竞争优势。

原文链接:Graph Databases for Beginners: Why Graph Technology Is the Future

译文连接:图数据库初学者:为什么图形技术是未来?

翻译:TomorJM

发表评论

电子邮件地址不会被公开。 必填项已用*标注