一.基础原理模块
1.图数据库的简单概念
图数据库出现是更符合人类社会复杂关系模型,任何结构或者概念,都可以分解成相互关联的部分。
图表(graph)是现实中的离散对象,图之间以关系的形式连接。
节点在数学重点定义是两条或多条边相交的点(Vertex)。
关系在数学的定义即边(Edge)。
图数据库是依赖于关系构建的数据,相比传统的关系型数据库,表间的关系建立在外键或外处理上(MapReduce),图数据库是通过节点和关系的简单抽象组成连接的结构。
2.Neo4j的基础属性
- Nodes(节点) 相当于图中的顶点(Vertex)
- Relationships(关系) 相当于图中的边(Edge)
- Labels(标签)
- Properties(属性)
节点(Nodes),在数据库使用中,可以用来表示对象(Objects)或者实体(Entities),并且节点可以打标签(Labels);另外节点必须存在属性(Properties),如果将节点以对象来理解,对象存在属性,自然是正常的;节点间通过属性产生联系,这个联系就是关系(Relationships)。
—注: 图中节点可以不需要属性存在,但是没有属性存在的节点,在图数据库中毫无意义,所以笔者认为图数据库中设计节点是必须存在属性。
标签(Labels),Labels是对应节点的集合 ,例如, 传统数据库中,导演表,演员表, 其中徐峥在两表中给有一条数据,两者之间没有联系(或通过Person表的id ,导演表的person和演员表的person是同一个建立关系),而图中,导演,演员,person都是徐峥节点的一个标签,徐峥是 对象/实体。
关系(Relationships),关系必须有类型(Type) ,必须有方向(Direction)。举个例子, ‘文牧野’是‘我不是药神’的导演, 方向是‘文牧野’指向‘我不是药神’,类型是‘导演’。
没有类型和方向,关系无法得到阐释。
关系属性(Relationship properties),关系此时用于表达特定属性的属性,关系属性必须有类型&方向,另外可能存在属性(Properties),例, ‘文牧野’在2018年7月导演了电影‘我不是药神’。 关系是导演,属性是 ‘在’(since),此时的表示着 导演这个行为发生在 2018年7月。
多重关系(Multiple relationships),多重关系基础依然是关系,所以必须有类型&方向,可能存在属性,节点可以共享多个关系。如下图
3.图的遍历(Traversing a graph)
定义三种关系 1.Walk(步进) 2.Trail(轨迹) 3.Path(路径)
Walk 即通过边(即关系)从A节点点到达B节点。
Trail即每次步进后形成的轨迹。
Path即A节点到达B节点,节点不重复的轨迹。
对于遍历可以研究 最短路径,深度/广度遍历,最长路径,哈密顿路径等, 这里不赘述。