互联网3.0时代的数据库之图数据库
小Ke同学 | 2023-03-27 15:01:22  1247 浏览

随着中国互联网的发展,互联网开始由web端访问逐渐演变为智能手机端、智能终端,而产生的数据从简单的结构化二维数据逐渐演变成视频音频图片的非结构化数据、专属网络的JSON&XML半结构化数据,对于互联网的运营方式也从不需要运营逐渐演变成打折优惠券返现的逐步运营、社群运营&精准投放的精细化运营,除了本人相关的年龄地点爱好信息之外,我们开始关注和本人相关的一度物品信息、二度物品信息,和本人相关的一度人脉、二度人脉、三度人脉,将对应的信息、对应人相关的信息推荐给本人,这就是新一代互联网特色。

互联网1.0时代,信息是单项传递,网站做信息发布告诉网民,网民被动接受;互联网2.0时代,信息是双向传递,网民和网站,网站和网站,网站和网民之间进行信息交流与传递;互联网3.0时代,信息是全方位互动,网络和网民在生活工作的方方面面全链接起来,建立以人为中心的与整个世界的信息交流与传递,我们现在正处于互联网3.0时代。所谓工欲善其事,必先利其器,在新一代互联网中,必要要有对应的工具进行支撑,在技术领域除了人工智能、大数据、云计算、5G等技术之外,还有一项比较小众但却越来越流行的技术,这便是图数据库技术

图数据库是在2010年开始逐步发展起来的技术,由于涌入互联网的网民和企业越来越多,网络的运营开始走向精细化,Facebook、Linked等社交网络公司开始研究如何更好更高效的社交,从而带动了图计算的大规模应用。图数据库,并非望文生义,存储图的数据库。图,是一种数据结构,在一个图中,包含节点和边,由多个节点、多条边链接起来,在图数据库中,包含实体、关系、属性、标签四个元素。

我们通过一个实际的case来理解下图这种数据结构。比如在当当这样的在线书籍售卖网站中,John,年龄27岁,他读过作者是IanRobinson.Jim Webber的书籍GraphDatabase,他还有朋友Sally,年龄32岁,也读过这本书。在图数据中,我们可以创造三个实体,John、Sally、GraphDataBase,每个实体由自己的标签和属性,比如John实体中,标签是人Person,属性是姓名John和年龄32,在GraphDatabase实体中,标签是书Book,属性是书名GraphDatabase和作者IanRobinson.JimWebber,实体与实体的关系包含朋友、是否阅读,比如John和Sally从2013年9月1日开始是朋友,Sally在2013年9月2日读过GraphDataBase这本书。

关于人和书的图谱就建立起来了,在商品推荐中,我们可以通过朋友这层关系,给Sally推荐John喜欢的书籍,也可以通过书这层关系给Sally推荐GraphDataBase类似的数据。怎么样?是不是很符合互联网3.0时代的特色呀?逛淘宝时给你推荐类似商品的逻辑、刷抖音时给你推荐类似视频的逻辑也大抵一样喔。image.png


图数据库应用起来很简单,它的使用也很简单呢。很多朋友可能认为这是一门新的技术,又要学习新的语法了,实际上它的语言和SQL差不多,使用思路和SQL也是差不多的。

比如在刚刚的Case中,我们使用下面的这些方法就可以去创建一个图数据库了。比如Create(节点:标签(属性))这个语法就可以来创建Sally这个Person类型的节点,节点中name属性为Sally,Age属性为32,CREATE{sally:Person{name:’Sally’,age:32}}

image.png

在图数据中,比如我们想获取所有的人信息、按姓名顺序获取最靠前的十个人信息,并返回姓名和年龄,使用下面的语法就可以实现,我们来看看使用最常用的SQL语法和图数据库语法之间的差别。

image.png

图数据库的技术结构包含三层,从上往下可分为接口层计算层存储层。在实际使用中可以作为底层存储引擎,也可以作为底层处理引擎使用,还可以提供接口和SDK供应用程序使用。

在对下场景中,所谓底层存储,它包含原生图存储和非原生图存储两种模式,原生图存储指的是优化过的数据,直接可以存储图数据,非原生图数据存储,指的是把图数据序列化,保存在关系型数据库或其它数据库当中。所谓计算引擎,指的是通过全局扫描和批处理大规模信息。在上场景中,对于使用Java语言开发的业务,使用JDBC方式链接图数据库就可以进行API调用使用了,此外也可以接入SDK,通过库函数调用图数据库的接口。

image.png

介绍完图数据库的使用后,我们接着介绍它的分类。图数据库其实也是Nosql数据库中的一类,Nosql中除了有键值数据库Redis、列式数据库Hbase、文档数据库MongoDB,还有图数据库Neo4j。图数据库用于存储关系,解决了关系型数据中关系类数据查询复杂、缓慢的特点,将查询速度、查询性能提升了上百倍。

随着互联网3.0时代的快速发展,图数据量的速度加快,对于图数据库的关注程度也在不断提高。在人工智能领域的知识图谱便可以以图数据库为依托呈现复杂的人与人的关系;在电信金融证券领域,利用图数据库可以实现风险控制、反欺诈;在社交网络、电商购物、搜索引擎领域,利于图数据库可以实现商品信息的推荐。可以说,新一代互联网中,图数据库必定是存储、关联、利用数据最高效的方式。


声明:所有发布的资讯文章,目的在于分享知识,若图片及某些文字言论涉及版权问题,请联系微信号:EKGC-CN,我们会在尽快删除处理,谢谢。


标签: