当你听到数据库一词时,你通常会想到的可能是一张表,其中每行都是单独的记录,列标题是字段名称-基本上是电子表格。而当数据过于复杂而无法容纳到单个表中,我们将转移到关系数据库-通过字段链接的多个表。
构建关系数据库需要了解数据结构的人员。并且,当添加新信息,或者新的关系变得重要,则数据库管理员将需要更改数据库的结构,并且很可能还要更新用户界面。
那么,如果数据集无法提前映射关系,该怎么办?人们是否可以通过你无法提前预测的事物进行连接,而不是通过单个数据点进行连接?
也许两个人在同一棒球队中,或者喜欢相同类型的书籍,或者住在同一座城市。对于数据库管理员来说,添加这些项目为单独的字段并为其创建新关系可能是一项非常耗时且永无止境的任务。
其中一种解决方案是图形数据库。
在图形数据库中,任何数据点都可以连接到任何其他数据点,并且业务用户可以在任何时候建立连接,而无需数据库管理员重写整个架构。
图形数据库被设计为具有可扩展性,使其非常适合现在的大数据应用程序。而且它们速度很快,使用户可沿着连接链快速移动,从而使企业可以更快更高效地获得见解。
塔夫茨大学工程学院研究生院院长兼IEEE研究员Karen Panetta说:“在常规的关系数据库中,如果我想添加一些东西或更改关系,我需要做很多计划。图形数据库使你可以很快添加新的关系。”
下面是图形数据库的主要用例。
欺诈和异常
Panetta说,欺诈检测是目前图数据库最强大的用例之一。
传统的欺诈检测方法依靠简单的清单。例如,如果交易金额超过一定金额或涉及政府监视名单中的实体,则该交易是可疑的。这种简单化的方法可能会错过更多的细微欺诈尝试,但旨在发现交易间异常连接的数据库可能能够识别这些欺诈行为。
例如,很多电子商务交易可能来自不同帐户,但全部来自同一IP地址或IP地址群集。或者,可能会从同一社区提取几笔相同的金额的现金,然后在同一天将现金存入不同的帐户。
这些事务单独来看可能没有任何可疑迹象,但是关联来看则需要引起注意。
Panetta说:“大型洗钱计划可能会使用一个人的名字,另一个人的社会安全号码,以及第三人的地址。你如何进行识别?图表的结构使你可以将这些东西识别为异常,使我们能够探索没有意义的关系。”
我们不仅可以通过这种方式检测到购物或银行欺诈。在网络安全中,企业可以通过寻找以不寻常方式关联的事件集来防御黑客攻击。
例如,当网络安全供应商Brinqa使用的关系数据库达到其灵活性极限时,便切换到Neo4j图形数据库系统。
Brinqa公司产品总监Syed Abdur Rahman说:“我们的平台是动态的,但是不足以处理所有类型的情况。而使用图数据库,你可以动态定义模式,你可以定义节点和关系。你不必提前定义它,你可以在引入数据时做到这一点。”
推荐引擎
不寻常的连接也可能是积极的事情。现在的高级推荐引擎会基于与其他事务的连接,推荐音乐、书籍、电影、衣服以及其他产品和服务。它们可以超越简单的直接的连接。
例如,购买狗粮的人也可能会购买狗项圈,也许他们还会对舒适的步行鞋或沙发套感兴趣。
推荐引擎开始出现在很多不同的地方,而不仅仅是流应用程序和电子商务网站。
Fabric是关联品牌与客户的消费者数据市场,它使用图形数据库来减少新功能、界面和分析的开发时间。
Fabric公司创始人兼首席执行官Paul Taylor说:“对于90%的新兴企业项目,图形数据库比关系数据库要好。”
图形数据库代替传统的关系数据库还可以减少对中间件的需求。“图形是强大的基础。”
他说,但这并不意味着它们适用于所有用例。
他说:“图形不太适合写入繁重型应用程序,在这些应用程序中,整个生命周期仅需要进行几次数据查询。”
数据同步
欧洲的通用数据保护条例(GDPR)和《加州消费者隐私法》等隐私法规要求企业能够汇总他们所收集的所有个人数据,并根据要求将其删除。由于企业通常将这些信息存储在不同的数据孤岛中,因此这可能是一项艰巨的任务。
但不仅仅是合规性要求让企业希望链接不同的数据集。数字服务咨询公司Nerdery数据科学总监Justin Richie表示,可穿戴设备公司、IoT供应商、医疗保健公司和金融公司都需要这种技术。
他说:“图形数据库最常用于实时数据同步。”
展望未来
塔夫茨大学的Panetta说,图形数据库仍处于起步阶段,我们将会看到更多的应用程序涌现。
她预测,图形数据库的未来用例将包括提升AI到新的水平。
她说:“我们现在对数据进行人工智能的方法是使用老式的关系数据库。”但是,人工智能是基于关系的。“图形数据库将帮助构建更好的AI系统。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
Java、JDBC和Postgres
现在越来越多的企业开始部署PostgreSQL,为什么呢?当你看到这个许可开源数据库所提供的功能,你就不会对此 […]
-
5个元数据管理最佳实践
在数据驱动的环境中,元数据不仅仅是数据的副产品;还是综合数据治理战略的关键组成部分。企业需要适当的元数据管理, […]
-
Cockroach Labs增加矢量搜索,更新定价选项
Cockroach Labs 近日推出矢量搜索功能,旨在使客户能够访问和操作非结构化数据,以训练生成式人工智能 […]
-
如何使用数据治理成熟度模型
如果没有强大的数据治理,数据就无法产生有价值的见解以及改善决策。数据治理成熟度模型可帮助企业评估当前的成就水平 […]