通过大数据的实际应用,图型搜索技术能够为企业带来货真价实的价值——Neo Technology公司软件工程师Max De Marzi。
不同的事物之间有哪些联系,通过找到这些联系就能够揭示出隐藏在背后的洞察和模式。Max De Marzi的工作就是利用Neo4j NoSQL数据库与Cypher查询语言,为客户建立一套概念验证(poc)模型。换句话说,他能够向我们展示如何运用这一新技术来解决特定的业务难题。
Max De Marzi最近的一个poc项目受到了Facebook社交搜索工具Graph Search的启发,这相当于是一个通过“自然语言”查询来为用户提供特定结果的搜索引擎。这今年的Big Data TechCon大会上,Max De Marzi将为我们展示如何利用大数据来创建企业自身的Graph Search。
让大数据发挥效能
最能从大数据中获取价值的往往是那些面向消费者的企业,或者更直接点说就是零售企业。Max De Marzi表示,他去访问的大部分零售企业网站,都仅仅会问消费者的一般兴趣点。在他看来这是不够的,如果零售商能够深入地收集关于消费者家庭情况,年龄以及其他感兴趣的事物的时候,他们就能够更精准地向消费者推送感兴趣的商品。
“这关系到你如何利用数据,你可以利用社交媒体数据,比如微博的数据。你并不一定非要自己去向消费者收集这些数据。在社交媒体上已经有大量的信息可供挖掘,你所需要的只是一个动态的手段来加以整合和利用。” Max De Marzi说。
虽然零售企业最能从graph search中获取价值,但并不是说企业行业就不行。Max De Marzi还举了结果例子,比如银行可以通过大数据来检测可以的连接,从而避免欺诈行为。如果一张信用卡被20个人拿来用,那么它很可能就存在欺诈的行为。
一些更复杂的情况,比如团伙诈骗等,都是通过将数据隐藏在误导的背后。传统欺诈检测的方法会讲这些信息作为单独的数据点进行处理,而忽视了数据之间的关系,就比如上述的那种20个人用一张卡的情况。而在大数据分析的指导下,银行就能很快地查找到这其间存在的蹊跷。
创建你自己的graph search
“无论是传统的DBA还是熟悉NoSQL的技术人员,这期间都会有一个学习的过程。” Max De Marzi说。首先,开发者需要学习如何理解自然语言,以便创建新的Cypher查询。他认为过渡阶段的难点并不是在技术层面,而是思维的转变。开发者需要转变传统的思维方式,更多地接受动态数据点以及相互连接对象的概念。
“这种思维的转变也许只用几个小时,也可能会用上好几天。但一旦开发者完成了这一过程,所有的事情就变得简单易用了。” Max De Marzi说。
幸运的是,这是一个信息爆炸的时代,目前无论是在网上还是书店都有很多相关的内容资料可供开发者来入门。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
2016年5月数据库流行度排行榜 MariaDB跻身前二十
2016年5的数据库流行榜单新鲜出炉,前三名依然是我们最熟悉的Oracle、MySQL和Microsoft SQL Server。
-
如何将大数据集成到数据仓库
在多数情况下,大数据应用的成功与其如何集成到您的企业数据仓库息息相关。本文将介绍几种方法,以便快速有效地完成这项工作。
-
数据库产品巡礼:图型数据库Neo4j概述
Neo4j图数据库提供了一个可扩展开源数据库管理系统,它支持ACID(原子性、一致性、隔离性和持久性),并且支持企业部署所需要的高可用集群。
-
内置库组件推动Spark分析应用发展
Apache Spark不只能做数据处理。它大数据平台的那些软件库支持其适合用于各种分析应用。