世界三大网络营销联盟之一的LinkShare在处理海量数据方面可以说是经验丰富。在两年前,LinkShare就决定将它们的数据仓库环境从IBM DB2迁移到两个单独的Oracle Exadata数据库云服务器上。据TechTarget记者了解,该公司目前管理着超过17TB的数据,超过100亿行的记录。 LinkShare能够将在线广告商以及广告发布者进行精准的匹配,并为二者提供一个相应的管理界面,包括一系列的报表和商业智能工具。
举例来说,一个广告商要运行一个报表,发现其中有一个banner广告的效果不佳。那么他们就可以快速地做出反应,撤销广告并找到更有效的方式。 为此,TechTarg……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
世界三大网络营销联盟之一的LinkShare在处理海量数据方面可以说是经验丰富。在两年前,LinkShare就决定将它们的数据仓库环境从IBM DB2迁移到两个单独的Oracle Exadata数据库云服务器上。据TechTarget记者了解,该公司目前管理着超过17TB的数据,超过100亿行的记录。
LinkShare能够将在线广告商以及广告发布者进行精准的匹配,并为二者提供一个相应的管理界面,包括一系列的报表和商业智能工具。举例来说,一个广告商要运行一个报表,发现其中有一个banner广告的效果不佳。那么他们就可以快速地做出反应,撤销广告并找到更有效的方式。
为此,TechTarget记者采访了LinkShare的BI总监Michael Brandt,让他谈一谈公司在部署和使用Oracle Exadata方面的经验。Brandt向我们解释了为何要放弃IBM DB2而选择Exadata,以下是采访实录:
LinkShare为何决定要将数据仓库环境从IBM DB2迁移到Oracle Exadata?
Brandt:我们的数据正在以指数的速度增长,因此公司急需一个可扩展的数据库解决方案,以满足不断增长的数据需求。我们之前的DB2采用了无共享多并行处理架构,其中在扩展性方面表现不好。我们需要像Exadata这样的产品,或者可以说是需要软硬件集成的解决方案,能够让我们轻松地添加更多的节点,一方面要节省空间,另一方面要对性能、CPU以及带宽有一个提升。
LinkShare所提供的服务,是不是涉及到所谓的“大数据”分析?
Brandt:17TB的数据规模应该说是相当大,但是对于网络广告营销市场来说,这称不上是特别大。也许八成以上从事数据仓库的人员会说:“Wow,这可是一个大系统,其中肯定有许多查询,许多客户数据,许多这样那样的东西。”但是我认为LinkShare的数据量在Oracle客户中应该也不算是最大的那些。
由于LinkShare的发展速度非常快,数据的规模肯定会越来越大,那是否考虑过在未来使用像Apache Hadoop这样的环境呢?
Brandt:是的,我们当然会考虑这个问题。我最近看到有报道称微软公司已经宣布他们将清除遗留的数据仓库系统,并迁移到Hadoop架构下。说实话我有些惊讶,特别是Hadoop它是基于Linux操作系统,而且是开源的技术。所以我在之前一段时间里对Hadoop进行了研究,看看它究竟能带给我们什么。很明显我们在Exadata上投入了大量的资金,但是你知道这类产品的使用寿命只有3-5年,而且我们已经使用了2年时间,也许在今后会考虑Hadoop。
您能否预计一下, 在未来Hadoop作为Oracle Exadata补充的场景?
Brandt:当然可以,我们有一个传统的数据仓库系统,我们仍然在使用它,但是会有许多种不同的方式。我们要为客户提供快速的报表,可以通过聚合或者roll-up这样的方式实现。而我们还有ad hoc团队会做深度的数据分析。但是我们都在使用同一个数据仓库架构,所以我们知道可以在不构建数据集市的情况下,创建更多的集成类型解决方案,以改善系统。
LinkShare的报表和一些分析服务有没有实时(real-time)的需求?
Brandt:我不能说它们是真正意义上的实时,我们习惯把它称作“小批量”,也就是说我们每五分钟就会运行一次点击。但是由于我们对点击有控制,所以我们就能够很快速地把数据加载进来。速度很快,但是不是真正意义上大实时。
LinkShare目前已经将两条Oracle Exadata数据库云服务器投入到了生产环境中。您觉得公司在哪些方面获得了成效?这两台Exadata的工作负载是如何分配的?
Brandt:由于我们购买了两台Exadata,因此我们很奢侈地将其中一台设置为非满负荷工作,每天会有六个多小时是不工作的,如果另一台服务器发生故障,就可以将所有的流量转移到这一台上。当然这样做可能会对性能有一定的影响,因为目前一台Exadata比另外一台多出30000到40000个请求。广告商请求会用一台来处理,另外一台则处理发布者的请求。当然,它们也会处理对方的数据,我们会将两台机器以网格的形式运作。
翻译
相关推荐
-
超越RDBMS:数据仓库与数据湖、数据集市
现在企业从各种来源收集的大量数据已经远远超出传统关系学数据库可处理的范畴。这引发数据仓库与数据湖的问题:何时使 […]
-
对SAP HANA数据库涉嫌知识产权盗窃的指控存疑
Enterprise Applications Consultin公司负责人Joshua Greenbaum表 […]
-
数据货币将决定企业成败
在2017年3月McKinsey公司对500多名高管的调查显示,越来越多的企业使用数据和分析来推动增长,但目前 […]
-
甲骨文自治数据库亮相 带来云计算新希望
早前甲骨文还不在云计算公司之列,而现在该公司正在迅速弥补其失去的时间。甲骨文的云计算核心是甲骨文自治数据库(O […]