一提到在线旅游服务提供商你会想到谁?携程?艺龙还是酷讯呢?那么你知道Expedia.com吗?它是全球最大的在线旅游公司,是艺龙最大的股东,还收购了酷讯,并在中国成立了全资子公司到到网。在上周举行的O’Reilly Strata大会上,来自Expedia的高级架构师Eddie Satterly向我们介绍,公司使用了Splunk软件来应对大数据的挑战。
尽管没有列出名单,但是Satterly透露Expedia从三家备选厂商中最终选择了Splunk提供的数据管理工具。而其中的原因,Satterly认为主要包括两点:1、Splunk软件拥有友好的业务用户界面;2、其扩展性非常好,能够迅速地使用标准硬件进行扩展。
虽然云计算以及相关的托管服务在成本方面给人们留下了深刻的印象,像Loggly公司就能够为用户提供托管软件来管理机器生成的数据,但是Satterly表示他选择不考虑托管软件的方式来解决特定问题。
“从根本上来讲,Expedia是一家技术公司,” Satterly表示:“我们需要把有许多知识产权和商务智能数据放入整体的解决方案当中,所以我们根本就没有考虑托管的方式。”
机器数据(Machine data),也是大数据最原始的数据类型,它通常包括所有设备生产的信息,而这些信息也是保证企业正常运转的关键。Splunk公司的产品市场副总裁Sanjay Mehta表示:“这些数据包括了日志文件、历史记录、Web服务器日志等。它们会通过网络交换机、企业应用系统、网络以及安全设备等。这些信息几乎包含了所有客户、交易、设备等元素的动作行为。”
Splunk软件能够从任何数据源实时地收集机器数据,然后进行索引并将这部分数据用于搜索、浏览和分析。Mehta表示,像Expedia这样的公司通常会利用机器生成数据来监测安全威胁或者欺诈行为,来分析特定群体的消费行为,来监控新产品或新服务的情况,以提供更高级别的智能运营。
Satterly 透露,Expedia公司大约拥有4000名技术人员,目前正在使用Splunk工具来收集并索引数据,而数据量达到了每天6TB的级别。这些数据源自于27000个服务器、网络交换机、设备等终端。
Satterly表示:“一年前,公司使用了大概20多个工具来管理这些数据。有一些是内部开发的,有一些则是开源的软件。Expedia用了三个月的时间,把它们全部替换为Splunk软件。”
将数据转化为竞争优势
Expedia表示,使用软件来管理机器生成数据的一个好处就是,能够改善整体的用户体验。举个例子,当Expedia的潜在客户在访问站点之后,如果酒店的图片无法显示或者网站访问速度太慢,那么这个客户很可能就不会下订单。于是Expedia开始监控服务器、应用以及日志,这样就可以在第一时间监测到这样的问题,并迅速地解决。
Satterly表示:“现在我们能够更快速地监测到这些问题,我们对代码进行了严格的编写,从而确保当问题发生我们就可以迅速地反应。”
选型前要理解用户基础
在进行软件工具评估之前,企业要牢记其用户的需求。在这一点上,Expedia可以用它们的亲身经历来解读。两年前,Expedia使用了另外一款工具来监控日志数据。Satterly并没有透露该产品的名字,但是它让整个公司明白到,在选型之前,一定要与业务部门的用户进行足够的沟通。
“当时使用的工具对运营和开发人员来说是很好的,但是业务用户甚至都无法登录到用户界面上,” Satterly说:“他们对这一工具抱怨连连,这不是业务部门想要的工具。”
Expedia:大数据探索永不停息
Expedia目前正在将Splunk产品集成到大数据环境当中,它们运行了开源的Apache Hadoop分布式文件系统来存储并分析点击流数据等信息。此外,Expedia还运行了NoSQL数据库Cassandra,用来收集“高级的”应用数据,包括搜索和应用使用模式的详细信息。Expedia将使用Splunk及其接口作为一个通向大数据环境的网关。
Satterly表示:“我们使用Splunk来向Cassandra数据存储做基础的SQL查询,这样就能够清楚地看到每一件事,从Windows Server上的事件日志一直到应用系统。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
探索Hadoop发行版以管理大数据
Hadoop是一种开源技术,它也是数据管理平台,现在它通常与大数据分布相关联。它的创建者在2006年设计了原始 […]
-
SQL Server 2019改进Linux、容器支持
紧随其SQL Server 2016和2017版本后,微软正在准备发布SQL Server 2019,该公司在 […]
-
Cloudera-Hortonworks合并或将减少Hadoop用户的选择
近日大数据领域两家顶级供应商达成交易协议,这可能会影响Hadoop和其他开源数据处理框架,并使大数据用户的技术 […]
-
SQL Server 2019预览版向DBMS引入Hadoop、Spark和AI
微软本周继续改进其SQL Server数据库平台,从关系数据进一步扩展到各种数据类型。 近日该公司发布SQL […]