位于英国剑桥的欧洲生物信息研究所(以下简称EBI)为全球科研人员提供免费的生物信息,让他们可以随时访问并将其用于科研工作。这家非盈利机构所存储的生物学数据竟然达到了将近50 PB的规模,并分布在三个数据中心当中。无论是高校还是商业机构,都可以访问这些数据,用来进行研究、应用开发或者培训。
根据EBI推算,他们每个月都要应对超过1200万个数据请求。
用户可以将数据下载到本地然后再做处理,也可以使用EBI的IaaS服务,免去了将数据存储到本地的麻烦。“这是一个相对新鲜的方式,这也让生命科学研究人员使用和消费数据的方法得到了改变。这种模式也可以推广到各个领域。”EBI的技术服务团队主管Steven Newhouse说。
EBI的570名员工中有将近20%的人都在从事以调查或协作为主的生命科学研究工作,因此整个机构的数据量几乎每年都会翻一翻。如果以这种速度增长,就意味着五年后的数据量将达到1500 PB,EBI的基础设施将面临严峻考验。
数据库虚拟化的经济性
为了解决这个问题,EBI决定采用虚拟化技术来对数据库进行精简,并最终选择部署了Delphix的数据即服务(DaaS)。这一技术能够捕获数据库元数据,并将其存储在一个单一的副本上,然后为提出请求的用户提供一个虚拟副本,而免去了数据复制这一步。
EBI预测,通过部署数据库虚拟化技术,使得他们能够减小将近70%的存储空间。Newhouse表示:“随着不断地生成数据,所有的基础设施都必须针对数据库进行调配并不断地扩展存储空间。而在使用Delphix的服务之后,我们的存储需求得到了控制,更关键的是我们不再需要大量的人力来管理这些数据。”
此外,数据库虚拟化还可以减少在企业内网之中流动的数据量,同时创建数据库实例也变得更快、更简单。“许多我们内部的用户都是开发人员,他们使用我们的元数据来开发应用,然后全世界的企业都会用到这些应用。开发人员需要创建一些数据库实例来支撑他们的开发工作,而Delphix所提供的,是快速克隆数据库的能力。” Newhouse说。
数据库虚拟化让IT团队可以加速创建数据库实例,然后把更新提交给开发人员,让他们的工作能够更加高效。
“Delphix使得我们可以看到不同数据库版本之间的区别,这样我们就可以根据不同来进行调整,不用再对整个数据库进行这样的操作,这就大大提升了部署新数据库的速度。IT团队的反馈越来越快,我们数据库更新的频率也得到了提高。这使得全球的科研人员都能够因此获益。” Newhouse说。
试点项目
据了解,EBI大约在一年之前开始了部署Delphix数据即服务的项目,而在此之前,他们已经对数据库虚拟化技术进行了3-4年的测试和试用。
“在过去几年中,我们进行了多次的试点项目,并从中收获了一些经验和信心。从反馈情况来看,用户提供的信息非常积极,因此我们最终决定这就是我们未来几年将要大规模部署的技术。” Newhouse说。
Newhouse表示,最终说服EBI做出决策的并不是Delphix所提供的服务,而是数据库虚拟化这个技术是正确的方向。“EBI内部的人大都比较保守,要说服他们采用新的技术,则需要许多年的时间。在最初提出的时候,不仅有许多人持怀疑态度,而且我们要确保新技术能够发挥它的作用,并在未来几年之内都提供完善的支持。” Newhouse说。
对服务器和数据库基础架构的虚拟化,使得EBI能够对更多的流程进行自动化处理。Newhouse希望利用这个机会来让EBI接受更多敏捷方法,并应用到在未来的app交付领域。
“我们希望未来的整体服务能够支持移动化,同时可以在不同的虚拟架构中进行部署。也就是说我们将打造一个混合云环境。” Newhouse说。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
SAP HANA数据存储:OLTP与OLAP存储方法对比
本文选自《Implementing SAP HANA》,我们主要介绍了OLTP和OLAP所用到的不同数据存储方法。
-
SAP HANA数据存储:传统硬盘的瓶颈问题
本文选自《Implementing SAP HANA》,主要探讨了基于传统磁盘的数据库性能问题,以及我们如何解决这一问题。
-
甲骨文发布面向销售的数据即服务(DaaS)产品
甲骨文宣布推出面向销售的数据即服务产品,该产品是Oracle数据云的最新组件,此举进一步兑现了甲骨文简化企业数据访问、帮助销售团队提升效率和业绩的承诺。
-
数据库虚拟化软件选型案例分享(医疗、电信)
虽然面临了不同的业务难题,但来自医疗和电信的两家企业都选择了相同的数据库虚拟化解决方案DxConsole。