对于企业来说,为什么需要对不同数据区别对待?在没有升级到Oracle数据库12c,无法使用数据库热图工具的情况下,企业该如何做到这一点?
Paypal数据库工程师John Kanagaraj:企业如今生成数据的速度在不断加快,包括传感器,人体设备以及物联网都在以飞快的速度生成大量数据。所有数据都存储在巨大的Oracle数据库中,然而一旦存入就没有人去管理跟踪,用户也不会去使用这些数据。由于磁盘存储的成本不断降低,企业于是就把能存的数据都存了。
但这也引发了一个问题,你不可能把所有数据都永久保存起来。另外当把这些数据放到生成数据库中,当你想要做测试或stage数据库时,就必须做很多的数据库复制。因此数据备份的效率和数据移动的效率都会随之降低,企业就需要对重要性不同的数据区别对待,哪些数据库是非常有用的,哪些数据是现在不重要但为了满足合规性需要保存的,当然最重要的是如何区别对待这些数据。
Oracle数据库12c的热图(Heat Map)工具能满足上述的条件,它能够判断数据的“冷热”温度。除了热图之外,还有一个工具叫做Automatic Data Optimization,它是一个策略制定工具,DBA可以通过它对目前用不到的数据进行压缩处理。
然而这个工具也是需要企业升级到Oracle数据库12c版本。对于Paypal来说,我们去年就想升级到12c,然而由于Oracle公司推出了发布日期,所以我们也只能推迟自己的升级计划。我们选择了自动工作负载库(Oracle AWR),如果你深入研究AWR就会发现,它里面有“segment usage”和“segment statistics”,后者会显示哪些表,哪些用户,哪些分区以及哪些索引正在使用以及它们的使用率的多少,有没有数据库正在写入或读取它们。其实这些信息都是可以获取到的。
我们使用了这些信息来确定哪些数据是热的,哪些数据是冷的。然后你可以使用分区功能来将这些数据分离,在某种范围内通常是根据时间。这样可以将冷数据提取出来,进行压缩然后移动到其他的表空间,或者直接拿到数据库外面进行存储,让主数据库做到尽可能精简。
企业必须要做到这一点。存储数据是非常昂贵的,长时间存储数据会引发问题,然而我们又处于合规等原因必须存储这些数据,那么针对不同温度的数据区别处理是最好的办法。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
迁移到Oracle多租户架构的五大原因
多租户并不是新生事物,它在2013年就首次发布了,初始版本是Oracle数据库12c,版本号是12.1.0.1,那么我为什么现在才做迁移呢?
-
甲骨文发布Oracle数据库12c第二版公开测试版
Oracle数据库12c第二版(Oracle 数据库12.2)公开测试版在2015年甲骨文全球大会正式发布!
-
Oracle ACE总监分享数据库12c最佳实践
Oracle ACE总监Kai Yu讲述了他在戴尔公司多年的Oracle管理经验,以及如何利用Oracle数据库12c来提升OLAP性能。
-
为何要把你的SAP运行在Oracle数据库上?
提起SAP和甲骨文这两家公司,真是有很多故事可以聊。抛开二者在应用软件领域的竞争不谈,今天在这里我们只聊数据库。