如何在Oracle数据库中处理不同温度的数据

日期: 2014-04-17 作者:Mark Fontecchio翻译:孙瑞 来源:TechTarget中国 英文

对于企业来说,为什么需要对不同数据区别对待?在没有升级到Oracle数据库12c,无法使用数据库热图工具的情况下,企业该如何做到这一点?

Paypal数据库工程师John Kanagaraj:企业如今生成数据的速度在不断加快,包括传感器,人体设备以及物联网都在以飞快的速度生成大量数据。所有数据都存储在巨大的Oracle数据库中,然而一旦存入就没有人去管理跟踪,用户也不会去使用这些数据。由于磁盘存储的成本不断降低,企业于是就把能存的数据都存了。

但这也引发了一个问题,你不可能把所有数据都永久保存起来。另外当把这些数据放到生成数据库中,当你想要做测试或stage数据库时,就必须做很多的数据库复制。因此数据备份的效率和数据移动的效率都会随之降低,企业就需要对重要性不同的数据区别对待,哪些数据库是非常有用的,哪些数据是现在不重要但为了满足合规性需要保存的,当然最重要的是如何区别对待这些数据。

Oracle数据库12c的热图(Heat Map)工具能满足上述的条件,它能够判断数据的“冷热”温度。除了热图之外,还有一个工具叫做Automatic Data Optimization,它是一个策略制定工具,DBA可以通过它对目前用不到的数据进行压缩处理。

然而这个工具也是需要企业升级到Oracle数据库12c版本。对于Paypal来说,我们去年就想升级到12c,然而由于Oracle公司推出了发布日期,所以我们也只能推迟自己的升级计划。我们选择了自动工作负载库(Oracle AWR),如果你深入研究AWR就会发现,它里面有“segment usage”和“segment statistics”,后者会显示哪些表,哪些用户,哪些分区以及哪些索引正在使用以及它们的使用率的多少,有没有数据库正在写入或读取它们。其实这些信息都是可以获取到的。

我们使用了这些信息来确定哪些数据是热的,哪些数据是冷的。然后你可以使用分区功能来将这些数据分离,在某种范围内通常是根据时间。这样可以将冷数据提取出来,进行压缩然后移动到其他的表空间,或者直接拿到数据库外面进行存储,让主数据库做到尽可能精简。

企业必须要做到这一点。存储数据是非常昂贵的,长时间存储数据会引发问题,然而我们又处于合规等原因必须存储这些数据,那么针对不同温度的数据区别处理是最好的办法。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

翻译

孙瑞
孙瑞

相关推荐