Teradata推出最新列式数据库

日期: 2011-10-24 作者:Teradata 来源:TechTarget中国

  中国,北京——全球最大、专注于数据仓库、大数据分析和整合营销管理解决方案的厂商Teradata天睿公司(Teradata Corporation,美国纽约证券交易所交易代码:TDC)宣布最新推出 Teradata列式数据库,充分整合了列式与行式的表,将灵活性、性能与压缩性提升到更高水平,这是数据库技术的一大变革和进步。Teradata 列式数据库的运行速度更快、压缩率更高,其先进的架构为企业提供最完善的即用环境,以应对大数据带来的巨大分析挑战。

  与行式数据库管理系统按行存储数据不同,列式数据库采用按列存储数据。取决于应用程序和数据类型,单独的行式或者列式两种方法各有其独特的优势。但是, Teradata 天睿公司全新推出的列式数据库,允许用户在同一个数据库表上采取行列混合的物理存储方法,以最好地适合应用程序,实现无与伦比的灵活性和性能。

  Teradata 实验室总裁 Scott Gnau 表示:“Teradata列式数据库的灵活性可以帮助企业应对庞大的数据集、不断增长的用户数量和性能驱动的服务级别协议,为更多人提供更快、更好的分析。同时,还能让同一个数据仓库支持要求特定表结构和优化响应时间的分析型应用。此外,这一数据库可以自动选择最佳的压缩方法,并且随着时间的推移根据数据的变化动态地调整压缩机制。”

  受益于列式数据库的行业

  Teradata列式数据库可以帮助各行各业的企业用户分析最新的数据,作出明智决策,创建可持续的竞争优势。

  电信 – 当消费者用电话与客服代表通话时,客服代表需要搜索消费者的详细通话记录 (CDR),记录项可能多达一百多列。但是,通常只需查询少数几列数据,即可回答来电者的问题。使用Teradata列式数据库,可以将查询所需的数据量减少 90%。通过减少输入和输出 (I/O),大大缩短了响应时间。

  金融服务 – 当银行营销经理使用 CRM 数据,以更有效地实现客户个性化销售时,他通常需要不到十个客户特征,如客户号、人口统计学特征、最近一次购买的产品和使用的渠道。而 CRM 系统中可记录着数百种客户特征,列式数据库可以只读取客户数百个特征项中所需的十种特征,将读取的数据量减少了 90%。此功能支持接触式营销查询所需的高性能和毫秒级响应时间。

  零售 – 采购代理商在为连锁商店订购产品时,仅对根据特定的存货单位(SKU) 编号选出的一些项目感兴趣。然而,为了满足各种报告需求,零售需求链管理系统对每个项目均存储了众多的特征项,包括日期、商店位置和SKU。另一方面,企业用户只需要与其问题相关的数据,而不是所有的特征信息。列式数据库只读取与代理商的问题相关的数据,相比要读取全部记录项来说能够实现更佳的性能并降低处理成本。

  Gnau 指出:“Teradata 列式数据库开创了业界混合列式存储之先河,是一次战略性飞跃。当前的纯列式数据库仍然存在种种局限,例如只能粗陋的按列存储,技术难于更新。Teradata 列式数据库不是纯列式技术,而是与世界领先的数据库软件整合在一起的,列式存储与行式存储相整合为企业带来了极大灵活性且简单易用,可以帮助企业充分利用其所有数据。”

  世界权威分析机构Gartner 公司副总裁、著名的分析师 Donald Feinberg 表示“我们认为纵列式数据存储能力是一个本质上的变革,纵列是一项关键技术,它通过帮助企业调整其信息基础设施,满足经营业务不断增长的、对及时的和可靠的信息需求,从而提供超值的商业价值。此外,它对系统设计将有着深远的影响,可降低对更高电力和冷却的需求,节约巨额成本。”

  列式数据库的前景

  Teradata 列式数据库采用纵向排列而不是横向排列存储数据,突破了性能瓶颈。只有查询所需要的列数据被放入内存中进行处理,大大减少了横列方式因读取所有列而耗时的输入/输出 (I/O)。

  Teradata 列式数据库具有精巧的混合设计,可以支持使用纵列表中海量数据的任务关键型应用程序。与其它混合式数据库不同,Teradata 列式数据库凭借以下特征支持应用程序:先进的工作负载管理功能、高可用性、丰富的结构化查询语言 (SQL)、数据库内分析、业界领先的优化器、以及无与伦比的可扩展性。

  Ventana Research 副总裁兼研究主任 David Menninger 表示:“Teradata 列式数据库将新的行列混合所带来的性能优势与 Teradata 的高可用性、丰富的 SQL 支持、优化和工作负载管理等诸多优势融为一体。现在,Teradata 的客户可以享用整合到 Teradata 平台的列式数据库能力所带来的诸多好处。”

  显著的和自动的压缩

  除了按列存储数据带来显著的性能优势外,Teradata 列式数据库还以另一种方式消除了输入/输出阻塞:压缩。由于回答查询所需的数据已被压缩成更小的一部分,因此压缩减少了数据读入内存所需的 I/O。另外,Teradata 列式数据库自动进行管理压缩,数据库管理员无需进行分析以选择若干复杂的压缩方案,数据库可以自动选择适合的最佳压缩机制。

  此外,当数据随着时间的推移而发生变化时,Teradata 列式数据库可以动态地调整压缩机制,实现最佳存储,从而减少数据库管理员为满足不断变化和增长的存储压缩需求而耗费的精力。Teradata 天睿公司采用独特的架构方法,在每个纵列内创建容器,使数据压缩更加有效。例如,某一纵列的一个容器中的数据值可能受益于某种压缩算法,而另一容器中六个月后加载的数据值可能更适合使用其他算法。通过自动为每个容器选择正确算法,Teradata 列式数据库可以最大程度地提升纵列中的压缩性能,通过巧妙的实施显著改善了 I/O 和系统性能。

  Teradata 列式数据库可以根据纵列值的分布从六种压缩类型中自动选择:运行长度、字典、修剪、平均德尔塔值、空值和UTF8。例如,饮料店在12月反复出售一种特殊的假日饮料,除了使用字典类型压缩外,还可进行运行长度编码压缩。在5月,饮料销售更多是随机的和零散的,采用运行长度编码压缩可减少重复。所以,系统在 12 月而不是5月自动将运行长度编码算法添加到压缩算法中。

  Teradata列式数据库功能将于12 月作为 Teradata Database 14 的一个组件进行发布。作为一个功能提升和强化的数据库,Teradata Database 14是一个高性能的分析引擎,为公司的 Teradata 数据仓库专用平台系列注入强大动力,所有的 Teradata 数据仓库专用平台都可受益于 Teradata 列式数据库功能,满足特定的分析型工作负载需求。Teradata Database 14 还提供纯软件的数据集市版和适用于云计算解决方案的 Teradata Express版。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

Teradata
Teradata

大数据分析服务供应商

相关推荐