一个全新设计的用于处理海量数据的方法,引领一家临床试验支持公司去发掘以前隐藏的收入来源。不过据公司的一位官员说,使他们实现目标的列式数据库软件和硬件项目并没有想象中那么一帆风顺。 Provisio公司的主要业务是数据和设计服务,以帮助医疗和制药公司寻找参与临床试验的合适患者。不久前,公司的首席安全官和高级信息架构师Sean Harrison表示,Provisio产生了对不断增长数据的管理问题。
“数据库变得杂乱无序,”Harrison说:“如果我考虑全部的数据源,我们正在处理近7000万美国人的健康史,这是一大堆数据。” 那时,Provisio的数据库分布于若干SQL Server……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
一个全新设计的用于处理海量数据的方法,引领一家临床试验支持公司去发掘以前隐藏的收入来源。不过据公司的一位官员说,使他们实现目标的列式数据库软件和硬件项目并没有想象中那么一帆风顺。
Provisio公司的主要业务是数据和设计服务,以帮助医疗和制药公司寻找参与临床试验的合适患者。不久前,公司的首席安全官和高级信息架构师Sean Harrison表示,Provisio产生了对不断增长数据的管理问题。
“数据库变得杂乱无序,”Harrison说:“如果我考虑全部的数据源,我们正在处理近7000万美国人的健康史,这是一大堆数据。”
那时,Provisio的数据库分布于若干SQL Server群集,整个安装共由23万张数据表组成。
“据我所知,我们公司的医疗资料是全美国最全的。”他说。
Provisio需要新数据库软件来帮助该公司更快地完成工作,即为客户运行数据密集的查询。 如果一家制药公司希望了解在特定地区有多少人患糖尿病,iTrials系统可以搜索其庞大的匿名医疗资料并提供信息。这些结果可以在增加交叉引用和搜索条件的基础上进一步完善。
选型评估——列式数据库软件
Harrison从Oracle、Teradata和ParAccel中考察了一系列关系数据库软件和相关工具,他还重新评价微软SQL Server产品。
“微软声称,他们的新平台一旦正确配置将快于我们目前执行情况的数千倍”他说:“但实际上能运行测试查询的选项只有Teradata和ParAccel。”
Harrison表示,Teradata快速且易于使用,但Teradata缺乏开发工具的合适选择来满足产品的开发。
“同时,ParAccel也有很多这样的局限,也没有很多这样的工具,”他说:“但是ParAccel通过有效的技术支持和有效的开发社区弥补了缺陷。”
Provisio选择ParAccel分析数据库并和两个月前在五个分布式节点上运行的软件结合起来。使得该公司能够将23万表中的数据迁移到12张表中,且运行查询的速度大大提高。
“ParAccel看起来真正擅长标准查询,” Harrison解释说:“我们的查询不会有很多连接也没有花哨的表结构等,它们是非常标准的查询但运行于非常大的数据集。”
目前,Provisio已在产品上取得成功,但Harrison表示如果ParAccel提供更多的开发工具,他会更高兴。ParAccel分析数据库运行在Linux上,使得他经常在各种开源软件供应商中谋求管理和开发工具。
“我可以用命令行编写raw SQL,也可以使用WinSQL或其他开源工具,”他说:“我喜欢的这些工具都来自ParAccel。”
ParAccel的高级产品经理Bala Narasimhan说,ParAccel的列式数据库用于实现远远高于传统的、基于角色的关系数据库的查询返回速度。ParAccel跟很多开源和专有的数据库软件工具厂商都有合作伙伴关系。
“今天我们用所有现有的BI工具和ETL工具来工作,”Narasimhan说:“而在我们即将推出的版本中,你会看到与更多分析软件和虚拟化厂商的合作关系。”
相关推荐
-
从Oracle的数据库世界路过
Oracle是IT领域的供应商之一,它提供了很多企业应用涉及的软硬件技术。其关系型软件,现在称为Oracle Database,依然是其旗舰产品。
-
专访Teradata首席分析官:是时候迎接分析的变革了
作为Teradata公司的首席分析官,Bill Franks在上一本书出版两年多之后,又携新书中文版《数据分析变革》再度来华,与媒体进行了深入的沟通。
-
针对JSON数据类型设计的数据仓库
SonarW是一款列数据仓库,专门用来处理JSON数据。它可以支持MongoDB系统的数据仓库和一些数据湖。
-
关系型数据库选型值得注意的七个因素和趋势
关系型数据库是大多数现有IT系统和应用程序的基础,并且长时间里仍将继续主导数据领域。