借助混合云架构,企业可以充分利用本地和云环境。IT管理员可以将这种混合模型应用于数据仓库以获得相同好处,但部署可能会带来挑战。
IT咨询服务机构AJW-Advisory首席执行官Andy Walter表示,传统数据仓库将企业锁定在本地系统中。这些限制使得有效地扩展 IT 基础架构变得困难(如果不是不可能的话)。借助混合数据仓库,管理员可以将部分数据仓库功能引入云端,同时维护本地功能。
然而,在采用混合数据仓库之前,企业应仔细评估该技术的优点和缺点。然后,某些架构设计技巧可以帮助实现部署。
混合数据仓库有哪些优势?
国际IT咨询和软件开发公司ScienceSoft数据分析部门负责人Alex Bekker表示,借助混合数据仓库,企业可以从云计算的灵活性和高性能中受益,并且仍然可以享受本地部署的数据可用性和合规性优势。
更具体地说,混合数据仓库的主要优势包括:
1. 易于部署
混合模型可简化云数据基础架构的部署,因为企业不必一次将所有数据迁移到云端,企业还是会继续依赖于现有的本地技术。混合数据仓库还可以简化不同部门或应用程序创建的数据孤岛。
2. 支持合作伙伴数据
Walter说,目前企业的趋势是将内部数据源与合作伙伴的外部数据源相结合,以改进分析。混合数据仓库非常适合这种方法,可以减少探索新分析模型所需的数据工程。
3. 基于需求的数据隔离
技术研究和咨询公司ISG的首席顾问Anay Nawathe说,本地和云数据仓库都具有根本优势。例如,传统数据仓库可以更具成本效益,而云数据仓库则提供增强的可扩展性。借助混合数据仓库,IT 团队可以根据用例隔离数据集,以利用每个模型。
4. 灵活性
总部位于丹佛的软件开发公司Itransition的高级经理Ivan Kot说,混合数据仓库可以更轻松地按需利用新的数据服务,以满足不断变化的需求。新兴分析服务可以轻松地跨云和本地环境进行扩展。
混合数据仓库的缺点
与本地数据仓库相比,混合数据仓库可能需要付出更多努力才能实现。企业需要详细的计划来启动混合数据仓库项目。该计划应解决各种挑战,例如:
1. 组织问题
在实施新流程或做法时,需要进行组织变革,混合数据仓库也不例外。Walter 称:“内部对变革的抵制可能很激烈,具有推迟项目的连锁反应,并以各种方式浪费时间和金钱。”管理员需要在一开始就获得团队的支持。
2. 成本考虑
本地系统具有防护栏,企业需要付出一些努力(无论是在技术上还是在财务上)来扩展基础设施。因此,企业会注意到任何额外的资源或成本。相比之下,云计算提供无穷无尽的存储和计算能力,资源部署很容易失控。虽然云提供商提供了缓解此问题的工具,但企业必须像对待本地系统一样谨慎地使用云和成本。
3. 不熟悉的工具
Nawathe 称:“对于云数据仓库,存在学习曲线,采用混合数据仓库并不能让你的企业避免这样的学习曲线。”在部署前,请仔细评估工具选项并制定学习计划。
设计混合数据仓库
理想情况下,混合数据仓库将本地基础结构的治理和效率与云的可伸缩性相结合。目标是将两个基础结构作为一个单元运行,而不是作为单独的数据池运行。虽然设置和操作两个独立的数据仓库可能更容易,但随着时间的推移,管理和使用两个单独的系统的成本更高。
采用正确的工具
团队需要寻找合适的工具来跨本地和云系统自动执行数据存储优化和数据处理优化。一种方法是采用 Data Fabric 工具来协调数据、分析和工作流。这些方法应跨越本地和云原生数据仓库。Data Fabric 工具包括 IBM Cloud Pak for Data、K2View Operational Data Fabric 和 NetApp Cloud Volumes OnTap。
另一种方法是采用数据仓库自动化工具。这些工具自动执行原始数据源与一个或多个数据仓库之间的 ETL 或提取、转换和加载操作。数据仓库自动化工具包括 Azure Data Factory、Informatica Data Validation、Oracle Autonomous Data Warehouse 和 Qlik Compose for Data Warehouses。
第三种选择是采用具有本地和云数据仓库功能的数据仓库工具,这些功能可以协同工作。示例包括Cloudera Data Platform,IBM Db2,Oracle Autonomous Data Warehouse和Teradata Vantage。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
Java、JDBC和Postgres
现在越来越多的企业开始部署PostgreSQL,为什么呢?当你看到这个许可开源数据库所提供的功能,你就不会对此 […]
-
5个元数据管理最佳实践
在数据驱动的环境中,元数据不仅仅是数据的副产品;还是综合数据治理战略的关键组成部分。企业需要适当的元数据管理, […]
-
Cockroach Labs增加矢量搜索,更新定价选项
Cockroach Labs 近日推出矢量搜索功能,旨在使客户能够访问和操作非结构化数据,以训练生成式人工智能 […]
-
如何使用数据治理成熟度模型
如果没有强大的数据治理,数据就无法产生有价值的见解以及改善决策。数据治理成熟度模型可帮助企业评估当前的成就水平 […]