大数据不仅是一个流行话题,更是企业中实实在在存在的需求。许多企业开始着手于大数据分析项目,但在此之前,我们需要一个良好的部署方案以确保最终的结果能够为业务服务。选择合适的技术是规划的第一部分,当企业选择了数据库软件、分析工具以及相关的技术架构之后,我们就可以进行下一步并开发一个真正成功的大数据平台。 当然,我们也没必要过分夸大项目管理进程的作用,成功的大数据分析项目来自于多个方面。
在本文中,我们就将介绍五个技巧,企业用户进行平台部署的时候可以作为一定的参考: 只选择你所需要的数据。出于其本身性质而言,大数据分析项目中我们会遇到海量的数据集。但是海量数据并不代表一个企业的所有数据,也不是……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
大数据不仅是一个流行话题,更是企业中实实在在存在的需求。许多企业开始着手于大数据分析项目,但在此之前,我们需要一个良好的部署方案以确保最终的结果能够为业务服务。选择合适的技术是规划的第一部分,当企业选择了数据库软件、分析工具以及相关的技术架构之后,我们就可以进行下一步并开发一个真正成功的大数据平台。
当然,我们也没必要过分夸大项目管理进程的作用,成功的大数据分析项目来自于多个方面。在本文中,我们就将介绍五个技巧,企业用户进行平台部署的时候可以作为一定的参考:
只选择你所需要的数据。出于其本身性质而言,大数据分析项目中我们会遇到海量的数据集。但是海量数据并不代表一个企业的所有数据,也不是相关数据源中的所有信息都需要我们来进行分析。企业需要确定哪些数据具有战略价值,能够为分析服务。举例来说,什么样的信息组合对于客户维系起到至关重要的作用?或者股票市场中,有哪些数据隐藏着交易的模式?在规划阶段,把注意力集中在业务目标之上,将有助于企业对分析进行精准的定位,在此基础之上我们可以也应该了解哪些数据能够满足这些业务目标。在一些情况下,包含所有数据的案例也会有,但毕竟还是少数。我们往往只需要大数据中的一个子集来进行分析。
构建高效的业务角色然后处理相应的复杂度。积极应对复杂性是大数据分析项目成功的关键之一。为了能够最终得到正确的分析结果,我们需要让所有相关的业务数据所有者参与到流程当中,以确保提前制定必要的业务角色。一旦业务角色制定完毕,技术人员就可以评估相应的复杂度,以及所需要做的工作。这就指向了部署的下一个阶段。
以协同的方式将业务角色转化为相关的分析。建立业务角色对于大数据分析应用来说只是第一步,接下来IT或者分析专家需要创建相应的算法。但这部分工作并不应该是独立的,起初的查询越准确,那么所需要的开发工作就越少。许多项目都需要持续反复的开发工作,究其原因还是因为项目执行人员和业务部门沟通出现了问题。因此,在项目开发的进程中,我们需要双发协同并及时沟通,以便保障项目的顺利进行。
确定一个维护计划。除了项目之前的一些开发工作,我们还需要不间断地注意变更。在业务需求变化之上的日常查询维护固然重要,但毕竟它只是整个分析项目管理的一部分。随着数据集的不断增长以及业务用户对分析过程的不断熟悉,他们对系统的要求也会相应地增加。分析团队必须能够及时地满足额外的要求。此外,在进行软硬件选项评估的时候,其中一个必须考虑的元素就是在不断变化的业务环境中能否支持迭代的开发过程。能够根据需求变化而改变的分析系统,在长时间内都会体现它的价值。
牢记用户需求,不是部分用户,而是所有用户。随着自助式BI工具的流行,在大数据分析项目中把终端用户放到考虑范畴之内就显得并不奇怪了。当然,能够应对不同数据类型的IT架构非常重要,但是系统的可操作性和交互性同样是我们需要考虑的问题。这需要我们把不同类型用户的反馈考虑在内,从高管层到操作工,从分析师到统计员都需要能够访问到大数据分析应用,不管是用何种方式。而他们对于工具的接受度,在很大程度上决定了项目成功与否。举例来说,普通员工或者业务经理不需要自己去运行一个大数据分析查询,他们只需要能够访问可视化的报表或者仪表盘就可以了。而分析人员以及IT部门可能就需要一些深入的功能。
并没有一种方法能够确保所有的大数据分析项目成功,但是了解一些最佳实践一定能够让你的大数据项目规划变得更加清晰。对于大数据分析的技术问题太过细节复杂,不是一朝一夕能够解释清楚,因此我们在本文中并没有提到技术细节。但技术和业务两方面决定着大数据项目的成败,只注重技术而忽视业务需求将会导致项目失衡,反之亦然。
作者
翻译
相关推荐
-
如何将大数据集成到数据仓库
在多数情况下,大数据应用的成功与其如何集成到您的企业数据仓库息息相关。本文将介绍几种方法,以便快速有效地完成这项工作。
-
内置库组件推动Spark分析应用发展
Apache Spark不只能做数据处理。它大数据平台的那些软件库支持其适合用于各种分析应用。
-
IBM加入Spark社区 计划培养百万数据科学家
IBM近日宣布,将大力推进Apache Spark项目,并计划培养超过100万名Spark数据科学家和数据工程师。
-
阿森纳卫冕足总杯 其实大数据早有预测
就在今年的足总杯决赛之前,英国的一家数据分析机构通过大数据,已经成功预测了阿森纳的最终夺冠。