高级数据分析流程要避免的常见错误

日期: 2011-05-02 作者:Beth Stackpole翻译:冯昀晖 来源:TechTarget中国 英文

高级分析项目从来都是复杂的。公司抉择错误会极大地加重在高级数据分析流程中获得预期收益的风险程度,更糟糕的是,昂贵而且资源密集型的策略注定会彻底失败。   既然许多公司在使用高级分析工具和技术方面的成熟度仍然处在提升阶段,那么他们就有很大的失误可能性。那么,原因何在?   按照经验丰富的用户和行业分析师们的观点,许多问题都与没有选择合适的人加入高级数据分析项目,没有合适的人参与有关数据质量的问题有关系。

组织文化是另一个大的障碍,尤其是在那些终端用户习惯于按直觉经营而不是基于事实构建的流程进行决策的公司。   David Menninger是Ventana研究公司的研究主管,他认为或许唯一最普遍的……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

高级分析项目从来都是复杂的。公司抉择错误会极大地加重在高级数据分析流程中获得预期收益的风险程度,更糟糕的是,昂贵而且资源密集型的策略注定会彻底失败。

  既然许多公司在使用高级分析工具和技术方面的成熟度仍然处在提升阶段,那么他们就有很大的失误可能性。那么,原因何在?

  按照经验丰富的用户和行业分析师们的观点,许多问题都与没有选择合适的人加入高级数据分析项目,没有合适的人参与有关数据质量的问题有关系。组织文化是另一个大的障碍,尤其是在那些终端用户习惯于按直觉经营而不是基于事实构建的流程进行决策的公司。

  David Menninger是Ventana研究公司的研究主管,他认为或许唯一最普遍的错误就是没有完全理解高级分析以及构思预测模型和数据挖掘算法的本质。他说:“公司可能会过于雄心勃勃地认为数据挖掘和预测分析可以做一切事情。这不是变魔术,这是数据问题。”

  他补充说,这类问题已经在调查数据中反映出来了。例如,Ventana公司去年对业务和IT专业人士发起的一次调查显示,参与调查的308名受访者中只有较少的9%表示他们对其组织中的商业智能和分析成果感到满意。同时,共有53%的人群称他们对部署的BI和分析技术能满足业务需要的程度信心不足或者完全没有信心。

  下面是关于高级数据分析过程中可能出差错的更多详细内容:

  组建了错误的团队。随着高级分析软件变得越来越易用,它变成了传统BI套件中的集成组件,它为主流商业用户提供了利用复杂的预测分析数据挖掘工具的机会。但是,那并不意味着你能依赖这类用户理解开发分析模型的原则,这些模型将会给隐含数据模式和业务趋势提供方向性指导。

  Rick Sherman是Athena IT 解决方案公司的创始人,他说,高级分析项目经理们应该确保他们的团队中包含有懂得统计和定性分析这类学科的人员,他们能恰当地操纵可用数据。他还提醒说:“否则的话,数据进去时是垃圾,出来还是垃圾。你可以得到能预测任何你想要信息的工具,但是这并不意味着它是有效的。”

  无效的或不完整的数据。数据质量问题是高级分析项目的一个主要绊脚石,对于传统BI和数据仓库策略尤其如此。因此,组织必须确保数据能正确清洗和规范化, Sherman和其他分析师们都这么认为。此外,他们需要确保所有必须的数据(包括历史数据和实时信息)都是高级数据分析流程中的一部分,这样才能产生可靠的和一致的分析结果。

  Dan Vesset是IDC公司的一名分析师,他说:“公司通常会低估待分析数据可用性和数据可信度的重要性,来自学术界的人们通常会用清楚干净的数据集来解决问题,但是在现实世界中,情况从来都不是这样的。”

  与业务的错位。把统计人员和其他高级数据分析师们都集中封闭到某个地方处理数据,而没有业务增长可能性的信息输入,分析项目必然不能启动。当然,数学头脑和扎实的数据分析技能对于高级分析的成功至关重要。但是,没有对业务问题和公司战略的深入理解,是不可能导向正确的可变因素以及建立准确预测和分析评分模型的关系。

  因此,业务人员,分析师和IT专业人士需要步调一致地处理高级分析策略和流程,许多专家都推荐建立数据分析团队,嵌入到专门的业务单元中。Gartner公司分析师Rita Sallam说:“当数据挖掘变得与组织文化融为一体时,该组织才真正利用数据带来了竞争力,这种情况只有在IT和业务部门紧密合作的情况下才可能出现。”

  选择一次性的方法。有一种普遍的误解:如果数据分析插入数据一次,他们就能得到即时可靠的结果;但是通常情况下,情况远非如此。分析师们表示,在大多数组织中,高级数据分析流程需要多次迭代并大量传递不同数据来集中分析采取行动的各种结果。

  不仅仅分析模型是一个迭代的过程——数据挖掘策略整体上往往也是一个移动的目标。只要问问Anthony Perez就知道了,他是奥兰多魔术篮球队的经营战略助理。Perez说,作为一个组织,魔术队在过去18个月以来取得了巨大的进步,他们利用数据挖掘软件启用了动态票价制定策略,并为市场营销的目的细分了客户分类。

  但是,在每次应用挖掘工具的新机会中,Perez的团队不得不继续调整其他数据源需要的方法和参数因子。Perez说:“这令我们大开眼界。每次我们向前迈进一步,都会认为我们遥遥领先了,现在我们认识到为了达到我们理想的目标位置,我们还有这么多事可以做。”

相关推荐