SNS数据挖掘技术尚需完善(下)

日期: 2010-11-01 作者:Jeff Kelly翻译:沈宏 来源:TechTarget中国 英文

接上文:SNS数据挖掘技术尚需完善(上)     但是,并非所有人都信服这个说法。KDPaine事务所首席执行官Katie Paine顾问认为,大多数社交媒体分析技术仍然在做一件“可怕”的工作,即停留在如何确定Facebook帖子、微博和其他网上讨论的情绪。   “很容易收集这些与社交媒体有关的数据,” Paine说:“但是要使这些数据变得有意义是非常困难的,因为93%的数据都是无序或者不相关的。”   Paine引用了近期与SAS软件研究所合作的经历。

该公司使用自己的技术来收集和分析与其本身有关的社交媒体数据。它收集了约3500件社交媒体的内容,然后剔除输入错误……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

接上文:SNS数据挖掘技术尚需完善(上)

    但是,并非所有人都信服这个说法。KDPaine事务所首席执行官Katie Paine顾问认为,大多数社交媒体分析技术仍然在做一件“可怕”的工作,即停留在如何确定Facebook帖子、微博和其他网上讨论的情绪。

  “很容易收集这些与社交媒体有关的数据,” Paine说:“但是要使这些数据变得有意义是非常困难的,因为93%的数据都是无序或者不相关的。”

  Paine引用了近期与SAS软件研究所合作的经历。该公司使用自己的技术来收集和分析与其本身有关的社交媒体数据。它收集了约3500件社交媒体的内容,然后剔除输入错误或其它主题后削减到250件左右实际上与SAS软件研究所相关的内容。

  Paine说,“利用其情感分析技术,SAS软件研究所试图确定每个帖子的情绪是积极的还是消极的。它能够确切地标识为积极的还是消极的只有大约50件。情感分析引擎把其余的大约200件标识为“中立”。虽然其中一些很可能是真正的中立,但对大多数内容来说,这项技术根本无法确定它的情绪,因此得到了一个默认的‘中性的’分类。”

  其结果是,许多公司仍然不信任依靠情感分析技术做出重要决策。

  “这项技术只是尚未成熟,”Liquidnet金融交易公司的商业智能总监Anglela Chen说。但是她认为情感分析技术具有很大潜力,可以帮助企业更好地了解他们的客户。

  “我会说这将是一个无论在那里也不得不挖掘数据的废墟,”Chen说,她指的是社交媒体相关数:“我希望厂商对增强这项技术给予更多的关注。”

  Forrester研究公司的James Kobielus分析师认为,寻找天才的BI和IT专业人员去设计和管理社交媒体分析项目也是一个问题。

  “这些都不是被广泛采用的,或熟知的,或由传统的专业人员使用的BI工具,”Kobielus说:“因此那些具有所需技能的分析专家可以得到一个不错的薪水。”

  然而,尽管它的缺点和高昂成本,情感分析技术在过去几年中得到明显地改善 -- 即便供应商、分析师和客户不认同有多大的改善。

  同样地,社交媒体分析有可能随着博客本身不断地扩大其重要性也将继续增长,这意味着对SAS和IBM来说还是有用武之地的。

  然而对客户来讲这也许并不一定是一件好事。

  “随着社交媒体向先进的分析应用程序提供更多的内容,假的积极情绪和假的消极情绪将成为一个更大的问题,”Kobielus说:“而这个还没有被语言学家制定出来。”

翻译

沈宏
沈宏

相关推荐