Hadoop生态图谱

日期: 2012-02-19 作者:nosqlfan 来源:TechTarget中国 英文

  当下Hadoop已经成长为一个庞大的体系,貌似只要和海量数据相关的,没有哪个领域缺少Hadoop的身影,下面是一个Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统中出现的各种数据工具。

  这一切,都起源自Web数据爆炸时代的来临

  数据抓取系统 – Nutch

  海量数据怎么存,当然是用分布式文件系统 – HDFS

  数据怎么用呢,分析,处理

  MapReduce框架,让你编写代码来实现对大数据的分析工作

  非结构化数据(日志)收集处理 – fuse,webdav, chukwa, flume, Scribe

  数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了 – Hiho, sqoop

  MapReduce太麻烦,好吧,让你用熟悉的方式来操作Hadoop里的数据 – Pig, Hive, Jaql

  让你的数据可见 – drilldown, Intellicus

  用高级语言管理你的任务流 – oozie, Cascading

  Hadoop当然也有自己的监控管理工具 – Hue, karmasphere, eclipse plugin, cacti, ganglia

  数据序列化处理与任务调度 – Avro, Zookeeper

  更多构建在Hadoop上层的服务 – Mahout, Elastic map Reduce

  OLTP存储系统 – Hbase

  

点击放大

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

nosqlfan
nosqlfan

相关推荐