悉数11种主流NoSQL文档型数据库

日期: 2012-08-02 作者:Lijin Joseji 来源:TechTarget中国

文档型数据库是NoSQL中非常重要的一个分支,它主要用来存储、索引并管理面向文档的数据或者类似的半结构化数据。顾名思义,文档型数据库(面向文档数据库)的关键核心概念即文档(Document),它是数据库中最小的单位。每一种文档型数据库的部署都有所不同,通常来说,它们假定文档以某种标准化格式封装并加密数据,并用多种格式进行解码,包括XML、YAML、JSON和BSON,当然也包括二进制格式如PDF、微软Office文档等。在本文中,来自IBM的高级IT工程师Lijin Joseji向我们介绍了11种主流的文档型数据库。

  • MongoDB

  MongoDB是目前最为流行的NoSQL数据库,它是一种面向集合,模式无关的文档型数据库。其中数据以“集合”的方式进行分组,每个集合都有单独的名称并可以包含无限数量的文档。这里的集合同关系型数据库中的表(table)类似,唯一的区别就是它并没有任何明确的schema。

  MongoDB以一系列键值对集合的方式存储数据,其中键(Key)是字符串,值(Value)是任何一种数据类型的集合,包括数组和文档。

  主页: http://www.mongodb.org/

  文档: http://www.mongodb.org/display/DOCS/Quickstart

  下载: http://www.mongodb.org/downloads

  • CouchDB

  CouchDB是一个文档型数据库服务器,可以通过JSON格式的REST接口进行访问,使用JavaScript作为查询语言。一个CouchDB文档就是一个对象,由不同字段组成。字段值可以是字符串、数字、日期,甚至可以是有序列表和关联映射。

  主页: http://couchdb.apache.org/

  文档: http://couchdb.apache.org/docs/intro.html

  下载: http://couchdb.apache.org/downloads.html

  • Terrastore

  Terrastore的特点是提供高级的扩展和弹性特征,而无需牺牲一致性。它是一个基于Terracotta实现的高性能分布式文档数据库,后者是业界公认的快速分布式集群技术。

  主页: http://code.google.com/p/terrastore/

  文档: http://code.google.com/p/terrastore/wiki/Documentation

  下载: http://code.google.com/p/terrastore/downloads/list

  • RavenDB

  Raven是一个.NET文档型数据库,它的特点是提供了高性能、schema-less、灵活可扩展的面向.NET和Windows平台的NoSQL数据存储平台。RavenDB在其内部可以存储任何JSON文档,他是一个无模式的数据库,你可以使用C#的Linq语法定义索引。

  主页: http://ravendb.net/

  文档: http://ravendb.net/tutorials

  下载: http://ravendb.net/download

  • OrientDB

  OrientDB是用Java编写的开源NoSQL数据库管理系统,虽然是文档型数据库,但是它的关系管理方式却和图形数据库相类似。它支持schema-less、schema-full和schema-mixed多种模式。OrientDB拥有健壮的基于用户角色的安全分析系统,并支持SQL查询。

  主页: http://www.orientechnologies.com/

  文档: http://code.google.com/p/orient/wiki/Tutorials

  下载: http://code.google.com/p/orient/wiki/Download

  • ThruDB

  Thrudb是一套建立在Apache Thrift framework下的简单服务,提供索引和文件存储服务的网站建设和推广。其目的是提供Web开发灵活,快速和易于使用的服务,可以加强或取代传统的数据存储和访问层。

  Thrudb支持多个数据存储后端,包括BerkeleyDB、Disk、MySQL,还拥有Memcache和Spread集成。

  主页: http://code.google.com/p/thrudb/

  文档: http://thrudb.googlecode.com/svn/trunk/doc/Thrudb.pdf

  下载: http://code.google.com/p/thrudb/source/checkout

  • SisoDB

  SisoDb是一个用C#编写的,专门提供给SQL Server面向文档的db-provider。它可以存储POCO的对象图形,而无需设置任何映射。每个实体都别视为一个聚合根,能够快速生成单独的表。

  主页: http://www.sisodb.com

  文档: http://www.sisodb.com/Wiki

  下载: https://github.com/danielwertheim/SisoDb-Provider/

  • RaptorDB

  RaptorDB是一个非常小型的快速嵌入式NoSQL数据库,它使用b+tree或者MurMur哈希索引。最初的设计是用来存储JSON数据,但是目前可以存储任何类型的数据。

  主页: http://www.codeproject.com/KB/database/RaptorDB.aspx

  文档: http://www.codeproject.com/KB/database/RaptorDB.aspx

  下载: http://www.codeproject.com/KB/database/RaptorDB.aspx

  • CloudKit

  CloudKit提供了模式无关、自动版本化的REST JSON存储,支持OpenID和OAuth,包括OAuth Discovery。

  主页: http://getcloudkit.com/

  文档: http://getcloudkit.com/api/

  下载: https://github.com/jcrosby/cloudkit

  • Perservere

  Persevere是一个开源的工具集,用来应对持久性和分布式计算,它使用了一个标准化的JSON接口。Persevere项目的核心就是Persevere Server,它包含了一个Persevere JavaScript客户端,但是基于标准的接口可以用于任何框架或者客户端。

  主页: http://code.google.com/p/persevere-framework/

  文档: http://code.google.com/p/persevere-framework/w/list

  下载: http://code.google.com/p/persevere-framework/downloads/list

  • Jackrabbit

  Apache Jackrabbit是一个JSR-170的开放源码实现,支持结构化与非结构化内容、全文搜索、版本控制、交易以及观测等。

  主页: http://jackrabbit.apache.or

  文档: http://jackrabbit.apache.org/getting-started-with-apache-jackrabbit.html

  下载: http://jackrabbit.apache.org/downloads.html

  结论

  文档数据库存储并检索文档数据,用户在选用的时候需要参照自身的需求而定。你需要考虑数据访问的模式和用例,以便创建一个高效实用的文档模型。当你的域模型能够分割并分配到多个文档的时候,文档型数据库将是一个不错的选择。比如一个博客软件、一个CMS或者一个维基百科类软件,使用文档型数据库是最佳的方法。而当数据库中有太多的关系和标准化约束的情况下,则传统的关系型数据库更为合适。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐