`
阿尔萨斯
  • 浏览: 4143050 次
社区版块
存档分类
最新评论

大数据时代的 9 大Key-Value存储数据库

 
阅读更多

在过去的十年中,计算世界已经改变。现在不仅在大公司,甚至一些小公司也积累了 TB 量级的数据。各种规模的组织开始有了处理大数据的需求,而目前关系型数据库在可缩放方面几乎已经达到极限。

一个解决方案是使用键值(Key-Value)存储数据库,这是一种 NoSQL(非关系型数据库)模型,其数据按照键值对的形式进行组织、索引和存储。KV 存储非常适合不涉及过多数据关系业务关系的业务数据,同时能有效减少读写磁盘的次数,比 SQL 数据库存储拥有更好的读写性能。

本文就为你介绍 9 种用于大数据处理的免费键值存储数据库。

1. Aerospike 社区版

大数据时代的 9 大Key-Value存储数据库

Aerospike 是一个以分布式为核心基础,可基于行随机存取内存中索引、数据或 SSD 存储中数据的数据库。

Aerospike 主要用于广告业务,作为一个服务器端的 cookie 存储来使用,在这种场景下读取和写入性能是至关重要的。

官网:http://www.aerospike.com/press-releases/aerospike-launches-free-community-edition/

相关资料:DocumentationFAQBlogForums

2. LevelDB

大数据时代的 9 大Key-Value存储数据库

Leveldb 是 Google 开发的一个非常高效的 kv 数据库,支持 billion 级别的数据量,在这个数量级别下还有着非常高的性能,主要归功于它的良好的设计,特别是 LSM 算法。Leveldb 已经作为存储引擎被 Riak 和 Kyoto Tycoon 所支持,在国内淘宝的 Tair 开源 key-value 存储也已经将 LevelDB 作为其持久化存储引擎,并部署在线上使用。

官网:http://code.google.com/p/leveldb/

相关资料:BenchmarksMailing ListTwitter

3. Scalaris

大数据时代的 9 大Key-Value存储数据库

Scalaris 是一个采用 Erlang 开发的分布式 key-value 存储系统,提供的 API 包括:Java、Python、Ruby 和 JSON。

官网:http://scalaris.googlecode.com/

相关资料:Users and Developers GuideFAQMailing List

4. Project Voldemort

大数据时代的 9 大Key-Value存储数据库

Voldemort 是一个分布式键值存储系统,是 Amazon's Dynamo 的一个开源克隆。特性如下:

  • 支持自动复制数据到多个服务器上。
  • 支持数据自动分割所以每个服务器只包含总数据的一个子集。
  • 提供服务器故障透明处理功能。
  • 支持可拨插的序化支持,以实现复杂的键-值存储,它能够很好的 5. 集成常用的序化框架如:Protocol Buffers、Thrift、Avro 和 Java Serialization。
  • 数据项都被标识版本能够在发生故障时尽量保持数据的完整性而不会影响系统的可用性。
  • 每个节点相互独立,互不影响。
  • 支持可插拔的数据放置策略

官网:http://project-voldemort.com/

相关资料:WikiMailing ListGithubProject Voldemort: Scaling Simple StorageServing Large-scale Batch Computed Data with Project Voldemort

5. HyperDex

大数据时代的 9 大Key-Value存储数据库

HyperDex 是一个分布式、可搜索的键值存储系统,特性如下:

  • 分布式 KV 存储,系统性能能够随节点数目线性扩展
  • 吞吐和延时都能秒杀现在风头正劲的 MonogDB,吞吐甚至强于 Redis
  • 使用了 hyperspace hashing 技术,使得对存储的K-V 的任意属性进行查询成为可能

官网:http://hyperdex.org/

相关资料:DocumentationBlogGitHubFAQAnnouncement Mailing ListDiscussion Mailing List

6. Berkeley DB

大数据时代的 9 大Key-Value存储数据库

Berkeley DB 是一个开源的文件数据库,介于关系数据库与内存数据库之间,使用方式与内存数据库类似,它提供的是一系列直接访问数据库的函数,而不是像关系数据库那样需要网络通讯、SQL 解析等步骤。

官网:http://www.oracle.com/technetwork/products/berkeleydb/overview/index.html

相关资料:WikiForumsLaunchpad

7. Apache Accumulo

大数据时代的 9 大Key-Value存储数据库

Apache Accumulo 是一个可靠的、可伸缩的、高性能的排序分布式的 Key-Value 存储解决方案,基于单元访问控制以及可定制的服务器端处理。Accumulo 使用 Google BigTable 设计思路,基于 Apache Hadoop、Zookeeper 和 Thrift 构建。

官网:http://accumulo.apache.org/

相关资料:ManualMailing ListsApache Accumulo Users Group

8. Redis

大数据时代的 9 大Key-Value存储数据库

Redis 是一个高性能的 key-value 存储系统,和 Memcached 类似,它支持存储的 value 类型相对更多,包括 string(字符串)、list(链表)、set(集合)和 zset(有序集合)。与 memcached 一样,为了保证效率,数据都是缓存在内存中,区别的是 Redis 会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件,并且在此基础上实现了主从同步。

Redis 的出现,很大程度补偿了 memcached 这类 key/value 存储的不足,在部分场合可以对关系数据库起到很好的补充作用。它提供了 Python、Ruby、Erlang、PHP 客户端,使用很方便。

官网:http://redis.io/

相关资料:DocumentationTutorialsFAQMailing ListTwitter

9. Apache Cassandra

大数据时代的 9 大Key-Value存储数据库

Apache Cassandra 是一个混合型的非关系数据库,它最初由 Facebook 开发,用于储存特别大的数据。

Cassandra 的主要特点就是它不是一个数据库,而是由一堆数据库节点共同构成的一个分布式网络服务,对 Cassandra 的一个写操作,会被复制到其它节点上去,对 Cassandra 的读操作,也会被路由到某个节点上面去读取。对于一个 Cassandra 群集来说,扩展性能是比较简单的事情,只管在群集里面添加节点就可以了。

官网:http://cassandra.apache.org/

相关资料:WikiGetting Started

Vialinuxlinks

分享到:
评论

相关推荐

    Go语言开发的基于DRH(Deep-Re-Hash)深度哈希分区算法的高性能高可用Key-Value嵌入式事务数据库

    数据结构是计算机存储、组织数据的方式,它涉及到数据的逻辑结构、物理结构以及对数据的基本操作。数据结构的选择会影响到程序的效率、可读性和可维护性。常见的数据结构有数组、链表、栈、队列、树、图等。 算法则...

    redis-linux-7.2.1

    redis是一个以key-value存储的数据库结构型服务器,它支持的数据结构类型包括:字符串(String)、链表(lists)、哈希表(hash)、集合(set)、有序集合(Zset)等。为了保证读取的效率,redis把数据对象都存储在...

    Redis-win64-5.0.14.1

    redis是一个以key-value存储的数据库结构型服务器,它支持的数据结构类型包括:字符串(String)、链表(lists)、哈希表(hash)、集合(set)、有序集合(Zset)等。为了保证读取的效率,redis把数据对象都存储在...

    二、大数据与分布式.pdf

    2.1 基于 Key-Value 存储的 NoSQL 数据库 基于 Key-Value 存储的 NoSQL 数据库主要是基于键值对来存储,利⽤哈希表来维护 Key 值与具体 Value 之间的映射关系,⽤户可以通 过 Key ⽅便的对数据进⾏定位。...

    Redis—整体知识

    存存储系统或者内存数据库,同时由于它支持丰富的数据结构,又被称为一种数据结构服务 器(Data Structure Server)。因为值(value)可以是字符串(String),哈希(Map),列表(list), 集合(sets)和有序集合(sorted ...

    Redis全套学习笔记

    redis是一个以key-value存储的数据库结构型服务器,它支持的数据结构类型包括:字符串(String)、链表(lists)、哈希表(hash)、集合(set)、有序集合(Zset)等。为了保证读取的效率,redis把数据对象都存储在...

    大数据图标大全.docx

    组件名称 说明 Falcon 一个数据生命周期管理框架 Solr 搜索工具 Hive 数据仓库 Hbase 基于key-value的列式存储数据库 TensorFlow 开源机器学习工具 Ambari Hadoop集群管理运维工具 Drill 数据查询引擎 Spark 实时...

    NoSQL数据库技术实战

    NoSQL与大数据简介、NoSQL的数据一致性、NoSQL的水平扩展与其他基础知识、BigTable与Google云计算原理、Google云计算的开源版本——Hadoop、Dynamo:Amazon的高可用键值对存储、LevelDb——出自Google的Key-Value...

    大数据云计算技术系列 NoSQL数据库学习教程(共71页).pdf

    4 最终一致性Key Value存储 4 Amazon之Dynamo 4 功能特色 4 架构特色 4 BeansDB 4 简介 4 更新 4 特性 4 性能 4 Nuclear 4 两个设计上的Tips 4 Voldemort 4 Dynomite 4 Kai 4 未分类 4 Skynet 4 Drizzle 4 比较 4 可...

    大数据标准体系.docx

    2部分:基于对象的云存储应用接口 在研 数据访问 28 20120569-T-469 信息技术云数据存储和管理第 5部分:基于 Key-Value 的云数据管理应用接口 在研 29 信息技术通用数据导入接口规范 已申报 30 信息技术通用数据...

    韩冬:大数据之Mongodb的理论实践与优化

    mongodb简介:开源、高性能和无模式,C++开发,key-value存储(nosql-->not only sql)。发展现状:新浪微博的Redis、Google的Bigtable和Amazon的SimpleDB都是Nosql型数据库。

    大数据与人工智能.pptx

    从文件系统到对象存储 海量非结构化数据 文本、语音、图片 (分布式)文件系统 目录结构 支持大文件 元数据服务器成为瓶颈 对象存储 去中心化 Key-Value 架构 支持小文件 分布式元数据存储 大数据与人工智能全文共...

    大数据高性能数据库Redis在Windows上的使用教程

     redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set –有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、...

    大数据标准体系.doc

    "27 " " "20120568-T-469 "信息技术云数据存储和管理第2部分:基于对象的云存储应用接口 "在研 " "28 " " "20120569-T-469 "信息技术云数据存储和管理第5部分:基于Key-Value "在研 " " " " " "的云数据管理应用接口...

    2017中国系统架构师大会PPT资料集合.zip

    京东分布式KEY-VALUE存储设计与挑战 Qunar网数据库架构的发展 阿里巴巴数据库计算存储分离架构与实践 京东金融数据库多场景架构实践 财付通交易核心演进之路 开源大容量redis - pika 的前世今生 开源技术的线上应用...

    Python实现遍历数据库并获取key的值

    遍历Redis数据库中有以格式为PREFIX_*的按照key-value方式存储的key,并打印其值. 遍历使用SCAN,因为KEYS PREFIX_*可能会造成Redis长时间阻塞。 查询使用pipeline减少交互,提高效率。 import redis import ...

    大数据标准体系(1).doc

    基于Key-Value "在研 " " " " " "的云数据管理应用接口 " " "29 " " " "信息技术通用数据导入接口规范 "已申报 " "30 " " " "信息技术通用数据导入接口测试规范 "暂时空缺" "31 "数据安全"通用要求 "GB/T 20009-2005...

    Redis入门到精通视频教程

    Redis可以理解为一个key-value存储系统,是当下互联网公司常用的NoSQL数据库之一,是进入互联网行业的Java开发工程师必备技术。 在本课程中,你将了解Redis是什么、能干什么、如何用,了解NoSQL的使用场景和概念,...

    基于图数据库存储引擎的CMDB系统.pdf

    同时结合实验对比分析图 数据库和传统关系型数据库在大规模资源对象与关系数据上的查询存储性能 及优势特点,借助图数据库存储引擎来提升数据中心 CMDB 系统在故障分析、 风险预测等运维功能上的数据应用处理能力。...

    大数据开源框架集锦.pdf

    Redis 开源的⽀持⽹络,基于内存可持久化⽇志,key-value数据库,可⽤于 数据库 缓存 消息中间件 Neo4j 开源⾼性能的NoSQL图形数据库 7 数据处理 MapReduce 分布式离线的计算框架 批处理 ⽇渐被spark和flink取代 ...

Global site tag (gtag.js) - Google Analytics