当前位置:首页--HBase

hbase配置详解

 1 准备工作 因为我只有一台机器,所以,一切都成为了伪分布,但是,其实和集群是一样的啦。 在hbase配置之前,先确定自己的linux上有两个前提—— hadoop运行环境和zookeeper运行环境 我的环境如下: hadoop-1.0.2 zookeeper-3.3.6 这些配置这里不进行叙述,确保两者都正常运行;这些东西对hbase配置有用的东西如下: hadoop里core-site.xm......

阅读全文

HBase性能优化 Java Api

 1. 使用“连接池” 如果每次和Hbase交互时都去新建连接的话,显然是低效率的,HBase也提供类连接池相关的API。 1.1. HTablePool 早期的API中使用它,但很不幸,现在它已经过时了。在次不再描述。 1.2. HConnection 取代HTablePool的就是现在的HConnection,可以通过它拿到几乎所有关于HBase的相关操作对象。 private static H......

阅读全文

HBase技术介绍简介 NOSQL数据库 入门(转载)

 HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MapRedu......

阅读全文

HBase图形界面管理工具HBaseXplorer发布1.0.2

 作者:杨鑫奇 HBase图形界面管理工具HBaseXplorer发布1.0.2 HBaseXplorer 是一款HBase管理工具,采用JAVA界面方式,查看和管理数据都很发布. HBaseXplorer原名为 hbase-gui-admin ,是由 zpasal 开发的一款HBase管理工具,并将之开源,原始连接地址在: https://github.com/zpasal/hbase-gui-a......

阅读全文

HBase 二次开发 java api和demo

 1. 试用thrift python/java以及hbase client api。结论例如以下:     1.1 thrift的安装和公布繁琐。可能会遇到未知的错误,且hbase.thrift的版本号在变化中。 长处代码简单,须要打包的内容少。     1.2 hbase client api,须要的jar非常多,公布版的容量也非常大。打包后近百兆。 长处是。明白。无歧义。 2. 推荐用hbas......

阅读全文

MapReduce操作HBase

 运行HBase时常会遇到个错误,我就有这样的经历。  ERROR: org.apache.hadoop.hbase.MasterNotRunningException: Retried 7 times 检查日志:org.apache.hadoop.ipc.RPC$VersionMismatch: Protocol org.apache.hadoop.hdfs.protocol.ClientProt......

阅读全文

Hadoop学习笔记—15.HBase框架学习(基础实践篇)

 一、HBase的安装配置 1.1 伪分布模式安装   伪分布模式安装即在一台计算机上部署HBase的各个角色,HMaster、HRegionServer以及ZooKeeper都在一台计算机上来模拟。   首先,准备好HBase的安装包,我这里使用的是HBase-0.94.7的版本,已经上传至百度网盘之中(URL:http://pan.baidu.com/s/1pJ3HTY7)   (1)通过FTP......

阅读全文

Hbase之Java API远程访问Kerberos认证

 HbaseConnKer.java 1 package BigData.conn; 2 3 import BigData.utils.resource.ResourcesUtils; 4 import org.apache.hadoop.conf.Configuration; 5 import org.apache.hadoop.hbase.HBaseConfiguration; 6......

阅读全文

HBase流量限制和表负载均衡剖析

 1.概述   在HBase-1.1.0之前,HBase集群中资源都是全量的。用户、表这些都是没有限制的,看似完美实则隐患较大。今天,笔者就给大家剖析一下HBase的流量限制和表的负载均衡。 2.内容   也许有同学有疑问,为啥要做流量限制,无限制全量跑不是更好吗?举个例子,比如今天的双十一日,数据流量是非常大的。如果不限制用户和表的流量,某些重要的核心业务,需要在资源有限的情况下优先保证正常运行。......

阅读全文
1 2 3 4 下一页 尾页