hive的安装与使用

badboyjaker

浏览: 58066 次
性别:
来自: 北京

最近访客更多访客>>

rubskin

muerzi

mengyou123344

hjc5345

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Hive

HadoopSQLApache.

      hive的安装非常简单。官方下载地址是：http://hive.apache.org。hive目前最新版本是0.7.0，支持Hadoop 0.20.1 及   0.20.2，由于我这里hadoop的版本是0.19.2，所以我就只能用之前的版本了。我使用的版本是0.5.0，可以支持hadoop 0.17到0.20。貌似现在官网上已经没下载链接了，我放到附件供大家下载吧。

    hive是依赖于hadoop的，所以安装hive之前请先装好hadoop，可以参看我的另一篇文章 hadoop的安装和使用。
    将下载到的文件hive-0.5.0-bin.tar.gz解压到hadoop目录下，然后修改下环境变量 /etc/profile ，加上下面几行：

Shell代码
1.export HIVE_HOME=/data/hadoop/hive-0.5.0-bin
2.export PATH=$PATH:$HIVE_HOME/bin
3.export HADOOP_HOME=/data/hadoop

    为了让刚设置的环境变量生效，需要退出终端，再重新登录。可以通过echo $HIVE_HOME命令查看，确保设置的环境变量已经生效。
    好了，下面就可以使用hive了，hive用起来很简单，看下面的例子。

Shell代码
[root@hd128 ~]# hive
Hive history file=/tmp/root/hive_job_log_root_201106191843_199722387.txt
hive> show tables;
OK
Time taken: 10.09 seconds
hive> CREATE TABLE tt(id int,name string)
    > ROW FORMAT DELIMITED
    > FIELDS TE RMINATED BY ','
    > STORED AS TEXTFILE;
OK
Time taken: 0.821 seconds
hive> show tables;
OK
tt
Time taken: 0.134 seconds
hive> select * from tt;
OK
Time taken: 0.245 seconds
hive> drop table tt;
OK
Time taken: 0.602 seconds
hive>

     这个例子中，我们启动hive程序，新建了一个新表tt，然后做了一次查询，然后将表删除了。通过这种简单的类SQL命令，就可以进行复杂的分布式计算了，是不是感觉很爽呢。如果需要学习更复杂的操作，可以参看hive的帮助文件。