`

hive的安装与使用

    博客分类:
  • Hive
阅读更多




HadoopSQLApache.


      hive的安装非常简单。官方下载地址是:http://hive.apache.org。hive目前最新版本是0.7.0,支持Hadoop 0.20.1 及   0.20.2,由于我这里hadoop的版本是0.19.2,所以我就只能用之前的版本了。我使用的版本是0.5.0,可以支持hadoop 0.17到0.20。貌似现在官网上已经没下载链接了,我放到附件供大家下载吧。

    hive是依赖于hadoop的,所以安装hive之前请先装好hadoop,可以参看我的另一篇文章 hadoop的安装和使用。
    将下载到的文件hive-0.5.0-bin.tar.gz解压到hadoop目录下,然后修改下环境变量 /etc/profile ,加上下面几行:



Shell代码 
1.export HIVE_HOME=/data/hadoop/hive-0.5.0-bin 
2.export PATH=$PATH:$HIVE_HOME/bin 
3.export HADOOP_HOME=/data/hadoop 

    为了让刚设置的环境变量生效,需要退出终端,再重新登录。可以通过echo $HIVE_HOME命令查看,确保设置的环境变量已经生效。
    好了,下面就可以使用hive了,hive用起来很简单,看下面的例子。



Shell代码 
[root@hd128 ~]# hive 
Hive history file=/tmp/root/hive_job_log_root_201106191843_199722387.txt 
hive> show tables; 
OK 
Time taken: 10.09 seconds 
hive> CREATE TABLE tt(id int,name string)  
    > ROW FORMAT DELIMITED  
    > FIELDS TE RMINATED BY ','  
    > STORED AS TEXTFILE; 
OK 
Time taken: 0.821 seconds 
hive> show tables; 
OK 
tt 
Time taken: 0.134 seconds 
hive> select * from tt; 
OK 
Time taken: 0.245 seconds 
hive> drop table tt; 
OK 
Time taken: 0.602 seconds 
hive>  

     这个例子中,我们启动hive程序,新建了一个新表tt,然后做了一次查询,然后将表删除了。通过这种简单的类SQL命令,就可以进行复杂的分布式计算了,是不是感觉很爽呢。如果需要学习更复杂的操作,可以参看hive的帮助文件。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics