博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
hadoop安装配置
阅读量:6932 次
发布时间:2019-06-27

本文共 3827 字,大约阅读时间需要 12 分钟。

hot3.png

Hadoop 安装配置教程

VMware: 11.0.0 build-2305329

Ubuntu版本:14.04.1

Jdk: jdk-6u45-linux-x64.bin

Hadoop: hadoop-0.20.2.tar.gz

 

 

  1. 首先安装JDK,可以到oracle官网上去下载你所需版本()

  2. 下载完成后,使用将文件拷贝到/home/vincent/目录下

  3. 更改权限;默认文件没有可执行权限

Sudo chmod 777 jdk-6u45-linux-x64.bin

  1. 使用命令:cd ~

进入到/home/Vincent/目录下

 003717_mWER_946962.png

接下来就是解压了

  1. 解压完成后,得到jdk1.6.0_45文件夹

  2. 使用命令:vi  /etc/profile  编辑profile文件,在profile文件后面添加下面的语句:

#set java enviroment

JAVA_HOME=/home/vincent/jdk1.6.0_45/

export JRE_HOME=/home/vincent/jdk1.6.0_45/jre

export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH

export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH

{

注意:在此版本中,vi编辑器有可能会和方向键冲突,

问题:

   ubuntuvi在编辑状态下方向键不能用,还有回格键不能删除等我们平时习惯的一些键都不能使用。

方案一:

解决办法:

可以安装vim full版本,在full版本下键盘正常,安装好后同样使用vi命令。

安装vim

 ubuntu预装的是vim tiny版本,而需要的是vim full版本。执行下面的语句安装vim full版本:

   $sudo apt-get remove vim-common

   $sudo apt-get install vim

这样就行了,vim是一款优秀的软件,可以在运用中体会到。

(推荐使用)方案二:

vi命令行使用命令“:set nocompatible”,就是设置vi不使用兼容模式。

}

  1. 接下来重启Ubuntu

  2. 重启后测试jkd

003805_j9Rr_946962.png

       出现这个说明安装成功

  1. 接下来安装Hadoop

安装ssh服务

ssh可以实现远程登录和管理,详细情况请google百度

ubuntu默认并没有安装ssh服务,如果通过ssh链接ubuntu,需要自己手动安装ssh-server。命令行:

 sudo apt-get install openssh-server

测试出入命令: ps –e |grep ssh

出现sshd说明安装成功

003830_TgY8_946962.png

  1. 终端下进入hadoop源码包所在目录,使用复制命令把hadoop源码包复制到/home/hadoop

cp hadoop-0.20.2.tar.gz /home/hadoop

然后解压,命令行如下

tar -xzvf *.tar.gz

  1. 配置hadoophadoop/conf下的hadoop-env.shcore-site.xmlmapred-site.xmlhdfs-site.xml

  2. 1)配置hadoop-0.20.2/conf/hadoop-env.sh,命令行:

gedit /home/hadoop/hadoop-0.20.2/conf/hadoop-env.sh

2) ctrl + f 搜索到JAVA_HOME

把前面的#去掉,加上本系统jdk路径,保存退出

  1. 配置hadoop-0.20.2/conf/core-site.xml,命令行:

gedit /home/hadoop/hadoop-0.20.2/conf/core-site.xml

hadoop新建hadoop_tmp目录,原因是:http://blog.csdn.net/bychjzh/article/details/7830508

将如下<configuration> </configuration>之间的添加进入,保存退出:

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>

        <property>

            <name>fs.default.name</name>

            <value>hdfs://localhost:9000</value>

        </property>

    <property>

          <name>hadoop.tmp.dir</name>

          <value>/home/hadoop/hadoop-0.20.2/hadoop_tmp</value>

         <description>A base for other temporary directories.</description>

    </property>

</configuration>

  1. 配置hadoop-1.2.1/conf/mapre-site.xml,命令行:

 gedit /home/hadoop/ hadoop-0.20.2/conf/mapre-site.xml.xml

将如下<configuration> </configuration>之间的添加进入,保存退出

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>

    <property>

        <name>mapred.job.tracker</name>

        <value>localhost:9001</value>

    </property>

</configuration>

  1. 配置hadoop-0.20.2/conf/hdfs-site.xml,命令行:

gedit /home/hadoop/ hadoop-0.20.2/conf/hdfs-site.xml

将如下<configuration> </configuration>之间的添加进入,保存退出

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>

    <property>

        <name>dfs.replication</name>

        <value>1</value>

    </property>

</configuration>

至此hadoop的安装配置已经完毕,稍后的是hadoop的初次运行操作

  1. 格式化hdfs文件系统

进入hadoop-0.20.2/bin

当你看到下图时

003916_YuDG_946962.png

恭喜你,hdsf文件系统格式化成功

  1. 启动hadoop服务

出现如下画面

003931_8B8e_946962.png

  1. jps是查看java虚拟机运行的java线程

然后出现如下画面

004029_1qSo_946962.png

不计jps,有五个hadoop相关线程,恭喜你,hadoop安装配置成功,运行正常。

然后可以退出hadoop。,以后再用时再启动,导入数据。

  1. 测试:

浏览器输入

004042_PoEy_946962.png

浏览器输入

004056_SdCz_946962.png

  1. 分布式Hadoop

  2. a)        首先再次新建一个Ubuntu虚拟机

  3. b)        并且安装openssh-server

  4. c)        查看此虚拟机的IP地址:192.168.114.132

  5. d)        在第一个虚拟机中执行:

004109_nwEm_946962.png

这样就把jdk复制到新建的虚拟机中了

  1. 配置如下信息:

hadoop-env.sh

004125_EQhY_946962.png

core-site.xml

004135_oONH_946962.png

 

hdfs-site.xml

004146_XapE_946962.png

mapred-site.xml

004200_S9Ia_946962.png

masters

004217_kFAl_946962.png

 

slaves

004227_SvLp_946962.png

 

拷贝Hadoop-0.20.2到其他虚拟机中:

sudo scp -r hadoop-0.20.2/

  1. ssh无密码登录

创建ssh-key,这里我们采用rsa方式,命令行如下:

ssh-keygen -t rsa -P ""

004236_MQGp_946962.png

004254_raRa_946962.png

master中,运行./start-all 的时候,会出现 cannot mv ……permission deny,是因为权限的问题,在slave中设置Hadoop0.20.2权限,chmod –r 777 /hadoop0.20.2  (注意-R 选项)

master中启动./start-all.sh时候在master中有

004335_dXQ9_946962.png

slave中有tasktrackerjps,但是没有datanode,在输入网址时 node值为0

查看日志,原来在slave中没有设置  dfs.data.dir  : /usr/hadoop-0.20.2/data 的权限,在slave中使用命令 设置该权限:004345_2Z1x_946962.png

注意命令选项 –R ,意思是该路径下的所有文件

转载于:https://my.oschina.net/duanvincent/blog/391819

你可能感兴趣的文章
suse10 linux 内核升级
查看>>
GIT 专贴
查看>>
Win2012R2 x64 安装MySQL5.7.14压缩版
查看>>
ProxmoxVE 之集群安装(V5.2)
查看>>
PHP中面向对象的分页类
查看>>
在Centos上安装使用GlusterFS
查看>>
Oracle纯SQL实现递归查询分页(树查询分页)
查看>>
【定制化图像开放平台】入门实例之手写数字模型训练
查看>>
Oracle 操作中的问题
查看>>
rabbitmq——prefetch count
查看>>
注册最新版Komodo, PDK , TDK
查看>>
shell study
查看>>
CSS 实现 0.5px 边框线
查看>>
Scala打印菱形*
查看>>
saas系统架构经验总结
查看>>
javascript闭包使用:解决循环绑定事件问题
查看>>
Apache Math Curve Fitting
查看>>
spring mvc ajax提交表单,字符串转日期类型
查看>>
linux 下查看某个端口是否被占用
查看>>
毕业设计之路(4)——IP协议
查看>>