Hadoop0.20.0部署与测试中的单机和伪分布模式操作方法简介
本节向大家介绍一下Hadoop0.20.0部署与测试方面的内容,本节主要包括单机模式和伪分布模式操纵方法介绍等内容,希望通过本节的介绍大家能够掌握Hadoop0.20.0部署与测试方法。下面是具体介绍。

成都创新互联公司专注为客户提供全方位的互联网综合服务,包含不限于成都做网站、成都网站设计、博兴网络推广、微信小程序定制开发、博兴网络营销、博兴企业策划、博兴品牌公关、搜索引擎seo、人物专访、企业宣传片、企业代运营等,从售前售中售后,我们都将竭诚为您服务,您的肯定,是我们最大的嘉奖;成都创新互联公司为所有大学生创业者提供博兴建站搭建服务,24小时服务热线:13518219792,官方网址:www.cdcxhl.com
1.单机模式Local(Standalone)Mode
默认情况下,Hadoop被配置成以非分Java布式模式运行的一个独立进程。这对调试非常有帮助。
 经过上述配置,就可以运行单机模式了。具体操作请查看手册
2.伪分布式模式的操作方法
Hadoop0.20.0部署中Hadoop可以在单节点上以所谓的伪分布式模式运行,此时每一个Hadoop守护进程都作为一个独立的Java进程运行。
 0.20版本较之前版本比配置文件有较大改动,由原来全部配置在hadoop-site.xml改为分别配置在以下三个文件中:
 conf/core-site.xml,conf/hdfs-site.xml,conf/mapred-site.xml
具体配置查看手册
 以conf/core-site.xml为例:
  
fs.default.name 
hdfs://localhost:9000 
如果出现连接错误,可以尝试将了localhost替换为本机IP或127.0.0.1
Hadoop0.20.0部署中免密码ssh设置
 现在确认能否不输入口令就用ssh登录localhost:
 $sshlocalhost
 如果不输入口令就无法用ssh登陆localhost,执行下面的命令:
 $ssh-keygen-tdsa-P''-f~/.ssh/id_dsa
 $cat~/.ssh/id_dsa.pub>>~/.ssh/authorized_keys
执行
 格式化一个新的分布式文件系统:
 $bin/hadoopnamenode-format
启动Hadoop守护进程:
 $bin/start-all.sh
Hadoop守护进程的日志写入到${HADOOP_LOG_DIR}目录(默认是${HADOOP_HOME}/logs).
 浏览NameNode和JobTracker的网络接口,它们的地址默认为:
 *NameNode-http://localhost:50070/
 *JobTracker-http://localhost:50030/
 到这步为止,必须要先访问上面的NameNode网络接口,当页面能正常显示HDFS的状态时,才能正常进行下面的步骤。
1.点击Browsethefilesystem,***次进入可能会返回一个404错误页面。
 2.返回上一页,刷新页面,这时候应该会出现下图所示画面,这就表明DFS已经正常工作(即DFSUsed等数值不再显示为0)。
 3.如果不行就反复操作1,2步骤,直至成功。
将输入文件拷贝到分布式文件系统:$bin/hadoopfs-putconfinput
 运行发行版提供的示例程序:$bin/hadoopjarhadoop-*-examples.jargrepinputoutput'dfs[a-z.]+'
查看输出文件:
 将输出文件从分布式文件系统拷贝到本地文件系统查看:
 $bin/hadoopfs-getoutputoutput
 $catoutput/*
 $bin/hadoopfs-getoutputoutput
 $catoutput/*
 或者
 在分布式文件系统上查看输出文件:
  
- $bin/hadoopfs-catoutput/*
- $bin/hadoopfs-catoutput/*
- 3dfs.class
- 2dfs.period
- 1dfs.file
- 1dfs.replication
- 1dfs.servers
- 1dfsadmin
- 1dfsmetrics.log
- 3 dfs.class
- 2 dfs.period
- 1 dfs.file
- 1 dfs.replication
- 1 dfs.servers
- 1 dfsadmin
- 1 dfsmetrics.log
完成全部操作后,停止守护进程:$bin/stop-all.sh
Hadoop0.20.0部署与测试中的命令(Command)总结
这部分内容其实可以通过命令的Help以及介绍了解,我主要侧重于介绍一下我用的比较多的几个命令。Hadoopdfs这个命令后面加参数就是对于HDFS的操作,和Linux操作系统的命令很类似,例如:
 Hadoopdfs–ls就是查看/usr/root目录下的内容,默认如果不填路径这就是当前用户路径;
 Hadoopdfs–rmrxxx就是删除目录,如果多次执行,则每次执行前可以用此命令删除已存在的文件夹内容;
 Hadoopdfsadmin–report这个命令可以全局的查看DataNode的情况;
 Hadoopjob后面增加参数是对于当前运行的Job的操作,例如list,kill等;
 Hadoopbalancer就是前面提到的均衡磁盘负载的命令。本节关于Hadoop0.20.0部署与测试相关内容介绍到这里。
网站名称:Hadoop0.20.0部署与测试中的单机和伪分布模式操作方法简介
URL链接:http://jxruijie.cn/article/djcoiei.html

 
                