Hadoop0.20.0部署与测试中的单机和伪分布模式操作方法是什么

技术Hadoop0.20.0部署与测试中的单机和伪分布模式操作方法是什么这篇文章将为大家详细讲解有关Hadoop0.20.0部署与测试中的单机和伪分布模式操作方法是什么,文章内容质量较高,因此小编分享给大家做个参考,希望

本文将详细解释如何在单机和伪分发模式下操作Hadoop0.20.0部署和测试。这篇文章的内容质量很高,所以边肖会分享给大家参考。希望大家看完这篇文章能有所了解。

1.独立模式本地(独立)模式

默认情况下,Hadoop被配置为以非分布式Java模式运行的独立进程。这对调试很有帮助。

完成上述配置后,您可以运行独立模式。详情请参考手册。

2.伪分布式模式的操作方法

在Hadoop0.20.0部署中,Hadoop可以在单个节点上以所谓的伪分布式模式运行。此时,每个Hadoop守护进程都作为独立的Java进程运行。

与之前的版本相比,0.20版本对配置文件做了很大的改动,从hadoop-site.xml中的原始配置变成了以下三个文件:

conf/core-site.xml,conf/hdfs-site.xml,conf/mapred-site.xml

特定配置检查手册

以conf/core-site.xml为例:

ConfigurationPropertyNamefs.default.name/NamevalueHDFS ://本地主机33609000/值/属性/配置如果出现连接错误,您可以尝试用本地IP或127.0.0.1替换本地主机。

Hadoop0.20.0部署中的无密码ssh设置

现在确认是否可以使用ssh登录localhost:而无需输入密码。

$sshlocalhost

如果不输入密码,就无法使用ssh登录到localhost,并执行以下命令:

$ssh-keygen-tdsa-P''-f~/。ssh/id_dsa

$cat~/。ssh/id_dsa.pub~/。ssh/授权密钥

执行

格式化新的分布式文件系统:

$ bin/Hadoop name node-格式

启动Hadoop守护程序:

$bin/start-all.sh

Hadoop守护程序的日志被写入${HADOOP_LOG_DIR}目录(默认为$ { HADOOP _ HOME }/LOG)。

浏览名称节点和作业跟踪器的网络接口,它们的地址默认为:

* NameNode-http://localhost :50070/

* job tracker-http://localhost :50030/

至此,您必须首先访问上面的名称节点网络接口,当页面可以正常显示HDFS的状态时,您可以正常进行以下步骤。

1.单击“浏览文件系统”,在* * *次访问后,可能会返回404错误页面。

2.返回上一页并刷新页面。这时应该会出现下图所示的画面,表示DFS一直正常工作(即DFSUsed等值不再显示为0)。

3.如果没有,重复步骤1和2,直到成功。

将输入文件复制到分布式文件系统:$bin/hadoopfs-putconfinput

运行发行版提供的示例程序:$ bin/Hadoop jarhadoop-*-examples . jargrepinputoutput ' DFS[a-z .]'

查看输出文件:

将输出文件从分布式文件系统复制到本地文件系统以供查看:

$ bin/Hadoop fs-getoutput

$catoutput/*

$ bin/Hadoop fs-getoutput

$catoutput/*

或者

要查看分布式文件系统上的输出文件,请执行以下操作:

$ bin/Hadoop fs-Cato utput/* $ bin/Hadoop fs-Cato utput/* 3dfs . class 2 DFS . period 1 DFS . file 1 DFS . replication 1 DFS . servers 1 DD min 1 fsmetrics . log3dfs . class 2 DFS . period 1 DFS . file 1 DFS . servers 1 DD min 1 fsmetrics . log停止守护进程:$ bin/stop-all.sh。

Hadoop0.20.0部署和测试中的命令摘要

这部分内容其实可以通过Help和命令的介绍来理解。我主要集中介绍几个我比较常用的命令。带参数的Hadoopdfs命令是HDFS的操作,类似于Linux操作系统的命令,例如:

HadoopdfsndashLs是查看/usr/根目录中的内容。默认情况下,如果未填写路径,这是当前用户路径。

HadoopdfsndashRmrxxx是删除目录。如果它被执行多次,您可以在每次执行之前使用此命令删除现有的文件夹内容。

Hadoopdfsadminndash报表命令可以全局查看数据节点的状态;

在HadoopJob之后添加的参数是针对当前正在运行的作业的操作,如列表、kill等。

Hadoopbalancer是前面提到的平衡磁盘负载的命令。

Hadoop0.20.0部署测试中有哪些单机和伪分布式的运行方式?我想在这里分享一下。

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/113117.html

(0)

相关推荐

  • Hibernate里的Fetch有什么用

    技术Hibernate里的Fetch有什么用这篇文章主要为大家展示了“Hibernate里的Fetch有什么用”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Hibernate

    攻略 2021年12月8日
  • HTML5如何使用video

    技术HTML5如何使用video小编给大家分享一下HTML5如何使用video,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!对video的支持

    攻略 2021年11月24日
  • 如何打麻将,打麻将怎么才能提高胜算

    技术如何打麻将,打麻将怎么才能提高胜算麻将这种棋牌游戏简单易学,四个人你来我往互不相让,争得不亦乐乎。殊不知正是是因为“简单易学”这四个字让很多人陷入了“易学难精”的尴尬境地,至于提高胜算更是可望而不可及。那么,真正能提

    生活 2021年10月23日
  • 如何安装spark 2.2.0独立版并演示字数统计

    技术如何进行spark 2.2.0 Standalone安装及wordCount演示本篇文章为大家展示了如何进行spark 2.2.0 Standalone安装及wordCount演示,内容简明扼要并且容易理解,绝对能使

    攻略 2021年12月17日
  • eclipse中的默认编码方式是什么(eclipse编码格式在哪里)

    技术eclipse编码方法是什么本篇内容介绍了“eclipse编码方法是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成

    攻略 2021年12月23日
  • kafka zookeeper存储结构图是怎样的

    技术kafka zookeeper存储结构图是怎样的这期内容当中小编将会给大家带来有关kafka zookeeper存储结构图是怎样的,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。ka

    攻略 2021年11月12日