windows 에서 hadoop 설치 를 마쳤다면 ..
Directory of D:\hadoop-2.4.1 01/18/2014 08:11 AM <DIR> . 01/18/2014 08:11 AM <DIR> .. 01/18/2014 08:28 AM <DIR> bin 01/18/2014 08:28 AM <DIR> etc 01/18/2014 08:28 AM <DIR> include 01/18/2014 08:28 AM <DIR> libexec 01/18/2014 08:28 AM <DIR> sbin 01/18/2014 08:28 AM <DIR> share 0 File(s) 0 bytes
Starting a Single Node (pseudo-distributed) Cluster
D:\hadoop-2.4.1\etc\hadoop\hadoop-env.cmd 파일을 열고 마지막 줄 밑에 추가한다.
set HADOOP_PREFIX=D:\hadoop-2.4.1
set HADOOP_CONF_DIR=%HADOOP_PREFIX%\etc\hadoop
set YARN_CONF_DIR=%HADOOP_CONF_DIR%
set PATH=%PATH%;%HADOOP_PREFIX%\bin
같은 경로의 core-site.xml 파일도 아래와 같이 수정
<configuration> <property> <name>fs.default.name</name> <value>hdfs://0.0.0.0:19000</value> </property> </configuration>
같은 경로의 hdfs-site.xml 파일도 아래와 같이 수정
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration>
slaves 파일도 아래와 같은지 확인
localhost
YARN Configuration
<configuration> <property> <name>mapreduce.job.user.name</name> <value>%USERNAME%</value> </property> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> <property> <name>yarn.apps.stagingDir</name> <value>/user/%USERNAME%/staging</value> </property> <property> <name>mapreduce.jobtracker.address</name> <value>local</value> </property>
마지막으로 yarn-site.xml 파일 수정
<configuration>
<property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> <property> <name>yarn.resourcemanager.address</name> <value>127.0.0.1:8032</value> </property> <property> <name>yarn.resourcemanager.scheduler.address</name> <value>127.0.0.1:8030</value> </property> <property> <name>yarn.resourcemanager.resource-tracker.address</name> <value>127.0.0.1:8031</value> </property> </configuration>
Windows SDK 7.1 Command Prompt 실행
에러가 없는지 확인.
완료가 되면 ex) D:\tmp 디렉토리에 파일시스템이 생깁니다.
Start HDFS Daemons
아래와 같이 나오면 된듯?
그밖에 많은 하둡 명령어 들이 있다.
http://hadoop.apache.org/docs/r0.18.3/hdfs_shell.html 참조
다음은 맵리듀스 예제.
먼저 yarn을 실행
hadoop을 찾을 수 없다면 etc/hadoop/hadoop-env 를 실행하고 해보자
yarn을 실행 시키고 http://localhost:8088/ 에 접속라면 리소스매니저라는 웹 페이지가 있다.
sbin/hadoop-all 을 열어보면 hdfs , yarn이 실행 되는것을 볼때.
하둡은 이 두가지 서비스 라는것으로 볼 수 있다.
HDFS : Hadoop Distributed File System
http://hadoop.apache.org/docs/r1.2.1/hdfs_design.html
YARN : Apache Hadoop NextGen MapReduce (YARN)
http://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/YARN.html
'Hadoop' 카테고리의 다른 글
flume 정리. (0) | 2014.10.08 |
---|---|
windows 에서 hadoop 설치 (3) | 2014.08.13 |