Java之使用Hadoop探索大数据的世界-白红宇

Java之使用Hadoop探索大数据的世界

阅读量：5812 次

发布时间：2019-06-18

本文共 1930 字，大约阅读时间需要 6 分钟。

　　什么是大数据

　　PB = 1024tb

　　7123913827189tb

　　Reids

　　无共享

　　HDFS

　　优点：特别适合存储大型文件

　　TFS

　　hdfs 架构

　　NameNode: 整个hadoop总管，只有一个，DataNode down了

　　存储为镜像文件fsimage 和edites

　　secondary 定期合并日志文件及镜像文件

　　DataNode 负责存储数据

　　以固定大小的block为基本单位组织文件内容默认大小是64M

　　MapReduce

　　JobTracker 主要负责资源监控。

　　TaskTrachker

　　slot 分为Map slot Reduce slot

　　Task

　　map Task Reduce Tack

　　配置单台hadoop 伪分布式环境

　　1编辑 ~/.bashrc

　　export HADOOP_HOME=/usr/local/hadoop //hadoop 安装路径

　　export HADOOP_INSTALL=$HADOOP_HOME

　　export HADOOP_MAPRED_HOME=$HADOOP_HOME

　　export HADOOP_COMMON_HOME=$HADOOP_HOME

　　export HADOOP_HDFS_HOME=$HADOOP_HOME

　　export YARN_HOME=$HADOOP_HOME

　　export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

　　export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

　　保存后让设置生效

　　source ~/.bashrc

　　./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep input output 'dfs[a-z.]+'

　　数据本地化

　　运算移动，数据不移动

　　需求：查询哪个多

　　moneys[] ....//moneys = 56789778687687;

　　max = 0L;

　　for(i=0L:moneys){

　　if(i>max){

　　max=i;

　　}

　　MapReduce

　　Map1 Map 2 Map4

　　1233 4223423 423432

　　1000 800 1200

　　1200

　　./etc/hadoop/core-site.xml

　　<name>hadoop.tmp.dir</name>

　　<value>file:/usr/local/hadoop/tmp</value>

　　<description>Abase for other temporary directories.</description>

　　</property>

　　<name>fs.defaultFS</name>

　　<value>hdfs://localhost:9000</value>

　　</property>

　　</configuration>

　　hdfs-site.xml

　　<name>dfs.replication</name>

　　</property>

　　<name>dfs.namenode.name.dir</name>

　　<value>file:/usr/local/hadoop/tmp/dfs/name</value>

　　</property>

　　<name>dfs.datanode.data.dir</name>

　　<value>file:/usr/local/hadoop/tmp/dfs/data</value>

　　</property>

　　</configuration>

　　优酷Java视频总汇地址：http://i.youku.com/i/UMTI4MTEzNTA0MA==?spm=a2hww.20023042.uerCenter.5~5!2~A

转载于:https://www.cnblogs.com/anjijiji/p/6233409.html

你可能感兴趣的文章

DEV-C++ 调试方法简明图文教程(转)

查看>>

参加婚礼

查看>>

Java重写equals方法和hashCode方法

查看>>

Spark API编程动手实战-07-join操作深入实战

查看>>

Spring ’14 Wave Update: Installing Dynamics CRM on Tablets for Windows 8.1

[Oracle]如何在Oracle中设置Event

查看>>

top.location.href和localtion.href有什么不同

java springcloud版b2b2c社交电商spring cloud分布式微服务（十五）Springboot整合RabbitMQ...

查看>>

10g手动创建数据库

查看>>