博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Java之使用Hadoop探索大数据的世界
阅读量:5812 次
发布时间:2019-06-18

本文共 1930 字,大约阅读时间需要 6 分钟。

  什么是大数据

  PB = 1024tb

  7123913827189tb

  Reids

  无共享

  HDFS

  优点 :特别适合存储大型文件

  TFS

  hdfs 架构

  NameNode: 整个hadoop总管,只有一个,DataNode down了

  存储为镜像文件fsimage 和edites

  secondary 定期合并日志文件及镜像文件

  DataNode 负责存储数据

  以固定大小的block为基本单位组织文件内容 默认大小是64M

  MapReduce

  JobTracker 主要负责资源监控。

  TaskTrachker

  slot 分为Map slot Reduce slot

  Task

  map Task Reduce Tack

  配置单台hadoop 伪分布式环境

  1编辑 ~/.bashrc

  export HADOOP_HOME=/usr/local/hadoop //hadoop 安装路径

  export HADOOP_INSTALL=$HADOOP_HOME

  export HADOOP_MAPRED_HOME=$HADOOP_HOME

  export HADOOP_COMMON_HOME=$HADOOP_HOME

  export HADOOP_HDFS_HOME=$HADOOP_HOME

  export YARN_HOME=$HADOOP_HOME

  export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

  export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

  保存后让设置生效

  source ~/.bashrc

  ./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep input output 'dfs[a-z.]+'

  数据本地化

  运算移动,数据不移动

  需求:查询哪个多

  moneys[] ....//moneys = 56789778687687;

  max = 0L;

  for(i=0L:moneys){

  if(i>max){

  max=i;

  }

  }

  MapReduce

  Map1 Map 2 Map4

  1233 4223423 423432

  1000 800 1200

  1200

  ./etc/hadoop/core-site.xml

  <configuration>

  <property>

  <name>hadoop.tmp.dir</name>

  <value>file:/usr/local/hadoop/tmp</value>

  <description>Abase for other temporary directories.</description>

  </property>

  <property>

  <name>fs.defaultFS</name>

  <value>hdfs://localhost:9000</value>

  </property>

  </configuration>

  hdfs-site.xml

  <configuration>

  <property>

  <name>dfs.replication</name>

  <value>1</value>

  </property>

  <property>

  <name>dfs.namenode.name.dir</name>

  <value>file:/usr/local/hadoop/tmp/dfs/name</value>

  </property>

  <property>

  <name>dfs.datanode.data.dir</name>

  <value>file:/usr/local/hadoop/tmp/dfs/data</value>

  </property>

  </configuration>

  优酷Java视频总汇地址:http://i.youku.com/i/UMTI4MTEzNTA0MA==?spm=a2hww.20023042.uerCenter.5~5!2~A

转载于:https://www.cnblogs.com/anjijiji/p/6233409.html

你可能感兴趣的文章
我的友情链接
查看>>
LeetCode--112--路径总和
查看>>
感悟贴2016-05-13
查看>>
DEV-C++ 调试方法简明图文教程(转)
查看>>
参加婚礼
查看>>
Java重写equals方法和hashCode方法
查看>>
Spark API编程动手实战-07-join操作深入实战
查看>>
Spring ’14 Wave Update: Installing Dynamics CRM on Tablets for Windows 8.1
查看>>
MySQL 备份与恢复
查看>>
TEST
查看>>
PAT A1037
查看>>
(六)Oracle学习笔记—— 约束
查看>>
[Oracle]如何在Oracle中设置Event
查看>>
top.location.href和localtion.href有什么不同
查看>>
02-创建hibernate工程
查看>>
Scrum之 Sprint计划会议
查看>>
svn命令在linux下的使用
查看>>
Gradle之module间依赖版本同步
查看>>
java springcloud版b2b2c社交电商spring cloud分布式微服务(十五)Springboot整合RabbitMQ...
查看>>
10g手动创建数据库
查看>>