参考答案:
map数量
影响map个数(split个数)的主要因素有:
文件的大小。当块(dfs.block.size)为128m时,如果输入文件为128m,会被划分为1个split;当块为256m,会被划分为2个split。
文件的个数。FileInputFormat按照文件分割split,并且只会分割大文件,即那些大小超过HDFS块的大小的文件。如果HDFS中dfs.block.size设置为128m,而输入的目录中文件有100个,则划分后的split个数至少为100个。
splitSize的大小。分片是按照splitszie的大小进行分割的,一个split的大小在没有设置的情况下,默认等于hdfs block的大小。
splitSize=max{minSize,min{maxSize,blockSize}}
map数量由处理的数据分成的block数量决定default_num = total_size / split_size
reduce数量
reduce的数量job.setNumReduceTasks(x); x为reduce的数量。不设置的话默认为1
服务器托管,北京服务器托管,服务器租用 http://www.fwqtg.net
机房租用,北京机房租用,IDC机房托管, http://www.fwqtg.net
相关推荐: 【网络】- 计算机网络体系结构 – OSI七层模型、TCP/IP四层(五层)协议
一、概述
二、计算机网络体系结构的形成
三、OSI 参考模型
目录 一、概述 二、计算机网络体系结构的形成 👉2.1 分层的网络体系结构 👉2.2 OSI 参考模型 👉2.3 TCP/IP – 事实的国际标准 三、OSI 参考模型 四、TCP/IP 协议 一、概述 但凡学习计算机网络知识,肯定绕不过网络协议的,而说…