1、设置job的基础属性 - Job job = new Job();
- job.setJarByClass(***.class);
- job.setJobName(“job name”);
- job.setNumReduce(2);
2、设置Map与Reudce的类 - job.setMappgerClass(*.class);
- job.setReduceClass(*.class);
3、设置Job的输入输出格式
- void setInputFormatClass(Class<? extends InputFormat> cls)
-
- void setOutputFormatClass(Class<? extends OutputFormat> cls)
前者默认是TextInputFormat,后者是FileOutputFormat。
4、设置Job的输入输出路径
当输入输出是文件时,需要指定路径。
- InputFormat:
- static void addInputPath(JobConf conf, Path path)
-
- FileOutputFormat:
- static void setOutputPath(Job job, Path outputDir)
当输入格式是其它类型时,则需要指定相应的属性,如Gora的DataSource。
5、设置map与reduce的输出键值类型 主要有以下4个类
- void setOutputKeyClass(Class<?> theClass)
-
- void setOutputValueClass(Class<?> theClass)
-
- void setMapOutputKeyClass(Class<?> theClass)
-
- void setMapOutputValueClass(Class<?> theClass)
(1)前面2个方法设置整个job的输出,即reduce的输出。默认情况下,map的输出类型与reduce一致,若二者不一致,则需要通过后面2个方法来指定map的输出类型。
(2)关于输入类型的说明:reduce的输入类型由output的输出类型决定。map的输入类型由输入格式决定,如输入格式是FileInputFormat,则输入KV类型为LongWriterable与Text。
6、运行程序 job.waitForCompletion()。
见以下示例:
- package org.jediael.hadoopdemo.maxtemperature;
-
- import org.apache.hadoop.fs.Path;
- import org.apache.hadoop.io.IntWritable;
- import org.apache.hadoop.io.Text;
- import org.apache.hadoop.mapreduce.Job;
- import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
- import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
-
- public class MaxTemperature {
- public static void main(String[] args) throws Exception {
- if (args.length != 2) {
- System.err
- .println("Usage: MaxTemperature <input path> <output path>");
- System.exit(-1);
- }
-
- Job job = new Job();
- job.setJarByClass(MaxTemperature.class);
- job.setJobName("Max temperature");
-
-
- job.setMapperClass(MaxTemperatureMapper.class);
- job.setReducerClass(MaxTemperatureReducer.class);
-
-
- job.setOutputKeyClass(Text.class);
- job.setOutputValueClass(IntWritable.class);
-
-
- FileInputFormat.addInputPath(job, new Path(args[0]));
- FileOutputFormat.setOutputPath(job, new Path(args[1]));
-
-
- System.exit(job.waitForCompletion(true) ? 0 : 1);
- }
- }
版权声明:本文为博主原创文章,转载请注明来自http://blog.csdn.net/jediael_lu/ https://blog.csdn.net/jediael_lu/article/details/43416751