Java FP: Java中函数式编程的Map和Fold(Reduce)

原文链接 作者:  Cyrille Martraire  译者: 李璟(jlee381344197@gmail.com)

在函数式编程中,Map和Fold是两个非常有用的操作,它们存在于每一个函数式编程语言中。既然Map和Fold操作如此强大和重要,但是Java语言缺乏Map和Fold机制,那么该如何解释我们使用Java完成日常编码工作呢?实际上你已经在Java中利用手动编写循环的方式实现了Map和Fold操作(译者注:许多动态语言如python都提供了内置的实现)。

免责声明:本篇文章仅仅只是一篇入门简介,并非函数式编程的参考。函数式编程爱好者可能会不赞同本文观点。

你已经很熟悉Map和Fold

假设这里有一个List<Double>,存储了不含增值税VAT(译者注:Value Added Tax)的金额列表,现在我们想把这个列表转换成包含增值税金额的列表。首先我们定义一个方法,为金额添加增值税:

public double addVAT(double amount, double rate) {
    return amount * (1 + rate);
}

现在将这个方法应用到每份金额上:

public List<Double> addVAT(List<Double> amounts, double rate) {
    final List<Double> amountsWithVAT = new ArrayList<Double>();
    for(double amount : amounts) {
        amountsWithVAT.add(addVAT(amount, rate));
    }
    return amountsWithVAT;
}

我们创建了一个输出列表,它的大小与输入列表一致,存储了对输入列表中每个元素应用了addVAT()之后的结果。恭喜你,我们刚才手工完成了对输入列表应用addVAT()的Map操作。让我们再来一次。
现在我们想利用汇率把每一份金额转换成另一种货币的金额,所以我们需要一个新的函数:

public List<Double> convertCurrency(List<Double> amounts, double currencyRate) {
    final List<Double> amountsInCurrency = new ArrayList<Double>();
    for(double amount : amounts) {
        amountsInCurrency.add(convertCurrency(amount, currencyRate));
    }
    return amountsInCurrency;
}

请注意,这两个方法接收同样的列表,除了在以下第2步稍显不同:

  1. 创建一个输出列表。
  2. 为输入列表中每个元素调用某个给定的函数,将函数结果存入输出列表中。
  3. 返回输出列表。

你经常使用Java完成上述的工作,这正式一个标准的Map操作:对输入列表list<T>中的每个元素应用给定的函数someMethod(T),返回一个同样大小的Map结果列表list<T>。

函数式编程语言意识到这样特殊的需求(为集合中每个元素应用某个方法)是非常常见的,所以设计者把这种行为封装到了内建函数Map中。这意味着,对于给定的addVAT(double, double) 方法,我们可以直接利用Map操作写出这样的代码:

List amountsWithVAT = map (addVAT, amounts, rate);

是的,第一个参数是一个函数。因为在函数式编程语言中,函数是第一要素,所以函数可以被当做是参数传递给方法。

代码中使用了Map操作,将会比使用了循环更加清晰以及更加不容易出错,并且代码的意图会更加明确,但是Map操作并不存在于Java中。

以上例子的重点是,你已经很熟悉你甚至不知道的函数式编程关键概念:Map操作。

现在轮到Fold操作

回到之前提到的包含了金额的列表中,现在我们需要计算列表中每个金额之和。很简单,我们用循环实现:

public double totalAmount(List<Double> amounts) {
    double sum = 0;
    for(double amount : amounts) {
        sum += amount;
    }
    return sum;
}

基本上我们将了“+=”函数,应用到列表中每一个数字元素上,递增式地把每个元素并拢到一个元素里,实现了一个Fold操作。Fold与Map类似,不同的是Fold返回一个标量而非一个列表。

同样,这也是你经常用Java编写的代码,现在这段代码拥有了在函数式编程语言中的名字:Fold或者Reduce。在函数式编程语言中,Fold操作通常是递归式的,这里不进行深入讨论。然而,我们可以在一个循环体内,利用可变状态累加每次循环之后的结果,实现类似Fold的操作。在这种方式中,Fold操作将一个带有内部可变变量并且读取单个参数的函数,比如someMethod(T),应用到输入列表list<T>中的每个元素中,一直到产生最后的Fold操作的结果之后结束。

典型的Fold操作如累加,逻辑与、逻辑或,List.add()和List.addAll(),StringBuilder.append(),max以及min等。

Fold的思想与SQL中的聚集函数类似。

在图形中思考

可以利用草图辅助我们思考。Map操作读取一个长度为n的列表,并且返回一个处理过后的同样大小的列表:

另一方面,Fold操作读取一个长度为n的列表,返回一个标量:

Eclipse模板

Map和Fold如此常用,我们在Eclipse中为这两个操作创建模板,比如Map:

走进Java中的Map和Fold

Map和Fold是一种期望读取到函数对象作为参数的代码结构。在Java中,将待传递函数包装到接口中,传递此接口的某个实现,是唯一的实现传递函数的途径。

在Apache Commons Collections中,有两个接口能满足我们的需求:只有transform(T):T方法的Transformer接口以及只有execute(T):void方法的Closure接口。CollectionUtils为Java集合类提供了简陋的类似Map的collect(Iterator, Tramformer)方法,以及一个利用Closure模拟Fold操作的的forAllDo()方法。

Google Guava的Iterables提供了一个静态的Map操作方法transform(Iterable, Function)。

List<Double> exVat = Arrays.asList(new Double[] { 99., 127., 35. });
Iterable<Double> incVat = Iterables.transform(exVat, new Function<Double, Double>() {
    public Double apply(Double exVat) {
        return exVat * (1.196);
    }
});
System.out.println(incVat); //print [118.404, 151.892, 41.86]

类似的transform方法的实现同样可以用在List和Map集合类中。

为了在Java中模拟Fold操作,可以使用Apache Common Collection中的Closure接口,该接口仅包含一个execute(T):void方法,所以你必须在内部维护当前可变状态,就像“+=”操作那样。

不幸的是,尽管被强烈要求,但是Guava中没有类似Fold操作的实现,甚至连类似闭包的功能都没有。但是实现你自己的Fold操作其实并不难,比如,你可以用以上提到的类简单封装:

// the closure interface with same input/output type
public interface Closure<T> {
    T execute(T value);
}
// an example of a concrete closure
public class SummingClosure implements Closure<Double> {
    private double sum = 0;
    public Double execute(Double amount) {
        sum += amount; // apply '+=' operator
        return sum; // return current accumulated value
    }
}
// the poor man Fold operator
public final static <T> T foreach(Iterable<T> list, Closure<T> closure) {
    T result = null;
    for (T t : list) {
        result = closure.execute(t);
    }
    return result;}
@Test // example of use
public void testFold() throws Exception {
    SummingClosure closure = new SummingClosure();
    List<Double> exVat = Arrays.asList(new Double[] { 99., 127., 35. });
    Double result = foreach(exVat, closure);
    System.out.println(result);// print 261.0
}

并非只为简单集合:在树形结构和其他结构上进行Fold

除了能操作简单集合,还能应用于任何有向结构中,这是Map和Fold的强大之处。

想象一下,一个树形结构将Node类作为它的子节点。把深度优先搜索DFS和广度优先搜索BFS分别编写到一个通用的接收Closure作为参数的方法中,会是一个非常不错的主意:

public class Node ...{
    ...
    public void dfs(Closure closure){...}
    public void bfs(Closure closure){...}
}

我以前经常使用这样的技巧,并且我发现利用一个通用的方法替代许多看起来相似的方法之后,可以大幅减少类的大小。最重要的是,可以通过伪造闭包实现遍历的单元测试,每个闭包同时也可以独立地进行单元测试。

访问者模式同样可以实现相似的功能,有可能你已经非常熟悉这个模式了。我不止一次在代码中发现,访问者模式非常适用于在遍历数据结构期间对状态的累加。在这个条件下,该访问者就是一个Fold操作的传递给其他函数的特殊闭包Closure。

一句话描述Map-Ruduce

也许你已经听过Map-Reduce模式。是的,Map和Reduce分别指的是我们提到过的Map和Fold的函数操作。虽然实际的应用程序非常复杂,但是不难理解,Map操作是高度并行的,所以可以将其用于做大量的并行运算。

时间: 2024-09-01 14:05:36

Java FP: Java中函数式编程的Map和Fold(Reduce)的相关文章

Java FP: Java中函数式编程的谓词函数(Predicates)第二部分

在上一篇文章中我们介绍了谓词函数.通过一个简单的只带一个返回值是true或者false的函数的接口,把函数式编程语言的优势带入到了类似Java的面向对象编程语言中.这一小节,我们将会介绍一些高级特性,方便你高效利用谓词函数. 测试 在测试代码中使用谓词的优势尤为明显.当你需要测试一个混合了数据结构与某些条件逻辑的方法时,通过使用谓词,你可以先单独测试数据结构,再测试条件逻辑. 第一步,先利用永真谓词或者永假谓词屏蔽用于判断的逻辑,将注意力集中在测试数据结构上: 1 // check with t

Java FP: Java中函数式编程的谓词函数(Predicates)第一部分

你一直在听说函数式编程将称霸整个编程届,而自己仍然沉浸在普通的Java里?请不要担心,因为你已经在日常Java代码中加入了函数式编程的特性.此外,函数式编程很有趣,能够帮你节省多行代码并且降低错误率. 什么是谓词函数? 许久之前,那时我还在用Java 1.4进行编码,当我第一次发现Apache Commons Collections,便爱上了谓词函数.Apache Commons Collections里的谓词函数仅仅只是一个只有一个方法的接口: evaluate(Object object):

王亟亟的Python学习之路(八)-函数式编程,map(),reduce(),filter()

转载请注明出处:王亟亟的大牛之路 首先在这里祝愿大家,新年快乐,工作顺利,BUG少少!!! 本来说是在春节假期内继续维持着写文章的进度,但是还是偷懒了几天(打了4天SC2哈哈哈) 今天上的是关于Python的文章,毕竟在亲戚家拜年,懒得插各类手机调试什么的,况且确实好久没有弄Python了,就写了,废话不多,开始正题!! 函数式编程 函数是什么? 把复杂的操作化为简单的函数分解成简单的操作,这种操作就是面向过程,也就是C这类的实现的大体概念. 函数式是什么? 函数没有变量,任意一个函数,只要输入

hadoop中slot简介(map slot 和 reduce slot)

Slots是Hadoop的一个重要概念.然而在Hadoop相关论文,slots的阐述难以理解.网上关于slots的概念介绍也很少,而对于一个有经验的Hadoop开发者来说,他们可能脑子里已经理解了slots的真正含义,但却难以清楚地表达出来,Hadoop初学者听了还是云里雾里.我来尝试讲解一下,以期抛砖引玉. 首先,slot不是CPU的Core,也不是memory chip,它是一个逻辑概念,一个节点的slot的数量用来表示某个节点的资源的容量或者说是能力的大小,因而slot是 Hadoop的资

Java函数式编程(一):你好,Lambda表达式_java

第一章 你好,lambda表达式! 第一节 Java的编码风格正面临着翻天覆地的变化. 我们每天的工作将会变成更简单方便,更富表现力.Java这种新的编程方式早在数十年前就已经出现在别的编程语言里面了.这些新特性引入Java后,我们可以写出更简洁,优雅,表达性更强,错误更少的代码.我们可以用更少的代码来实现各种策略和设计模式. 在本书中我们将通过日常编程中的一些例子来探索函数式风格的编程.在使用这种全新的优雅的方式进行设计编码之前,我们先来看下它到底好在哪里. 改变了你的思考方式 命令式风格--

Python中的函数式编程

虽然人们总把Python当作过程化的,面向对象的语言,但是他实际上包含了函数化编程中,你需要的任何东西.这篇文章主要讨论函数化编程的一般概念,并说明用Python来函数化编程的技术. 我们最好从艰难的问题开始出发:"到底什么是函数化编程呢?"其中一个答案可能是这样的,函数化编程就是你在使用Lisp这样的语言时所做的(还有Scheme,Haskell,ML,OCAML,Mercury,Erlang和其他一些语言).这是一个保险的回答,但是它解释得并不清晰.不幸的是对于什么是函数化编程,很

JavaScript的函数式编程,你了解吗?

探索函数式编程,通过它让你的程序更具有可读性和易于调试 当 Brendan Eich 在 1995 年创造 JavaScript 时,他原本打算将 Scheme 移植到浏览器里 .Scheme 作为 Lisp 的方言,是一种函数式编程语言.而当 Eich 被告知新的语言应该是一种可以与 Java 相比的脚本语言后,他最终确立了一种拥有 C 风格语法的语言(也和 Java 一样),但将函数视作一等公民.而 Java 直到版本 8 才从技术上将函数视为一等公民,虽然你可以用匿名类来模拟它.这个特性允

函数式接口、默认方法、纯函数、函数的副作用、高阶函数、可变的和不可变的、函数式编程和 Lambda 表达式 - 响应式编程 [Android RxJava2](这到底是什么)第三部分

本文讲的是函数式接口.默认方法.纯函数.函数的副作用.高阶函数.可变的和不可变的.函数式编程和 Lambda 表达式 - 响应式编程 [Android RxJava2](这到底是什么)第三部分, 太棒了,我们又来到新的一天.这一次,我们要学一些新的东西让今天变得有意思起来. 大家好,希望你们都过得不错.这是我们的 RxJava2 Android 系列的第三篇文章. 第一部分 第二部分 在这篇文章中,我们将讨论函数式的接口,函数式编程,Lambda 表达式以及与 Java 8 的相关的其它内容.这

Javascript函数式编程简单介绍_javascript技巧

几十年来,函数式编程一直是计算机科学狂热者的至爱,由于数学的纯洁性和谜一般的本质, 它被埋藏在计算机实验室,只有数据学家和有希望获得博士学位的人士使用.但是现在,它正经历一场复兴, 这要感谢一些现代语言比如Python,Julia,Ruby,Clojure以及--但不是最后一个--Javascript. 你是说Javascript?这个WEB脚本语言?没错! Javascript已经被证明是一项长期以来都没有消失的重要的技术.这主要是由于它扩展的一些框架和库而使其具有重生的能力, 比如backb