学习函数式编程 Monad_vlambda技术博客

vlambda
2020-11-24

学习函数式编程 Monad

上一篇文章中，我们讨论了常用的函数式编程案例，一些同学反馈没有讲到底层概念，想了解一下什么是 Monad？基于这个问题，我们来探究一下。

在函数式编程中，Monad 是一种结构化程序的抽象，我们通过三个部分来理解一下。

Monad 定义
Monad 使用场景
Monad 一句话解释

Monad 定义

根据维基百科的定义，Monad 由以下三个部分组成：

一个类型构造函数（M），可以构建出一元类型 M<T>。
一个类型转换函数（return or unit），能够把一个原始值装进 M 中。

unit(x) : T -> M T

一个组合函数 bind，能够把 M 实例中的值取出来，放入一个函数中去执行，最终得到一个新的 M 实例。

M<T> 执行 T-> M<U> 生成 M<U>

除此之外，它还遵守一些规则：

单位元规则，通常由 unit 函数去实现。
结合律规则，通常由 bind 函数去实现。

单位元：是集合里的一种特别的元素，与该集合里的二元运算有关。当单位元和其他元素结合时，并不会改变那些元素。

乘法的单位元就是 1，任何数 x 1 = 任何数本身、1 x 任何数 = 任何数本身。

加法的单位元就是 0，任何数 + 0 = 任何数本身、0 + 任何数 = 任何数本身。

这些定义很抽象，我们用一段 js 代码来模拟一下。

class Monad {
  value = "";
  // 构造函数
  constructor(value) {
    this.value = value;
  }
  // unit，把值装入 Monad 构造函数中
  unit(value) {
    this.value = value;
  }
  // bind，把值转换成一个新的 Monad
  bind(fn) {
    return fn(this.value);
  }
}

// 满足 x-> M(x) 格式的函数
function add1(x) {
  return new Monad(x + 1);
}
// 满足 x-> M(x) 格式的函数
function square(x) {
  return new Monad(x * x);
}

// 接下来，我们就能进行链式调用了
const a = new Monad(2)
     .bind(square)
     .bind(add1);
     //...

console.log(a.value === 5); // true

上述代码就是一个最基本的 Monad，它将程序的多个步骤抽离成线性的流，通过 bind 方法对数据流进行加工处理，最终得到我们想要的结果。

Ok，我们已经明白了 Monad 的内部结构，接下来，我们再看一下 Monad 的使用场景。

Monad 使用场景

通过 Monad 的规则，衍生出了许多使用场景。

组装多个函数，实现链式操作。

链式操作可以消除中间状态，实现 Pointfree 风格。
链式操作也能避免多层函数嵌套问题 fn1(fn2(fn3()))。
如果你用过 rxjs，就能体会到链式操作带来的快乐。

处理副作用。

包裹异步 IO 等副作用函数，放在最后一步执行。

还记得 Jquery 时代的 ajax 操作吗？

$.ajax({
  type: "get",
  url: "request1",
  success: function (response1) {
    $.ajax({
      type: "get",
      url: "request2",
      success: function (response2) {
        $.ajax({
          type: "get",
          url: "request3",
          success: function (response3) {
            console.log(response3); // 得到最终结果
          },
        });
      },
    });
  },
});

上述代码中，我们通过回调函数，串行执行了 3 个 ajax 操作，但同样也生成了 3 层代码嵌套，这样的代码不仅难以阅读，也不利于日后维护。

Promise 的出现，解决了上述问题。

fetch("request1")
  .then((response1) => {
    return fetch("request2");
  })
  .then((response2) => {
    return fetch("request3");
  })
  .then((response3) => {
    console.log(response3); // 得到最终结果
  });

我们通过 Promise，将多个步骤封装到多个 then 方法中去执行，不仅消除了多层代码嵌套问题，而且也让代码划分更加自然，大大提高了代码的可维护性。

想一想，为什么 Promise 可以不断执行 then 方法？

其实，Promise 和 Monad 很类似，它满足了多条 Monad 规则。

Promise 本身就是一个构造函数。
Monad 中的 unit，在 Promise 中可以看为： x => Promise.resolve(x)
Monad 中的 bind，在 Promise 中可以看为： Promise.prototype.then

我们用代码来验证一下。

// 首先定义 2 个异步处理函数。

// 延迟 1s 然后 加一
function delayAdd1(x) {
  return new Promise((resolve) => {
    setTimeout(() => {
      resolve(x + 1);
    });
  }, 1000);
}

// 延迟 1s 然后 求平方
function delaySquare(x) {
  return new Promise((resolve) => {
    setTimeout(() => {
      resolve(x * x);
    });
  }, 1000);
}
/****************************************************************************************/

// 单位元 e 规则，满足：e*a = a*e = a
const promiseA = Promise.resolve(2).then(delayAdd1);
const promiseB = delayAdd1(2);
// promiseA === promiseB，故 promise 满足左单位元。

const promiseC = Promise.resolve(2);
const promiseD = a.then(Promise.resolve);
// promiseC === promiseD，故 promise 满足右单位元。

// promise 既满足左单位元，又满足右单位元，故 Promise 满足单位元。
// ps：但一些特殊的情况不满足该定义，下文中会讲到

/****************************************************************************************/

// 结合律规则：（a * b）* c = a *（b * c）
const promiseE = Promise.resolve(2);
const promiseF = promiseE.then(delayAdd1).then(delaySquare);
const promiseG = promiseE.then(function (x) {
  return delayAdd1(x).then(g);
});

// promiseF === promiseG，故 Promise 是满足结合律。
// ps：但一些特殊的情况不满足该定义，下文中会讲到

看完上面的代码，不禁感觉很惊讶，Promise 和 Monad 也太像了吧，不仅可以实现链式操作，也满足单位元和结合律，难道 Promise 就是一个 Monad？

其实不然，Promise 并不完全满足 Monad：

Promise.resolve 如果传入一个 Promise 对象，会等待传入的 Promise 执行，并将执行结果作为外层 Promise 的值。
Promise.resolve 在处理 thenable 对象时，同样不会直接返回该对象，会将对象中的 then 方法当做一个 Promise 等待结果，并作为外层 Promise 的值。

如果是这两种情况，那就无法满足 Monad 规则。

// Promise.resolve 传入一个 Promise 对象
const functionA = function (p) {
  // 这时 p === 1
  return p.then((n) => n * 2);
};
const promiseA = Promise.resolve(1);
Promise.resolve(promiseA).then(functionA);
// RejectedPromise TypeError: p.then is not a function
// 由于 Promise.resolve 对传入的 Promise 进行了处理，导致直接运行报错。违背了单位元和结合律。

// Promise.resolve 传入一个 thenable 对象
const functionB = function (p) {
  // 这时 p === 1
  alert(p);
  return p.then((n) => n * 2);
};
const obj = {
  then(r) {
    r(1);
  },
};
const promiseB = Promise.resolve(obj);
Promise.resolve(promiseB).then(functionB);
// RejectedPromise TypeError: p.then is not a function
// 由于 Promise.resolve 对传入的 thenable 进行了处理，导致直接运行报错。违背了单位元和结合律。

看到这里，相信大家对 Promise 也有了一层新的了解，正是借助了 Monad 一样的链式操作，才使 Promise 广泛应用在了前端异步代码中，你是否也和我一样，对 Monad 充满了好感？

Monad 处理副作用

接下来，我们再看一个常见的问题：为什么 Monad 适合处理副作用？

ps：这里说的副作用，指的是违反纯函数原则的操作，我们应该尽可能避免这些操作，或者把这些操作放在最后去执行。

例如：

var fs = require("fs");

// 纯函数，传入 filename，返回 Monad 对象
var readFile = function (filename) {
  // 副作用函数：读取文件
  const readFileFn = () => {
    return fs.readFileSync(filename, "utf-8");
  };
  return new Monad(readFileFn);
};

// 纯函数，传入 x，返回 Monad 对象
var print = function (x) {
  // 副作用函数：打印日志
  const logFn = () => {
    console.log(x);
    return x;
  };
  return new Monad(logFn);
};

// 纯函数，传入 x，返回 Monad 对象
var tail = function (x) {
  // 副作用函数：返回最后一行的数据
  const tailFn = () => {
    return x[x.length - 1];
  };
  return new Monad(tailFn);
};

// 链式操作文件
const monad = readFile("./xxx.txt").bind(tail).bind(print);
// 执行到这里，整个操作都是纯的，因为副作用函数一直被包裹在 Monad 里，并没有执行
monad.value(); // 执行副作用函数

上面代码中，我们将副作用函数封装到 Monad 里，以保证纯函数的优良特性，巧妙地化解了副作用存在的安全隐患。

Ok，到这里为止，本文的主要内容就已经分享完了，但在学习 Monad 中的某一天，突然发现有人用一句话就解释清楚了 Monad，自叹不如，简直太厉害了，我们一起来看一下吧！

Warning：下文的内容偏数学理论，不感兴趣的同学跳过即可。

Monad 一句话解释

早在 10 多年前，Philip Wadler 就对 Monad 做了一句话的总结。

原文：A monad is a monoid in the category of endofunctors。

翻译：Monad 是一个自函子范畴上的幺半群” 。

这里标注了 3 个重要的概念：自函子、范畴、幺半群，这些都是数学知识，我们分开理解一下。

什么是范畴？

任何事物都是对象，大量的对象结合起来就形成了集合，对象和对象之间存在一个或多个联系，任何一个联系就叫做态射。

一堆对象，以及对象之间的所有态射所构成的一种代数结构，便称之为范畴。

什么是函子？

我们将范畴与范畴之间的映射称之为函子。映射是一种特殊的态射，所以函子也是一种态射。

什么是自函子？

自函子就是一个将范畴映射到自身的函子。

什么是幺半群 Monoid？

幺半群是一个存在单位元的半群。

什么是半群？

如果一个集合，满足结合律，那么就是一个半群。

什么是单位元？

单位元是集合里的一种特别的元素，与该集合里的二元运算有关。当单位元和其他元素结合时，并不会改变那些元素。

如：
任何一个数 + 0 = 这个数本身。那么 0 就是单位元（加法单位元）
任何一个数 * 1 = 这个数本身。那么 1 就是单位元（乘法单位元）

Ok，我们已经了解了所有应该掌握的专业术语，那就简单串解一下这段解释吧：

一个自函子范畴上的幺半群，可以理解为，在一个满足结合律和单位元规则的集合中，存在一个映射关系，这个映射关系可以把集合中的元素映射成当前集合自身的元素。

相信掌握了这些理论知识，肯定会对 Monad 有一个更加深入的理解。

总结

本文从 Monad 的维基百科开始，逐步介绍了 Monad 的内部结构以及实现原理，并通过 Promise 验证了 Monad 在实战中发挥的重大作用。

文中包含了许多数学定义、函数式编程的理论等知识，大多是参考网络资料和自我经验得出的，如果有错误的地方，还望大家多多指点 🙏

最后，如果你对此有任何想法，欢迎留言评论！

好文！点个在看！

vlambda博客
学习文章列表