clojure实战——函数内存化

来源：互联网发布：java base64解码编辑：程序博客网时间：2024/06/04 18:29

纯函数

就从纯函数开始讲起吧。
对于纯函数，它具以下几个特征：

没有副作用：不会读写数据库、文件、socket、以及全局变量等。
具有一致性：正是因为没有副作用，纯函数才能表现出一致性：即对于参数a, b它始终会返回结果c，不管在什么环境中。
易于测试：纯函数的返回值完全由它的参数决定，因此编写测试用例时，不需要mock，你可以轻松地对一个纯函数进行全面测试。
结果可缓存：任何使用到纯函数表达式的地方，都可以用它的返回值来代替，不会改变代码的行为。如（+ 1 2）（- 10 7）等，这些都可以用3来代替。
易于并行化：因为没有副作用，不会对线程间共享数据产生竞争，是线程安全的。

因为对于特定的输入，纯函数的输出是一定的，所以我们再有些应用场景中可以将函数的返回值缓存下来，下次再调用的时候，就可以直接返回缓存的返回值，而不需要再次计算。这一技术也称作：内存化。

clojure实现内存化

clojure是利用memoize函数实现内存化的，如：

;定义一个判断是否为素数的函数(defn prime?  [n]  (cond (= 1 n) false        (= 2 n) true        (even? n) false        :else (->> (range 3 (inc (Math/sqrt n)) 2)                   (filter #(zero? (rem n %)))                   empty?)));未内存化之前，测试其性能(time (prime? 112567875444488899908778877722222229999999))"Elapsed time: 1.530635 msecs"=> false; 进行内存化，并测试其性能(let [m-prime? (memoize prime?)]  (time (m-prime? 112567875444488899908778877722222229999999))  (time (m-prime? 112567875444488899908778877722222229999999)))"Elapsed time: 1.538332 msecs""Elapsed time: 0.056948 msecs"=> false

可以看出，对于一些耗时很长的运算，利用内存化可以大大提高效率。

上述所说是建立在纯函数的基础之上，但并不是说只有纯函数的情况下才能使用这一技术。比如说，我们有时需要读取一个在程序运行过程中不会被改变的文件（如配置文件），我们可以在第一次读取的时候，将所有配置信息通过内存化技术缓存起来，以后读取时就可以不用再加载文件。另外，在实际项目中，我们也经常会提到一些所谓的“经验值”，实际上和这个是相似的思想，通过很多次的实际应用，得出某些运算产生的值与经验值相近（满足实际要求），则可以用该经验值代替此运算，以提升效率。

memoize实现内存化的原理

memoize会保存所有调用参数和对应返回值的映射，不会被JVM垃圾回收。因此，如果要被内存化的函数的参数或返回值非常占内存，那么需要谨慎考虑，不然会造成“内存泄露”，可将其放在顶层函数的内部，而不是定义为一个全局变量。

0 0