clojure实战——函数内存化

来源:互联网 发布:java base64解码 编辑:程序博客网 时间:2024/06/04 18:29

纯函数

就从纯函数开始讲起吧。
对于纯函数,它具以下几个特征:

  • 没有副作用:不会读写数据库、文件、socket、以及全局变量等。
  • 具有一致性:正是因为没有副作用,纯函数才能表现出一致性:即对于参数a, b它始终会返回结果c,不管在什么环境中。
  • 易于测试:纯函数的返回值完全由它的参数决定,因此编写测试用例时,不需要mock,你可以轻松地对一个纯函数进行全面测试。
  • 结果可缓存:任何使用到纯函数表达式的地方,都可以用它的返回值来代替,不会改变代码的行为。如(+ 1 2)(- 10 7)等,这些都可以用3来代替。
  • 易于并行化:因为没有副作用,不会对线程间共享数据产生竞争,是线程安全的。

因为对于特定的输入,纯函数的输出是一定的,所以我们再有些应用场景中可以将函数的返回值缓存下来,下次再调用的时候,就可以直接返回缓存的返回值,而不需要再次计算。这一技术也称作:内存化。

clojure实现内存化

clojure是利用memoize函数实现内存化的,如:

;定义一个判断是否为素数的函数(defn prime?  [n]  (cond (= 1 n) false        (= 2 n) true        (even? n) false        :else (->> (range 3 (inc (Math/sqrt n)) 2)                   (filter #(zero? (rem n %)))                   empty?)));未内存化之前,测试其性能(time (prime? 112567875444488899908778877722222229999999))"Elapsed time: 1.530635 msecs"=> false; 进行内存化,并测试其性能(let [m-prime? (memoize prime?)]  (time (m-prime? 112567875444488899908778877722222229999999))  (time (m-prime? 112567875444488899908778877722222229999999)))"Elapsed time: 1.538332 msecs""Elapsed time: 0.056948 msecs"=> false

可以看出,对于一些耗时很长的运算,利用内存化可以大大提高效率。

上述所说是建立在纯函数的基础之上,但并不是说只有纯函数的情况下才能使用这一技术。比如说,我们有时需要读取一个在程序运行过程中不会被改变的文件(如配置文件),我们可以在第一次读取的时候,将所有配置信息通过内存化技术缓存起来,以后读取时就可以不用再加载文件。另外,在实际项目中,我们也经常会提到一些所谓的“经验值”,实际上和这个是相似的思想,通过很多次的实际应用,得出某些运算产生的值与经验值相近(满足实际要求),则可以用该经验值代替此运算,以提升效率。

memoize实现内存化的原理

memoize会保存所有调用参数和对应返回值的映射,不会被JVM垃圾回收。因此,如果要被内存化的函数的参数或返回值非常占内存,那么需要谨慎考虑,不然会造成“内存泄露”,可将其放在顶层函数的内部,而不是定义为一个全局变量。

0 0