C++矩阵优化算法浅析

来源:互联网 发布:寻侠武功突破数据八门 编辑:程序博客网 时间:2024/06/04 18:58

转载自烟花飘飘工作室的Blog:http://hi.baidu.com/yhpp521/blog/item/1e054910dfba3affc2ce795e.html

写在前面的话:此矩阵优化算法并非原创,迅捷只是转述了一种智慧。

在C++中,定义一个矩阵通常是这样的: class MyMatrix {       ........       public:       ........       float data[50000]; }        这里为了方便说明问题,使用固定大小的数组,实际使用中更多的是动态分配。在对MyMatrix重载operator +和-后,我们就可以进行如下计算了: MyMatrix m1,m2,m3,m4; ..... m4=m1+m2-m3;//表达式 ......

C++编译器将表达式解释为:先把m1+m2计算好赋给一个临时MyMatrix类变量(tmp1),tmp1-m3后生成新的临时变量tmp2,然后才把tmp2赋值给m4。程序执行过程中,会产生临时变量tmp1,tmp2(有些C++编译器可以优化掉其中一个或全部),由于data一般较大,分配内存会占用时间和空间。这就是为什么在数值计算方面强大的C++比Fortran慢的重要原因之一。但如果放弃MyMatrix的operator +和-重载,添加operator []取data[]的重载后,写如下代码:

struct plus; struct minus; template <class L, class OpTag, class R> struct Expression {       Expression(L const& l, R const& r)           : l(l), r(r) {}

      float operator[](unsigned index) const;

      L const& l;       R const& r; };

template <class L, class R> Expression<L,plus,R> operator+(L const& l, R const& r) {       return Expression<L,plus,R>(l, r); } template <class L, class R> Expression<L,minus,R> operator-(L const& l, R const& r) {       return Expression<L,minus,R>(l, r); } struct plus {       static float apply(float a, float b)       { return a + b; } };

struct minus {       static float apply(float a, float b)       { return a - b; } };

对MyMatrix添加=重载: template <class Expr> MyMatrix &MyMatrix::operator=(Expr const& x) {       for (unsigned i = 0; i < 50000; i++)           (*this) = x;       return *this; }

然后计算: ...... m4=m1+m2-m3;

这时生成的临时变量类型是Expression<L,plus,R>,和Expression<Expression<L,plus,R> ,minus,R>, 它们占用的内存远比MyMatrix小,Expression直到operator=MyMatrix 的时候才展开计算,实际上是把矩阵运算变成了加法,所以大大加快了速度。这正是数值计算所需要的。这种方法叫Expression templates优化。更多细节参考<<C++ template>>、Blitz++库、boost::ublas库和MTL库等。

后话:编程语言之争一直是热门话题。因为迅捷所接触的有限元计算程序涉及大规模的数值计算,所以迅捷也曾花了2年时间搞腾Fortran。最后,迅捷还是放弃古老的Fortran,转投C++的阵营了——毕竟连微软都早放弃Fortran了:)

Fortran在数值计算方面的确有些优势,但Fortran在软件工程方面的表现得实在让人汗颜。须知,面向对象并不是一个炒作出来的概念,面向对象对改进软件工程方面起了里程碑式的作用,大大提高了软件开发效率。

从本质上看,可执行程序都编译成二进制代码了,怎么会存在Fortran比C++快的道理?其实最主要原因还是开发人员对C++的数值计算不熟悉所致。从上面的例子也可以看出,Fortran只是在某些方面做了一些适合数值计算的技术处理,C++并非不能做到,只是一般人平时没留心罢了。

Fortran计算速度快还有一个原因是大量使用了全局变量。Fortran有一个公共变量块的定义,可以在那里设置全局变量。如果你愿意,你也可以在C++程序中大量使用全局变量提高程序运行速度。问题是这样做的后果是在软件工程方面带来无尽的后遗症,软件维护变得异常困难。

C++比Fortran慢有一个不好克服的原因就是使用了面向对象。虚函数的重载要查找虚函数表,必然会降低效率。所以在听说了Fortran要支持面向对象以后,彻底让迅捷转投到C++的阵营去了——如果Fortran支持面向对象,他在数值计算方面的优势将荡然无存。

Fortran,过时的工具了,还是放弃吧。

原创粉丝点击