C++矩阵优化算法浅析
来源:互联网 发布:寻侠武功突破数据八门 编辑:程序博客网 时间:2024/06/04 18:58
转载自烟花飘飘工作室的Blog:http://hi.baidu.com/yhpp521/blog/item/1e054910dfba3affc2ce795e.html
写在前面的话:此矩阵优化算法并非原创,迅捷只是转述了一种智慧。
在C++中,定义一个矩阵通常是这样的: class MyMatrix { ........ public: ........ float data[50000]; } 这里为了方便说明问题,使用固定大小的数组,实际使用中更多的是动态分配。在对MyMatrix重载operator +和-后,我们就可以进行如下计算了: MyMatrix m1,m2,m3,m4; ..... m4=m1+m2-m3;//表达式 ......
C++编译器将表达式解释为:先把m1+m2计算好赋给一个临时MyMatrix类变量(tmp1),tmp1-m3后生成新的临时变量tmp2,然后才把tmp2赋值给m4。程序执行过程中,会产生临时变量tmp1,tmp2(有些C++编译器可以优化掉其中一个或全部),由于data一般较大,分配内存会占用时间和空间。这就是为什么在数值计算方面强大的C++比Fortran慢的重要原因之一。但如果放弃MyMatrix的operator +和-重载,添加operator []取data[]的重载后,写如下代码:
struct plus; struct minus; template <class L, class OpTag, class R> struct Expression { Expression(L const& l, R const& r) : l(l), r(r) {}
float operator[](unsigned index) const;
L const& l; R const& r; };
template <class L, class R> Expression<L,plus,R> operator+(L const& l, R const& r) { return Expression<L,plus,R>(l, r); } template <class L, class R> Expression<L,minus,R> operator-(L const& l, R const& r) { return Expression<L,minus,R>(l, r); } struct plus { static float apply(float a, float b) { return a + b; } };
struct minus { static float apply(float a, float b) { return a - b; } };
对MyMatrix添加=重载: template <class Expr> MyMatrix &MyMatrix::operator=(Expr const& x) { for (unsigned i = 0; i < 50000; i++) (*this) = x; return *this; }
然后计算: ...... m4=m1+m2-m3;
这时生成的临时变量类型是Expression<L,plus,R>,和Expression<Expression<L,plus,R> ,minus,R>, 它们占用的内存远比MyMatrix小,Expression直到operator=MyMatrix 的时候才展开计算,实际上是把矩阵运算变成了加法,所以大大加快了速度。这正是数值计算所需要的。这种方法叫Expression templates优化。更多细节参考<<C++ template>>、Blitz++库、boost::ublas库和MTL库等。
后话:编程语言之争一直是热门话题。因为迅捷所接触的有限元计算程序涉及大规模的数值计算,所以迅捷也曾花了2年时间搞腾Fortran。最后,迅捷还是放弃古老的Fortran,转投C++的阵营了——毕竟连微软都早放弃Fortran了:)
Fortran在数值计算方面的确有些优势,但Fortran在软件工程方面的表现得实在让人汗颜。须知,面向对象并不是一个炒作出来的概念,面向对象对改进软件工程方面起了里程碑式的作用,大大提高了软件开发效率。
从本质上看,可执行程序都编译成二进制代码了,怎么会存在Fortran比C++快的道理?其实最主要原因还是开发人员对C++的数值计算不熟悉所致。从上面的例子也可以看出,Fortran只是在某些方面做了一些适合数值计算的技术处理,C++并非不能做到,只是一般人平时没留心罢了。
Fortran计算速度快还有一个原因是大量使用了全局变量。Fortran有一个公共变量块的定义,可以在那里设置全局变量。如果你愿意,你也可以在C++程序中大量使用全局变量提高程序运行速度。问题是这样做的后果是在软件工程方面带来无尽的后遗症,软件维护变得异常困难。
C++比Fortran慢有一个不好克服的原因就是使用了面向对象。虚函数的重载要查找虚函数表,必然会降低效率。所以在听说了Fortran要支持面向对象以后,彻底让迅捷转投到C++的阵营去了——如果Fortran支持面向对象,他在数值计算方面的优势将荡然无存。
Fortran,过时的工具了,还是放弃吧。
- C++矩阵优化算法浅析
- C++矩阵优化算法
- 矩阵键盘算法优化
- 矩阵乘法优化算法
- 浅析嵌入式C优化技巧
- strassen算法优化矩阵乘法
- CUDA C 矩阵乘优化
- C语言矩阵算法集合
- 嵌入式开发中C程序优化浅析
- 矩阵乘法的并行算法优化
- 矩阵相乘优化算法实现讲解
- 矩阵相乘优化算法实现讲解
- 矩阵相乘优化算法实现讲解
- 矩阵相乘优化算法实现讲解
- 单应性矩阵的优化(LM算法)
- 常见算法:c语言矩阵算法问题
- C语言、C++矩阵乘法优化
- 浅析过滤敏感词过滤算法(C++)
- 永恒的爱
- 一幅图总结出外国人和中国人的区别
- 一幅图总结出外国人和中国人的区别
- 如何在net中禁用后退按钮
- 什么是软件版本标志
- C++矩阵优化算法浅析
- 在Oracle中建表时容易忽视的一个小问题
- 使用.Net Reflection 反射机制 动态获取对象字段内容的示例
- UPnP详解
- Joomla API简介
- jsp的一些小技巧, 收集....
- 转:《北大牛人唐翔》
- 程序员的学习方法--一点思考
- Apprication excute order