C#正确操作字符串

来源:互联网 发布:转发软件卖货话术 编辑:程序博客网 时间:2024/06/04 19:01

字符串应该是所有编程语言中使用最频繁的一种基础数据类型。如果使用不慎,我们就会为一次字符串的操作所带来的额外性能开销而付出代价。

建议从两个方面来探讨如何规避这类型的性能开销:

1.确保尽量少的装箱

2.避免分配额外的内存空间

比如下面的两行代码:

String str1 = "str1" + 9;String str2 = "str2" + 9.ToString();

我们知道第一行代码在运行时,会完成一次封箱行为;而第二行代码中的9.ToString()并没有发生封箱行为,它实际调用的是整型的ToString方法,而ToString方法的原型为:

public override String ToString(){return Number.FormatInt32(m_value, null, NumberFormatInfo.CurrentInfo);}

有人会问是不是原型中的FormatInt32方法会发生封箱行为呢?实际上,那是一个非托管的方法,它是直接操作内存来完成从int到string的转换,效率要比装箱高很多。所以在使用其他值引用类型到字符串的转换并完成拼接是,应当避免使用操作符“+”来完成,而应该使用值引用类型提供的ToString方法。

这里有一个指导原则: 在自己编写的代码中,应当尽可能地避免编写不必要的装箱代码


装箱之所以会带来性能损耗,因为它需要完成下面的三个步骤:

  1. 首先,会为值类型在托管堆中分配内存。除了值类型本身所分配的内存外,内存总量还要加上类型对象指针和同步块索引所占用的内存。
  2. 将值类型的值复制到新分配的堆内存中。
  3. 返回已经成为引用类型的对象的地址。
另外,避免非配额外的内存空间。 对CLR来说,string对象是个很特殊的对象,它一旦被赋值就不可改变。在运行时调用System.String类中的任何方法或进行任何运算(如“=”赋值、“+”拼接等),都会在内存中创建一个新的字符串对象,也意味着要为该新对象分配新的内存空间。
private static void NewMethod1()        {            string s1 = "abc";            s1 = "123" + s1 + "456";    //以上两行代码创建了3个            //字符串对象,并执行了一次string.Contact方法        }        private static void NewMethod6()        {            string re6 = 9 + "456";     //该代码发生一次装箱,并调            //用一次string.Contact方法        }
//而以下代码中,字符串不会在运行时拼接字符串,而是会在编译时直接生成一个字符串
        private static void NewMethod2()        {            string re2 = "123" + "abc" + "456"; //该代码等效于             //string re2 = "123abc456";        }        private static void NewMethod9()        {            const string a = "t";            string re1 = "abc" + a;     //因为a是一个常量,所以            //该代码等效于 string re1 = "abc" + "t";             //最终等效于string re1 = "abct";        }

为了避免System.String类带来的性能损耗,微软提供了StringBuilder来弥补String的不足。SB不会重新创建一个string对象,它的效率源于预先以非托管的方式分配内存。如果未定义sb的长度,则默认分配16.小于16时便不再分配,若大于16,系统会分配16的倍数。
private static void NewMethod8()        {            string a = "t";            a += "e";            a += "s";            a += "t";        }        private static void NewMethod7()        {            string a = "t";            string b = "e";            string c = "s";            string d = "t";            string result = a + b + c + d;        }
//上面两种方式的效率都不高。不要以为前者比后者创建的字符串对象更少,
//实际上,两者创建的字符串对象相等,而且前者进行了3次string.Contact方法调用,比后者还多了两次。        private static void NewMethod10()        {            //为了演示必要,定义了4个变量            string a = "t";            string b = "e";            string c = "s";            string d = "t";            StringBuilder sb = new StringBuilder(a);            sb.Append(b);            sb.Append(c);            sb.Append(d);            //再次提示,是运行时,所以没有使用下面的代码            //StringBuilder sb = new StringBuilder("t");            //sb.Append("e");            //sb.Append("s");            //sb.Append("t");            string result = sb.ToString();        }
//或者使用string.Format方法。
        private static void NewMethod11()        {            //为了演示必要,定义了4个变量            string a = "t";            string b = "e";            string c = "s";            string d = "t";            string.Format("{0}{1}{2}{3}", a, b, c, d);        }

读《改善C#程序的157个建议》笔记抄录。

0 0
原创粉丝点击