.NET中的String的奥妙

知道91 | ASP.NET | 2015-03-09 | 阅读:5137

概述

String在任何语言中,都有它的特殊性,在.NET中也是如此。它属于基本数据类型,也是基本数据类型中唯一的引用类型。字符串可以声明为常量,但是它却放在了堆中。希望通过本文能够使大家对.NET中的String有一个深入的了解。

不可改变对象

在.NET中String是不可改变对象,一旦创建了一个String对象并为它赋值,它就不可能再改变,也就是你不可能改变一个字符串的值。这句话初听起来似乎有些不可思议,大家也许马上会想到字符串的连接操作,我们不也可以改变字符串吗?看下面这段代码:

using System;
namespace Demo1
{
    ///public class Test
    {
        public static void Main(string[] args)
        {
            string a = "1234";
            Console.WriteLine(a);

            a += "5678";
            Console.WriteLine(a);
            Console.ReadLine();
        }
    }
}

运行的结果:

1234 12345678

看起来我们似乎已经把MyStr的值从“1234”改为了“12345678”。事实是这样的吗?实际上并没有改变。在第5行代码中创建了一个String对象它的值是“1234”,MyStr指向了它在内存中的地址;第七行代码中创建了一个新的String对象它的值是“12345678”,MyStr指向了新的内存地址。这时在堆中其实存在着两个字符串对象,尽管我们只引用了它们中的一个,但是字符串“1234”仍然在内存中驻留。

引用类型

前面说过String是引用类型,这就是如果我们创建很多个相同值的字符串对象,它在内存中的指向地址应该是一样的。也就是说,当我们创建了字符串对象a,它的值是“1234”,当我们再创建一个值为“1234”的字符串对象b时它不会再去分配一块内存空间,而是直接指向了a在内存中的地址。这样可以确保内存的有效利用。看下面的代码:

using System;
namespace Demo2
{
    ///public class Test
    {
        public static void Main(string[] args)
        {
            string a = "1234";

            Console.WriteLine(a);

            Test.Change(a);

            Console.WriteLine(a);
            Console.ReadLine();
        }

        public static void Change(string s)
        {
            s = "5678";
        }
    }
}

运行结果:

1234 1234

做一个小改动,注意Change(ref string s)

using System;
namespace Demo2
{
    ///public class Test
    {
        public static void Main(string[] args)
        {
            string a = "1234";

            Console.WriteLine(a);

            Test.Change(ref a);

            Console.WriteLine(a);
            Console.ReadLine();
        }

        public static void Change(ref string s)
        {
            s = "5678";
        }
    }
}

1234 5678

字符串的比较

在.NET中,对字符串的比较操作并不仅仅是简单的比较二者的值,= =操作首先比较两个字符串的引用,如果引用相同,就直接返回True;如果不同再去比较它们的值。所以如果两个值相同的字符串的比较相对于引用相同的字符串的比较要慢,中间多了一步判断引用是否相同。看下面这段代码:

using System;
 namespace Demo3
 {
     /// <summary>
     /// String类型的比较
     public class Test
     {
         public static void Main(string[] args)
         {
             string a = "1234";
             string b = "1234";
             string c = "123";
             c += "4";
 
             int times = 1000000000;
             int start,end;
             
             ///测试引用相同所用的实际时间
             start = Environment.TickCount;
             for(int i=0;i<times;i++)
             {
                 if(a==b)
                 {}
             }
             end = Environment.TickCount;
             Console.WriteLine((end-start));
             
             ///测试引用不同而值相同所用的实际时间
             start = Environment.TickCount;
             for(int i=0;i<times;i++)
             {
                 if(a==c)
                 {}
             }
             end = Environment.TickCount;
             Console.WriteLine((end-start));
 
             Console.ReadLine();
         }
     }
 }

执行的结果(运行的结果可能有些不同):

1671 4172

由此我们看出值相同时的比较用= =比引用相同时的比较慢了好多。这里仅仅是一个测试,因为做这样的比较并没有任何实际的意义。

有一点需要明确的是,.NET中==跟Equals()内部机制完全是一样的,==是它的一个重载。

public static bool operator ==(string a, string b)
{
      return string.Equals(a, b);
}

public static bool Equals(string a, string b)
{
      if (a == b)
      {
            return true;
      }
      if ((a != null) && (b != null))
      {
            return a.Equals(b);
      }
      return false;
}

字符串驻留

看一下这段代码:

using System;
namespace Demo4
{
    ///public class Test
    {
        public static void Main(string[] args)
        {
            string a = "1234";
            string s = "123";
            s += "4";

            string b = s;
            string c = String.Intern(s);

            Console.WriteLine((object)a == (object)b);
            Console.WriteLine((object)a == (object)c);
            Console.ReadLine();
        }
    }
}

执行的结果:

False True

在这段代码中,比较这两个对象发现它的引用并不是一样的。如果要想是它们的引用相同,可以用Intern()函数来进行字符串的驻留(如果有这样的值存在)。

StringBuilder对象

通过上面的分析可以看出,String类型在做字符串的连接操作时,效率是相当低的,并且由于每做一个连接操作,都会在内存中创建一个新的对象,占用了大量的内存空间。这样就引出StringBuilder对象,StringBuilder对象在做字符串连接操作时是在原来的字符串上进行修改,改善了性能。这一点我们平时使用中也许都知道,连接操作频繁的时候,使用StringBuilder对象。但是这两者之间的差别到底有多大呢?来做一个测试:

using System;
using System.Text;
namespace Demo5
{
    ///public class Test
    {
        public static void Main(string[] args)
        {
            string a = "";
            StringBuilder s = new StringBuilder();

            int times = 10000;
            int start,end;
            
            ///测试String所用的时间
            start = Environment.TickCount;
            for(int i=0;i<times;i++)
            {
                a += i.ToString();
            }
            end = Environment.TickCount;
            Console.WriteLine((end-start));
            
            ///测试StringBuilder所用的时间
            start = Environment.TickCount;
            for(int i=0;i<times;i++)
            {
                s.Append(i.ToString());
            }
            end = Environment.TickCount;
            Console.WriteLine((end-start));

            Console.ReadLine();
        }
    }
}

运行结果:

884 0

通过上面的分析,可以看出用String来做字符串的连接时效率非常低,但并不是所任何情况下都要用StringBuilder,当我们连接很少的字符串时可以用String,但当做大量的或频繁的字符串连接操作时,就一定要用StringBuilder。