使用 GUID 值来作为数据库行标识(转载)

来源：互联网发布：python的helloworld 编辑：程序博客网时间：2024/05/21 10:03

GUID在Asp.net 2.0及其兼容程序得到广泛应用

GUID（Global unique identifier）全局唯一标识符，它是由网卡上的标识数字(每个网卡都有唯一的标识号)以及 CPU 时钟的唯一数字生成的的一个 16 字节的二进制值。

GUID 的格式为“xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx”，其中每个 x 是 0-9 或 a-f 范围内的一个十六进制的数字。例如：6F9619FF- 8B86-D011-B42D-00C04FC964FF 即为有效的 GUID 值。

世界上的任何两台计算机都不会生成重复的 GUID 值。GUID 主要用于在拥有多个节点、多台计算机的网络或系统中，分配必须具有唯一性的标识符。在 Windows 平台上，GUID 应用非常广泛：注册表、类及接口标识、数据库、甚至自动生成的机器名、目录名等。

在这次开发 ASP.NET 应用时，我大量使用了类型为 GUID 的 ID 列作为各实体表的关键字(键)。由于其唯一、易产生的特性，给应用程序处理带来诸多好处。

1、在 SQL Server 中使用 GUID

如果在 SQL Server 的表定义中将列类型指定为 uniqueidentifier，则列的值就为 GUID 类型。

SQL Server 中的 NewID() 函数可以产生 GUID 唯一值，使用此函数的几种方式如下：

1) 作为列默认值

将 uniqueidentifier 的列的默认值设为 NewID()，这样当新行插入表中时，会自动生成此列 GUID 值。

2)使用 T-SQL

在 T-SQL 中使用 NewID()函数，如“INSERT INTO Table(ID,... ) VALUES(NewID(),...)”来生成此列的 GUID 值。

3)提前获取 GUID 值

由于特殊功能需要，需要预先获知新行的 ID 值，也可以使用如下 C# 代码提前获得 GUID 的值，再存储到数据库中:

SqlCommand cmd = New SqlCommand();
cmd.CommandText = "SELECT NewID()";
string rowID = (string) cmd.ExecuteScalar();
cmd.CommandText = "INSERT INTO Table(ID,...) VALUES(@ID,...)
cmd.Parameters.Add("@ID",SqlDbType.UniqueIdentifier).Value = new Guid(rowID);
cmd.ExecuteNoQuery();

uniqueidentifier 值不能进行算术运算，但可以进行(意义不大的)比较操作和 NULL 检查；它不能象 IDENTITY 列一样，可以获知每行的增加时间的先后顺序，只能通过增加其它时间或时间戳列来完成此功能。

2、在 .NET 中使用 GUID

GUID 在 .NET 中使用非常广泛，而且 .NET Framework 提供了专门 Guid 基础结构。

Guid 结构的常用法包括：

1) Guid.NewGUID()

生成一个新的 GUID 唯一值

2) Guid.ToString()

将 GUID 值转换成字符串，便于处理

3)构造函数 Guid(string)

由 string 生成 Guid 结构，其中string 可以为大写，也可以为小写，可以包含两端的定界符“{}”或 “()”，甚至可以省略中间的“-”， Guid 结构的构造函数有很多，其它构造用法并不常用。

同时，为了适用数据库中使用 GUID 的需要，.NET Framework 也提供了 SqlGUID 结构，它和 Guid 结构类似，只是两者对排序(CompareTo)的处理方式不同，SqlGuid 计算值的最后 6 个字节。而 Guid 计算全部 16 个字节，这种差异可能会给 SQL Server 中 uniqueidentifier 列的排序带来一定影响，当然这种排序意义也不大。

.NET Framework 中可以使用类 GuidConverter 提供将 Guid 结构与各种其他表示形式相互转换的类型转换器。

3、GUID 的优缺点

1) 优点

同 IDENTITY 列相比，uniqueidentifier 列可以通过 NewID() 函数提前得知新增加的行 ID，为应用程序的后续处理提供了很大方便。
便于数据库移植，其它数据库中并不一定具有 IDENTITY 列，而 Guid 列可以作为字符型列转换到其它数据库中，同时将应用程序中产生的 GUID 值存入数据库，它不会对原有数据带来影响。
便于数据库初始化，如果应用程序要加载一些初始数据， IDENTITY 列的处理方式就比较麻烦，而 uniqueidentifier 列则无需任何处理，直接用 T-SQL 加载即可。
便于对某些对象或常量进行永久标识，如类的 ClassID，对象的实例标识，UDDI 中的联系人、服务接口、tModel标识定义等。

2) 缺点

GUID 值较长，不容易记忆和输入，而且这个值是随机、无顺序的，所以使用时要注意场合，最好不要尝试用它来作为你的电子邮件地址 J
GUID 的值有 16 个字节，与其它那些诸如 4 字节的整数相比要相对大一些。这意味着如果在数据库中使用 uniqueidentifier 键，可能会带来两方面的消极影响：存储空间增大；索引时间较慢。

综合来说， GUID 的优点带来的便利远超出其缺点带来的影响，随着诸如 WebService 等系统互联与整合技术的不断发展，其唯一标识的特性使得其应用越来越广，在您的应用程序中也应考虑使用它了。

来自博客讨论:
GUID是很好的主键标识的解决方案，可能有的程序员没有遇见过系统移植，比如以前我做过一个项目，JAVA+SqlServer架构，因一些原因需将之移植到Linux下，得用JAVA+MySQL，而很要命，在SqlServer中用到了自动编号类型的主键，移植中必须将数据导入MySQL，遇上很多的刺手问题，还好数据库的数据还不是很多，用了程序导入，数据库设计总的来说依据3范式，所以必须要程序相应解决了数据的完整性，最后幸不辱使命。

整个移植工作完毕之后，考虑了好多在数据库设计阶段的思路，总结了一些经验。
尽量运用各种常用数据库支持的通用的数据类型，尽量少用或不用自动编号数据库类型；
管理员代号+日期+时间+随机数并不是很好的解决方案，因为同样是损失的索引消耗资源，且程序实现反而不如GUID来得干脆；
不用自动编号字段做主键标识时，尽量少用/不用存储过程根据表中记录的Max(XX)获取当前的最大Int，在你往返查询-->插入数据过程中，时间好象很短，对系统来说已经过了很长时间了，可能你获取了当前应该是100，当你插入数据时，已经又条佬不知什么时候占了100了，这就存在并发的问题；
利用GUID还是解决分布式系统的好方案，在多层分布系统中，多个服务器，多个数据库，如用自动编号，则当你需要汇总数据的时候，会发现麻烦来了，主键重复，系统崩溃。