Data Transfer Object（数据传输对象）

来源：互联网发布：深入浅出数据分析代码编辑：程序博客网时间：2024/05/17 20:13

产生原因：

您正在设计一个分布式应用程序，为了满足单个客户端请求，您发现自己对一个远程接口发出了多个调用，而这些调用所增加的响应时间超出了可接受的程度。

影响因素：

1、远程调用

　　在与远程对象通信时，请考虑下列需要权衡的因素：

　　远程调用（那些必须跨越网络的调用）速度缓慢。虽然许多远程调用框架可以隐藏进行远程调用的复杂性，但是它们不能消除发生通信所需的步骤。例如，必须先找到远程对象位置，而且建立与远程计算机的连接，然后才能将数据串行化为字节流，然后可能进行加密，最后才能将其传输到远程计算机。

2、网络性能

　　在考虑网络性能时，必须同时考虑滞后时间和吞吐量。简单地说，"滞后时间"描述了数据的首字节到达目的地之前所经过的时间。"吞吐量"描述了在某个时间段（例如 1 秒）内通过网络发送的数据字节数。在基于IP路由的现代网络（例如 Internet）中，滞后时间可以是比吞吐量更大的因素。这意味着，传输 10 字节数据所用的时间可能几乎等于传输 1,000 字节数据所用的时间。在使用无连接协议（如HTTP）时，此效果尤其明显。通常，网络速度越快可以使吞吐量得以增加，但是，要减少滞后时间则会更加困难。

3、接口设计

　　在设计对象接口时，好的做法是将大量信息隐藏在对象内，并提供一组细粒度方法来访问和操作该信息。"细粒度"意味着每个方法都应该负责单个的、相当小的和基本的功能单位。此方法简化了编程，并提供了对对象内部的更佳抽象，从而增加了重用的可能性。必须根据以下事实对此进行平衡取舍：使用较细粒度的方法意味着需要调用更多的方法才能执行高级别的任务。通常，在同一进程内调用方法时，这些额外函数调用的开销是可接受的；但是，在跨进程和网络边界调用这些方法时，开销可能变得难以接受。

　　避免远程调用中固有的滞后时间问题的最佳方法是进行更少的调用，并让每个调用传递更多的数据。做到这一点的一种方法是，使用长参数列表来声明远程方法。这样，客户端就可以在单个调用中将更多的信息传递给远程组件。但是，这样做会使针对此接口的编程容易出错，因为程序很可能仅按调用语句中的位置来调用外部方法的参数。例如，如果远程方法接受 10 个字符串参数，则开发人员很容易按错误顺序传递参数。编译器将无法检测到这样的错误。

　　长参数列表无助于从远程调用向客户端返回更多的信息，因为大多数的编程语言将方法调用的返回类型限制为单个参数。而巧合的是，在传输大多数数据时通常需要返回较多信息。例如，许多用户接口传输少量的信息，却希望返回大量结果数据。

解决方案：

创建一个数据传输对象 (DTO)，用该对象包含远程调用所需要的所有数据。修改远程方法签名，以便将 DTO 作为单个参数接受，并将单个 DTO 参数返回给客户端。在调用方应用程序收到 DTO 并将其作为本地对象存储之后，应用程序可以分别对 DTO 发出一系列单独的过程调用，而不会引发远程调用开销。Martin Fowler 在 Patterns of Enterprise Application Architecture [Fowler03] 中对此模式进行了说明。

　　下图显示客户端应用程序如何进行一系列远程调用以检索客户名称的各个元素。

　　图 1:没有 DTO 的远程调用

　　DTO 允许远程对象在单个远程调用中将整个客户名称返回给客户端。在此示例中，这样做将使调用次数从 4 次减为 1 次。客户端进行单个调用，然后在本地与 DTO 交互，而不用进行多次远程调用（见图 2）。

　　图 2:通过使用 DTO 减少调用次数

　　DTO 是一组需要跨进程或网络边界传输的聚合数据的简单容器。它不应该包含业务逻辑，并将其行为限制为诸如内部一致性检查和基本验证之类的活动。注意，不要因实现这些方法而导致 DTO 依赖于任何新类。

　　在设计数据传输对象时，您有两种主要选择：使用一般集合；或使用显式的 getter 和 setter 方法创建自定义对象。

　　一般集合的优点是，只需要一个类，就可以在整个应用程序中满足任何数据传输目的。此外，集合类（例如，简单数组或散列图）内置于几乎所有语言库中，因此您根本不必编写新类的代码。对 DTO 使用集合对象的主要缺点是，客户端必须按位置序号（在简单数组的情况下）或元素名称（在键控集合的情况下）访问集合内的字段。此外，集合存储的是同一类型（通常是最一般的 Object 类型）的项目，这可以导致在编译时无法检测到的微妙但致命的编码错误。

　　如果为每个 DTO 创建自定义类，则可以提供与任何其他对象完全一样的、客户端应用程序可访问的强类型对象，这样的对象可以提供编译时检查，并支持代码编辑器功能。主要缺点是，如果应用程序发出许多远程调用，则您最终可能必须编写大量类的代码。

　　许多方法试图将这两种方法的优点结合在一起。第一种方法是代码生成技术，该技术可以生成脱离现有元数据（如可扩展标记语言(XML) 架构）的自定义 DTO 类的源代码。第二种方法是提供更强大的集合，尽管它是一般的集合，但它将关系和数据类型信息与原始数据存储在一起。

　　有了 DTO 类以后，需要用数据填充它。大多数情况下，DTO 内的数据来自多个域对象。因为 DTO 没有行为，因此它不能从域对象提取数据。这是对的，因为如果让 DTO 不知道域对象，您就可以在不同的上下文中重用 DTO。同样，您不希望域对象知道 DTO，因为这可能意味着更改 DTO 将要求更改域逻辑中的代码，这将导致大量维护任务。

图 3:使用 Assembler将数据加载到 DTO 中

　　Assembler 的关键特征是 DTO 和域对象不相互依赖。这就消除了这两种对象的相互影响。不利方面是 Assembler 同时依赖于 DTO 和域对象。对这些类的任何更改都可能导致必须更改 Assembler 类。