SMTP协议分析

来源：互联网发布：小视频软件app 编辑：程序博客网时间：2024/06/06 15:38

1.2.1. 邮件

邮件是一种消息的格式，由信封、首部和正文组成。

信封上最重要的是收信人的地址。邮件服务器用这个地址将邮件发送到收信人所在的邮件服务器上。

首部是由用户代理或邮件服务器添加的一些信息。包括Received、Message-ID、From、Data、Reply-To、X-Phone、X-Mailer、To和Subject等字段。

正文是是发送用户发给接收用户报文的内容。RFC 822 规定正文为NVT ASCII文字行。

更为详细的说明，请参考RFC821和RFC822等协议。

1.2.2. 用户代理

用户代理UA（User Agent）是用户与电子邮件系统的交互接口，一般来说它就是我们PC机上的一个程序。Windows上常见的用户代理是Foxmail和Outlook Express。

用户代理提供一个好的用户界面，它提取用户在其界面填写的各项信息，生成一封符合SMTP等邮件标准的邮件，然后采用SMTP协议将邮件发送到发送端邮件服务器。

2.2. 命令和响应

2.2.1. 格式

SMTP的命令不多（14个），它的一般形式是：COMMAND [Parameter] <CRLF>。其中COMMAND是ASCII形式的命令名，Parameter是相应的命令参数，<CRLF>是回车换行符(0DH, 0AH)。

SMTP的响应也不复杂，它的一般形式是：XXX Readable Illustration。XXX是三位十进制数；Readable Illustration是可读的解释说明，用来表明命令是否成功等。XXX具有如下的规律：以2开头的表示成功，以4和5开头的表示失败，以3开头的表示未完成（进行中）。

2.2.3. 常用命令

SMTP命令不区分大小写，但参数区分大小写，有关这方面的详细说明请参考RFC821。常用的命令如下。

HELO <domain> <CRLF>。向服务器标识用户身份发送者能欺骗，说谎，但一般情况下服务器都能检测到。

MAIL FROM: <reverse-path> <CRLF>。<reverse-path>为发送者地址，此命令用来初始化邮件传输，即用来对所有的状态和缓冲区进行初始化。

RCPT TO：<forward-path> <CRLF>。　<forward-path>用来标志邮件接收者的地址，常用在MAIL FROM后，可以有多个RCPT TO。

DATA <CRLF>。将之后的数据作为数据发送，以<CRLF>.<CRLF>标志数据的结尾。

REST <CRLF>。重置会话，当前传输被取消。

NOOP <CRLF>。要求服务器返回OK应答，一般用作测试。

QUIT <CRLF>。结束会话。

VRFY <string> <CRLF>。验证指定的邮箱是否存在，由于安全方面的原因，服务器大多禁止此命令。

EXPN <string> <CRLF>。验证给定的邮箱列表是否存在，由于安全方面的原因，服务器大多禁止此命令。

HELP <CRLF>。查询服务器支持什么命令。

2.2.4. 常用响应

常用的响应如下所示，数字后的说明是从英文译过来的。更详细的说明请参考RFC821。

501参数格式错误

502命令不可实现

503错误的命令序列

504命令参数不可实现

211系统状态或系统帮助响应

214帮助信息

220＜domain＞服务就绪

221＜domain＞服务关闭

421＜domain＞服务未就绪，关闭传输信道

250要求的邮件操作完成

251用户非本地，将转发向＜forward-path＞

450要求的邮件操作未完成，邮箱不可用

550要求的邮件操作未完成，邮箱不可用

451放弃要求的操作；处理过程中出错

551用户非本地，请尝试＜forward-path＞

452系统存储不足，要求的操作未执行

552过量的存储分配，要求的操作未执行

553邮箱名不可用，要求的操作未执行

354开始邮件输入，以"."结束

554操作失败

第3章. SMTP的扩充

3.1. SMTP的缺点

从2.2.2的例子可以看出，SMTP至少还有如下缺点。

1) 命令过于简单，没提供认证等功能。

2) 只传送7位的ASCII码，不能传送二进制文件。

针对缺点1)，标准化组织制定了扩充的SMTP（即ESMTP）(返回EHLO响应)，对应的RFC文档为RFC1425。针对缺点2)，标准化组织在兼容SMTP的前提下，提出了传送非7位ASCII码的方法，对应的RFC文档有两个：邮件首部的扩充对应于RFC1522，邮件正文的扩充对应与RFC1521（即MIME）。

SMTP验证

最初的SMTP协议是不包含安全认证的，所谓的ESMTP在安全性方面扩展了SMTP，通过增加命令EHLO和AUTH。如今的SMTP服务器，无论是公网的还是内网的，大都要求安全认证，如果你使用的是Outlook Express，那么在邮箱帐户的配置中有一个选项－“我的SMTP服务器要求验证”。我们的应用程序中经常有发送邮件的功能，而简单的邮件发送程序没有包含验证的模块。

当客户端发送“EHLO”到Server后，Server将发送一个列表，类似：

EHLO
250-SMTP.Mydomain.com Hello [192.168.0.1]
250-8bitmime
250-BINARYMIME
250-VRFY
250-AUTH LOGIN PLAIN CRAM-MD5
250-AUTH=LOGIN
250 OK

列表中"LOGIN PLAIN CRAM-MD5"说明了该SMTP Server支持的验证方式，本文将详细解释这三种验证方式。

LOGIN方式

使用login方式的验证序列如下（C：表示Client，S：表示Server）
C：auth login ------------------------------------------------- 进行用户身份认证
S：334 VXNlcm5hbWU6 ----------------------------------- BASE64编码“Username:”
C：Y29zdGFAYW1heGl0Lm5ldA== ----------------------------------- 用户名，使用BASE64编码
S：334 UGFzc3dvcmQ6 -------------------------------------BASE64编码"Password:"
C：MTk4MjIxNA== ----------------------------------------------- 密码，使用BASE64编码
S：235 auth successfully -------------------------------------- 身份认证成功

PLAIN方式
基于明文的SMTP验证，详见：前面博文
其发送用户名与口令的格式应该是“<NULL>tim<NULL>tanstaaftanstaaf”。“tim”是用户名，后边的字符串是口令，NULL是ASCII的0（所以无法使用telnet登录）。

CRAM-MD5方式
CRAM-MD5即是一种Keyed-MD5验证方式，CRAM是“Challenge-Response Authentication Mechanism”的所写。所谓Keyed-MD5，是将Clieng与Server共享的一个Key作为一部分MD5的输入，正好邮件系统的用户口令可以作为这个Key。具体的交互如下：

S: * OK IMAP4 Server
C: A0001 AUTHENTICATE CRAM-MD5
S: + PDE4OTYuNjk3MTcwOTUyQHBvc3RvZmZpY2UucmVzdG9uLm1jaS5uZXQ+ -------- Server发送BASE64编码的Timestamp、Hostname等给Client
C: dGltIGI5MTNhNjAyYzdlZGE3YTQ5NWI0ZTZlNzMzNGQzODkw ------- Client将收到的信息加上用户名和口令，编码为BASE64发送给Server
S: A0001 OK CRAM authentication successful ----------- Server使用该用户的口令进行MD5运算，如果得到相同的输出则认证成功

Keyed-MD5的计算公式为：
MD5 ( (tanstaaftanstaaf XOR opad),MD5((tanstaaftanstaaf XOR ipad), <1896.697170952@postoffice.reston.mci.net>) )，其中

MD5()为标准的MD5算法，“tanstaaftanstaaf”为用户口令，“<1896.697170952@postoffice.reston.mci.net>”是从Server发送过来的Timestamp和Hostname等，ipad和opad为Keyed-MD5算法特定的常数。上面的公式得出的digest为"b913a602c7eda7a495b4e6e7334d3890"，加上用户名，即"tim b913a602c7eda7a495b4e6e7334d3890"进行BASE64的编码，得到上面发送给Server的“dGltIGI5MTNhNjAyYzdlZGE3YTQ5NWI0ZTZlNzMzNGQzODkw”。

3.3. 邮件首部的扩充

首部通过两种编码方式来支持传送非7位ASCII码。它首先通过一个如下格式的编码字来表明所用的编码方式。

=?charset?encoding?encoded-text?text

charset是字符集规范。有效值是两个字符串us-ascii和iso-8859-x，其中x 是一个单个数字，例如iso-8859-1中的数字为“ 1”。

encoding是一个单个字符用来指定编码方法，支持两个值。

Q代表quoted-printable（可打印）编码。任何要发送的字符若其第8比特置1则被作为3个字符发送：第1个是字符是“=”，后面的两个字符对应于字符的十六进制表示。例如对于二进制码11111111，其对应的十六进制表示为“FF”，所以对应的编码位“=FF”。为了能够传输“=”，“=”的编码方式与第８比特置１的字符相同，因为其二进制代码为00111101，所以对应的编码为“=3D”。可以看出这种编码方式的开销达200%，所以只适合传送只含有少量非7位ASCII码的文本。

B代表base64编码。它的编码方法是先将二进制代码划分为一个24bit长的单元，然后将这24 bit单元划分为4个6 bit组。每个组按图 2所示的方法转换成ASCII码。

fffffff

图2　base64映射表

可以看出这种映射方法是这样的：0-25依次映射成A-Z，26-51依次映射成a-z,52-61依次映射成数字0-9，然后62映射成+，63映射成/。

对于二进制代码01001001 00110001 01111001，先将其划分成4个6 bit组，即010010 0100011 000101 111001。接着按图 2所示的映射表，可得到base64编码为：STF5。可以看出，这种编码方式的开销是25%，相对quoted-printable编码来说，它更适合用来传送含大量非7位ASCII码的二进制文件。

3.4. 正文的扩充

正文的扩充主要是使正文不仅可以传输NVT ASCII字符，而且可以传输任意字符，对应的文档为RFC1511（即MIME）。

MIME全称为“Multiple Internet Mail Extensions”, 比较确切的中文名称为“多用途互联网邮件扩展”。它通过新增一些邮件首部字段、邮件内容格式和传送编码，使得其成为一种应用很广泛的可以传输多媒体的电子邮件规范。

4.3. 浏览器发送邮件用的什么协议

浏览器如IE、Maxthon可通过登陆用户邮箱，来收发邮件，这是怎样实现的？例如bripengandre@126.com可通过登陆www.126.com来收发邮件。

这个过程是这样的：bripengandre@126.com在www.126.com提供的邮件页面上填写的相应信息（如发信人邮箱、收信人邮箱等），通过http协议被提交给126服务器；126服务器根据这些信息组装一封符合邮件规范的邮件（就像用户代理一样）；然后smtp.126.com通过SMTP协议将这封邮件发送到接收端邮件服务器。

可以看出，浏览器发送邮件只是用户代理的功能直接放到邮件服务器上去做了，至于邮件服务器间发送邮件还是采用的SMTP协议。我们看问题，如果有必要还是要适当地透过现象看本质。

0 0