SYN Cookie的原理和实现

本文主要内容:SYN Cookie的原理,以及它的内核实现。


Author:zhangskd @ csdn blog


SYN Flood



SYN Flood是一种非常危险而常见的Dos攻击方式。到目前为止,能够有效防范SYN Flood攻击的手段并不多,

SYN Cookie就是其中最著名的一种。


SYN Flood攻击是一种典型的拒绝服务(Denial of Service)攻击。所谓的拒绝服务攻击就是通过进行攻击,使受害主机或


SYN Flood攻击利用的是IPv4中TCP协议的三次握手(Three-Way Handshake)过程进行的攻击。

TCP服务器收到TCP SYN request包时,在发送TCP SYN + ACK包回客户机前,TCP服务器要先分配好一个数据区专门

服务于这个即将形成的TCP连接。一般把收到SYN包而还未收到ACK包时的连接状态称为半打开连接(Half-open Connection)。

在最常见的SYN Flood攻击中,攻击者在短时间内发送大量的TCP SYN包给受害者。受害者(服务器)为每个TCP SYN包分配




SYN Cookie


SYN Cookie原理由D.J. Bernstain和Eric Schenk提出。

SYN Cookie是对TCP服务器端的三次握手做一些修改,专门用来防范SYN Flood攻击的一种手段。它的原理是,在TCP服务器

接收到TCP SYN包并返回TCP SYN + ACK包时,不分配一个专门的数据区,而是根据这个SYN包计算出一个cookie值。这个

cookie作为将要返回的SYN ACK包的初始序列号。当客户端返回一个ACK包时,根据包头信息计算cookie,与返回的确认序列

号(初始序列号 + 1)进行对比,如果相同,则是一个正常连接,然后,分配资源,建立连接。





mac = MAC(A, k);











判断是否使用SYN Cookie。如果SYN Cookie功能有编译进内核(CONFIG_SYN_COOKIE),且选项

tcp_syncookies不为0,那么可使用SYN Cookie。同时设置SYN Flood标志(listen_opt->synflood_warned)。

/* Return true if a syncookie should be sent. */bool tcp_syn_flood_action(struct sock *sk, const struct sk_buff *skb, const char *proto){    const char *msg = "Dropping request";    bool want_cookie = false;    struct listen_sock *lopt;#ifdef CONFIG_SYN_COOKIE    if (sysctl_tcp_syncookies) { /* 如果允许使用SYN Cookie */        msg = "Sending cookies";        want_cookie = true;        NET_INC_STATS_BH(sock_net(sk), LINUX_MIB_TCPREQQFULLDOCOOKIES);    } else#endif        NET_INC_STATS_BH(sock_net(sk), LINUX_MIB_TCPREQQFULLDROP);    lopt = inet_csk(sk)->icsk_accept_queue.listen_opt; /* 半连接队列 */    if (! lopt->synflood_warned) {        lopt->synflood_warned = 1; /* 设置SYN Flood标志 */        pr_info("%s: Possible SYN flooding on port %d. %s.  Check SNMP counters.\n",                       proto, ntohs(tcp_hdr(skb)->dest), msg);    }    return want_cookie;}



计算SYN Cookie的值。



        |--> cookie_v4_init_sequence

                          |--> secure_tcp_syn_cookie

/* Generate a syncookie. mssp points to the mss, which is returned rounded down to the * value encoded in the cookie. */__u32 cookie_v4_init_sequence(struct sock *sk, struct sk_buff *skb, __u16 *mssp){    const struct iphdr *iph = ip_hdr(skb);    const struct tcphdr *th = tcp_hdr(skb);    int mssind; /* mss index */    const __u16 mss = *mssp;    tcp_synq_overflow(sk); /* 记录半连接队列溢出的最近时间 */    for (mssind = ARRAY_SIZE(msstab) - 1; mssind; mssind--)        if (mss >= msstab[mssind])            break;    *mssp = msstab[mssind];    NET_INC_STATS_BH(sock_net(sk), LINUX_MIB_SYNCOOKIESSENT);    return secure_tcp_syn_cookie(iph->saddr, iph->daddr, th->source, th->dest, ntohl(th->seq),                      jiffies / (HZ * 60), mssind); /* 计算SYN Cookie的具体值 */}
/* syncookie: remember time of last synqueue overflow */static inline void tcp_synq_overflow(struct sock *sk){    tcp_sk(sk)->rx_opt.ts_recent_stamp = jiffies;}/*  * MSS Values are taken from the 2009 paper * 'Measuring TCP Maximum Segment Size' by S. Alcock and R. Nelson: * - values 1440 to 1460 accounted for 80% of observed mss values * - values outside the 536-1460 range are rare (<0.2%). * * Table must be sorted. */static __u16 const msstab[] = {    64,    512,    536,    1024,    1440,    1460,    4312,    8960,};
static __u32 secure_tcp_syn_cookie(__be32 saddr, __be32 daddr, __be16 sport, __be16 dport,                                   __u32 sseq, __u32 count, __u32 data){    /* Compute the secure sequence number.     * The output should be:     * HASH(sec1, saddr, sport, daddr, dport, sec1) + sseq + (count * 2^24) +     *     (HASH(sec2, saddr, sport, daddr, dport, count, sec2) % 2^24).     * Where sseq is their sequence number and count increases every minute by 1.     * As an extra hack, we add a small "data" value that encodes the MSS into the second hash value.     */    return (cookie_hash(saddr, daddr, sport, dport, 0, 0) + sseq + (count << COOKIEBITS) +              ((cookie_hash(saddr, daddr, sport, dport, count, 1) + data) & COOKIEMASK));}#define COOKIEBITS 24 /* Upper bits store count */#define COOKIEMASK (((__u32) 1 << COOKIEBITS) - 1)#define SHA_DIGEST_WORDS 5#define SHA_WORKSPACE_WORDS 16


__u32 syncookie_secret[2] [16 - 4 + SHA_DIGEST_WORDS];static __init int init_syncookies(void){    get_random_bytes(syncookie_secret, sizeof(syncookie_secret));    return 0;}static DEFINE_PER_CPU(__u32 [16 + 5 + SHA_WORKSPACE_WORDS], ipv4_cookie_scratch);static u32 cookie_hash(__be32 saddr, _be32 daddr, __be16 sport, __be16 dport, u32 count, int c){    __u32 *tmp = __get_cpu_var(ipv4_cookie_scratch);    memcpy(tmp + 4, syncookie_secret[c], sizeof(syncookie_secret[c])); /* c取值为0、1 */    tmp[0] = (__force u32) saddr;    tmp[1] = (__force u32) daddr;    tmp[2] = ((__force u32) sport << 16) + (__force u32) dport;    tmp[3] = count;    sha_transform(tmp + 16, (__u8 *)tmp, tmp + 16 + 5); /* generate a 160-bit digest from 512-bit block */    return tmp[17];}


安全哈希算法(Secure HASH Algorithm)主要适用于数字签名。




1. 不可以从消息摘要中复原信息。

2. 两个不同的消息不会产生同样的消息摘要。


/* sha_transform - single block SHA1 transform * @digest: 160 bit digest to update * @data: 512 bits of data to hash * @array: 16 words of workspace (see note) * * This function generates a SHA1 digest for a single 512-bit block. * /void sha_transform(__u32 *digest, const char *data, __u32 *array) {}




        |--> tcp_make_synack

                       |--> cookie_init_timestamp

如果SYNACK段使用SYN Cookie,并且使用时间戳选项,则把TCP选项信息保存在SYNACK段中tsval的低6位。

/* When syncookies are in effect and tcp timestamps are enabled we encode tcp options * in the lower bits of the timestamp value that will be sent in the syn-ack. * Since subsequent timestamps use the normal tcp_time_stamp value, we must make * sure that the resulting initial timestamp is <= tcp_time_stamp. */__u32 cookie_init_timestamp(struct request_sock *req){    struct inet_request_sock *ireq;    u32 ts, ts_now = tcp_time_stamp;    u32 options = 0;    ireq = inet_rsk(req);    options = ireq->wscale_ok ? ireq->snd_wscale : 0xf;    options |= ireq->sack_ok << 4;    options |= ireq->ecn_ok << 5;    ts = ts_now & ~TSMASK;    ts |= options;    if (ts > ts_now) {        ts >>= TSBITS;        ts--;        ts <<= TSBITS;        ts |= options;    }    return ts;}#define TSBITS 6#define TSMASK (((__u32) 1 << TSBITS) - 1)




        |--> cookie_v4_check

                      |--> cookie_check

                                       |--> check_tcp_syn_cookie


SYN Cookie的设计非常巧妙, 我们来看看它是怎么验证的。

首先,把ACK包的ack_seq - 1,得到原来计算的cookie。把ACK包的seq - 1,得到SYN段的seq。


cookie = cookie_hash(saddr, daddr, sport, dport, 0, 0) + seq +

                (t1 << 24) + (cookie_hash(saddr, daddr, sport, dport, t1, 1) + mssind) % 24;

t1为服务器发送SYN Cookie的时间,单位为分钟,保留在高12位。

mssind为MSS的索引(0 - 7),保留在低24位。



t1 = (cookie - cookie_hash(saddr, daddr, sport, dport, 0, 0) - seq) >> 24; /* 高12位表示时间 */

t2为收到ACK的时间,t2 - t1 < 4分钟,才是合法的。也就是说ACK必须在4分钟内到达才行。



cookie -= (cookie_hash(saddr, daddr, sport, dport, 0, 0) - seq);

mssind = (cookie - cookie_hash(saddr, daddr, sport, dport, t1, 1)) % 24; /* 低24位 */

mssind < 8,才是合法的。



/* Check if a ack sequence number is a valid syncookie. * Return the decoded mss if it is, or 0 if not. */static inline int cookie_check(struct sk_buff *skb, __u32 cookie){    const struct iphdr *iph = ip_hdr(skb);    const struct tcphdr *th = tcp_hdr(skb);    __u32 seq = ntohl(th->seq) - 1; /* SYN的序号 */    __u32 mssind = check_tcp_syn_cookie(cookie, iph->saddr, iph->daddr, th->source, th->dest,                          seq, jiffies / (HZ * 60), COUNTER_TRIES);    /* 如果不合法则返回0 */    return mssind < ARRAY_SIZE(msstab) ? msstab[mssind] : 0;}
/* 使用SYN Cookie时,ACK超过了这个时间到达,会被认为不合法。*//* This (misnamed) value is the age of syncookie which is permitted. * Its ideal value should be dependent on TCP_TIMEOUT_INIT and sysctl_tcp_retries1. * It's a rather complicated formula (exponential backoff) to compute at runtime so it's * currently hardcoded here. */#define COUNTER_TRIES 4 /* 4分钟 */static __u32 check_tcp_syn_cookie(__u32 cookie, __be32 saddr, __be32 daddr, __be16 sport,            __be16 dport, __u32 sseq, __u32 count, __u32 maxdiff){    __u32 diff;    /* Strip away the layers from the cookie, 剥去固定值的部分 */    cookie -= cookie_hash(saddr, daddr, sport, dport, 0, 0) + sseq;    /* Cookie is now reduced to (count * 2^24) + (hash % 2^24) */    diff = (count - (cookie >> COOKIEBITS)) & ((__u32) -1 >> COOKIEBITS); /* 高12位是时间,单位为分钟 */    if (diff >= maxdiff)        return (__u32)-1;    /* Leaving the data behind,返回的是原来的data,即mssind */    return (cookie - cookie_hash(saddr, daddr, sport, dport, count - diff, 1)) & COOKIEMASK;}



接收到ACK后,SYN Cookie的处理函数为cookie_v4_check()。






时间戳对SYN Cookie有着重要的意义,如果不支持时间戳选项,则通过SYN Cookie建立的连接就会


struct sock *cookie_v4_check(struct sock *sk, struct sk_buff *skb, struct ip_options *opt){    struct tcp_options_received tcp_opt;    const u8 *hash_location;    struct inet_request_sock *ireq;    struct tcp_request_sock *treq;    struct tcp_sock *tp = tcp_sk(sk);    const struct tcphdr *th = tcp_hdr(skb);    __u32 cookie = ntohl(th->ack_seq) - 1;    struct sock *ret = sk;    struct request_sock *req;    int mss;    struct rtable *rt;    __u8 rcv_wscale;    bool ecn_ok = false;    struct flowi4 fl4;    if (! sysctl_tcp_syncookies || ! th->ack || th->rst)        goto out;    /* 验证cookie的合法性,必须同时符合:     * 1. 最近3s内有发生半连接队列溢出。     * 2. 通过cookie反算的t1和mssind是合法的。     */    if (tcp_synq_no_recent_overflow(sk) || (mss = cookie_check(skb, cookie)) == 0) {        NET_INC_STATS_BH(sock_net(sk), LINUX_MIB_SYNCOOKIESFAILED);        goto out;    }    NET_INC_STATS_BH(sock_net(sk), LINUX_MIB_SYNCOOKIESRECV);    /* check for timestamp cookie support */    memset(&tcp_opt, 0, sizeof(tcp_opt));    /* 全面解析TCP选项,并保存到tcp_opt中 */    tcp_parse_options(skb, &tcp_opt, &hash_location, 0, NULL);    /* 如果有使用时间戳选项,则从ACK的tsecr中提取选项信息 */    if (! cookie_check_timestamp(&tcp_opt, &ecn_ok))        goto out;    ret = NULL;    /* 从缓存块中分配一个request_sock实例,指定此实例的操作函数集为tcp_request_sock_ops */    req = inet_reqsk_alloc(&tcp_request_sock_ops);    if (! req)        goto out;    ireq = inet_rsk(req);    treq = tcp_rsk(req);    treq->rcv_isn = ntohl(th->seq) - 1; /* 客户端的初始序列号 */    treq->snt_isn = cookie; /* 本端的初始序列号 */    req->mss = mss; /* 客户端通告的MSS,通过解析cookie获得 */    ireq->loc_port = th->dest; /* 本端端口 */    ireq->rmt_port = th->source; /* 客户端端口 */    ireq->loc_addr = ip_hdr(skb)->daddr; /* 本端IP */    ireq->rmt_addr = ip_hdr(skb)->saddr; /* 客户端IP */    ireq->ecn_ok = ecn_ok; /* ECN选项,通过TS编码获得 */    ireq->snd_wscale = tcp_opt.snd_wscale; /* 客户端窗口扩大因子,通过TS编码获得 */    ireq->sack_ok = tcp_opt.sack_ok; /* SACK允许选项,通过TS编码获得 */    ireq->wscale_ok = tcp_opt.wscale_ok; /* 窗口扩大选项,通过TS编码获得 */    ireq->tstamp_ok = tcp_opt.saw_tstamp; /* 时间戳选项,通过观察ACK段有无携带时间戳 */    req->ts_recent = tcp_opt.saw_tstamp ? tcp_opt.rcv_tsval : 0; /* 本端下个发送段的时间戳回显值 */    treq->snt_synack = tcp_opt.saw_tstamp ? tcp_opt.rcv_tsecr : 0; /* 本端发送SYNACK段的时刻 */    /* We throwed the options of the initial SYN away, so we hope the ACK carries the same options     * again (see RFC1122     * 通过ACK段,获取IP选项。     */    if (opt && opt->optlen) {        int opt_size = sizeof(struct ip_options_rcu) + opt->optlen;        ireq->opt = kmalloc(opt_size, GFP_ATOMIC);        if (ireq->opt != NULL && ip_options_echo(&ireq->opt->opt, skb)) {            kfree(ireq->opt);            ireq->opt = NULL;        }    }    /* SELinux相关 */    if (security_inet_conn_request(sk, skb, req)) {        reqsk_free(req);        goto out;    }    req->expires = 0UL; /* SYNACK的超时时间 */    req->retrans = 0; /* SYNACK的重传次数 */    /* We need to lookup the route here to get at the correct window size.     * We should better make sure that the window size hasn't changed since we     * received the original syn, but I see no easy way to do this.     * 查找路由缓存。     */    flowi4_init_output(&fl4, 0, sk->sk_mark, RT_CONN_FLAGS(sk), RT_SCOPE_UNIVERSE,        IPPROTO_TCP, inet_sk_flowi_flags(sk), (opt && opt->srr) ? opt->faddr : ireq->rmt_addr,        ireq->loc_addr, th->source, th->dest);    security_req_classify_flow(req, flowi4_to_flowi(&fl4));    rt = ip_route_output_key(sock_net(sk), &fl4);    if (IS_ERR(rt)) {        reqsk_free(req);        goto out;    }    /* Try to redo what tcp_v4_send_synack did. */    req->window_clamp = tp->window_clamp ? : dst_metric(&rt->dst, RTAX_WINDOW);    /* 获取接收窗口的初始值,窗口扩大因子和接收窗口的上限 */    tcp_select_initial_window(tcp_full_space(sk), req->mss, &req->rcv_wnd, &req->window_clamp,        ireq->wscale_ok, &rcv_wscale, dst_metric(&rt->dst, RTAX_INITRWND));    ireq->rcv_wscale = rcv_wscale;    /* 到了这里,三次握手基本完成。     * 接下来为新的连接创建和初始化一个传输控制块,并把它和连接请求块关联起来。     * 最后把该连接请求块移入全连接队列中,等待accept()。     */    ret = get_cookie_sock(sk, skb, req, &rt->dst);        /* ip_queue_xmit() depends on our flow being setup     * Normal sockets get it right from inet_csk_route_child_sock()     */    if (ret)        inet_sk(ret)->cork.fl.u.ip4 = fl4;out:     return ret;}/* RFC 1122 initial RTO value, now used as a fallback RTO for the initial data * transmssion if no valid RTT sample has been accquired, most likely due to * retrans in 3WHS. */#define TCP_TIMEOUT_FALLBACK ((unsigned) (3 * HZ)) /* syncookies: no recent synqueue overflow on this listening socket?  * 如果最近3s内没有发生半连接队列溢出,则为真。 */static inline bool tcp_synq_no_recent_overflow(const struct sock *sk){    unsigned long last_overflow = tcp_sk(sk)->rx_opt.ts_recent_stamp;    return time_after(jiffies, last_overflow + TCP_TIMEOUT_FALLBACK);}


如果SYNACK段使用SYN Cookie,并且使用时间戳选项,则把TCP选项信息保存在SYNACK段中tsval的低6位。


/* When syncookies are in effect and tcp timestamps are enabled we stored addtional tcp * options in the timestamp. * This extracts these options from the timestamp echo. * The lowest 4 bits store snd_wscale. * next 2 bits indicate SACK and ECN support. * return false if we decode an option that should not be. */bool cookie_check_timestamp(struct tcp_options_received *tcp_opt, bool *ecn_ok){    /* echoed timestamp, lowest bits contain options */    u32 options = tcp_opt->rcv_tsecr & TSMASK;    /* 如果ACK没有携带时间戳,则把tcp_opt中的tstamp_ok、sack_ok、wscale_ok     * snd_wscale和cookie_plus置零。     */    if (! tcp_opt->saw_tstamp) {        tcp_clear_options(tcp_opt);        return true;    }    if (! sysctl_tcp_timestamps)        return false;    tcp_opt->sack_ok = (options & (1 << 4)) ? TCP_SACK_SEEN : 0;    *ecn_ok = (options >> 5) & 1;    if (*ecn_ok && ! sysctl_tcp_ecn)        return false;    if (tcp_opt->sack_ok && ! sysctl_tcp_sack)        return false;    if ((options & 0xf) == 0xf)        return true; /* no window scaling. */    tcp_opt->wscale_ok = 1;    tcp_opt->snd_wscale = options & 0xf;    return sysctl_tcp_window_scaling != 0;}




static inline struct sock *get_cookie_sock(struct sock *sk, struct sk_buff *skb,     struct request_sock *req, struct dst_entry *dst){    struct inet_connection_sock *icsk = inet_csk(sk);    struct sock *child;    /* 为新的连接创建和初始化一个传输控制块。     * 对于TCP/IPv4,实例为ipv4_specific,调用tcp_v4_syn_recv_sock()     */    child = icsk->icsk_af_ops->syn_recv_sock(sk, skb, req, dst);    if (child)        /* 把完成三次握手的连接请求块,和新的sock关联起来,并把它移入全连接队列中。*/        inet_csk_reqsk_queue_add(sk, req, child);     else        reqsk_free(req);    return child;} static inline void inet_csk_reqsk_queue_add(struct sock *sk, struct request_sock *req, struct sock *child){    reqsk_queue_add(&inet_csk(sk)->icsk_accept_queue, req, sk, child);}



static inline void reqsk_queue_add(struct request_sock_queue *queue, struct request_sock *req,      struct sock *parent, struct sock *child){    req->sk = child; /* 连接请求块request_sock,关联了一个新sock */    sk_acceptq_added(parent); /* 监听sock的全连接队列中的连接请求个数加一 */    /* 全连接队列是一个FIFO队列,把req加入到队列尾部 */    if (queue->rskq_accept_head == NULL)        queue->rskq_accept_head = req;    else        queue->rskq_accept_tail->dl_next = req;    queue->rskq_accept_tail = req;    req->dl_next = NULL;}static inline void sk_acceptq_added(struct sock *sk){    sk->sk_ack_backlog++;}




SYN Cookie技术由于在建立连接的过程中不需要在服务器端保存任何信息,实现了无状态的三次握手,从而有效的

防御了SYN Flood攻击。但是该方法也存在一些弱点。由于cookie的计算只涉及到包头部分信息,在建立连接的过程


增加了连接建立的延迟时间,因此,SYN Cookie技术不能作为高性能服务器的防御手段。通常采用动态资源分配机制,

当分配了一定的资源后再采用cookie技术,Linux就是这样实现的。还有一个问题是,当我们避免了SYN Flood攻击的


SYN Flood供给方面,SYN Cookie技术仍然是有效的(引用自[1])。




Linux内核中的SYN Cookie机制主要的功能是防止本机遭受SYN Flood攻击。

SYN Cookie Firewall利用SYN Cookie的原理,在内网和外网之间实现TCP三次握手过程的代理(proxy)。

一些SYN攻击的防火墙也是基于SYN Cookie,只是把这个功能移动到内核之外的代理服务器上。





