Linux 网络编程基础

来源:互联网 发布:搜狐域名邮箱 编辑:程序博客网 时间:2024/05/03 09:05

大家在面试的时候,经常会被问到TCP,UDP的一些东西,我们平时在工作中,直接用封装好的网络请求,很少关注这些,今天我就来总结下这些基本的知识,在早期的时候有一个OSI网络模型
这里写图片描述

其实后来的各种协议,并没有完全使用这七层结构,比如我们熟知的TCP/IP,是四层网络模型
这里写图片描述
我们常用的网络传输Socket,就是应用了这些协议进行通信,这个我们后面说。
TCP UDP属于传输层,他们的区别如下:
1、TCP面向连接(如打电话要先拨号建立连接);UDP是无连接的,即发送数据之前不需要建立连接

2、TCP提供可靠的服务。也就是说,通过TCP连接传送的数据,无差错,不丢失,不重复,且按序到达;UDP尽最大努力交付,即不保证可靠交付
3、TCP面向字节流,实际上是TCP把数据看成一连串无结构的字节流;UDP是面向报文的
UDP没有拥塞控制,因此网络出现拥塞不会使源主机的发送速率降低(对实时应用很有用,如IP电话,实时视频会议等)
4、每一条TCP连接只能是点到点的;UDP支持一对一,一对多,多对一和多对多的交互通信
5、TCP首部开销20字节;UDP的首部开销小,只有8个字节
6、TCP的逻辑通信信道是全双工的可靠信道,UDP则是不可靠信道

下面来说下TCP的三次握手和四次挥手
TCP的报文格式:
这里写图片描述
(1)序号:Seq序号,占32位,用来标识从TCP源端向目的端发送的字节流,发起方发送数据时对此进行标记。
(2)确认序号:Ack序号,占32位,只有ACK标志位为1时,确认序号字段才有效,Ack=Seq+1。
(3)标志位:共6个,即URG、ACK、PSH、RST、SYN、FIN等,具体含义如下:
(A)URG:紧急指针(urgent pointer)有效。
(B)ACK:确认序号有效。
(C)PSH:接收方应该尽快将这个报文交给应用层。
(D)RST:重置连接。
(E)SYN:发起一个新连接。
(F)FIN:释放一个连接。
所谓三次握手(Three-Way Handshake)即建立TCP连接,就是指建立一个TCP连接时,需要客户端和服务端总共发送3个包以确认连接的建立。在socket编程中,这一过程由客户端执行connect来触发,整个流程如下图所示:
这里写图片描述

(1)第一次握手:Client将标志位SYN置为1,随机产生一个值seq=J,并将该数据包发送给Server,Client进入SYN_SENT状态,等待Server确认。
(2)第二次握手:Server收到数据包后由标志位SYN=1知道Client请求建立连接,Server将标志位SYN和ACK都置为1,ack=J+1,随机产生一个值seq=K,并将该数据包发送给Client以确认连接请求,Server进入SYN_RCVD状态。
(3)第三次握手:Client收到确认后,检查ack是否为J+1,ACK是否为1,如果正确则将标志位ACK置为1,ack=K+1,并将该数据包发送给Server,Server检查ack是否为K+1,ACK是否为1,如果正确则连接建立成功,Client和Server进入ESTABLISHED状态,完成三次握手,随后Client与Server之间可以开始传输数据了。

所谓四次挥手(Four-Way Wavehand)即终止TCP连接,就是指断开一个TCP连接时,需要客户端和服务端总共发送4个包以确认连接的断开。在socket编程中,这一过程由客户端或服务端任一方执行close来触发,整个流程如下图所示:
这里写图片描述

由于TCP连接时全双工的,因此,每个方向都必须要单独进行关闭,这一原则是当一方完成数据发送任务后,发送一个FIN来终止这一方向的连接,收到一个FIN只是意味着这一方向上没有数据流动了,即不会再收到数据了,但是在这个TCP连接上仍然能够发送数据,直到这一方向也发送了FIN。首先进行关闭的一方将执行主动关闭,而另一方则执行被动关闭,上图描述的即是如此。
(1)第一次挥手:Client发送一个FIN,用来关闭Client到Server的数据传送,Client进入FIN_WAIT_1状态。
(2)第二次挥手:Server收到FIN后,发送一个ACK给Client,确认序号为收到序号+1(与SYN相同,一个FIN占用一个序号),Server进入CLOSE_WAIT状态。
(3)第三次挥手:Server发送一个FIN,用来关闭Server到Client的数据传送,Server进入LAST_ACK状态。
(4)第四次挥手:Client收到FIN后,Client进入TIME_WAIT状态,接着发送一个ACK给Server,确认序号为收到序号+1,Server进入CLOSED状态,完成四次挥手。
上面是一方主动关闭,另一方被动关闭的情况,实际中还会出现同时发起主动关闭的情况,具体流程如下图:
这里写图片描述

关于三次握手和四次挥手经常会有面试官这样问:
(1)三次握手是什么或者流程?四次握手呢?答案前面分析就是。
(2)为什么建立连接是三次握手,而关闭连接却是四次挥手呢?
这是因为服务端在LISTEN状态下,收到建立连接请求的SYN报文后,把ACK和SYN放在一个报文里发送给客户端。而关闭连接时,当收到对方的FIN报文时,仅仅表示对方不再发送数据了但是还能接收数据,己方也未必全部数据都发送给对方了,所以己方可以立即close,也可以发送一些数据给对方后,再发送FIN报文给对方来表示同意现在关闭连接,因此,己方ACK和FIN一般都会分开发送。

接下来我们来谈一下主机字节序和网络字节序
什么是字节序?是指整数在内存中保存的顺序。
字节序有两种:
a.Little endinan 低位存储在内存的低地址,高位存储在内存的高地址(小端模式);
b.Big endian 高位存储在内存的低地址,低位存储在内存的高地址(大端模式);

主机字节序就是当前主机所采用的内存中的存储顺序,而网络字节序这是TCP/IP协议中定义好的一种数据表示格式,它是与你的机器的cpu,操作系统什么的无关的,这样可以保证数据在网络中传输时,不管怎么样都能正确的解释了,网络字节序选择了Big endian。这样就给编写网络程序的程序员带来一个问题,程序员必须把本地数据从主机字节序转换成网络字节序发送到主机,同时,主机也必须把收到的数据从网络字节序转换成本地字节序,这样才能保证双方正确的收发数据

转换函数如下:
这里写图片描述

我们来看一个例子:
这里写图片描述

运行结果:
这里写图片描述

这种转换只是用来转换ip地址的。

我们在用Socket编程的时候,会用到套接字,套接字里面存的就是ip地址,协议和端口,以达到区分的目的,套接字地址是一个数据结构,我们仅基于TCP传输协议作为例子。套接字地址这个数据结构里面包含了:地址类型、端口号、IP地址、填充字节这4种数据。而它的数据结构原型为:
struct sockaddr_in{
unsigned short sin_family;
unsigned short int sin_port;
struct in_addr sin_addr;
unsigned char sin_zero[8];
};
其中:
sin_family表示地址类型,对于基于TCP/IP传输协议的通信,该值只能是AF_INET;
sin_prot表示端口号,例如:21 或者 80 或者 27015,总之在0 ~ 65535之间;
sin_addr表示32位的IP地址,例如:192.168.1.5 或 202.96.134.133;
sin_zero表示填充字节,一般情况下该值为0;
Socket数据的赋值实例:
struct sockaddr_in Lewis;
Lewis.sin_family = AF_INET;
Lewis.sin_port = htons(80);
Lewis.sin_addr.s_addr = inet_addr(“202.96.134.133”);
memset(Lewis.sin_zero,0,sizeof(Lewis.sin_zero));
分析:我们设置了一个名叫Lewis的套接字地址,它基于TCP/IP协议,因此sin_family的值为AF_INET,这个是雷打不动的,只要使用TCP/IP协议簇,该值就是AF_INET,memset函数在这里起到给sin_zero数组清零的作用

sin_addr是一个数据结构,原型是:
struct in_addr{
unsigned long s_addr;
};

我们知道一般ip都是”192.168.0.1”这样的字符串,那想实现跟unsigned long的互相转换呢
这里写图片描述

运行结果:
这里写图片描述

最后说一下gethostbyname函数,我们可以通过这个函数根据域名获取到ip地址

这里写图片描述

下面我们来根据百度的域名来获取相应的ip

这里写图片描述

运行结果:
这里写图片描述

好了,Linux 网络编程基础就总结到这里,如有问题,欢迎指正,谢谢。

0 0
原创粉丝点击