4.Linux应用编程——线程

来源：互联网发布：adobe accc是什么软件编辑：程序博客网时间：2024/05/17 06:59

线程
线程概念：
在一个程序里的一个执行路线就叫做线程（thread）。更准确的定义是：线程是“一个进程内部的控制序列/指令序列”;
一切进程至少有一个执行线程;

当前linux采用的线程模型：轻量级进程（可以单独拥有时间片的函数）
轻量级进程是内核支持的用户线程，是内核线程的一种抽象对象。每个线程拥有一个或多个轻量级线程，而每个轻量级线程分别被绑定在一个内核线程上。
N:M线程模型克服了多对一模型的并发度不高的缺点,又克服了一对一模型的一个用户线程占用太多内核级线程,开销太大的缺点.又拥有多对一,一对一模型的各自的优点,可谓集两家之长;

分类：
1.用户级线程（不需要操作系统内核的支持，这类线程拥有的时间片是进程给他分配的，
这类线程是不能跟其他的进程竞争CPU的）：
用户级线程主要解决的是上下文切换的问题，它的调度算法和调度过程全部由用户自行
选择决定，在运行时不需要特定的内核支持。在这里，操作系统往往会提供一个用户空
间的线程库，该线程库提供了线程的创建、调度和撤销等功能，而内核仍然仅对进程进
行管理。如果一个进程中的某一个线程调用了一个阻塞的系统调用函数，那么该进程
包括该进程中的其他所有线程也同时被阻塞。这种用户级线程的主要缺点是在一个进程
中的多个线程的调度中无法发挥多处理器的优势。

2内核级线程（依赖进程，需要操作系统内核支持，可以单独拥有时间片，可以与其他
的线程或进程共同竞争CPU）：
这种线程允许不同进程中的线程按照同一相对优先调度方法进行调度，这样就可以发挥
多处理器的并发优势。
现在大多数系统都采用用户级线程与核心级线程并存的方法。一个用户级线程可以对应
一个或几个核心级线程，也就是“一对一”或“多对一”模型。这样既可满足多处理机系统
的需要，也可以最大限度地减少调度开销。

线程和进程的区别：
1.进程是资源分配(进程需要参与资源的竞争)的基本单位,而线程是处理器调度(程序执行)的最小单位;
2.线程共享进程数据，但也拥有自己的一部分(非常少O(∩_∩)O~)数据,如线程ID、程序
计数器、一组寄存器、堆栈、errno(错误代码)、信号状态、优先级等;
3.一个进程内部的线程可以共享资源，如代码段、数据段、打开文件和信号等;
总结：进程之间空间独立；线程之间可以共享空间

线程共享哪些资源：
静态数据
文件描述符
工作路径
信号操作函数

哪些资源独立的：
线程ID
相关寄存器
子线程里定义的堆和栈

第三方线程库名字：pthread
shell命令模板：gcc 1.c -l pthread

进程用task_struct 结构体描述
线程也是由task_struct 结构体描述
信号也是由task_struct 结构体描述
注：在当前环境下凡是以_t结尾的类型都是整数类型

编程相关函数(API)：（有下划线的函数一般为POSIX标准，而POSIX标准的函数接口也一般用于线程）
1.pthread_create函数
描述：创建线程
#include <pthread.h>
int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);
第一个参数：线程ID（定义一个pthread_t类型变量，将这个变量的地址传入，原因是避免野指针）
第二个参数：线程属性，一般给NULL，NULL代表系统默认的属性
第三个参数：函数指针，线程启动后要执行的函数
第四个参数：传给线程函数的参数
返回值：成功返回值为0；不成功返回值不等于0：

fork与pthread_create对比
fork：当一个进程执行一个fork调用的时候，会创建出进程的一个新拷贝，新进程将拥
有它自己的变量和它自己的PID。这个新进程的运行时间是独立的,它在执行时几乎完全独立于创建它的进程(其父进程).
pthread_create：而在进程里面创建一个新线程的时候，新的执行线程会拥有自己的堆栈
（因此也就有自己的局部变量），但要与它的创建者共享全局变量、文件描述符、信号处理器和当前的工作目录状态。

2.pthread_exit函数
void pthread_exit(void *value_ptr);
描述：终止线程
value_ptr:指向该终止线程的返回值（不能指向一个局部变量）

3.pthread_join函数
int pthread_join(pthread_t thread, void **value_ptr);
描述：等待线程结束
thread：等待结束的线程
value_ptr:指向一个指针，这个指针指向结束线程的返回值
返回值：成功返回0，失败返回error number

4.pthread_self函数
pthread_t pthread_self(void);
描述：返回线程ID

5.pthread_cancel函数
int pthread_cancel(pthread_t thread);
描述：取消一个执行中的线程

线程的优点
1 创建一个新线程的代价要比创建一个新进程小得多(因此有时thread被称为轻型进程)
2 与进程之间的切换相比，线程之间的切换需要操作系统做的工作要少很多(提高了并发程度)
3 线程占用的资源要比进程少很多
4 能充分利用多处理器的可并行数量
5 在等待慢速I/O操作结束的同时，程序可执行其他的计算任务
6 计算密集型应用，为了能在多处理器系统上运行，将计算分解到多个线程中实现
7 I/O密集型应用，为了提高性能，将I/O操作重叠。线程可以同时等待不同的I/O操作
线程缺点
1 性能损失:一个很少被外部事件阻塞的计算密集型线程往往无法与共它线程共享同一
个处理器。如果计算密集型线程的数量比可用的处理器多，那么可能会有较大的性能
损失，这里的性能损失指的是增加了额外的同步和调度开销，而可用的资源不变。
2 健壮性降低:编写多线程需要更全面更深入的考虑，在一个多线程程序里，因时间分
配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是很大的，因
此如果一个进程中的一个线程崩溃可能会造成其他线程和本身的进程的崩溃!换句话
说线程之间是缺乏保护的。
3 缺乏访问控制:进程是访问控制的基本粒度，如在一个线程中调用某些OS函数会对整
个进程造成影响,比如在一个线程中更改了当前工作目录,则其他线程也随之改变。
4 编程难度提高:编写与调试一个多线程程序比单线程程序困难得多;

线程调度竞争范围
操作系统提供了各种模型，用来调度应用程序创建的线程。这些模型之间的主要不同是,
在竞争系统资源（特别是CPU时间）时，线程调度竞争范围(thread-scheduling contention scope）不一样:
1.进程竞争范围（process contention scope）：各个线程在同一进程竞争“被调度的CPU时间”（但不直接和其他进程中的线程竞争）。
2.系统竞争范围（system contention scope）：线程直接和“系统范围”内的其他线程竞争。

0 0