tasklet原理
来源:互联网 发布:arora浏览器 windows 编辑:程序博客网 时间:2024/05/16 19:23
tasklet是Linux内核中“可延迟执行”机制、或“中断下半部”的一种。基于软中断实现,但比软中断灵活,tasklet有的地方翻译作“任务蕾”,大部分书籍没找到合适的词汇去翻译它。本篇博客主要介绍tasklet的设计原理、使用方法。
本篇博客耗时8小时。
一、tasklet解决什么问题?
先看下tasklet在一些书籍上的介绍:
- tasklet是I/O驱动程序中实现可延迟函数的首选方法(我猜某个内核版本开始,块设备从tasklet中独立出来成为单独的软中断BLOCK_SOFTIRQ和BLOCK_IOPOLL_SOFTIRQ)——ULK。
- tasklet和工作队列是延期执行工作的机制,其实现基于软中断,但他们更易于使用,因而更适合与设备驱动程序...tasklet是“小进程”,执行一些迷你任务,对这些人物使用全功能进程可能比较浪费——PLKA。
- tasklet是并行可执行(但是是锁密集型的)软件中断和旧下半区的一种混合体,这里既谈不上并行性,也谈不上性能。引入tasklet是为了替代原来的下半区。
下面这段来自于PLKA的话我也很想留在这里:软中断是将操作推迟到未来时刻执行的最有效的方法。但该延期机制处理起来非常复杂。因为多个处理器可以同时且独立的处理软中断,同一个软中断的处理程序可以在几个CPU上同时运行。对软中断的效率来说,这是一个关键,多处理器系统上的网络实现显然受惠于此。但处理程序的设计必须是完全可重入且线程安全的。另外,临界区必须用自旋锁保护(或其他IPC机制),而这需要大量审慎的考虑。
我自己的理解,由于软中断以ksoftirqd的形式与用户进程共同调度,这将关系到OS整体的性能,因此软中断在Linux内核中也仅仅就几个(网络、时钟、调度以及Tasklet等),在内核编译时确定。软中断这种方法显然不是面向硬件驱动的,而是驱动更上一层:不关心如何从具体的网卡接收数据包,但是从所有的网卡接收的数据包都要经过内核协议栈的处理。而且软中断比较“硬”——数量固定、编译时确定、操作函数必须可重入、需要慎重考虑锁的问题,不适合驱动直接调用,因此Linux内核为驱动直接提供了一种使用软中断的方法,就是tasklet。
二、tasklet数据结构
tasklet通过软中断实现,软中断中有两种类型属于tasklet,分别是级别最高的HI_SOFTIRQ和TASKLET_SOFTIRQ。
Linux内核采用两个PER_CPU的数组tasklet_vec[]和tasklet_hi_vec[]维护系统种的所有tasklet(kernel/softirq.c),分别维护TASKLET_SOFTIRQ级别和HI_SOFTIRQ级别的tasklet:
1
2
3
4
5
6
7
8
struct
tasklet_head
{
struct
tasklet_struct *head;
struct
tasklet_struct **tail;
};
static
DEFINE_PER_CPU(
struct
tasklet_head, tasklet_vec);
static
DEFINE_PER_CPU(
struct
tasklet_head, tasklet_hi_vec);
tasklet的核心结构体如下(include/linux/interrupt.h):
1
2
3
4
5
6
7
8
struct tasklet_struct
{
struct tasklet_struct *next;
unsigned long state;
atomic_t
count
;
void (*func)(unsigned long);
unsigned long data;
};
习惯上称之为tasklet描述符,func指针是具体的处理函数指针,data为可选参数,state表示该tasklet的状态,分别使用不同的bit表示两个状态:TASKLET_STATE_SCHED和TASKLET_STATE_RUN:
- TASKLET_STATE_SCHED置位表示已经被调度(挂起),也意味着tasklet描述符被插入到了tasklet_vec和tasklet_hi_vec数组的其中一个链表中,可以被执行。
- TASKLET_STATE_RUN置位表示该tasklet正在某个CPU上执行,单个处理器系统上并不校验该标志,因为没必要检查特定的tasklet是否正在运行。
count为原子计数器,用于禁用已经调度的tasklet,如果该值不为0,则不予以执行。
三、tasklet操作接口
tasklet对驱动开放的常用操作包括:
- 初始化,tasklet_init(),初始化一个tasklet描述符。
- 调度,tasklet_schedule()和tasklet_hi_schedule(),将taslet置位TASKLET_STATE_SCHED,并尝试激活所在的软中断。
- 禁用/启动,tasklet_disable_nosync()、tasklet_disable()、task_enable(),通过count计数器实现。
- 执行,tasklet_action()和tasklet_hi_action(),具体的执行软中断。
- 杀死,tasklet_kill(),。。。
tasklet_int()函数实现如下(kernel/softirq.c):
1
2
3
4
5
6
7
8
9
void tasklet_init(struct tasklet_struct *t,
void (*func)(unsigned long), unsigned long data)
{
t->next = NULL;
t->state = 0;
atomic_set(&t->
count
, 0);
t->func = func;
t->data = data;
}
tasklet_schedule()函数与tasklet_hi_schedule()函数的实现很类似,这里只列tasklet_schedule()函数的实现(kernel/softirq.c),都挺明白就不描述了:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
static
inline void tasklet_schedule(struct tasklet_struct *t)
{
if
(!test_and_set_bit(TASKLET_STATE_SCHED, &t->state))
__tasklet_schedule(t);
}
void __tasklet_schedule(struct tasklet_struct *t)
{
unsigned long flags;
local_irq_save(flags);
t->next = NULL;
*__this_cpu_read(tasklet_vec.tail) = t;
__this_cpu_write(tasklet_vec.tail, &(t->next));
raise_softirq_irqoff(TASKLET_SOFTIRQ);
local_irq_restore(flags);
}
tasklet_disable()函数、task_enable()函数以及tasklet_disable_nosync()函数(include/linux/interrupt.h),不说了只列代码:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
static
inline
void
tasklet_disable_nosync(
struct
tasklet_struct *t)
{
atomic_inc(&t->count);
smp_mb__after_atomic_inc();
}
static
inline
void
tasklet_disable(
struct
tasklet_struct *t)
{
tasklet_disable_nosync(t);
tasklet_unlock_wait(t);
smp_mb();
}
static
inline
void
tasklet_enable(
struct
tasklet_struct *t)
{
smp_mb__before_atomic_dec();
atomic_dec(&t->count);
}
只列tasklet_action()函数(kernel/softirq.c):
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
static
void
tasklet_action(
struct
softirq_action *a)
{
struct
tasklet_struct *list;
local_irq_disable();
list = __this_cpu_read(tasklet_vec.head);
__this_cpu_write(tasklet_vec.head, NULL);
__this_cpu_write(tasklet_vec.tail, &__get_cpu_var(tasklet_vec).head);
local_irq_enable();
while
(list) {
struct
tasklet_struct *t = list;
list = list->next;
if
(tasklet_trylock(t)) {
if
(!atomic_read(&t->count)) {
if
(!test_and_clear_bit(TASKLET_STATE_SCHED, &t->state))
BUG();
t->func(t->data);
tasklet_unlock(t);
continue
;
}
tasklet_unlock(t);
}
local_irq_disable();
t->next = NULL;
*__this_cpu_read(tasklet_vec.tail) = t;
__this_cpu_write(tasklet_vec.tail, &(t->next));
__raise_softirq_irqoff(TASKLET_SOFTIRQ);
local_irq_enable();
}
}
tasklet_action()函数在softirq_init()函数中被调用:
1
2
3
4
5
6
void
__init softirq_init(
void
)
{
...
open_softirq(TASKLET_SOFTIRQ, tasklet_action);
open_softirq(HI_SOFTIRQ, tasklet_hi_action);
}
tasklet_kill()实现:
1
2
3
4
5
6
7
8
9
10
11
12
13
void
tasklet_kill(
struct
tasklet_struct *t)
{
if
(in_interrupt())
printk(
"Attempt to kill tasklet from interruptn"
);
while
(test_and_set_bit(TASKLET_STATE_SCHED, &t->state)) {
do
{
yield();
}
while
(test_bit(TASKLET_STATE_SCHED, &t->state));
}
tasklet_unlock_wait(t);
clear_bit(TASKLET_STATE_SCHED, &t->state);
}
yeild()函数是个值的研究的点。
四、一个tasklet调用例子
找了一个tasklet的例子看一下(drivers/usb/atm,usb摄像头),在其自举函数usbatm_usb_probe()中调用了tasklet_init()初始化了两个tasklet描述符用于接收和发送的“可延迟操作处理”,但此是并没有将其加入到tasklet_vec[]或tasklet_hi_vec[]中:
1
2
3
4
tasklet_init(&instance->rx_channel.tasklet,
usbatm_rx_process, (unsigned long)instance);
tasklet_init(&instance->tx_channel.tasklet,
usbatm_tx_process, (unsigned long)instance);
在其发送接口usbatm_atm_send()函数调用tasklet_schedule()函数将所初始化的tasklet加入到当前cpu的tasklet_vec链表尾部,并尝试调用do_softirq_irqoff()执行软中断TASKLET_SOFTIRQ:
1
2
3
4
5
6
static
int usbatm_atm_send(struct atm_vcc *vcc, struct sk_buff *skb)
{
...
tasklet_schedule(&instance->tx_channel.tasklet);
...
}
在其断开设备的接口usbatm_usb_disconnect()中调用tasklet_disable()函数和tasklet_enable()函数重新启动其收发tasklet(具体原因不详,这个地方可能就是由这个需要,暂时重启收发tasklet):
1
2
3
4
5
6
7
8
9
10
void usbatm_usb_disconnect(struct usb_interface *intf)
{
...
tasklet_disable(&instance->rx_channel.tasklet);
tasklet_disable(&instance->tx_channel.tasklet);
...
tasklet_enable(&instance->rx_channel.tasklet);
tasklet_enable(&instance->tx_channel.tasklet);
...
}
在其销毁接口usbatm_destroy_instance()中调用tasklet_kill()函数,强行将该tasklet踢出调度队列。
从上述过程以及tasklet的设计可以看出,tasklet整体是这么运行的:驱动应该在其硬中断处理函数的末尾调用tasklet_schedule()接口激活该tasklet,内核经常调用do_softirq()执行软中断,通过softirq执行tasket,如下图所示。图中灰色部分为禁止硬中断部分,为保护软中断pending位图和tasklet_vec链表数组,count的改变均为原子操作,count确保SMP架构下同时只有一个CPU在执行该tasklet:
五、tasklet同步
主要看两个参数,一个state,一个count。
state用于校验在tasklet_action()或tasklet_schedule()时,是否执行该tasklet的handler。state被tasklet_schedule()函数、tasklet_hi_schedule()函数、tasklet_action()函数以及tasklet_kill()函数所修改:
- tasklet_schedule()函数、tasklet_hi_schedule()函数将state置位TASKLET_STATE_SCHED。
- tasklet_action()函数将state的TASKLET_STATE_SCHED清除,并设置TASKLET_STATE_RUN。
- tasklet_kill()函数将state的TASKLET_STATE_SCHED清除。
tasklet_action()函数在设置TASKLET_STATE_RUN标志时,使用了tasklet_trylock()、tasklet_unlock()等接口:
count用于smp同步,count不为0,则表示该tasklet正在某CPU上执行,其他CPU则不执行该tasklet,count保证某个tasklet同时只能在一个CPU上执行。count的操作都是原子操作:
- tasklet_disable()函数/tasklet_disable_nosync()函数将count原子减1。
- tasklet_enablle()函数将count原子加1。
另外,tasklet的操作中还所使用了local_irq_save()/local_irq_disable()等禁止本地中断的函数,早保护对象被修改完毕后立即使用local_irq_resore()/local_irq_enable()开启:
- tasklet_schedule()函数中,用于保护tasklet_vec[]链表和软中断的pending位图的更改。因为硬中断的激发能导致二者的更改。
- tasklet_action()函数中,用于保护tasklet_vec[]链表和软中断的pending位图的更改。因为硬中断的激发能导致二者的更改。
六、总结
tasklet是一种“可延迟执行”机制中的一种,基于软中断实现,主要面向驱动程序。tasklet与软中断的区别在于每个CPU上不能同时执行相同的tasklet,tasklet函数本身也不必是可重入的。与软中断一样,为了保证tasklet和硬中断之间在同一个CPU上是串行执行的,维护其PER_CPU的链表时,需要屏蔽硬中断。
不要为了列代码而列代码,不要为了抄书而抄书。
七、细节
1、原子操作
tasklet使用taskle_disable()函数和tasklet_enable()函数对count位进行增减操作,以保证SMP架构下,不在不同的CPU上同时运行相同的tasklet。这里使用了原子操作atomic_inc()和atomic_dec():
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
static
inline
void
atomic_inc(atomic_t *v)
{
asm
volatile
(LOCK_PREFIX
"incl %0"
:
"+m"
(v->counter));
}
static
inline
void
atomic_dec(atomic_t *v)
{
asm
volatile
(LOCK_PREFIX
"decl %0"
:
"+m"
(v->counter));
}
#ifdef CONFIG_SMP
#define LOCK_PREFIX_HERE
".pushsection .smp_locks,"a"n"
".balign 4n"
".long 671f - .n"
/* offset */
".popsectionn"
"671:"
#define LOCK_PREFIX LOCK_PREFIX_HERE "ntlock; "
#else /* ! CONFIG_SMP */
#define LOCK_PREFIX_HERE ""
#define LOCK_PREFIX ""
#endif
2、memory barrier
参考资料:
1、Understanding Linux Kernel
2、Professinal Linux Kernel Architecture
- tasklet原理
- tasklet原理
- tasklet原理
- tasklet原理
- tasklet原理
- tasklet原理
- tasklet原理和源码分析
- tasklet原理和源码分析
- tasklet原理和源码分析
- tasklet
- tasklet
- tasklet
- tasklet
- tasklet
- tasklet
- tasklet
- tasklet
- Tasklet
- 数字信号处理公式变程序(五)——仿matlab的spectrogram函数(STFT)
- 在树莓派、香蕉派上安装ROS JADE (Arch Linux)
- NSCache使用常见错误
- 鼠标悬浮 实现隐藏div 提示
- Amazon AWS亚马逊云服务免费一年VPS主机成功申请和使用方法
- tasklet原理
- mac下安装eclipse的svn插件
- ibatis 缓存设置 ------cacheModel
- jdk修改配置不鞥生效解决方案
- Linux命令行的艺术
- 根据URL的value找rowkey或者其他数据
- 安装VMware Workstation 10
- ibaits2中要注意remapResults-被坑了
- ASP.NET Web API 2 - 简单Unit Testing