Linux时间系统：时钟源clocsource

来源：互联网发布：for循环遍历二维数组编辑：程序博客网时间：2024/06/01 08:49

时钟源(clock source)

clock source顾名思义就是提供给系统提供时钟的时钟源。
clock source负责读取芯片中按时间增加的值(所谓cycle)，并提供给timekeeper，当然也要提供按cycle的值计算时间间隔的内容。
clocksource以及timer相关的内容都在kernel/kernel/time目录下面。

obj-y += timekeeping.o ntp.o clocksource.o jiffies.o timer_list.oobj-y += timeconv.o posix-clock.o alarmtimer.oobj-$(CONFIG_GENERIC_CLOCKEVENTS_BUILD)        += clockevents.oobj-$(CONFIG_GENERIC_CLOCKEVENTS)      += tick-common.oobj-$(CONFIG_GENERIC_CLOCKEVENTS_BROADCAST)    += tick-broadcast.o tick-broadcast-hrtimer.oobj-$(CONFIG_GENERIC_SCHED_CLOCK)      += sched_clock.oobj-$(CONFIG_TICK_ONESHOT)         += tick-oneshot.oobj-$(CONFIG_TICK_ONESHOT)         += tick-sched.oobj-$(CONFIG_TIMER_STATS)          += timer_stats.o

下面来看一下时钟源是怎么注册上去，怎么提供计算时间的内容给timekeeper。

1. 时钟源注册过程:

linux可以有很多时钟源，其中一种时钟源是jiffies。还有就是平台相关的时钟源，精度较高。
当然在注册了很多种时钟源之后，linux内核也用某种方式去选择当前的时钟源来保证最好的精度。
这里写图片描述

1）jiffies时钟源注册过程：

jiffies我们知道就是一秒钟会增加相当于HZ大小的一个变量。
首先需要根据时钟源，填充clocksource相关数据结构中的成员。

static struct clocksource clocksource_jiffies = {  .name= "jiffies",    .rating= 1,     .read= jiffies_read,   /*读取当前jiffies*/  .mask= 0xffffffff, /*32bits*/     .mult= NSEC_PER_JIFFY << JIFFIES_SHIFT, /* details above */  .shift= JIFFIES_SHIFT,};

从这个例子，可以看出来 (mult>>shift)*cloclsource->read() 这个读的就是jiffies数。
当然如果要注册一些更高精度的时钟源，mult和shift要进行小心的计算，以保证其值不会溢出。这个后面再看。

2. 平台相关的时钟源

int clocksource_register(struct clocksource *cs){    /* calculate max adjustment for given mult/shift */    cs->maxadj = clocksource_max_adjustment(cs); /*计算相当于mult值得11%赋给maxadj*/    /* calculate max idle time permitted for this clocksource */    cs->max_idle_ns = clocksource_max_deferment(cs); /*max_idle_ns计算方法看下面*/    mutex_lock(&clocksource_mutex);    clocksource_enqueue(cs);  //把注册的clock source 添加到clocksource_list链表中，按rate的降序排序    clocksource_enqueue_watchdog(cs);    clocksource_select(); //按rate选择最佳的clocksource，当然这里rate哪个大就选哪                           个，，    mutex_unlock(&clocksource_mutex);    return 0;}static u64 clocksource_max_deferment(struct clocksource *cs){     u64 max_nsecs, max_cycles;    max_cycles = 1ULL << (63 - (ilog2(cs->mult + cs->maxadj) + 1));     /* 上面的计算出来就是2的63次方 = max_cycles*(cs->mult + cs->maxadj)  ，也就是说    这个是在计算2的63次方纳秒对应的cycles，也就是计算最大的cycles，因为时间对应的纳秒不能超    过2的64次方，因为会溢出    */    max_cycles = min_t(u64, max_cycles, (u64) cs->mask); /*max_cycles和cs->mask中的最小值赋值给max_cycles*/    max_nsecs = clocksource_cyc2ns(max_cycles, cs->mult - cs->maxadj,                    cs->shift);return max_nsecs - (max_nsecs >> 3);}static struct clocksource clocksource_counter = {.name   = "arch_sys_counter",.rating = 400,.read   = arch_counter_read,.mask   = CLOCKSOURCE_MASK(56),.flags  = CLOCK_SOURCE_IS_CONTINUOUS,};static void __init arch_timer_counter_init(void){    clocksource_register_hz(&clocksource_counter, arch_timer_rate);    setup_sched_clock(arch_timer_update_sched_clock, 32, arch_timer_rate);/* Use the architected timer for the delay loop. */    arch_delay_timer.read_current_timer = &arch_timer_read_current_timer;    arch_delay_timer.freq = arch_timer_rate;    register_current_timer_delay(&arch_delay_timer);}static inline int clocksource_register_hz(struct clocksource *cs, u32 hz){   return __clocksource_register_scale(cs, 1, hz);}int __clocksource_register_scale(struct clocksource *cs, u32 scale, u32 freq){        /* Initialize mult/shift and max_idle_ns */    __clocksource_updatefreq_scale(cs, scale, freq); //根据clocksource的频                            率计算mult和shit的值       /* Add clocksource to the clcoksource list */         mutex_lock(&clocksource_mutex);    clocksource_enqueue(cs);    clocksource_enqueue_watchdog(cs);    clocksource_select();    mutex_unlock(&clocksource_mutex);        return 0;}void __clocksource_updatefreq_scale(struct clocksource *cs, u32 scale, u32 freq){    u64 sec;    sec = (cs->mask - (cs->mask >> 3));    do_div(sec, freq);    do_div(sec, scale);if (!sec)        sec = 1;else if (sec > 600 && cs->mask > UINT_MAX)        sec = 600;    clocks_calc_mult_shift(&cs->mult, &cs->shift, freq,                   NSEC_PER_SEC / scale, sec * scale);    cs->maxadj = clocksource_max_adjustment(cs);while ((cs->mult + cs->maxadj < cs->mult)|| (cs->mult - cs->maxadj > cs->mult)) {        cs->mult >>= 1;        cs->shift--;        cs->maxadj = clocksource_max_adjustment(cs);}    cs->max_idle_ns = clocksource_max_deferment(cs);}voidclocks_calc_mult_shift(u32 *mult, u32 *shift, u32 from, u32 to, u32 maxsec){    u64 tmp;    u32 sft, sftacc= 32;      tmp = ((u64)maxsec * from) >> 32;      while (tmp) {        tmp >>=1;        sftacc--;}for (sft = 32; sft > 0; sft--) {        tmp = (u64) to << sft;        tmp += from / 2;        do_div(tmp, from);if ((tmp >> sftacc) == 0)break;}*mult = tmp;*shift = sft;}

kernel用乘法+移位来替换除法：根据cycles来计算过去了多少ns。
单纯从精度上讲，肯定是mult越大越好，但是计算过程可能溢出，所以mult也不能无限制的大，这个计算中有个magic number 600 ：
这个600的意思是600秒，表示的Timer两次计算当前计数值的差不会超过10分钟。主要考虑的是系统进入IDLE状态之后，时间信息不会被更新，10分钟内只要退出IDLE，clocksource还是可以成功的转换时间。当然了，最后的这个时间不一定就是10分钟，它由clocksource_max_deferment计算并将结果存储在max_idle_ns中
筒子比较关心的问题是如何计算 ,精度如何,其实我不太喜欢这种计算,Kernel总是因为某些原因把代码写的很蛋疼.反正揣摩代码意图要花不少时间,收益嘛其实也不太大.如何实现我也不解释了,我以TSC为例子我评估下这种mult+shift的精度.

#include<stdio.h>#include<stdlib.h>typedef unsigned int u32;typedef unsigned long long u64;#define NSEC_PER_SEC 1000000000Lvoidclocks_calc_mult_shift(u32 *mult, u32 *shift, u32 from, u32 to, u32 maxsec){    u64 tmp;    u32 sft, sftacc= 32;    /*     * * Calculate the shift factor which is limiting the conversion     * * range:     * */    tmp = ((u64)maxsec * from) >> 32;    while (tmp) {            tmp >>=1;            sftacc--;        }    /*     * * Find the conversion shift/mult pair which has the best     * * accuracy and fits the maxsec conversion range:     * */    for (sft = 32; sft > 0; sft--) {            tmp = (u64) to << sft;            tmp += from / 2;            //do_div(tmp, from);            tmp = tmp/from;            if ((tmp >> sftacc) == 0)                break;        }    *mult = tmp;    *shift = sft;}int main(){     u32 tsc_mult;    u32 tsc_shift ;    u32 tsc_frequency = 2127727000/1000; //TSC frequency(KHz)    clocks_calc_mult_shift(&tsc_mult,&tsc_shift,tsc_frequency,NSEC_PER_SEC/1000,        600*1000); //NSEC_PER_SEC/1000是因为TSC的注册是clocksource_register_khz    fprintf(stderr,"mult = %d shift = %d\n",tsc_mult,tsc_shift);    return 0;}

600是根据TSC clocksource的MASK算出来的的入参,感兴趣可以自己推算看下结果:

mult = 7885042 shift = 24root@manu:~/code/c/self/time# pythonPython 2.7.3 (default, Apr 10 2013, 05:46:21) [GCC 4.6.3] on linux2Type "help", "copyright", "credits" or "license" for more information.>>> (2127727000*7885042)>>241000000045L>>> 我们知道TSC的frequency是2127727000Hz,如果cycle走过2127727000,就意味过去了1秒,或者说10^9(us).按照我们的算法得出的时间是1000000045ns. 这个误差是多大呢,每走10^9秒,误差是45纳秒,换句话说,运行257天,产生1秒的计算误差.考虑到NTP的存在,这个运算精度还可以了.

3. clocksource watchdog

clocksource_enqueue_watchdog会将clocksource挂到watchdog链表.watchdog顾名思义,监控所有clocksource:

#define WATCHDOG_INTERVAL (HZ >> 1)#define WATCHDOG_THRESHOLD (NSEC_PER_SEC >> 4)

如果0.5秒内,误差大于0.0625s,表示这个clocksource精度极差,将rating设成0.

实际的应用场景

以高通msm8916为例，除了jiffies，其他clocksource是没有直接使用kernel/kernel/time/clocksource.c文件里边的接口的。
其他arm_arch_timer.c[/kernel/driver/clocksource/arm_arch_timer.c]
和 arch_timer.c [kernel/arch/arm/kernel/arch_timer.c] 两个都是使用
sched_clock.c[/kernel/kernel/time/sched_clock.c]文件里边的
sched_clock_register()来进行注册，并使用sched_clock_32()函数读取当前时间。

0 1