中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

替换x86 rdtsc汇编指令

现象描述

编译报错:error: impossible constraint in ‘asm’

__asm__ __volatile__("rdtsc" : "=a" (lo), "=d" (hi));。

问题原因

TSC是时间戳计数器的缩写,它是Pentium兼容处理器中的一个计数器,它记录自启动以来处理器消耗的时钟周期数。在每个时钟到来时,该计数器自动加一。因为TSC随着处理器周期速率的变化而变化,所以它提供了非常高的精确度。它经常被用来分析和检测代码。x86平台TSC的值可以通过rdtsc指令来读取,鲲鹏平台需要使用类似算法实现。

处理步骤

x86平台实现样例:

static inline uint64_t Rdtsc() 
{ 
    uint32_t lo, hi; 
    __asm__ __volatile__ ("rdtsc" : "=a" (lo), "=d" (hi)); 
    return (uint64_t)hi << 32 | lo; 
}

鲲鹏平台实现样例:

  • 方法一:使用Linux提供的获取时间函数clock_gettime进行近似替换。
    #include <time.h>
    static inline uint64_t Rdtsc() 
    { 
        struct timespec tmp; 
        clock_gettime(CLOCK_MONOTONIC, &tmp); 
        return tmp.tv_sec*2400000000+(uint64_t)tmp.tv_nsec*2.4; //2400000000和2.4基于服务器主频而定
    }
  • 方法二:鲲鹏有Performance Monitors Control Register系列寄存器,其中PMCCNTR_EL0就类似于x86的TSC寄存器。但默认情况用户态是不可读的,需要 内核态 使能后才能读取。具体可参考:http://ilinuxkernel.com/?p=1755
    1. 下载read aarch64 TSC ,解压压缩包,在arrch64_tsc目录下执行make命令,安装相应内核驱动,生成如下文件。

    2. 执行insmod pmu.ko命令安装内核模块,使能内核态(初次执行即可)。
    3. 代码替换。
    static inline uint64_t Rdtsc() 
    { 
        uint64_t count_num; 
        uint64_t Current_Speed = 2400; // Current Speed =2400MHz 
        uint64_t External_Clock = 100; // External Clock = 100MHz 
        __asm__ __volatile__ ("mrs %0, cntvct_el0" : "=r" (count_num)); 
        return count_num *(Current_Speed / External_Clock);
    }

    其中Cent Speed和External Clock的值可由以下命令获取到:dmidecode |grep MHz。