达夫设备(Duff‘s Device)浅析

发布时间:2024年01月23日

今天偶尔看到 Duff’s Device C语言代码 , 凭兴趣研究了一下;
这段代码的来历是这样的:
达夫设备(Duff’s Device)是一段著名的C语言代码,由Tom Duff在1983年编写,用于手动展开循环以优化数据的复制操作。它是一种与众不同的编程技巧,结合了C语言中的switch语句和do…while循环结构,达到循环展开(unrolling)的效果,从而提高程序的运行效率。

下面是一个标准的达夫设备的示例代码:

void duff_device(char *to, char *from, int count)
{
    int n = (count + 7) / 8;

    switch (count % 8) {
        case 0: do { *to++ = *from++;
        case 7:      *to++ = *from++;
        case 6:      *to++ = *from++;
        case 5:      *to++ = *from++;
        case 4:      *to++ = *from++;
        case 3:      *to++ = *from++;
        case 2:      *to++ = *from++;
        case 1:      *to++ = *from++;
                } while (--n > 0);
    }
}

这段代码做的事情是将from指向的内存区域中的数据拷贝到to指向的内存区域中,拷贝的长度为count个字节。

解释一下代码的执行逻辑:

首先计算count除以8后向上取整的值给n,这将决定完整展开循环的次数。
然后通过count % 8获取剩余未处理的元素数量,作为switch语句的条件。
switch语句跳转到对应的case标签。这里的case标签作用是标记接下来需要执行的数据复制操作的起始点。
do…while循环开始执行,每次进入循环都执行8次数据复制操作,直到n减到0为止。当count不是8的倍数时,switch确保了从正确的地方开始复制。
达夫设备的核心优化思想是循环展开,通过减少循环迭代的次数来减少循环控制的开销,从而提高代码的执行效率。然而,这种技巧牺牲了代码的可读性,很容易导致代码维护上的困难,并且现代编译器的优化通常能够自动进行循环展开,所以它现在更多的是一个编程领域的趣闻,而不是推荐使用的代码实践。

读到这里 就自己动手实验了一下;
下面是我的实验代码


#include "test.h"

void duff_device(char* to, char* from, int count)
{
    cout_time();

    int n = (count + 7) / 8;

    switch (count % 8) {
    case 0: do {
        *to++ = *from++;
    case 7:      *to++ = *from++;
    case 6:      *to++ = *from++;
    case 5:      *to++ = *from++;
    case 4:      *to++ = *from++;
    case 3:      *to++ = *from++;
    case 2:      *to++ = *from++;
    case 1:      *to++ = *from++;
    } while (--n > 0);
    }
    cout_time();
}

int main()
{

    char s[100]="";
    char s1[100] = "hello world china";

    duff_device(s, s1, 17);
    std::cout << s <<std::endl;

    copy(s, s1, 17);

    std::cout << s << std::endl;
}


void copy(char *to , char *from , int count)
{
    cout_time();
    for (int i = 0; i < count; i++) {
        *to++ = *from++;
    }
    cout_time();
}




void cout_time()
{
    auto now = std::chrono::system_clock::now();

    //通过不同精度获取相差的毫秒数
    uint64_t dis_millseconds = 
        std::chrono::duration_cast<std::chrono::milliseconds>(now.time_since_epoch()).count()
      - std::chrono::duration_cast<std::chrono::seconds>(now.time_since_epoch()).count() * 1000;


    time_t tt = std::chrono::system_clock::to_time_t(now);
    tm * time_tm = new tm();
    localtime_s(time_tm ,&tt);

    char strTime[25] = { 0 };

    sprintf_s(strTime, "%d-%02d-%02d %02d:%02d:%02d %03d", time_tm->tm_year + 1900,
        time_tm->tm_mon + 1, time_tm->tm_mday, time_tm->tm_hour,
        time_tm->tm_min, time_tm->tm_sec, (int)dis_millseconds);
    std::cout << strTime << std::endl;

    delete time_tm;
}

达夫代码运行了3毫秒,普通循环运行了不到1毫秒
达夫代码运行了3毫秒,普通循环运行了不到1毫秒 , 使用的ide是 windows visual studio
猜测现在的编译器早就优化了;

文章来源:https://blog.csdn.net/semicolon_hello/article/details/135769397
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。