今天偶尔看到 Duff’s Device C语言代码 , 凭兴趣研究了一下;
这段代码的来历是这样的:
达夫设备(Duff’s Device)是一段著名的C语言代码,由Tom Duff在1983年编写,用于手动展开循环以优化数据的复制操作。它是一种与众不同的编程技巧,结合了C语言中的switch语句和do…while循环结构,达到循环展开(unrolling)的效果,从而提高程序的运行效率。
下面是一个标准的达夫设备的示例代码:
void duff_device(char *to, char *from, int count)
{
int n = (count + 7) / 8;
switch (count % 8) {
case 0: do { *to++ = *from++;
case 7: *to++ = *from++;
case 6: *to++ = *from++;
case 5: *to++ = *from++;
case 4: *to++ = *from++;
case 3: *to++ = *from++;
case 2: *to++ = *from++;
case 1: *to++ = *from++;
} while (--n > 0);
}
}
这段代码做的事情是将from指向的内存区域中的数据拷贝到to指向的内存区域中,拷贝的长度为count个字节。
解释一下代码的执行逻辑:
首先计算count除以8后向上取整的值给n,这将决定完整展开循环的次数。
然后通过count % 8获取剩余未处理的元素数量,作为switch语句的条件。
switch语句跳转到对应的case标签。这里的case标签作用是标记接下来需要执行的数据复制操作的起始点。
do…while循环开始执行,每次进入循环都执行8次数据复制操作,直到n减到0为止。当count不是8的倍数时,switch确保了从正确的地方开始复制。
达夫设备的核心优化思想是循环展开,通过减少循环迭代的次数来减少循环控制的开销,从而提高代码的执行效率。然而,这种技巧牺牲了代码的可读性,很容易导致代码维护上的困难,并且现代编译器的优化通常能够自动进行循环展开,所以它现在更多的是一个编程领域的趣闻,而不是推荐使用的代码实践。
读到这里 就自己动手实验了一下;
下面是我的实验代码
#include "test.h"
void duff_device(char* to, char* from, int count)
{
cout_time();
int n = (count + 7) / 8;
switch (count % 8) {
case 0: do {
*to++ = *from++;
case 7: *to++ = *from++;
case 6: *to++ = *from++;
case 5: *to++ = *from++;
case 4: *to++ = *from++;
case 3: *to++ = *from++;
case 2: *to++ = *from++;
case 1: *to++ = *from++;
} while (--n > 0);
}
cout_time();
}
int main()
{
char s[100]="";
char s1[100] = "hello world china";
duff_device(s, s1, 17);
std::cout << s <<std::endl;
copy(s, s1, 17);
std::cout << s << std::endl;
}
void copy(char *to , char *from , int count)
{
cout_time();
for (int i = 0; i < count; i++) {
*to++ = *from++;
}
cout_time();
}
void cout_time()
{
auto now = std::chrono::system_clock::now();
//通过不同精度获取相差的毫秒数
uint64_t dis_millseconds =
std::chrono::duration_cast<std::chrono::milliseconds>(now.time_since_epoch()).count()
- std::chrono::duration_cast<std::chrono::seconds>(now.time_since_epoch()).count() * 1000;
time_t tt = std::chrono::system_clock::to_time_t(now);
tm * time_tm = new tm();
localtime_s(time_tm ,&tt);
char strTime[25] = { 0 };
sprintf_s(strTime, "%d-%02d-%02d %02d:%02d:%02d %03d", time_tm->tm_year + 1900,
time_tm->tm_mon + 1, time_tm->tm_mday, time_tm->tm_hour,
time_tm->tm_min, time_tm->tm_sec, (int)dis_millseconds);
std::cout << strTime << std::endl;
delete time_tm;
}
达夫代码运行了3毫秒,普通循环运行了不到1毫秒 , 使用的ide是 windows visual studio
猜测现在的编译器早就优化了;