vlambda博客
学习文章列表

C语言冷知识:Duff's Device(达夫设备)

相信大家主要都是写业务逻辑的if else程序员,面向if、else、for、while、switch编程。但是你见过switch嵌套do..while吗?

void send( int * to, int * from, int count){ int n = (count + 7 ) / 8 ; switch (count % 8 ) { case 0 : do { * to ++ = * from ++ ; case 7 : * to ++ = * from ++ ; case 6 : * to ++ = * from ++ ; case 5 : * to ++ = * from ++ ; case 4 : * to ++ = * from ++ ; case 3 : * to ++ = * from ++ ; case 2 : * to ++ = * from ++ ; case 1 : * to ++ = * from ++ ; } while ( -- n > 0 ); } }

这个就是达夫设备(Duff's Device)。咋一看,这玩意能编译通过?别说,还真能。

这是语言律师在炫技吗?不是,这东西在当时确实也有一些实用价值(不过大家不要学,在公司写代码写这个,估计会被老大打死)。

1983年,在卢卡斯影业(没错,就是星球大战那个卢卡斯)上班的程序员Tom Duff,为了加速一个实时动画程序发明了这一写法。

Tom Duff

应用的是C语言里面case 标签的Fallthrough特性(其实就是没有break继续执行)。

简单讲下背景。最早他是想实现从一个数组复制数据到一个寄存器。


duff 写的第一版(大众版)

第一次是这样写的(略有修改,补了返回值声明):

void send(to, from, count)register short *to, *from;register int count;{ do { /* count > 0 assumed */ *to++ = *from++; } while (--count > 0);}

开头一坨,你可能没加过,但是其实C语言课本里应该都有讲过,这种“古早”的函数定义方式:把参数和参数类型分离。其实等价于:

void send(register short* to, register short* from, register int count){ do { /* count > 0 assumed */ *to++ = *from++; } while (--count > 0);}

先忽略register可能更清晰一点(暂时忽略越界、覆盖这种事):

void send(short* to, short* from, int count){ do { /* count > 0 assumed */ *to++ = *from++; } while (--count > 0);}

一般人应该都是这么写的。但是他的使用场景下,count永远是8的倍数,然后他就写了第二版(我直接去掉了古早的语法)。

duff 写的第二版(特化版)

void send2(short* to, short* from, int count){ int n = count / 8; do { *to++ = *from++; *to++ = *from++; *to++ = *from++; *to++ = *from++; *to++ = *from++; *to++ = *from++; *to++ = *from++; *to++ = *from++; } while (--n > 0);}

你可能觉得这代码太丑了,有啥意义。也无非就是减少了,比较次数。其实在汇编层面讲 do... while(--count > 0) 这个代码(不算里面的逻辑)是6条指令(不同编译器可能不同)。大家可以用godbolt.org/ 测一下。

C语言冷知识:Duff's Device(达夫设备)

如果原始count是256,但就这一部分指令减少(256-256/8)*6=(256-32)*6=1344。当然这个并不准确,因为写法2 引入了额外的除法操作(int n = count/8),对应6条指令:

实际减少的指令约为1344-6*32=1152条。当然这个数字也不一定准,可能我还有遗漏。大家不要较真啦。大概就是确实会减少指令数。

这样就够了吗。达夫又写了第三版!也就是最终的达夫设备。

duff写的第三版(Duff's Device)

void send3(short* to, short* from, int count){ int n = (count + 7) / 8; switch (count % 8) { case 0: do { *to++ = *from++; case 7: *to++ = *from++; case 6: *to++ = *from++; case 5: *to++ = *from++; case 4: *to++ = *from++; case 3: *to++ = *from++; case 2: *to++ = *from++; case 1: *to++ = *from++; } while (--n > 0); }}

这一版,其实在性能上较第二版,并没有什么提升。这一版的意义在于将第二版的思想,在通用性上完成了进化!我们可以发现,最终版的达夫设备,count不局限于一定是8的倍数了!而第二版存在这个限制。


然而时至今日,达设备到底还能否提高性能是存疑的,因为编译器也早今非昔比。在代码里显式地用这种Trick的方式进行优化,可能反而阻碍了编译器潜在的优化。

Anyway,达夫设备,权当一个冷知识!