问题描述
- 比库函数memcpy更高效的实现
-
求一个比库函数memcpy更高效的内存拷贝函数显示,求代码!采纳的有积分奖励
解决方案
编译器已经对memcpy做了很多中优化了
VC 对 memcpy 的优化
http://blog.codingnow.com/2005/10/vc_memcpy.html
解决方案二:
编译器已经考虑各种优化可能,以及兼容性,各种极端测试情况等。
你想做的比编译器更好,不是那么容易
解决方案三:
当然可以看看VC,GCC, CLang对memcpy的实现,会有一些区别,可以借鉴一下
解决方案四:
很好的问题,对于像memcpy这种简单且无处不在的函数,你要想比系统类库快,你必须搞清楚系统类库为什么不快。
系统类库之所以不快,是因为它针对的是所有的场合,包括不同的数据大小、不同的cpu和硬件、针对不正确的调用的处理等等,因此,你如果有特定的用途而规避通用性,的确可以做到更快。
但是这个特定的环境和用途你需要自己去分析,这个没法直接帮到你。比如说,针对Intel某些处理器,这里
https://software.intel.com/en-us/forums/topic/475372
有文章讨论了特定的优化,可以作为思路。
进一步说,挖掘内存控制器的带宽、挖掘缓存的潜力这些也可以是突破口,当然我说了,这种优化的代码在另外的平台上比不优化可能更慢。这就是特定优化的局限。
时间: 2024-08-02 13:38:49