">AccelerEyes于7月15日宣布,用于MATLAB的Jacket GPU引擎已经升级至1.4版本,新增加了对NVIDIA Fermi计算架构的支持,包括GeForce GTX 400系列显卡和Tesla 20系列加速卡。
Jacket是面向MATLAB和其他高级语言的一个软件平台,能充分利用GPU强大的浮点性能提供可视计算加速,特别是降低了科学家和工程师使用GPU计算的门槛,可广泛用于政府、制造、能源、媒体、汽车、地震、生物医学、金融、科研等诸多高性能计算领域。
Jacket 1.4可充分发挥Fermi新架构面向通用计算设计的一系列特性,包括448个计算核心、IEEE-754浮点算法精度、ECC错误校验、增强缓存机制等等,特别是能为普通算术和线性代数实现更好的双精度性能。借助Fermi架构硬件,Jacket 1.4的即时编译技术性能得以大幅提升,矩阵乘法速度加快了20-60%,可直接访问NVIDIA Performance Primitives来实现ERODE、DILATE等新的图像处理技术,针对不同函数加入了对GFOR的支持。
AccelerEyes表示,针对Fermi架构的初步客户测试显示了令人印象深刻的结果。一方是GT200架构的Tesla C1060,核心频率1265MHz,运行Jacket 1.3、CUDA 2.3,另一方是Fermi架构的Tesla C2050,核心频率1025MHz,运行Jacket 1.4,CUDA 3.0,运算4000×4000矩阵的结果:
- Multiply-add (MAD):GPU双精度计算,Fermi、GT200分别耗时2秒、2.8秒,快了40%。
- 2D 2-point (GRADIENT):GPU单精度计算,Fermi、GT200分别耗时0.3秒、0.9秒,快了200%。
- 2D FFT (FFT2):GPU双精度计算,Fermi、GT200分别耗时0.1秒、0.2秒,快了100%。