为数据中心配备全球快的深度学习训练加速器
从图像识别与自然语言处理到神经机器翻译和图像分类,深度学习正在重新定义人类的能力所及。从初创公司到大型 Web 服务供应商,深度学习
现已成为企业发展的基石,使企业能够为终用户提供绝佳的解决方案。
深度学习模型的训练一般需要花费数日到数周时间,这让科学家不得不在精确度与部署时间之间有所取舍。NVIDIA Tesla M40 GPU 加速器基于超
高效的 NVIDIA Maxwell™ 架构,专为提供高的单精度性能而打造。再加上极高的显存密度,这让 Tesla M40 成为了用于深度学习训练的全球
快加速器。
与 CPU 计算系统花费数日的时间相比,Caffe 和 Torch 在 Tesla M40 上处理同一模型仅用了短短数小时:
专为 TESLA 平台而打造的深度学习生态系统
Tesla M40 加速器可为客户提供强大的基础,使其能够利用顶级的深度学习软件和解决方案。NVIDIA cuDNN、DIGITS™ 以及各种深度学习
框架均针对 NVIDIA Maxwell™架构和 Tesla M40 进行了优化,因此可成就下一代机器学习应用。
深度学习软件开发包
NVIDIA cuDNN
cuDNN 可提供 GPU 加速的深度神经网络基元、极低的内存总开销、灵活的数据布局,而且还支持:
NVIDIA DIGITS
DIGITS 是一款互动深度神经网络开发环境,它让数据科学家能够:
GPU 架构 | NVIDIA Maxwell |
NVIDIA CUDA® 核心数量 | 3072 |
单精度性能 | 利用 NVIDIA GPU Boost 技术可实现 7 Teraflops |
双精度性能 | 0.2 Teraflops |
显存 | 12 GB GDDR5 |
显存带宽 | 288 GB/s |
系统接口 | PCI Express 3.0 x16 |
大功耗 | 250 W |
散热方案 | 被动式 |
卡型 | 高 4.4 英寸 x 长 10 .5 英寸,双槽,全高式 |
计算 API | CUDA, DirectCompute, OpenCL™, OpenACC |