核心频率:1304 MHz
Turbo频率:1442 MHz
流处理单元:3584 个
核心架构:Pascal
GPU代号:GP100
生产工艺:16 nm
TDP功耗:235W
内存频率:1430 Mbps
内存类型:HBM2
内存位宽:4096 bit
最大显存:16 GB
晶体管数量:15,300 million
代工厂:TSMC
核心面积:610 mm²
一级缓存:24 KB
二级缓存:4 MB
光栅单元:224
纹理单元:96
SM count:56
建议电源:550 W
公版供电:1x 8-pin
公版接口:1x DVI4x DisplayPort
总线接口:PCIe 3.0 x16
像素填充率:138.4 GPixel/s
纹理填充率:323.0 GTexel/s
显存带宽:732.2 GB/s
FP16:20.67 TFLOPS (2:1)
FP32:10.34 TFLOPS
FP64:5.168 TFLOPS (1:2)
DirectX:12 (12_1)
OpenGL:4.6
OpenCL:3.0
Vulkan:1.2
CUDA:6.0
Shader model:6.4
GP100容易让人误会,它并非是核心名,而品名就是Quadro GP100,作为这一家族的旗舰登场。Quadro GP100基于Pascal核心,单精度CUDA 3584个,双精度CUDA 1792个,半精/单精/双精浮点运算性能分别是20.7T、10.3T和5.2T,匹配16GB HBM2显存,带宽高达717GB/s,功耗235W。
GP100 提供超过 20 TFLOPS 的半精度计算,可谓在 Windows 和 Linux 环境中进行深度学习的理想开发平台。
GP100是帕斯卡家族的旗舰核心,预计桌面上的GTX 1080 Ti、新版GTX Titan X也会使用它。
它采用台积电16nm FinFET工艺制造,集成了153亿个晶体管,比麦克斯韦GM200多了超过90%,核心面积达610平方毫米,只比28nm工艺的GM200大了区区9平方毫米。
完整的GP100核心拥有60个SM(流式多处理器)单元,Tesla P100只开启了其中的56个。每个SM单元内有64个FP32单精度CUDA核心(麦克斯韦、开普勒架构分别有128个、192个),总计3840个。
每个SM单元分为两部分,每部分有32个FP32 CUDA核心、一个指令缓冲器、一个Warp调度器、两个分派单元。
GP100核心每个SM单元的CUDA核心数量虽然只有麦克斯韦架构的一半,但是拥有相同的寄存器文件尺寸(256KB),支持类似的Warp和线程模块。
GP100核心的每个SM单元内还有32个FP64双精度CUDA核心,总计1920个,是单精度的1/2,这种比例可以更好地配合GP100核心新的数据路径配置,更高效地处理双精度负载。
GP100核心还有统一的4096KB二级缓存,超过开普勒GK110 1536KB、麦克GM200 3702KB,可以减少对GPU DRAM的请求,从而降低整体功耗、内存带宽,提升性能。
整个核心还配备了240个纹理单元。
Copyright 2020-2026 同袍存储 粤ICP备2021121885号网站地图