与 Tesla 显卡不同,Titan V 是一款合适的显卡。它有 3 个 DisplayPort 和 1 个 HDMI 输出,它使用标准的 GeForce 驱动程序堆栈,可以玩游戏。它可能会很好地发挥它们的作用,尽管迄今为止 Nvidia 尚未提出任何游戏性能声明。那是因为,尽管它是图形卡,但它并不是真正针对图形应用程序的。相反,它的目标是与 Tesla 卡适用的相同类型的基于 GPU 的计算(尤其是机器学习)应用程序,只是规模略小。Titan V 将用于工作站 PC,而不是数据中心的计算集群。
考虑到这些相似的角色,Titan V 的规格与 Tesla V100 的规格极为相似也就不足为奇了。这两款卡都有 5,120 个计算核心,并且都有 640 个面向机器学习的“张量核心”,专门用于 4×4 矩阵算法。Tesla 卡的确切时钟速度尚不清楚,但 Titan V 可以提升至 1.455GHz,略高于 V100 的 1.370GHz。最大的不同在于内存子系统:Titan V 拥有 12GB 的 HBM2 内存,以及 3,072 位的内存总线。Tesla V100 具有 16GB 的 HBM2 和 4,096 位总线。Titan 的内存也慢了一点,与 1.75Gb/s 相比,主频为 1.70Gb/s。
综合来看,新卡的计算性能几乎相同——每秒 13.8 万亿次单精度浮点运算、6.9 双精度 TFLOPS 和 110 降低精度机器学习 TFLOPS 在 Titan V 中,相比之下,单精度为 14,双精度为 7,双精度为 112 V100 上的机器学习 TFLOPS——但内存带宽仅为 653GB/s,而计算卡则为 900GB/s。
高昂的价格和计算重点意味着尽管它的物理外观,Titan V 的目标是“专业”客户的“专业”客户,而 Titan 系列传统上是针对这些客户的。不可避免的是,一些财大气粗的游戏玩家会拿起 Titan V 并将其用作显卡,但这肯定不是核心市场。