资讯

未来,cuDNN将进一步拓展算子融合支持,以持续推动深度学习工作负载性能的提升。 自2017年首次推出以来,CUTLASS一直是研究人员和开发者在NVIDIA GPU上实现高性能CUDA内核的重要工具。 CUTLASS通过提供丰富的工具集,帮助开发者高效设计针对NVIDIA Tensor Core的自定义 ...