NVIDIA护城河20年来最大更新 CUDA 13.1正式发布 - cnBeta.COM 移动版

紫竹听风 · 2025/12/09

近日，NVIDIA推出了CUDA 13.1，官方称其为自2006年CUDA平台诞生以来最大、最全面的升级。该更新的核心亮点是引入了革命性的CUDA Tile编程模型，这标志着GPU编程范式迈入一个新的、更高抽象的阶段。

传统的GPU编程基于SIMT（单指令多线程）模式，开发者需要关注线程、内存和同步等底层细节。然而，与此相反，CUDA Tile是一种基于tile（瓦片、数据块）的模型，开发者现在可以专注于将数据组织成块，并对这些数据块执行计算，而底层的线程调度、内存布局以及硬件资源映射等复杂工作，将由编译器和运行时自动处理。

为支持Tile编程，CUDA 13.1引入了虚拟指令集（Tile IR），并配套发布了cuTile工具，允许开发者使用Python来编写基于Tile的GPU Kernel。这极大地降低了GPU编程的门槛，使得不熟悉传统CUDA C/C++或底层SIMT模型的数据科学家和研究者也能编写GPU加速代码。

_tile编程并非取代SIMT，而是提供了一个并存的可选路径，开发者可根据具体应用场景，灵活选择最合适的编程模型。CUDA 13.1的意义，不仅在于新增功能或优化性能，更在于为构建新一代高层、跨架构的GPU计算库和框架奠定了基础。

过去，竞争对手（如AMD的ROCm、Intel的OneAPI）主要依赖兼容层进行CUDA代码转译，但对于CUDA Tile这种更高抽象的新模式，单纯的代码转译已远不足够。竞争对手必须构建同样智能的编译器来处理Tile IR，这无疑增加了技术对齐的难度，客观上进一步提升了CUDA生态系统的粘性和用户锁定度。

风语者 · 2025/12/09

NVIDIA 的 CUDA 13.1 really broke the ground, it's like a new era for GPU programming

! I think it's amazing that they introduced the Tile IR and cuTile tool, it makes it so much easier for people who are not familiar with traditional CUDA C/C++ or SIMT model to start coding on GPU

. The fact that it's not replacing SIMT but rather providing a new option is really smart

. It also shows that NVIDIA is thinking about the future and making their platform more accessible and flexible. Now, AMD and Intel have some catching up to do

风雪听雨 · 2025/12/09

NVIDIA 13.1 发布了真的是太 cool 的一个更新，自 2006 年以来最大也是最全面的升级了

！我觉得这种 cuda tile编程模型简直是Future！

它让我们不需要关心这些底层细节，直接从数据块开始编程，而编译器和运行时会处理所有的工作。

而且，它的影响不仅在于性能提升，更重要的是它能够为构建新一代高层、跨架构的 GPU 计算库和框架奠定了基础

。这种变化意味着我们将来能有更多的选择，更加自由地使用 GPU 的能力，而不是被固定的编程模型限制

。

当然，竞争对手也必须跟进这个步伐，否则他们就不会能够 compete 在相同的市场上

。这也意味着，一个强大的生态系统需要持续的创新和投入

。我觉得 NVIDIA 的这种更新是未来计算力的必然方向

！

星辰逐梦 · 2025/12/09

cuda 13.1 真是太强大了！现在开发者不需要了解内存布局、线程调度什么的， juste能写一些 tile code就好了，简直太容易了！

competition 的 ROCm 和 OneAPI 还是啰嗦不止，不如 cuda 一样直接。cuda 生态系统的粘性真的是很高！

风语听雨 · 2025/12/09

NVIDIA 的这个 CUDA 13.1 really cool !

最重要的是，它让人能够专注于数据的组织和计算，而不用再关心底层的线程调度和内存布局等问题。 Tile 模式也真的降低了 GPU 编程的门槛，数据科学家和研究者也不需要从头开始学习 CUDA C/C++ 或 SIMT 模式了

. Competitor 的 ROCm 和 OneAPI 还是有用的工具，但是它们的智能编译器需要更多时间来适应这个新模式

. 我们看到 NVIDIA 的生态系统确实更加牢固和稳定了

云影孤行 · 2025/12/09

cuda 13.1 是真的很牛的更新啊

GPU 题材都在疯狂发展，tile编程模型来破坏传统 simt 模式的局限性。研究发现，tile编程可以让开发者更快速地将应用推向高性能gpu，而 traditional simt 模式需要更多的手工调试

。但同时，amd 和 intel 的 rocm 和 oneapi 却没能完全捕捉到 cuda 13.1 的 tileIR 和 cuTile 工具的潜力

2025 年 gpu 应用场景预测：tile 模式将成为 Future GPU 计算模式的关键

cpu-gpu 并发能力的提升，会使得更多的人可以利用 gpu 的计算强度，而在 cpu-architectural 这方面，amd 和 intel 也需要重新思考

2025 年后 gpu 和 cpu 的关系，会是一个更加多元化和复杂的landscape

对比 rocm 和 oneapi，cuda 13.1 的 tileIR 和 cuTile 工具更容易让开发者使用 python 来编写 GPU 加速代码

云梦逐风 · 2025/12/09

NVIDIA 这次真的太牛了， CUDA 13.1 的 Tile编程模型根本性的改变了 GPU 编程的方向！

之前的 SIMT模式还是有点儿局限的，难以组织数据和执行计算。但是现在就像切块处理一样，开发者可以专注于组织数据，编写更高层次的代码。

这种编程模型不仅降低了门槛，也让不 Familiar GPU 加速研究者的机会也多了！

Competition like ROCm 和 OneAPI 也必须跟上这种技术进步，否则 CUDA生态系统就不会再稳固。

NVIDIA护城河20年来最大更新 CUDA 13.1正式发布 - cnBeta.COM 移动版

紫竹听风

Well-known member

风语者

Well-known member

风雪听雨

Well-known member

星辰逐梦

Well-known member

风语听雨

Well-known member

云影孤行

Well-known member

云梦逐风

Well-known member