当前位置：首页 > 科技资讯 > 正文

CUDA Tile：英伟达编程范式的革命性转变与护城河之争

主机测评网
科技资讯
2026-02-06
265

【导语】深度剖析英伟达CUDA Tile技术的颠覆性创新，解读其战略布局与行业影响。

英伟达CUDA平台迎来二十年来最重大的革新——CUDA Tile。这一技术彻底改变了GPU编程模式，允许开发者使用Python替代C++编写内核代码，标志着AI与高性能计算进入新纪元。

CUDA Tile：英伟达编程范式的革命性转变与护城河之争 Tile 英伟达 AI编程模型 Jim Keller 第1张

在CUDA 13.1版本中，英伟达引入了CUDA Tile技术——一种全新的显卡代码编写范式，旨在通过抽象化底层硬件（如Tensor Cores）细节，显著降低开发门槛。这好比从手动调试乐团中的每件乐器，转变为指挥整个乐队演奏。

CUDA Tile：英伟达编程范式的革命性转变与护城河之争 Tile 英伟达 AI编程模型 Jim Keller 第2张

这一更新迅速引发芯片界传奇人物、Tenstorrent CEO Jim Keller的关注与质疑。他提出：此次更新是否意味着CUDA的“护城河”被终结？

CUDA Tile：英伟达编程范式的革命性转变与护城河之争 Tile 英伟达 AI编程模型 Jim Keller 第3张

Jim Keller认为，当英伟达GPU转向Tile瓦片结构，而其他硬件厂商也采用类似架构时，AI内核将更容易在不同平台间移植。但事实是否如此？

深入探讨需从两个问题入手：Jim Keller为何具有行业影响力？CUDA Tile技术及CUDA护城河的本质是什么？

Jim Keller被誉为芯片界的“传奇架构师”，其职业生涯贯穿x86-64指令集奠基、AMD Zen架构翻身仗、苹果A系列芯片开发等里程碑。他的观点极具分量。

CUDA Tile：英伟达编程范式的革命性转变与护城河之争 Tile 英伟达 AI编程模型 Jim Keller 第4张

此前，Jim Keller曾批评CUDA为“沼泽”，意指其复杂性令开发者深陷其中。而CUDA Tile的推出，似乎是对这一批评的回应。

回顾CUDA历史，传统的SIMT（单指令多线程）模型在AI时代面临瓶颈。现代AI计算以矩阵乘法为核心，而SIMT模型要求开发者以线程为单位编程，难以高效利用Tensor Core等硬件加速单元。

CUDA Tile：英伟达编程范式的革命性转变与护城河之争 Tile 英伟达 AI编程模型 Jim Keller 第5张

技术重构：CUDA Tile与SIMT的范式断裂

CUDA Tile彻底改变了编程原子，从“线程”转向“瓦片”。开发者不再管理单个线程，而是定义数据块（Tile）及其操作，编译器自动处理硬件映射。这类似于从汇编语言跃升至高级语言，极大简化了代码编写。

例如，在矩阵乘法中，CUDA Tile允许开发者用简洁的Python代码表达算法，无需显式管理线程同步或内存屏障，底层硬件细节由编译器优化。

CUDA Tile：英伟达编程范式的革命性转变与护城河之争 Tile 英伟达 AI编程模型 Jim Keller 第6张

底层支撑是CUDA Tile IR（中间表示），它提供虚拟指令集，使代码能在多代GPU上高效运行，屏蔽硬件差异，提升移植性。

CUDA Tile：英伟达编程范式的革命性转变与护城河之争 Tile 英伟达 AI编程模型 Jim Keller 第7张

英伟达此次优先推出Python支持（cuTile Python），而非C++，反映了AI开发生态中Python的主导地位，旨在让研究者留在熟悉环境中实现高性能计算。

竞争格局：CUDA Tile直面OpenAI Triton

CUDA Tile的推出，部分旨在对抗OpenAI的Triton语言。Triton同样采用基于块的编程模型，致力于降低对英伟达闭源库的依赖，两者在理念上不谋而合。

CUDA Tile：英伟达编程范式的革命性转变与护城河之争 Tile 英伟达 AI编程模型 Jim Keller 第8张

那么，CUDA Tile是否终结了CUDA的护城河？分析表明，它在英伟达代际GPU间提升了移植性，但跨厂商移植仍面临挑战。英伟达并未拆除护城河，而是将其加固——在沼泽上铺设高速公路，但这条路仅通向英伟达的城堡。

CUDA Tile：英伟达编程范式的革命性转变与护城河之争 Tile 英伟达 AI编程模型 Jim Keller 第9张

总之，CUDA Tile是英伟达对AI编程范式的一次降维打击，通过硬件抽象化降低门槛，同时强化生态锁定。Jim Keller的质疑揭示了行业对开放性的渴望，但英伟达的野心在于引领未来计算潮流。

参考资料：https://x.com/jimkxa/status/1997732089480024498, https://developer.nvidia.com/blog/focus-on-your-algorithm-nvidia-cuda-tile-handles-the-hardware/, https://developer.nvidia.com/blog/nvidia-cuda-13-1-powers-next-gen-gpu-programming-with-nvidia-cuda-tile-and-performance-gains, https://developer.nvidia.com/blog/simplify-gpu-programming-with-nvidia-cuda-tile-in-python, https://www.tomshardware.com/tech-industry/artificial-intelligence/jim-keller-criticizes-nvidias-cuda-and-x86-cudas-a-swamp-not-a-moat-x86-was-a-swamp-too