只需百行代码,让H100提速30%,斯坦福开源全新AI加速框架 文章用大量篇幅讨论了如何让 GPU 更快的运行,并发布了一个库 ThunderKittens,用户可以很容易地在 CUDA 上编写快速的深度学习内核。 AI资讯# A100# AI# aigc 22小时前4