共计 28 篇文章
2025
nvidia gpu结构简介和cuda编程入门
pytorch各种乘法,mm, matmul, dot, @, *, mul, multiply
2024
激活函数和GLU
优化器:从SGD到Adam到AdamW
似然(likelihood)和NLLLoss
deepspeed训练模型提示:cpu_adam.so: cannot open shared object file: No such file or directory
线性代数知识回顾
pytorch分布式训练注意事项/踩坑总结 - 持续更新
pytorch调试时CUDA报错,如何精确定位
浅谈位置编码(RoPE)