AI Infra(MLsys)共1篇
AI Infra/machine learning system 相关
【AI Infra/MLsys】CMU 10-714 Needle:训练 PTB 爆显存?深扒 Python GC 与 GPU 显存的“跨服交流障碍”-Crzax的博客

【AI Infra/MLsys】CMU 10-714 Needle:训练 PTB 爆显存?深扒 Python GC 与 GPU 显存的“跨服交流障碍”

关键词:Needle, AI Infra, Python GC, Reference Cycle, CUDA OOM, Memory Leak 0. 背景 前两个月听学长建议,下定决心转 AI Infra 方向。为了快速补齐系统知识并准备实习面试,我花了半个月时...
Crzax的头像-Crzax的博客钻石会员Crzax8小时前
0606