LLM/AI 技术探索、源码解析、学习笔记

文章 Alignment CS336 Data DeepSeek Evaluation GPU Inference LLM MoE PyTorch RLHF RLVR SFT Scaling Laws Tokenization Transformer muP 学习笔记 并行训练 性能优化 投机采样 推理优化 源码解析 硅谷101