diffusion-engineering
扩散模型的实用工程:架构、训练、推理、内存优化。用于具有扩散模型的任何任务:设计或修改架构(UNet/DiT/Flow/Flux)、调度器/采样器的选择和配置、附加训练(LoRA/DreamBooth/完全微调)、内存优化(AMP/检查点/ZeRO/FSDP/量化)、文本编码器的替换或融合(CLIP/Qwen)、使用扩散器、调试扩散管道、质量评估(FID/CLIPScore/LPIPS)、潜扩散、VAE、引导/CFG、整流流、稳定扩散、SDXL、通量。在训练生成模型、文本到图像管道、ControlNet、多编码器融合、WebDataset 时询问有关 GPU 内存的问题时也可使用。 --- # 扩散工程技能 ## 快速定位 最影响质量/速度/成本的三个工程决策是: 1. **扩散在哪里** → 像素(昂贵)或潜在空间(LDM/SD 系列 - 实用) 2. **降噪器的骨干** → UNet(经典,更简单)或 Transformer/DiT/Flow(缩放更好) 3. **采样控制** → 调度程序、步骤数、guiding_scale - 通常提供的不仅仅是编辑网络 --- ## 参考文件 - 按任务读取 |主题 |文件|何时阅读 | |---|---|---| |架构和数据流| `references/architectures.md` | DDPM/SDE/LDM/DiT/Flux/VAE/SDXL,管道图| |调度程序和指导| `references/samplers.md` | DDIM/Euler/Heun/DPM-Solver/PNDM、CFG、预测类型 | |培训和进修| `参考文献/training.md` |损失/目标、LoRA/DreamBooth/full FT、超参数 | |内存和分布| `引用/内存.md` | AMP、检查点、ZeRO、FSDP、量化、FP8 | |文本编码器和数据 | `references/encoders-data.md` | CLIP/Qwen/多编码器、标记化、数据管道 | |评估和故障排除 | `references/eval-debug.md` | FID/CLIPScore/LPIPS、典型故障和修复、许可证 | --- ## 快速清单“我正在构建/修改 diffusio n» - [ ] **Backbo
更新日志: Source: GitHub https://github.com/AnastasiyaW/claude-code-skills
还没有评论,快来第一个发言吧。