unsloth-buddy
当用户想要使用高度优化的 Unsloth 库微调语言模型或执行强化学习(SFT、DPO、GRPO、ORPO、KTO、SimPO)时,应该使用此技能。涵盖环境设置、LoRA 修补、VRAM 优化、视觉/多模态微调、TTS、嵌入训练和 GGUF/vLLM/Ollama 部署。应该在涉及快速、内存高效的本地或云 GPU 训练的任务中调用,特别是当用户提到 Unsloth 或硬件限制妨碍标准训练时。
更新日志: Source: GitHub https://github.com/TYH-labs/unsloth-buddy
还没有评论,快来第一个发言吧。