debug
使用 Tinker 诊断训练问题 — 缓慢的步骤、挂起的会话、输出不匹配、错误消息、渲染器问题和部署问题。每当用户报告训练速度慢、步骤花费太长、会话挂起、Tinker 和外部引擎(vLLM、SGLang)之间的模型输出不同、他们收到令人困惑的错误消息、训练质量差(高 KL、糟糕的输出)或者他们怀疑出现问题时,请使用此技能。当用户询问“这是 Tinker 问题还是我的问题?”、“Tinker 停机了吗?”、报告意外等待时间、查看输出质量回归、获得不透明错误或想要分析/调试其训练或部署管道时,也会触发。该技能通过系统分类来确定根本原因。
更新日志: Source: GitHub https://github.com/thinking-machines-lab/tinker-cookbook
评论加载中...