cuda-skill
查询 NVIDIA PTX ISA 9.1、CUDA Runtime API 13.1、Driver API 13.1、编程指南 v13.1、最佳实践指南、Nsight Compute、Nsight Systems 本地文档。使用 nsys/ncu/compute-sanitizer 工作流程调试和优化 GPU 内核。包括 T4、A100、H100、A800、RTX 3060 和 Jetson Orin 的硬件快速指南。在编写、调试或优化 CUDA 代码、GPU 内核、PTX 指令、内联 PTX、TensorCore 操作(WMMA、WGMMA、TMA、tcgen05)时,或者当用户提及 CUDA API 函数、错误代码、设备属性、内存管理、分析、GPU 性能、计算功能、CUDA 图形、协作组、统一内存、动态并行性或 CUDA 编程模型概念时使用。
更新日志: Source: GitHub https://github.com/windog-labs/edge-fm-x
评论加载中...