cuda-skill

分类: 开发与编程 | 上传者: windog-labswindog-labs | 下载: 0 | 版本: v1.0(最新)

查询 NVIDIA PTX ISA 9.1、CUDA Runtime API 13.1、Driver API 13.1、编程指南 v13.1、最佳实践指南、Nsight Compute、Nsight Systems 本地文档。使用 nsys/ncu/compute-sanitizer 工作流程调试和优化 GPU 内核。包括 T4、A100、H100、A800、RTX 3060 和 Jetson Orin 的硬件快速指南。在编写、调试或优化 CUDA 代码、GPU 内核、PTX 指令、内联 PTX、TensorCore 操作(WMMA、WGMMA、TMA、tcgen05)时,或者当用户提及 CUDA API 函数、错误代码、设备属性、内存管理、分析、GPU 性能、计算功能、CUDA 图形、协作组、统一内存、动态并行性或 CUDA 编程模型概念时使用。

更新日志: Source: GitHub https://github.com/windog-labs/edge-fm-x

目录结构

当前层级: tree/master/.codex/skills/cuda-skill/

  • 📄 SKILL.md 19.4 KB

SKILL.md

登录后下载/点赞/收藏 ❤ 14 | ★ 0
评论 0

请先登录后评论。

评论加载中...