网站地图官方微信:
网站首页 文安县 郊区 博兴县 八江镇 漠沙镇 楼观镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 如何评价极目新闻批判《捞女游戏》,认为靠性别对立捞流量? |

    极目锐评丨《捞女游戏》制作人B站账号被封,靠性别对立“捞”流...

    查看详情>>
  • | 继续C++还是转前端? |

  • | 为什么Dreamwe***er,FrontPage会被淘汰? |

  • | 如何评价「尖叫」这种饮料? |

  • | 如何评价祝绪丹在《五哈》第十期的表现? |

  • | 如何看待使用mac mini当7*24h的服务器? |

  • | Linux 内核的系统有没有类似macOS 那样漂亮流畅的桌面环境的发行版本? |

  • | 为什么windows的arm版没有被广泛使用? |

  • | 你见过最上进的人是怎样的? |

  • | duckdb的性能如何? |

  • | 如何评价中国电科研发的JY-10防空指挥控制系统成为伊朗防空指挥系统核心? |

  • NO.10 F/A18经典虫(个人认为比超虫好看) ...

    2025-06-21
  • 本文通过对Cloudflare的创立故事及其招股书中两个双轮...

    2025-06-21
  • 伊朗终于把压箱底的宝贝拿了出来。 看这诡异的运行曲线,...

    2025-06-20
  • 黑公关们尽快转行回数码区吧,再闹就该进去了! 《求是》杂志作...

    2025-06-20

关注我们

添加微信好友,关注最新动态