Skip to content

Latest commit

 

History

History
32 lines (24 loc) · 2.16 KB

README.md

File metadata and controls

32 lines (24 loc) · 2.16 KB

后端优化

《编译后端优化》后端优化作为 AI 编译器跟硬件之间的相连接的模块,更多的是算子或者 Kernel 进行优化,而优化之前需要把计算图转换称为调度树等 IR 格式,然后针对每一个算子/Kernel 进行循环优化、指令优化和内存优化等技术。

内容大纲

PPT字幕需要到 Github 下载,网页课程版链接会失效哦~

建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~

小节 链接
01 AI 编译器后端优化介绍 文章, PPT, 视频
02 算子分为计算与调度 文章, PPT, 视频
03 算子优化手工方式 文章, PPT, 视频
04 算子循环优化 文章, PPT, 视频
05 指令和内存优化 文章, PPT, 视频
06 Auto-Tuning 原理 文章, PPT, 视频

备注

文字课程开源在 AISys,系列视频托管B 站油管,PPT 开源在github,欢迎取用!!!

非常希望您也参与到这个开源课程中,B 站给 ZOMI 留言哦!

欢迎大家使用的过程中发现 bug 或者勘误直接提交代码 PR 到开源社区哦!

欢迎大家使用的过程中发现 bug 或者勘误直接提交 PR 到开源社区哦!

请大家尊重开源和 ZOMI 的努力,引用 PPT 的内容请规范转载标明出处哦!