Article

post_img

算子融合fusion

摘要

1. 啥是fusion fusion我们简单理解: MLIR中提供的算子fusion机制,并且经常使用的fusion处于linal …

post_img

cpu cache 详解

摘要

  Cache Associativity – Algorithmica CPU cache会十分影响程序的实际性能表现 …

post_img

mlir设计原则

摘要

不愧是长期搞compiler的,有很深的洞见。现在的compiler设计思路耦合行太强,灵活度不够。比如很多compiler设计时 …

post_img

mlir造轮子动机

摘要

  这帮大佬搞类似tensorflow 机器学习框架时,框架的底层通常由各种不同的编译器组建构成。比如上图中的图优化,各 …