循环拆解的实现方式 #179
Unanswered
ZHANGWENTAI
asked this question in
Q&A
循环拆解的实现方式
#179
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
在 2.4. TensorIR: 张量程序抽象案例研究 中,我看到 j_factor 采用随机的方式拆解单层循环。
我有一个想法,如果可以通过系统调用在优化前了解到当前硬件的信息:比如寄存器个数,cache line的大小、cache的级数,那么是否可以根据这些信息直接确定较好的拆解方式(循环的层数和每一层循环的大小),而不用构造搜索空间进行搜索?
另外,可否提供一些相关的参考资料,我想了解循环拆解目前的主流实现方式,感激不尽。
Beta Was this translation helpful? Give feedback.
All reactions