Replies: 1 comment
-
1和3的实现是不一样的,因为循环方式不同导致访问内存的顺序不同。所有变换都不影响程序的正确性,只影响程序运行方式。不同的变换结果会导致程序运行速度不一样,但结果都是一样的 |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
1 最初的numpy代码实现为

2 其TVM实现为

3 然后对其做变换





1)numpy形式为
2)对应的TVM操作是
按我的理解是先对其做split操作,然后在对其做reorder
TVM实现为

3)问题:为什么对j做了split操作后,需要对其做reorder?
如果不做reorder,也行吧,其numpy实现是

我感觉1)和3)的numpy实现都是一样的,不需要对其做reorder操作吧
Beta Was this translation helpful? Give feedback.
All reactions