Add cudnn_batch_norm decomposition to default nvfuser decompositions (#661)

anijain2305 · web-flow · commit 015f8b63218a · 2022-04-06T10:13:51.000-07:00
* Add cudnn_batch_norm decomposition to default nvfuser decompositions

* Comments

* Revert zeros change

* Using new_zeros
diff --git a/functorch/_src/compilers.py b/functorch/_src/compilers.py
@@ -265,6 +265,8 @@ def nnc_jit(f, static_argnums=None):
         aten.hardswish_backward,
         aten.tanh_backward,
         aten.silu_backward,
+        aten.cudnn_batch_norm,
+        aten.cudnn_batch_norm_backward,
     ]
 )
 default_decompositions = get_decompositions(default_decompositions)
diff --git a/functorch/_src/decompositions.py b/functorch/_src/decompositions.py
@@ -580,11 +580,15 @@ def detach_decomposition(x):
     return x
 
 
-# @register_decomposition(aten.cudnn_batch_norm)
-# def cudnn_batch_norm(input: Tensor, weight: Tensor, bias: Optional[Tensor], running_mean: Optional[Tensor], running_var: Optional[Tensor], training: bool, exponential_average_factor: float, epsilon: float):
-#     a, b, c = aten.native_batch_norm(input, weight, bias, running_mean, running_var, training, exponential_average_factor, epsilon)
-#     return (a,b, c, aten.new_empty(input, (1,)))
-
-# @register_decomposition(aten.cudnn_batch_norm_backward)
-# def cudnn_batch_norm_backward(input: Tensor, grad_output: Tensor, weight: Tensor, running_mean: Optional[Tensor], running_var: Optional[Tensor], save_mean: Optional[Tensor], save_var: Optional[Tensor], epsilon: float, reserveSpace: Tensor):
-#     return aten.native_batch_norm_backward(grad_output, input, weight, running_mean, running_var, save_mean, save_var, True, epsilon, [True, True, True])
+@register_decomposition(aten.cudnn_batch_norm)
+def cudnn_batch_norm(input: Tensor, weight: Tensor, bias: Optional[Tensor], running_mean: Optional[Tensor], running_var: Optional[Tensor], training: bool, exponential_average_factor: float, epsilon: float):
+    a, b, c = aten.native_batch_norm(input, weight, bias, running_mean, running_var, training, exponential_average_factor, epsilon)
+    # Cudnn return running mean and variance when training is True
+    if training:
+        return (a, b, c, input.new_zeros((1,)))
+    return (a, input.new_zeros((1,)), input.new_zeros((1,)), input.new_zeros((1,)))
+
+
+@register_decomposition(aten.cudnn_batch_norm_backward)
+def cudnn_batch_norm_backward(input: Tensor, grad_output: Tensor, weight: Tensor, running_mean: Optional[Tensor], running_var: Optional[Tensor], save_mean: Optional[Tensor], save_var: Optional[Tensor], epsilon: float, reserveSpace: Tensor):
+    return aten.native_batch_norm_backward(grad_output, input, weight, running_mean, running_var, save_mean, save_var, True, epsilon, [True, True, True])

Original file line number	Diff line number	Diff line change
`@@ -265,6 +265,8 @@ def nnc_jit(f, static_argnums=None):`
`265`	`265`	`aten.hardswish_backward,`
`266`	`266`	`aten.tanh_backward,`
`267`	`267`	`aten.silu_backward,`
	`268`	`+ aten.cudnn_batch_norm,`
	`269`	`+ aten.cudnn_batch_norm_backward,`
`268`	`270`	`]`
`269`	`271`	`)`
`270`	`272`	`default_decompositions = get_decompositions(default_decompositions)`