NVIDIA
diff --git a/‎apex/contrib/conv_bias_relu/__init__.py‎
Lines changed: 1 addition & 1 deletion b/‎apex/contrib/conv_bias_relu/__init__.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎apex/contrib/conv_bias_relu/conv_bias_relu.py‎
Lines changed: 23 additions & 0 deletions b/‎apex/contrib/conv_bias_relu/conv_bias_relu.py‎
Lines changed: 23 additions & 0 deletions
@@ -1,2 +1,2 @@
-from .conv_bias_relu import ConvBiasReLU, ConvBias, ConvBiasMaskReLU 
+from .conv_bias_relu import ConvBiasReLU, ConvBias, ConvBiasMaskReLU, ConvFrozenScaleBiasReLU
 
@@ -75,7 +75,30 @@ def backward(ctx, grad_output):
         return grads[0], grads[1], grads[2], None, None
 
 
+class ConvFrozenScaleBiasReLU_(torch.autograd.Function):
+    @staticmethod
+    @torch.cuda.amp.custom_fwd(cast_inputs=torch.half)
+    def forward(ctx, x, weight, scale, bias, padding, stride):
+        output = fused_conv_bias_relu.forward_cscale_cbias_relu([x, weight, scale, bias], padding, stride)
+        ctx.save_for_backward(x, weight, scale, output)
+        ctx.padding = padding
+        ctx.stride = stride
+
+        return output
+
+    @staticmethod
+    @torch.cuda.amp.custom_bwd
+    def backward(ctx, grad_output):
+        bwd_args = [*ctx.saved_tensors, grad_output]
+        padding = ctx.padding
+        stride = ctx.stride
+        grads = fused_conv_bias_relu.backward_cscale_cbias_relu(bwd_args, padding, stride)
+
+        return grads[0], grads[1], None, None, None, None
+
+
 ConvBiasReLU = ConvBiasReLU_.apply
 ConvBiasMaskReLU = ConvBiasMaskReLU_.apply
 ConvBias = ConvBias_.apply
+ConvFrozenScaleBiasReLU = ConvFrozenScaleBiasReLU_.apply
Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,2 @@`
`1`		`-from .conv_bias_relu import ConvBiasReLU, ConvBias, ConvBiasMaskReLU`
	`1`	`+from .conv_bias_relu import ConvBiasReLU, ConvBias, ConvBiasMaskReLU, ConvFrozenScaleBiasReLU`
`2`	`2`