[MLBEDSW-2846] Do not use NHCWB16 for reduce_sum int32 Added checks for not using NHCWB16 for reduce_sum int32 which makes int8/uint8 softmax work. Also enabled softmax graph rewrite by default and fixed a saturation problem. Change-Id: Ic01bd9ece7e5c3edb2900b7915cc747efe9e5760 Signed-off-by: Fredrik Svedberg <fredrik.svedberg@arm.com>

commit: 880e73543120648f08886365a45e8b2ce32d5ff1 [log] [tgz]
author: Fredrik Svedberg <fredrik.svedberg@arm.com> Tue Aug 25 11:31:47 2020 +0200
committer: Fredrik Svedberg <fredrik.svedberg@arm.com> Thu Aug 27 16:39:29 2020 +0200
tree: 420627fb8e7e5000f23f82c52ba6569f4a696813
parent: a41cd4de2af1e43b76a2a33d78eeb2d90a88b757 [diff] [blame]
diff --git a/ethosu/vela/supported_operators.py b/ethosu/vela/supported_operators.py
index 567c05c..f57cbee 100644
--- a/ethosu/vela/supported_operators.py
+++ b/ethosu/vela/supported_operators.py

@@ -22,8 +22,7 @@
 
 
 class SupportedOperators:
-    def __init__(self, softmax_support):
-        self.softmax_support = softmax_support
+    def __init__(self):
         # Categorised lists of supported operators
         self.npu_pre_ops = set(("QuantizedResizeBilinear", "SplitSliceRead",))
         self.convolution_ops = set(("Conv2DBiasAct", "Conv2D", "QuantizedConv2D",))
@@ -393,9 +392,6 @@
 
     def check_activation_ops(self, op):
         if op.type == "Softmax":
-            if not self.softmax_support:
-                return False
-
             ifm_tensor = op.inputs[0]
             ofm_tensor = op.outputs[0]
commit	880e73543120648f08886365a45e8b2ce32d5ff1	[log] [tgz]
author	Fredrik Svedberg <fredrik.svedberg@arm.com>	Tue Aug 25 11:31:47 2020 +0200
committer	Fredrik Svedberg <fredrik.svedberg@arm.com>	Thu Aug 27 16:39:29 2020 +0200
tree	420627fb8e7e5000f23f82c52ba6569f4a696813
parent	a41cd4de2af1e43b76a2a33d78eeb2d90a88b757 [diff] [blame]