IVGCVSW-4597 Modify BF16 optimizer to Convert only inputs and weights of Convolution2d and FullyConnected layers * Add InsertConvertFp32ToBf16LayersBefore * Add ConvertWeight to ConvertFp32NetworkToBf16Impl for Conv2d and FullyConnected * Allow different input and output when input is BF16 and output is FP32 Conv2d and FullyConnected layers * Unit tests Signed-off-by: Narumol Prangnawarat <narumol.prangnawarat@arm.com> Change-Id: Ic8f92ff28edcae08a72a3114a28f50c4619f919b

commit: 57ef0088d20dd708ff92222d244ea02f1e1e5216 [log] [tgz]
author: Narumol Prangnawarat <narumol.prangnawarat@arm.com> Thu Mar 26 09:20:43 2020 +0000
committer: Narumol Prangnawarat <narumol.prangnawarat@arm.com> Thu Mar 26 16:16:55 2020 +0000
tree: ae11f55f6bac939a51d5182eae441d322efb3e0e
parent: 9272f8b9050096f39796227c5d89ed7b9905146d [diff] [blame]
diff --git a/src/armnn/Network.cpp b/src/armnn/Network.cpp
index 5f77197..0272b3d 100644
--- a/src/armnn/Network.cpp
+++ b/src/armnn/Network.cpp

@@ -1020,10 +1020,11 @@
     }
 
     // If Fp32 to Bf16 optimization is set convert Fp32 network to Bf16
+    // Convert input of Convolution2d and FullyConnected from Fp32 to Bf16
+    // Only Constant weight of Convolution2d and FullyConnected are converted from Fp32 to Bf16
     if (options.m_ReduceFp32ToBf16)
     {
         Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToBf16Converter()));
-        Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToBFloat()));
     }
 
     // Initialize backend settings
commit	57ef0088d20dd708ff92222d244ea02f1e1e5216	[log] [tgz]
author	Narumol Prangnawarat <narumol.prangnawarat@arm.com>	Thu Mar 26 09:20:43 2020 +0000
committer	Narumol Prangnawarat <narumol.prangnawarat@arm.com>	Thu Mar 26 16:16:55 2020 +0000
tree	ae11f55f6bac939a51d5182eae441d322efb3e0e
parent	9272f8b9050096f39796227c5d89ed7b9905146d [diff] [blame]