Optimize add layer by considering the input tensors as 1D array Resolves: COMPMID-5108 Change-Id: I544f8160fbe5b4ffbef348d1fbd3dd626a6e1bdb Signed-off-by: Gunes Bayir <gunes.bayir@arm.com> Reviewed-on: https://review.mlplatform.org/c/ml/ComputeLibrary/+/8002 Reviewed-by: Gian Marco Iodice <gianmarco.iodice@arm.com> Comments-Addressed: Arm Jenkins <bsgcomp@arm.com> Benchmark: Arm Jenkins <bsgcomp@arm.com> Tested-by: Arm Jenkins <bsgcomp@arm.com>

commit: 9b921be1ff7283050eb39d9ce1b10b5c8bfc1300 [log] [tgz]
author: Gunes Bayir <gunes.bayir@arm.com> Thu Jul 28 17:44:00 2022 +0100
committer: Gunes Bayir <gunes.bayir@arm.com> Mon Aug 01 20:13:56 2022 +0000
tree: 0cb274a6c529717b8ef987aa3e270647927e9d89
parent: 385dad2bffecbf395aa9aad257809de81c727ac7 [diff] [blame]
diff --git a/src/cpu/kernels/add/generic/neon/fp16.cpp b/src/cpu/kernels/add/generic/neon/fp16.cpp
index 12d4a46..bb6636a 100644
--- a/src/cpu/kernels/add/generic/neon/fp16.cpp
+++ b/src/cpu/kernels/add/generic/neon/fp16.cpp

@@ -1,5 +1,5 @@
 /*
- * Copyright (c) 2021 Arm Limited.
+ * Copyright (c) 2021-2022 Arm Limited.
  *
  * SPDX-License-Identifier: MIT
  *
@@ -33,6 +33,11 @@
 {
     return add_same_neon<float16_t>(src0, src1, dst, policy, window);
 }
+
+void add_fp16_neon_as_1d_array(const ITensor *src0, const ITensor *src1, ITensor *dst, const ConvertPolicy &policy, const Window &window)
+{
+    return add_same_neon_as_1d_array<float16_t>(src0, src1, dst, policy, window);
+}
 }
 } // namespace arm_compute
 #endif /* (__ARM_FEATURE_FP16_VECTOR_ARITHMETIC) && defined(ENABLE_FP16_KERNELS) */
commit	9b921be1ff7283050eb39d9ce1b10b5c8bfc1300	[log] [tgz]
author	Gunes Bayir <gunes.bayir@arm.com>	Thu Jul 28 17:44:00 2022 +0100
committer	Gunes Bayir <gunes.bayir@arm.com>	Mon Aug 01 20:13:56 2022 +0000
tree	0cb274a6c529717b8ef987aa3e270647927e9d89
parent	385dad2bffecbf395aa9aad257809de81c727ac7 [diff] [blame]