[ONCPUML-1451] Add matmul kernel to enable bf16 to bf16 operations via PyTorch® autocast() function The full range of tests must be added with [MLINFSW-482] epic due to the lack of reordering kernels implemented in Acl. Co-Authored-By: David Mansell <David.Mansell@arm.com> Change-Id: I820d316295a1ec94fdc89c37e4144a268f914c36 Signed-off-by: Renato Arantes <renato.arantes@arm.com> Reviewed-on: https://review.mlplatform.org/c/ml/ComputeLibrary/+/11169 Tested-by: Arm Jenkins <bsgcomp@arm.com> Reviewed-by: Gunes Bayir <gunes.bayir@arm.com> Comments-Addressed: Arm Jenkins <bsgcomp@arm.com> Benchmark: Arm Jenkins <bsgcomp@arm.com>

commit: 36a75dafdbe6d6a3a6f50bd075fe01f5b7dace38 [log] [tgz]
author: Renato Arantes <renato.arantes@arm.com> Fri Jan 26 17:31:18 2024 +0000
committer: Renato Barros Arantes <renato.arantes@arm.com> Thu Mar 21 11:15:30 2024 +0000
tree: 0701d615ef30444b9d0789db691b59b81fd9e86e
parent: d2191150736dde66d79eb97e0c8ee506eef3c8fc [diff] [blame]
diff --git a/filelist.json b/filelist.json
index d44a721..9f0f302 100644
--- a/filelist.json
+++ b/filelist.json

@@ -1586,6 +1586,7 @@
               "src/core/NEON/kernels/arm_gemm/gemm_bf16.cpp",
               "src/core/NEON/kernels/arm_gemm/gemm_fp16.cpp",
               "src/core/NEON/kernels/arm_gemm/gemm_fp32.cpp",
+              "src/core/NEON/kernels/arm_gemm/gemm_bf16bf16.cpp",
               "src/core/NEON/kernels/arm_gemm/gemm_int16.cpp",
               "src/core/NEON/kernels/arm_gemm/gemm_int8.cpp",
               "src/core/NEON/kernels/arm_gemm/gemm_qint8.cpp",
commit	36a75dafdbe6d6a3a6f50bd075fe01f5b7dace38	[log] [tgz]
author	Renato Arantes <renato.arantes@arm.com>	Fri Jan 26 17:31:18 2024 +0000
committer	Renato Barros Arantes <renato.arantes@arm.com>	Thu Mar 21 11:15:30 2024 +0000
tree	0701d615ef30444b9d0789db691b59b81fd9e86e
parent	d2191150736dde66d79eb97e0c8ee506eef3c8fc [diff] [blame]