Add SME2 implementation of softmax for FP32 Signed-off-by: Viet-Hoa Do <viet-hoa.do@arm.com> Change-Id: I8a63610cfb9ccff89dec6045d023439fc19b027a Reviewed-on: https://review.mlplatform.org/c/ml/ComputeLibrary/+/11357 Tested-by: Arm Jenkins <bsgcomp@arm.com> Reviewed-by: Gunes Bayir <gunes.bayir@arm.com> Comments-Addressed: Arm Jenkins <bsgcomp@arm.com> Benchmark: Arm Jenkins <bsgcomp@arm.com>

commit: 77bbe2e08b0376edfd3f504950be7f4b5720eeb0 [log] [tgz]
author: Viet-Hoa Do <viet-hoa.do@arm.com> Wed Dec 06 11:01:15 2023 +0000
committer: Omar Al Khatib <omar.alkhatib@arm.com> Tue Apr 02 09:25:23 2024 +0000
tree: 153e4298e569565f5293017b19a22e3fb5718bbe
parent: 905786ea0c1abb2b8df36c56eae93a97823cace1 [diff] [blame]
diff --git a/docs/user_guide/release_version_and_change_log.dox b/docs/user_guide/release_version_and_change_log.dox
index 31b7560..aa27c2b 100644
--- a/docs/user_guide/release_version_and_change_log.dox
+++ b/docs/user_guide/release_version_and_change_log.dox

@@ -45,6 +45,7 @@
  - Add Bfloat16 data type support for @ref NEMatMul.
  - Optimize start-up time of @ref NEConvolutionLayer for some input configurations where GeMM is selected as the convolution algorithm
  - Optimize @ref NEConvolutionLayer for input tensor size > 1e7 bytes and weight tensor height > 7
+ - Add support for SoftMax in SME2 for FP32.
  - Performance optimizations:
    - Optimize @ref NESoftmaxLayer for axis != 0 by natively supporting higher axes up to axis 3.
commit	77bbe2e08b0376edfd3f504950be7f4b5720eeb0	[log] [tgz]
author	Viet-Hoa Do <viet-hoa.do@arm.com>	Wed Dec 06 11:01:15 2023 +0000
committer	Omar Al Khatib <omar.alkhatib@arm.com>	Tue Apr 02 09:25:23 2024 +0000
tree	153e4298e569565f5293017b19a22e3fb5718bbe
parent	905786ea0c1abb2b8df36c56eae93a97823cace1 [diff] [blame]