Blame - docs/user_guide/release_version_and_change_log.dox - ml/ComputeLibrary

blob: a82520a5b2fb4a4d9808408869bd9869eebbd606 [file] [log] [blame]

Vidhya Sudhan Loganathan	d646ae1	2018-11-19 15:18:20 +0000	[diff] [blame]	1	///
Jonathan Deakin	2db938c	2024-02-05 15:32:31 +0000	[diff] [blame]	2	/// Copyright (c) 2017-2024 Arm Limited.
Vidhya Sudhan Loganathan	d646ae1	2018-11-19 15:18:20 +0000	[diff] [blame]	3	///
				4	/// SPDX-License-Identifier: MIT
				5	///
				6	/// Permission is hereby granted, free of charge, to any person obtaining a copy
				7	/// of this software and associated documentation files (the "Software"), to
				8	/// deal in the Software without restriction, including without limitation the
				9	/// rights to use, copy, modify, merge, publish, distribute, sublicense, and/or
				10	/// sell copies of the Software, and to permit persons to whom the Software is
				11	/// furnished to do so, subject to the following conditions:
				12	///
				13	/// The above copyright notice and this permission notice shall be included in all
				14	/// copies or substantial portions of the Software.
				15	///
				16	/// THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
				17	/// IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
				18	/// FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
				19	/// AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
				20	/// LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
				21	/// OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
				22	/// SOFTWARE.
				23	///
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	24	namespace arm_compute
				25	{
Sheri Zhang	d813bab	2021-04-30 16:53:41 +0100	[diff] [blame]	26	/** @page versions_changelogs Release Versions and Changelog
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	27
				28	@tableofcontents
				29
Sheri Zhang	d813bab	2021-04-30 16:53:41 +0100	[diff] [blame]	30	@section S2_1_versions Release versions
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	31
				32	All releases are numbered vYY.MM Where YY are the last two digits of the year, and MM the month number.
				33	If there is more than one release in a month then an extra sequential number is appended at the end:
				34
				35	v17.03 (First release of March 2017)
				36	v17.03.1 (Second release of March 2017)
				37	v17.04 (First release of April 2017)
				38
				39	@note We're aiming at releasing one major public release with new features per quarter. All releases in between will only contain bug fixes.
Ramy Elgammal	fa8ff8e	2022-08-12 16:57:10 +0100	[diff] [blame]	40	@note Starting from release 22.05, 'master' branch is no longer being used, it has been replaced by 'main'. Please update your clone jobs accordingly.
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	41
Sheri Zhang	d813bab	2021-04-30 16:53:41 +0100	[diff] [blame]	42	@section S2_2_changelog Changelog
Pablo Marquez Tello	29e27b0	2023-08-03 14:47:31 +0100	[diff] [blame]	43
Michael Tyler	fc94f4d	2024-06-04 15:47:37 +0100	[diff] [blame^]	44	v24.07 Public major release
				45	- Add support for mixed sign quantized convolution.
				46	- Add support for mixed sign dequantized GEMM.
				47	- Add SME FP16 GEMV kernel.
				48	- Change SME vector length function to use RDSVL instead of static variable.
				49	- Remove unused "get_default_activation_values" functions.
				50	- Add SVE fixed format interleaved BF16 DOT kernel.
				51	- Updates and optimizations to assembly kernels.
				52
Ramy Elgammal	e8f2813	2024-06-12 18:22:57 +0100	[diff] [blame]	53	v24.06 Public minor release
				54	- Enable FP16 in multiple Neon™ kernels for multi_isa + v8a
				55	- Fix OpenMP® thread scheduling for large machine
Gunes Bayir	ab538a2	2024-05-21 15:39:54 +0100	[diff] [blame]	56	- Optimize CPU activation functions using LUT-based implementation:
				57	- Tanh function for FP16.
				58
Gunes Bayir	ada3200	2024-04-24 10:27:13 +0100	[diff] [blame]	59	v24.05 Public major release
Gunes Bayir	301e33f	2024-04-29 17:00:14 +0100	[diff] [blame]	60	- Add @ref CLScatter operator for FP32/16, S32/16/8, U32/16/8 data types
Ramy Elgammal	b4b61a6	2024-05-14 15:21:07 +0100	[diff] [blame]	61	- Various fixes to enable FP16 kernels in armv8a multi_isa builds.
Omar Al Khatib	f5053f7	2024-05-09 16:06:23 +0100	[diff] [blame]	62	- Updated logic in the OpenMP scheduler to exclude LITTLE cores.
Gunes Bayir	ada3200	2024-04-24 10:27:13 +0100	[diff] [blame]	63
Gunes Bayir	ef63739	2024-02-12 21:32:51 +0000	[diff] [blame]	64	v24.04 Public major release
Renato Arantes	36a75da	2024-01-26 17:31:18 +0000	[diff] [blame]	65	- Add Bfloat16 data type support for @ref NEMatMul.
Omar Al Khatib	c1575b2	2024-04-23 16:26:56 +0100	[diff] [blame]	66	- Add support for SoftMax in SME2 for FP32, FP16, QASYMM8 and QASYMM8_SIGNED.
Radu Salavat	f1f1f87	2024-02-27 18:32:26 +0000	[diff] [blame]	67	- Add support for in place accumulation to CPU GEMM kernels.
Jonathan Deakin	a668f9f	2024-01-24 09:15:38 +0000	[diff] [blame]	68	- Add low-precision Int8 * Int8 -> FP32 CPU GEMM which dequantizes after multiplication
				69	- Add is_dynamic flag to QuantizationInfo to signal to operators that it may change after configuration
Michael Kozlov	5057ce9	2024-04-17 14:34:46 +0100	[diff] [blame]	70	- Performance optimizations:
				71	- Optimize start-up time of @ref NEConvolutionLayer for some input configurations where GeMM is selected as the convolution algorithm
				72	- Optimize @ref NEConvolutionLayer for input tensor size > 1e7 bytes and weight tensor height > 7
				73	- Optimize @ref NESoftmaxLayer for axis != 0 by natively supporting higher axes up to axis 3.
Gunes Bayir	ef63739	2024-02-12 21:32:51 +0000	[diff] [blame]	74
Felix Thomasmathibalan	d0611c1	2024-03-08 15:34:58 +0000	[diff] [blame]	75	v24.02.1 Public patch release
				76	- Fix performance regression in fixed-format kernels
				77	- Fix compile and runtime errors in arm_compute_validation for Windows on Arm(WoA)
				78
Jonathan Deakin	2db938c	2024-02-05 15:32:31 +0000	[diff] [blame]	79	v24.02 Public major release
Felix Thomasmathibalan	d98e27e	2024-02-12 13:48:29 +0000	[diff] [blame]	80	- Replace template writer with compute kernel writer in dynamic fusion.
Jonathan Deakin	2db938c	2024-02-05 15:32:31 +0000	[diff] [blame]	81	- Performance optimizations:
				82	- Parallelize @ref NEDepthwiseConvolutionLayer over batches if there is only 1 row
				83
Jakub Sujak	e30c874	2023-11-13 14:57:16 +0000	[diff] [blame]	84	v24.01 Public major release
				85	- Remove the legacy 'libarm_compute_core' library. This library is an artifact of Compute Library's legacy library architecture and no longer serves any purpose.
				86	You should link only to the main `libarm_compute` library for core functionality.
Gunes Bayir	85cafff	2023-12-18 13:29:31 +0000	[diff] [blame]	87	- Expand GPUTarget list with Mali™ G720 and G620.
Mohammed Suhail Munshi	7467ba8	2023-12-05 14:27:31 +0000	[diff] [blame]	88	- Optimize CPU activation functions using LUT-based implementation:
				89	- Sigmoid function for FP16.
Pablo Marquez Tello	9f7aca9	2023-08-16 15:21:44 +0100	[diff] [blame]	90	- New features
				91	- Add support for FP16 in all multi_isa builds.
Gunes Bayir	fadc9b1	2023-11-07 05:43:07 +0000	[diff] [blame]	92	- Performance optimizations:
				93	- Optimize @ref NESoftmaxLayer
Viet-Hoa Do	4737094	2023-11-13 17:20:45 +0000	[diff] [blame]	94	- Optimize @ref NEDepthToSpaceLayer.
Jakub Sujak	e30c874	2023-11-13 14:57:16 +0000	[diff] [blame]	95
Pablo Marquez Tello	29e27b0	2023-08-03 14:47:31 +0100	[diff] [blame]	96	v23.11 Public major release
Viet-Hoa Do	633ebd1	2023-08-11 12:27:59 +0100	[diff] [blame]	97	- New features
Pablo Marquez Tello	29e27b0	2023-08-03 14:47:31 +0100	[diff] [blame]	98	- Add support for input data type U64/S64 in CLCast and NECast.
				99	- Add support for output data type S64 in NEArgMinMaxLayer and CLArgMinMaxLayer
Gunes Bayir	91cb733	2023-07-25 17:00:33 +0100	[diff] [blame]	100	- Port the following kernels in the experimental Dynamic Fusion interface to use the new Compute Kernel Writer interface:
				101	- @ref experimental::dynamic_fusion::GpuCkwResize
ramy.elgammal@arm.com	a04ae3e	2023-07-27 18:23:17 +0100	[diff] [blame]	102	- @ref experimental::dynamic_fusion::GpuCkwPool2d
				103	- @ref experimental::dynamic_fusion::GpuCkwDepthwiseConv2d
Adnan AlSinan	fde45d8	2023-10-24 12:03:21 +0100	[diff] [blame]	104	- @ref experimental::dynamic_fusion::GpuCkwMatMul
Viet-Hoa Do	500e10b	2023-09-12 17:49:38 +0100	[diff] [blame]	105	- Add support for OpenCL™ comand buffer with mutable dispatch extension.
Anitha Raj	38eb5fb	2023-11-13 14:55:40 +0000	[diff] [blame]	106	- Add support for Arm® Cortex®-A520 and Arm® Cortex®-R82.
				107	- Add support for negative axis values and inverted axis values in @ref arm_compute::NEReverse and @ref arm_compute::CLReverse.
				108	- Add new OpenCL™ kernels:
				109	- @ref opencl::kernels::ClMatMulLowpNativeMMULKernel support for QASYMM8 and QASYMM8_SIGNED, with batch support
Anitha Raj	eb5696d	2023-07-14 11:19:34 +0100	[diff] [blame]	110	- Performance optimizations:
David Mansell	1b2ee3e	2023-08-22 13:27:03 +0100	[diff] [blame]	111	- Optimize @ref cpu::CpuReshape
Jakub Sujak	a23b468	2023-10-05 10:20:59 +0100	[diff] [blame]	112	- Optimize @ref opencl::ClTranspose
Gunes Bayir	0b72aa4	2023-10-07 23:52:48 +0100	[diff] [blame]	113	- Optimize @ref NEStackLayer
Viet-Hoa Do	c210c85	2023-10-09 10:58:35 +0100	[diff] [blame]	114	- Optimize @ref CLReductionOperation.
Viet-Hoa Do	29254ae	2023-10-13 17:40:32 +0100	[diff] [blame]	115	- Optimize @ref CLSoftmaxLayer.
SiCong Li	c5ab4df	2023-10-17 17:38:57 +0100	[diff] [blame]	116	- Optimize start-up time of @ref NEConvolutionLayer for some input configurations where GeMM is selected as the convolution algorithm
Anitha Raj	38eb5fb	2023-11-13 14:55:40 +0000	[diff] [blame]	117	- Reduce CPU Overhead by optimal flushing of CL kernels.
Adnan AlSinan	40a9d3e	2023-09-15 13:46:17 +0100	[diff] [blame]	118	- Deprecate support for Bfloat16 in @ref cpu::CpuCast.
Adnan AlSinan	704c22f	2023-10-24 11:05:56 +0100	[diff] [blame]	119	- Support for U32 axis in @ref arm_compute::NEReverse and @ref arm_compute::CLReverse will be deprecated in 24.02.
Anitha Raj	38eb5fb	2023-11-13 14:55:40 +0000	[diff] [blame]	120	- Remove legacy PostOps interface. PostOps was the experimental interface for kernel fusion and is replaced by the new Dynamic Fusion interface.
				121	- Update OpenCL™ API headers to v2023.04.17
Pablo Marquez Tello	29e27b0	2023-08-03 14:47:31 +0100	[diff] [blame]	122
Jakub Sujak	59b9ff0	2023-06-11 21:35:11 +0100	[diff] [blame]	123	v23.08 Public major release
				124	- Deprecate the legacy 'libarm_compute_core' library. This library is an artifact of Compute Library's legacy library architecture and no longer serves any purpose.
				125	Users must no longer link their applications to this library and instead link only to the main `libarm_compute` library for core functionality.
Ramy Elgammal	c952596	2023-05-19 14:23:37 +0100	[diff] [blame]	126	- New features
ramy.elgammal@arm.com	11b23f7	2023-08-09 15:38:03 +0100	[diff] [blame]	127	- Rewrite CLArgMinMaxLayer for axis 0 and enable S64 output.
				128	- Add multi-sketch support for dynamic fusion.
				129	- Break up arm_compute/core/Types.h and utils/Utils.h a bit to reduce unused code in each inclusion of these headers.
				130	- Add Fused Activation to CLMatMul.
				131	- Implement FP32/FP16 @ref opencl::kernels::ClMatMulNativeMMULKernel using the MMUL extension.
				132	- Use MatMul in fully connected layer with dynamic weights when supported.
				133	- Optimize CPU depthwise convolution with channel multiplier.
				134	- Add support in CpuCastKernel for conversion of S64/U64 to F32.
Ramy Elgammal	c952596	2023-05-19 14:23:37 +0100	[diff] [blame]	135	- Add new OpenCL™ kernels:
				136	- @ref opencl::kernels::ClMatMulNativeMMULKernel support for FP32 and FP16, with batch support
Viet-Hoa Do	019a7d9	2023-06-27 16:33:57 +0100	[diff] [blame]	137	- Enable transposed convolution with non-square kernels on CPU and GPU.
ramy.elgammal@arm.com	11b23f7	2023-08-09 15:38:03 +0100	[diff] [blame]	138	- Add support for input data type U64/S64 in CLCast.
				139	- Add new Compute Kernel Writer (CKW) subproject that offers a C++ interface to generate tile-based OpenCL code in just-in-time fashion.
Jakub Sujak	e1c96e7	2023-07-31 13:36:58 +0100	[diff] [blame]	140	- Port the following kernels in the experimental Dynamic Fusion interface to use the new Compute Kernel Writer interface with support for FP16/FP32 only:
				141	- @ref experimental::dynamic_fusion::GpuCkwActivation
				142	- @ref experimental::dynamic_fusion::GpuCkwCast
				143	- @ref experimental::dynamic_fusion::GpuCkwDirectConv2d
				144	- @ref experimental::dynamic_fusion::GpuCkwElementwiseBinary
				145	- @ref experimental::dynamic_fusion::GpuCkwStore
Viet-Hoa Do	0c19f59	2023-08-01 14:42:41 +0100	[diff] [blame]	146	- Various optimizations and bug fixes.
				147
ramy.elgammal@arm.com	2f0ef00	2023-06-28 21:31:03 +0100	[diff] [blame]	148	v23.05.1 Public patch release
				149	- Enable CMake and Bazel option to build multi_isa without FP16 support.
				150	- Fix compilation error in NEReorderLayer (aarch64 only).
				151	- Disable invalid (false-negative) validation test with CPU scale layer on FP16.
				152	- Various bug fixes
				153
SiCong Li	8893e45	2023-03-23 12:06:45 +0000	[diff] [blame]	154	v23.05 Public major release
Omar Al Khatib	32a6250	2023-05-10 11:45:20 +0100	[diff] [blame]	155	- New features:
				156	- Add new Arm® Neon™ kernels / functions:
				157	- @ref NEMatMul for QASYMM8, QASYMM8_SIGNED, FP32 and FP16, with batch support.
				158	- NEReorderLayer (aarch64 only)
				159	- Add new OpenCL™ kernels / functions:
				160	- @ref CLMatMul support for QASYMM8, QASYMM8_SIGNED, FP32 and FP16, with batch support.
				161	- Add support for the multiple dimensions in the indices parameter for both the Arm® Neon™ and OpenCL™ implementations of the Gather Layer.
				162	- Add support for dynamic weights in @ref CLFullyConnectedLayer and @ref NEFullyConnectedLayer for all data types.
				163	- Add support for cropping in the Arm® Neon™ and OpenCL™: implementations of the BatchToSpace Layer for all data types.
				164	- Add support for quantized data types for the ElementwiseUnary Operators for Arm® Neon™.
				165	- Implement RSQRT for quantized data types on OpenCL™.
				166	- Add FP16 depthwise convolution kernels for SME2.
				167	- Performance optimizations:
				168	- Improve CLTuner exhaustive mode tuning time.
				169	- Deprecate dynamic block shape in @ref NEBatchToSpaceLayer and @ref CLBatchToSpaceLayer.
				170	- Various optimizations and bug fixes.
SiCong Li	8893e45	2023-03-23 12:06:45 +0000	[diff] [blame]	171
Jakub Sujak	22e7613	2023-03-13 17:27:51 +0000	[diff] [blame]	172	v23.02.1 Public patch release
				173	- Allow mismatching data layouts between the source tensor and weights for \link cpu::CpuGemmDirectConv2d CpuGemmDirectConv2d \endlink with fixed format kernels.
				174	- Fixes for experimental CPU only Bazel and CMake builds.
				175
SiCong Li	90e5720	2023-02-01 14:39:41 +0000	[diff] [blame]	176	v23.02 Public major release
Jakub Sujak	06db85e	2023-02-06 17:42:47 +0000	[diff] [blame]	177	- New features:
				178	- Rework the experimental dynamic fusion interface by identifying auxiliary and intermediate tensors, and specifying an explicit output operator.
				179	- Add the following operators to the experimental dynamic fusion API:
				180	- GpuAdd, GpuCast, GpuClamp, GpuDepthwiseConv2d, GpuMul, GpuOutput, GpuPool2d, GpuReshape, GpuResize, GpuSoftmax, GpuSub.
				181	- Add SME/SME2 kernels for GeMM, Winograd convolution, Depthwise convolution and Pooling.
Jakub Sujak	9eefd4b	2023-02-10 14:36:48 +0000	[diff] [blame]	182	- Add new CPU operator AddMulAdd for float and quantized types.
Jakub Sujak	06db85e	2023-02-06 17:42:47 +0000	[diff] [blame]	183	- Add new flag @ref ITensorInfo::lock_paddings() to tensors to prevent extending tensor paddings.
Jakub Sujak	06db85e	2023-02-06 17:42:47 +0000	[diff] [blame]	184	- Add experimental support for CPU only Bazel and CMake builds.
				185	- Performance optimizations:
				186	- Optimize CPU base-e exponential functions for FP32.
				187	- Optimize CPU StridedSlice by copying first dimension elements in bulk where possible.
				188	- Optimize CPU quantized Subtraction by reusing the quantized Addition kernel.
				189	- Optimize CPU ReduceMean by removing quantization steps and performing the operation in integer domain.
				190	- Optimize GPU Scale and Dynamic Fusion GpuResize by removing quantization steps and performing the operation in integer domain.
Jakub Sujak	9eefd4b	2023-02-10 14:36:48 +0000	[diff] [blame]	191	- Update the heuristic for CLDepthwiseConvolutionNative kernel.
				192	- Add new optimized OpenCL kernel to compute indirect convolution:
				193	- \link opencl::kernels::ClIndirectConv2dKernel ClIndirectConv2dKernel \endlink
				194	- Add new optimized OpenCL kernel to compute transposed convolution:
				195	- \link opencl::kernels::ClTransposedConvolutionKernel ClTransposedConvolutionKernel \endlink
SiCong Li	90e5720	2023-02-01 14:39:41 +0000	[diff] [blame]	196	- Update recommended/minimum NDK version to r20b.
Jakub Sujak	06db85e	2023-02-06 17:42:47 +0000	[diff] [blame]	197	- Various optimizations and bug fixes.
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	198
Viet-Hoa Do	b1f8288	2022-11-11 11:29:50 +0000	[diff] [blame]	199	v22.11 Public major release
				200	- New features:
				201	- Add new experimental dynamic fusion API.
Viet-Hoa Do	293ab60	2022-11-15 10:51:26 +0000	[diff] [blame]	202	- Add CPU batch matrix multiplication with adj_x = false and adj_y = false for FP32.
Viet-Hoa Do	b1f8288	2022-11-11 11:29:50 +0000	[diff] [blame]	203	- Add CPU MeanStdDevNorm for QASYMM8.
				204	- Add CPU and GPU GELU activation function for FP32 and FP16.
				205	- Add CPU swish activation function for FP32 and FP16.
				206	- Performance optimizations:
				207	- Optimize CPU bilinear scale for FP32, FP16, QASYMM8, QASYMM8_SIGNED, U8 and S8.
				208	- Optimize CPU activation functions using LUT-based implementation:
				209	- Sigmoid function for QASYMM8 and QASYMM8_SIGNED.
				210	- Hard swish function for QASYMM8_SIGNED.
				211	- Optimize CPU addition for QASYMM8 and QASYMM8_SIGNED using fixed-point arithmetic.
				212	- Optimize CPU multiplication, subtraction and activation layers by considering tensors as 1D.
				213	- Optimize GPU depthwise convolution kernel and heuristic.
				214	- Optimize GPU Conv2d heuristic.
				215	- Optimize CPU MeanStdDevNorm for FP16.
				216	- Optimize CPU tanh activation function for FP16 using rational approximation.
				217	- Improve GPU GeMMLowp start-up time.
				218	- Various optimizations and bug fixes.
				219
SiCong Li	fe1b1f6	2022-05-19 18:58:31 +0100	[diff] [blame]	220	v22.08 Public major release
Ramy Elgammal	0d274b7	2022-08-05 13:14:57 +0100	[diff] [blame]	221	- Various bug fixes.
				222	- Disable unsafe FP optimizations causing accuracy issues in:
				223	- \link opencl::kernels::ClDirectConv2dKernel ClDirectConv2dKernel \endlink
				224	- \link opencl::kernels::ClDirectConv2dKernel ClDirectConv3dKernel \endlink
				225	- @ref CLDepthwiseConvolutionLayerNativeKernel
				226	- Add Dynamic Fusion of Elementwise Operators: Div, Floor, Add.
				227	- Optimize the gemm_reshaped_rhs_nly_nt OpenCL kernel using the arm_matrix_multiply extension available for Arm® Mali™-G715 and Arm® Mali™-G615.
				228	- Add support for the arm_matrix_multiply extension in the gemmlowp_mm_reshaped_only_rhs_t OpenCL kernel.
				229	- Expand GPUTarget list with missing Mali™ GPUs product names: G57, G68, G78AE, G610, G510, G310.
				230	- Extend the direct convolution 2d interface to configure the block size.
				231	- Update ClConv2D heuristic to use direct convolution.
				232	- Use official Khronos® OpenCL extensions:
				233	- Add cl_khr_integer_dot_product extension support.
				234	- Add support of OpenCL 3.0 non-uniform workgroup.
				235	- Cpu performance optimizations:
				236	- Add LUT-based implementation of Hard Swish and Leaky ReLU activation function for aarch64 build.
				237	- Optimize Add layer by considering the input tensors as 1D array.
				238	- Add fixed-format BF16, FP16 and FP32 Neon™ GEMM kernels to support variable weights.
				239	- Add new winograd convolution kernels implementation and update the ACL \link arm_compute::cpu::CpuWinogradConv2d CpuWinogradConv2d\endlink operator.
Jakub Sujak	117e17e	2023-02-21 10:52:57 +0000	[diff] [blame]	240	- Add experimental support for native builds for Windows® on Arm™.
Ramy Elgammal	966218d	2022-08-11 16:23:22 +0100	[diff] [blame]	241	- Build flag interpretation change: arch=armv8.6-a now translates to -march=armv8.6-a CXX flag instead of march=armv8.2-a + explicit selection of feature extensions.
SiCong Li	fe1b1f6	2022-05-19 18:58:31 +0100	[diff] [blame]	242	- Build flag change: toolchain_prefix, compiler_prefix:
Ramy Elgammal	0d274b7	2022-08-05 13:14:57 +0100	[diff] [blame]	243	- Use empty string "" to suppress any prefixes.
				244	- Use "auto" to use default (auto) prefixes chosen by the build script. This is the default behavior when unspecified.
				245	- Any other string will be used as custom prefixes to the compiler and the rest of toolchain tools.
				246	- The default behaviour when prefix is unspecified does not change, but its signifier has been changed from empty string "" to "auto".
				247	- armv7a with Android build will no longer be tested or maintained.
SiCong Li	fe1b1f6	2022-05-19 18:58:31 +0100	[diff] [blame]	248
Adnan AlSinan	2921e5b	2022-05-16 14:30:41 +0100	[diff] [blame]	249	v22.05 Public major release
				250	- Various bug fixes.
				251	- Various optimizations.
				252	- Add support for NDK r23b.
				253	- Inclusive language adjustment. Please refer to @ref S5_0_inc_lang for details.
				254	- New Arm® Neon™ kernels / functions :
				255	- \link opencl::kernels::ClPool3dKernel ClPool3dKernel \endlink
				256	- New OpenCL kernels / functions :
				257	- \link cpu::kernels::CpuPool3dKernel CpuPool3dKernel \endlink
				258	- Improve the start-up times for the following OpenCL kernels:
				259	- \link opencl::kernels::ClWinogradInputTransformKernel ClWinogradInputTransformKernel \endlink
				260	- \link opencl::kernels::ClWinogradOutputTransformKernel ClWinogradOutputTransformKernel \endlink
				261	- \link opencl::kernels::ClWinogradFilterTransformKernel ClWinogradFilterTransformKernel \endlink
				262	- \link opencl::kernels::ClHeightConcatenateKernel ClHeightConcatenateKernel \endlink
				263	- Decouple the implementation of the following Cpu kernels into various data types (fp32, fp16, int):
				264	- \link cpu::kernels::CpuDirectConv2dKernel CpuDirectConv2dKernel \endlink
				265	- \link cpu::kernels::CpuDepthwiseConv2dNativeKernel CpuDepthwiseConv2dNativeKernel \endlink
				266	- \link cpu::kernels::CpuGemmMatrixAdditionKernel CpuGemmMatrixAdditionKernel \endlink
				267	- \link cpu::kernels::CpuGemmMatrixMultiplyKernel CpuGemmMatrixMultiplyKernel \endlink
				268	- @ref NEFuseBatchNormalizationKernel
				269	- @ref NEL2NormalizeLayerKernel
				270
Adnan AlSinan	69854ba	2022-02-07 15:28:56 +0000	[diff] [blame]	271	v22.02 Public major release
				272	- Various bug fixes.
				273	- Various optimizations.
				274	- Update A510 arm_gemm cpu Kernels.
				275	- Inclusive language adjustment. Please refer to @ref S5_0_inc_lang for details.
				276	- Improve the start-up time for the following OpenCL kernels:
				277	- @ref CLScale
				278	- @ref CLGEMM
				279	- @ref CLDepthwiseConvolutionLayer
				280	- \link opencl::kernels::ClIm2ColKernel ClIm2ColKernel \endlink
				281	- \link opencl::kernels::ClDirectConv2dKernel ClDirectConv2dKernel \endlink
				282	- Remove functions:
				283	- CLRemap
				284	- NERemap
				285	- Remove padding from OpenCL kernels:
				286	- \link opencl::kernels::ClDirectConv2dKernel ClDirectConv2dKernel \endlink
				287	- Remove padding from Cpu kernels:
				288	- \link cpu::kernels::CpuDirectConv2dKernel CpuDirectConv2dKernel \endlink
				289	- Decouple the implementation of the following Cpu kernels into various data types (fp32, fp16, int):
				290	- \link cpu::kernels::CpuActivationKernel CpuActivationKernel \endlink
				291	- \link cpu::kernels::CpuAddKernel CpuAddKernel \endlink
				292	- \link cpu::kernels::CpuElementwiseKernel CpuElementwiseKernel \endlink
				293	- \link cpu::CpuSoftmaxGeneric CpuSoftmaxKernel \endlink
				294	- @ref NEBoundingBoxTransformKernel
				295	- @ref NECropKernel
				296	- @ref NEComputeAllAnchorsKernel
				297	- @ref NEInstanceNormalizationLayerKernel
Adnan AlSinan	bb8b235	2022-02-14 14:30:38 +0000	[diff] [blame]	298	- NEMaxUnpoolingLayerKernel
Adnan AlSinan	69854ba	2022-02-07 15:28:56 +0000	[diff] [blame]	299	- @ref NEMeanStdDevNormalizationKernel
				300	- @ref NERangeKernel
				301	- @ref NEROIAlignLayerKernel
				302	- @ref NESelectKernel
				303
Sheri Zhang	5dda217	2021-10-15 19:54:17 +0100	[diff] [blame]	304	v21.11 Public major release
				305	- Various bug fixes.
Gunes Bayir	0877370	2021-11-05 12:34:34 +0000	[diff] [blame]	306	- Various optimizations:
				307	- Improve performance of bilinear and nearest neighbor Scale on both CPU and GPU for FP32, FP16, Int8, Uint8 data types
Adnan AlSinan	abc093b	2022-02-08 16:57:06 +0000	[diff] [blame]	308	- Improve performance of Softmax on GPU for Uint8/Int8
Sheri Zhang	5dda217	2021-10-15 19:54:17 +0100	[diff] [blame]	309	- New OpenCL kernels / functions:
				310	- @ref CLConv3D
				311	- New Arm® Neon™ kernels / functions:
				312	- @ref NEConv3D
Gunes Bayir	0877370	2021-11-05 12:34:34 +0000	[diff] [blame]	313	- Support configurable build by a selected subset of operator list
				314	- Support MobileBert on Neon™ backend
				315	- Improve operator/function logging
				316	- Remove padding from OpenCL kernels:
				317	- ClPool2dKernel
				318	- ClScaleKernel
				319	- ClGemmMatrixMultiplyReshapedKernel
				320	- Remove padding from Cpu kernels:
				321	- CpuPool2dKernel
				322	- Remove Y padding from OpenCL kernels:
				323	- ClGemmMatrixMultiplyKernel
				324	- ClGemmReshapedRHSMatrixKernel
				325	- Remove legacy GeMM kernels in gemm_v1.cl
Sheri Zhang	5dda217	2021-10-15 19:54:17 +0100	[diff] [blame]	326
Freddie Liardet	77014ff	2021-08-05 15:50:31 +0100	[diff] [blame]	327	v21.08 Public major release
				328	- Various bug fixes.
				329	- Various optimizations:
				330	- Improve LWS (Local-Workgroup-Size) heuristic in OpenCL for GeMM, Direct Convolution and Winograd Transformations when OpenCL tuner is not used
				331	- Improve QASYMM8/QSYMM8 performance on OpenCL for various Arm® Mali™ GPU architectures
				332	- Add dynamic weights support in Fully connected layer (CPU/GPU)
				333	- Various performance optimizations for floating-point data types (CPU/GPU)
				334	- Add a reduced core library build arm_compute_core_v2
				335	- Expose Operator API
				336	- Support fat binary build for arm8.2-a via fat_binary build flag
				337	- Add CPU discovery capabilities
				338	- Add data type f16 support for:
Adnan AlSinan	6863fa0	2022-02-04 13:04:55 +0000	[diff] [blame]	339	- CLRemapKernel
Freddie Liardet	77014ff	2021-08-05 15:50:31 +0100	[diff] [blame]	340	- Port the following functions to stateless API:
				341	- @ref CLConvolutionLayer
				342	- @ref CLFlattenLayer
				343	- @ref CLFullyConnectedLayer
				344	- @ref CLGEMM
				345	- @ref CLGEMMConvolutionLayer
				346	- @ref CLGEMMLowpMatrixMultiplyCore
				347	- @ref CLWinogradConvolutionLayer
				348	- @ref NEConvolutionLayer
				349	- @ref NEFlattenLayer
				350	- @ref NEFullyConnectedLayer
				351	- @ref NEGEMM
				352	- @ref NEGEMMConv2d
				353	- @ref NEGEMMConvolutionLayer
				354	- @ref NEGEMMLowpMatrixMultiplyCore
				355	- @ref NEWinogradConvolutionLayer
				356	- Remove the following functions:
				357	- CLWinogradInputTransform
				358	- Remove CLCoreRuntimeContext
				359	- Remove ICPPSimpleKernel
				360	- Rename file arm_compute/runtime/CL/functions/CLElementWiseUnaryLayer.h to arm_compute/runtime/CL/functions/CLElementwiseUnaryLayer.h
				361
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	362	v21.05 Public major release
Sheri Zhang	c2bed95	2021-05-06 12:12:38 +0100	[diff] [blame]	363	- Various bug fixes.
				364	- Various optimisations.
				365	- Various documentation updates:
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	366	- Add supported operators and corresponding Android NNAPI operators.
				367	- Documentation reorg into user guide and contributor guide.
Sheri Zhang	c2bed95	2021-05-06 12:12:38 +0100	[diff] [blame]	368	- Add support for a global allocator for OpenCL tensors
				369	- Add experimental support for [CLVK](https://github.com/kpet/clvk).
				370	- Add data type S32 support for:
				371	- @ref opencl::kernels::ClArithmeticKernel
				372	- Add data type QASYMM8 support for:
				373	- @ref CLROIPoolingLayer
				374	- @ref CLROIPoolingLayerKernel
				375	- @ref NEROIPoolingLayer
				376	- @ref NEROIPoolingLayerKernel
				377	- Add per-channel quantization support for:
				378	- @ref CLDeconvolutionLayer
				379	- @ref CLDirectDeconvolutionLayer
				380	- @ref NEConvolutionLayer
				381	- @ref NEDeconvolutionLayer
				382	- Remove padding from OpenCL kernels:
				383	- @ref CLL2NormalizeLayerKernel
Gian Marco Iodice	8155c02	2021-04-16 15:08:59 +0100	[diff] [blame]	384	- CLDepthwiseConvolutionLayer3x3NHWCKernel
Sheri Zhang	c2bed95	2021-05-06 12:12:38 +0100	[diff] [blame]	385	- @ref CLNormalizationLayerKernel
				386	- @ref CLNormalizePlanarYUVLayerKernel
				387	- @ref opencl::kernels::ClMulKernel
				388	- @ref CLReductionOperationKernel
				389	- @ref CLROIPoolingLayerKernel
				390	- Remove computer vision support from Arm® Neon™ backend
				391	- Remove the following functions:
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	392	- NEAbsoluteDifference
				393	- NEAccumulate
				394	- NEBox3x3
				395	- NECannyEdge
				396	- NEChannelCombine
				397	- NEChannelExtract
				398	- NEColorConvert
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	399	- NEConvolution
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	400	- NEDerivative
				401	- NEDilate
				402	- NEEqualizeHistogram
				403	- NEErode
				404	- NEFastCorners
				405	- NEGaussian3x3
				406	- NEGaussian5x5
				407	- NEGaussianPyramid
				408	- NEHOGDescriptor
				409	- NEHOGDetector
				410	- NEHOGGradient
				411	- NEHOGMultiDetection
				412	- NEHarrisCorners
				413	- NEHistogram
				414	- NEIntegralImage
				415	- NELaplacianPyramid
				416	- NELaplacianReconstruct
				417	- NEMagnitude
				418	- NEMeanStdDev
				419	- NEMedian3x3
				420	- NEMinMaxLocation
				421	- NENonLinearFilter
				422	- NEOpticalFlow
				423	- NEPhase
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	424	- NEScharr3x3
				425	- NESobel3x3
				426	- NESobel5x5
				427	- NESobel7x7
				428	- NETableLookup
				429	- NEThreshold
				430	- NEWarpAffine
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	431	- NEWarpPerspectiveKernel
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	432	- Remove all GLES kernels / functions / tests / examples
Sheri Zhang	c2bed95	2021-05-06 12:12:38 +0100	[diff] [blame]	433	- Remove computer vision support from CL backend
				434	- Remove the following functions:
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	435	- CLAbsoluteDifference
				436	- CLAccumulate
				437	- CLBox3x3
				438	- CLCannyEdge
				439	- CLChannelCombine
				440	- CLChannelExtract
				441	- CLColorConvert
				442	- CLConvolution
				443	- CLDerivative
				444	- CLDilate
				445	- CLEqualizeHistogram
				446	- CLErode
				447	- CLFastCorners
				448	- CLGaussian3x3
				449	- CLGaussian5x5
				450	- CLGaussianPyramid
				451	- CLHOGDescriptor
				452	- CLHOGDetector
				453	- CLHOGGradient
				454	- CLHOGMultiDetection
				455	- CLHarrisCorners
				456	- CLHistogram
				457	- CLIntegralImage
				458	- CLLaplacianPyramid
				459	- CLLaplacianReconstruct
				460	- CLMagnitude
				461	- CLMeanStdDev
				462	- CLMedian3x3
				463	- CLMinMaxLocation
				464	- CLNonLinearFilter
				465	- CLOpticalFlow
				466	- CLPhase
				467	- CLScharr3x3
				468	- CLSobel3x3
				469	- CLSobel5x5
				470	- CLSobel7x7
				471	- CLTableLookup
				472	- CLThreshold
				473	- CLWarpAffine
				474	- CLWarpPerspective
Ramy Elgammal	0d274b7	2022-08-05 13:14:57 +0100	[diff] [blame]	475
Georgios Pinitas	40f51a6	2020-11-21 03:04:18 +0000	[diff] [blame]	476	v21.02 Public major release
Sheri Zhang	da6a6eb	2021-01-06 11:15:06 +0000	[diff] [blame]	477	- Various bug fixes.
				478	- Various optimisations.
Georgios Pinitas	4551403	2020-12-30 00:03:09 +0000	[diff] [blame]	479	- Upgrade C++ standard to C++14
				480	- Add macOS support
Giorgio Arena	1055dc1	2021-02-19 09:53:06 +0000	[diff] [blame]	481	- Add Armv8-R AArch64 architecture support
Sheri Zhang	da6a6eb	2021-01-06 11:15:06 +0000	[diff] [blame]	482	- Add SVE/SVE2 support for:
Manuel Bottini	10b3826	2021-02-19 18:16:44 +0000	[diff] [blame]	483	- NEScaleKernel
Sheri Zhang	da6a6eb	2021-01-06 11:15:06 +0000	[diff] [blame]	484	- @ref NEActivationLayer
				485	- @ref NEArithmeticAddition
				486	- @ref NEBatchNormalizationLayerKernel
Gunes Bayir	fadc9b1	2023-11-07 05:43:07 +0000	[diff] [blame]	487	- cpu::kernels::CpuLogits1DSoftmaxKernel
				488	- cpu::kernels::CpuLogits1DMaxKernel
Giorgio Arena	1055dc1	2021-02-19 09:53:06 +0000	[diff] [blame]	489	- @ref cpu::kernels::CpuElementwiseUnaryKernel
Sheri Zhang	dda6914	2021-02-01 19:06:57 +0000	[diff] [blame]	490	- Remove padding from OpenCL kernels:
Sheri Zhang	1efed92	2021-03-10 22:43:38 +0000	[diff] [blame]	491	- CLDirectConvolutionLayerKernel
Sheri Zhang	dda6914	2021-02-01 19:06:57 +0000	[diff] [blame]	492	- @ref CLArgMinMaxLayerKernel
				493	- @ref CLPadLayerKernel
				494	- @ref CLROIAlignLayerKernel
				495	- @ref CLRangeKernel
Manuel Bottini	3b131ab	2021-02-19 18:16:44 +0000	[diff] [blame]	496	- CLScaleKernel
Sheri Zhang	dda6914	2021-02-01 19:06:57 +0000	[diff] [blame]	497	- @ref CLSelectKernel
				498	- @ref CLBitwiseKernel
Giorgio Arena	1055dc1	2021-02-19 09:53:06 +0000	[diff] [blame]	499	- @ref opencl::kernels::ClFloorKernel
Teresa Charlin	2788609	2021-02-25 20:15:01 +0000	[diff] [blame]	500	- CLTransposeKernel
Giorgio Arena	5b50f42	2021-02-17 11:43:05 +0000	[diff] [blame]	501	- Deprecate functions in CLTuner:
				502	- add_lws_to_table
				503	- import_lws_table
				504	- lws_table
Sheri Zhang	da6a6eb	2021-01-06 11:15:06 +0000	[diff] [blame]	505	- Remove functions:
Georgios Pinitas	96b16b6	2020-12-01 17:41:34 +0000	[diff] [blame]	506	- NELocallyConnectedLayer / CLLocallyConnectedLayer
Georgios Pinitas	f7c5a41	2020-12-03 14:38:33 +0000	[diff] [blame]	507	- NEIm2Col
				508	- NECol2Im
				509	- NEGEMMInterleave4x4
				510	- NEGEMMTranspose1xW
Georgios Pinitas	8c3c0e7	2020-12-03 20:11:53 +0000	[diff] [blame]	511	- NEComputeAllAnchors / CLComputeAllAnchors
Georgios Pinitas	ec2256b	2020-12-03 18:51:58 +0000	[diff] [blame]	512	- NEGEMMAssemblyDispatch
Georgios Pinitas	c53266e	2020-12-09 03:11:53 +0000	[diff] [blame]	513	- NEUpsampleLayer / CLUpsampleLayer
Sheri Zhang	da6a6eb	2021-01-06 11:15:06 +0000	[diff] [blame]	514	- Remove kernels:
Georgios Pinitas	d308df3	2020-12-01 16:56:36 +0000	[diff] [blame]	515	- NEGEMMMatrixVectorMultiplyKernel
Georgios Pinitas	96b16b6	2020-12-01 17:41:34 +0000	[diff] [blame]	516	- NELocallyConnectedMatrixMultiplyKernel / CLLocallyConnectedMatrixMultiplyKernel
Georgios Pinitas	c53266e	2020-12-09 03:11:53 +0000	[diff] [blame]	517	- NEUpsampleLayerKernel / CLUpsampleLayerKernel
Gian Marco Iodice	f5aad51	2021-02-08 17:34:40 +0000	[diff] [blame]	518	- Extend OpenCL tuner with workgroup batch size support
				519	- Experimental extension for the OpenCL tuner to tune the batches of work groups distribute to compute units
Gian Marco Iodice	716b1be	2021-02-10 17:33:27 +0000	[diff] [blame]	520	- Add functionality to load the OpenCL GEMM heuristics at runtime
				521	- The GEMM heuristic file (MLGO) can be used to update the default GEMM heuristics available for OpenCL
Giorgio Arena	cd7d178	2021-02-22 14:58:37 +0000	[diff] [blame]	522	- Note: there might be performance regressions against v20.08 in Inception v3 using int8 data types on Arm Mali-G77 GPUs. Currently under investigation
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	523	- Note: data-type decoupling is in progress and experimental. Warning of unused symbols might be raised
Georgios Pinitas	40f51a6	2020-11-21 03:04:18 +0000	[diff] [blame]	524
SiCong Li	96209c7	2020-08-21 12:28:30 +0100	[diff] [blame]	525	v20.11 Public major release
morgolock	70b1eb8	2020-11-24 13:54:19 +0000	[diff] [blame]	526	- Various bug fixes.
				527	- Various optimisations.
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	528	- Performance regressions can be noted when executing Depthwise Convolution on Arm® Neon™ with a depth multiplier > 1 for quantized data type.
morgolock	0e72849	2020-11-20 11:03:33 +0000	[diff] [blame]	529	This is planned to be resolved in 21.02 release.
morgolock	70b1eb8	2020-11-24 13:54:19 +0000	[diff] [blame]	530	- Added new data type QASYMM8_SIGNED support for @ref NEROIAlignLayer.
SiCong Li	903f8cc	2020-08-27 10:17:10 +0100	[diff] [blame]	531	- Added new data type S32 support for:
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	532	- NEArithmeticSubtraction
				533	- NEArithmeticSubtractionKernel
SiCong Li	bb88f89	2020-08-28 11:18:47 +0100	[diff] [blame]	534	- @ref NEPixelWiseMultiplication
Sheri Zhang	1e3ab42	2021-03-16 17:35:08 +0000	[diff] [blame]	535	- NEPixelWiseMultiplicationKernel
Sang-Hoon Park	63001ac	2021-01-18 14:20:27 +0000	[diff] [blame]	536	- NEElementwiseDivision
				537	- NEDivisionOperationKernel
SiCong Li	96209c7	2020-08-21 12:28:30 +0100	[diff] [blame]	538	- Interface change
				539	- Properly support softmax axis to have the same meaning as other major frameworks. That is, axis now defines the dimension
				540	on which Softmax/Logsoftmax is performed. E.g. for input of shape 4x5x6 and axis=1, softmax will be applied to 4x6=24 vectors of size 5.
				541	The supported value range of axis is [-rank, rank).
				542	This change applies to the following functions:
				543	- @ref NESoftmaxLayer
				544	- @ref NELogSoftmaxLayer
				545	- @ref CLSoftmaxLayer
				546	- @ref CLLogSoftmaxLayer
Manuel Bottini	ceaa0bf	2021-02-16 15:15:19 +0000	[diff] [blame]	547	- GCSoftmaxLayer
Sheri Zhang	824061d	2020-10-26 15:46:37 +0000	[diff] [blame]	548	- New OpenCL kernels / functions:
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	549	- CLGEMMLowpQuantizeDownInt32ScaleByFixedPointKernel
morgolock	0e72849	2020-11-20 11:03:33 +0000	[diff] [blame]	550	- @ref CLLogicalNot
				551	- @ref CLLogicalAnd
				552	- @ref CLLogicalOr
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	553	- New Arm® Neon™ kernels / functions:
morgolock	0e72849	2020-11-20 11:03:33 +0000	[diff] [blame]	554	- @ref NELogicalNot
				555	- @ref NELogicalAnd
				556	- @ref NELogicalOr
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	557	- Removed padding from Arm® Neon™ kernels:
Sheri Zhang	1e3ab42	2021-03-16 17:35:08 +0000	[diff] [blame]	558	- NEComplexPixelWiseMultiplicationKernel
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	559	- NENonMaximaSuppression3x3Kernel
Adnan AlSinan	6863fa0	2022-02-04 13:04:55 +0000	[diff] [blame]	560	- NERemapKernel
Michele Di Giorgio	93b75e0	2021-06-21 12:00:43 +0100	[diff] [blame]	561	- NEGEMMInterleave4x4Kernel
Manuel Bottini	327225d	2021-04-13 13:09:30 +0100	[diff] [blame]	562	- NEDirectConvolutionLayerKernel
Manuel Bottini	10b3826	2021-02-19 18:16:44 +0000	[diff] [blame]	563	- NEScaleKernel
Georgios Pinitas	96b16b6	2020-12-01 17:41:34 +0000	[diff] [blame]	564	- NELocallyConnectedMatrixMultiplyKernel
Manuel Bottini	cfac51c	2021-06-18 15:47:28 +0100	[diff] [blame]	565	- NEGEMMLowpOffsetContributionKernel
Michele Di Giorgio	93b75e0	2021-06-21 12:00:43 +0100	[diff] [blame]	566	- NEGEMMTranspose1xWKernel
Michele Di Giorgio	1928904	2021-02-03 16:05:00 +0000	[diff] [blame]	567	- NEPoolingLayerKernel
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	568	- NEConvolutionKernel
Michalis Spyrou	60c3b0e	2021-04-08 12:02:58 +0100	[diff] [blame]	569	- NEDepthwiseConvolutionLayerNativeKernel
Manuel Bottini	cfac51c	2021-06-18 15:47:28 +0100	[diff] [blame]	570	- NEGEMMLowpMatrixMultiplyKernel
Michele Di Giorgio	53832b2	2021-06-21 14:45:44 +0100	[diff] [blame]	571	- NEGEMMMatrixMultiplyKernel
Manuel Bottini	327225d	2021-04-13 13:09:30 +0100	[diff] [blame]	572	- NEDirectConvolutionLayerOutputStageKernel
Sheri Zhang	ed36713	2020-10-08 15:46:16 +0100	[diff] [blame]	573	- @ref NEReductionOperationKernel
Manuel Bottini	cfac51c	2021-06-18 15:47:28 +0100	[diff] [blame]	574	- NEGEMMLowpMatrixAReductionKernel
				575	- NEGEMMLowpMatrixBReductionKernel
Sheri Zhang	824061d	2020-10-26 15:46:37 +0000	[diff] [blame]	576	- Removed padding from OpenCL kernels:
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	577	- CLBatchConcatenateLayerKernel
Michele Di Giorgio	1e0208a	2021-01-22 15:42:59 +0000	[diff] [blame]	578	- CLElementwiseOperationKernel
Sheri Zhang	824061d	2020-10-26 15:46:37 +0000	[diff] [blame]	579	- @ref CLBatchNormalizationLayerKernel
Michele Di Giorgio	e131466	2021-02-01 17:09:32 +0000	[diff] [blame]	580	- CLPoolingLayerKernel
Manuel Bottini	c6f4ec3	2021-05-18 18:41:56 +0100	[diff] [blame]	581	- CLWinogradInputTransformKernel
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	582	- CLGEMMLowpMatrixMultiplyNativeKernel
				583	- CLGEMMLowpMatrixAReductionKernel
				584	- CLGEMMLowpMatrixBReductionKernel
				585	- CLGEMMLowpOffsetContributionOutputStageKernel
				586	- CLGEMMLowpOffsetContributionKernel
Manuel Bottini	c6f4ec3	2021-05-18 18:41:56 +0100	[diff] [blame]	587	- CLWinogradOutputTransformKernel
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	588	- CLGEMMLowpMatrixMultiplyReshapedKernel
Sheri Zhang	824061d	2020-10-26 15:46:37 +0000	[diff] [blame]	589	- @ref CLFuseBatchNormalizationKernel
				590	- @ref CLDepthwiseConvolutionLayerNativeKernel
Georgios Pinitas	11d8415	2021-04-28 10:20:18 +0100	[diff] [blame]	591	- CLDepthConvertLayerKernel
Sheri Zhang	7e20e29	2021-02-02 11:49:34 +0000	[diff] [blame]	592	- CLCopyKernel
Gian Marco Iodice	8155c02	2021-04-16 15:08:59 +0100	[diff] [blame]	593	- CLDepthwiseConvolutionLayer3x3NHWCKernel
Georgios Pinitas	f47f718	2021-01-15 09:29:50 +0000	[diff] [blame]	594	- CLActivationLayerKernel
Manuel Bottini	c6f4ec3	2021-05-18 18:41:56 +0100	[diff] [blame]	595	- CLWinogradFilterTransformKernel
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	596	- CLWidthConcatenateLayerKernel
				597	- CLWidthConcatenate4TensorsKernel
				598	- CLWidthConcatenate2TensorsKernel
Sang-Hoon Park	201e0fe	2021-01-27 13:14:56 +0000	[diff] [blame]	599	- CLLogits1DMaxShiftExpSumKernel
				600	- CLLogits1DNormKernel
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	601	- CLHeightConcatenateLayerKernel
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	602	- CLGEMMMatrixMultiplyKernel
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	603	- CLGEMMLowpQuantizeDownInt32ScaleKernel
				604	- CLGEMMLowpQuantizeDownInt32ScaleByFloatKernel
				605	- CLGEMMLowpMatrixMultiplyReshapedOnlyRHSKernel
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	606	- CLDepthConcatenateLayerKernel
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	607	- CLGEMMLowpQuantizeDownInt32ScaleByFixedPointKernel
Sheri Zhang	824061d	2020-10-26 15:46:37 +0000	[diff] [blame]	608	- Removed OpenCL kernels / functions:
				609	- CLGEMMLowpQuantizeDownInt32ToInt16ScaleByFixedPointKernel
				610	- CLGEMMLowpQuantizeDownInt32ToInt8ScaleByFixedPointKernel
				611	- CLGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPointKernel
morgolock	00c7601	2020-11-06 10:40:12 +0000	[diff] [blame]	612	- Deprecated OpenCL kernels / functions (If a kernel is used only by the function that is being deprecated, the kernel is deprecated together):
Georgios Pinitas	2d22139	2020-09-03 15:16:37 +0100	[diff] [blame]	613	- CLLocallyConnectedLayer
				614	- CLLocallyConnectedMatrixMultiplyKernel
morgolock	00c7601	2020-11-06 10:40:12 +0000	[diff] [blame]	615	- CLAbsoluteDifference
				616	- CLAbsoluteDifferenceKernel
				617	- CLAccumulate
				618	- CLAccumulateKernel
				619	- CLAccumulateSquared
				620	- CLAccumulateSquaredKernel
				621	- CLAccumulateWeighted
				622	- CLAccumulateWeightedKernel
				623	- CLAccumulateWeightedFP16Kernel
				624	- CLBox3x3
				625	- CLBox3x3Kernel
				626	- CLBox3x3FP16Kernel
				627	- CLCannyEdge
				628	- CLChannelCombine
				629	- CLChannelCombineKernel
				630	- CLChannelExtract
				631	- CLChannelExtractKernel
				632	- CLColorConvert
				633	- CLColorConvertKernel
				634	- CLConvolution3x3
				635	- CLConvolutionRectangle
				636	- CLConvolutionRectangleKernel
				637	- CLConvolutionSquare
				638	- CLConvolutionKernel
				639	- CLDerivative
				640	- CLDerivativeKernel
				641	- CLDilate
				642	- CLDilateKernel
				643	- CLEqualizeHistogram
				644	- CLErode
				645	- CLErodeKernel
				646	- CLFastCorners
				647	- CLFastCornersKernel
				648	- CLGaussian3x3
				649	- CLGaussian3x3Kernel
				650	- CLGaussian5x5
				651	- CLGaussian5x5HorKernel
				652	- CLGaussian5x5VertKernel
				653	- CLGaussianPyramid
				654	- CLGaussianPyramidHalf
				655	- CLGaussianPyramidOrb
				656	- CLHarrisCorners
				657	- CLHarrisScoreKernel
				658	- CLHarrisScoreFP16Kernel
				659	- CLHistogram
				660	- CLHistogramKernel
				661	- CLHOGOrientationBinningKernel
				662	- CLHOGBlockNormalizationKernel
				663	- CLHOGDetectorKernel
				664	- CLHOGNonMaximaSuppressionKernel
				665	- CLHOGDescriptor
				666	- CLHOGDetector
				667	- CLHOGGradient
				668	- CLHOGMultiDetection
				669	- CLHOGOrientationBinningKernel
				670	- CLHOGBlockNormalizationKernel
				671	- CLHOGDetectorKernel
				672	- CLIntegralImage
				673	- CLIntegralImageKernel
				674	- CLLaplacianReconstruct
				675	- CLLaplacianPyramid
				676	- CLMagnitude
				677	- CLMagnitudePhaseKernel
				678	- CLMedian3x3
				679	- CLMedian3x3Kernel
				680	- CLMinMaxLocation
				681	- CLMinMaxLocationKernel
				682	- CLNonLinearFilter
				683	- CLNonLinearFilterKernel
				684	- CLNonMaximaSuppression3x3
				685	- CLNonMaximaSuppression3x3FP16Kernel
				686	- CLNonMaximaSuppression3x3Kernel
				687	- CLOpticalFlow
				688	- CLPhase
				689	- CLRemap
				690	- CLRemapKernel
				691	- CLScharr3x3
				692	- CLScharr3x3Kernel
				693	- CLSobel3x3
				694	- CLSobel3x3Kernel
				695	- CLSobel5x5
				696	- CLSobel5x5HorKernel
				697	- CLSobel5x5VertKernel
				698	- CLSobel7x7
				699	- CLSobel7x7HorKernel
				700	- CLSobel7x7VertKernel
				701	- CLThreshold
				702	- CLThresholdKernel
				703	- CLWarpAffine
				704	- CLWarpAffineKernel
				705	- CLWarpPerspective
				706	- CLWarpPerspectiveKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	707	- Deprecated Arm® Neon™ kernels / functions (If a kernel is used only by the function that is being deprecated, the kernel is deprecated together):
Georgios Pinitas	2d22139	2020-09-03 15:16:37 +0100	[diff] [blame]	708	- NELocallyConnectedLayer
				709	- NELocallyConnectedMatrixMultiplyKernel
morgolock	0c86265	2020-11-06 08:59:45 +0000	[diff] [blame]	710	- NEAbsoluteDifference
				711	- NEAbsoluteDifferenceKernel
				712	- NEAccumulate
				713	- NEAccumulateKernel
				714	- NEAccumulateSquared
				715	- NEAccumulateSquaredKernel
				716	- NEAccumulateWeighted
				717	- NEAccumulateWeightedKernel
				718	- NEAccumulateWeightedFP16Kernel
				719	- NEBox3x3
				720	- NEBox3x3Kernel
				721	- NEBox3x3FP16Kernel
				722	- NECannyEdge
				723	- NEChannelCombine
				724	- NEChannelCombineKernel
				725	- NEChannelExtract
				726	- NEChannelExtractKernel
				727	- NEColorConvert
				728	- NEColorConvertKernel
				729	- NEConvolution3x3
				730	- NEConvolutionRectangle
				731	- NEConvolutionRectangleKernel
				732	- NEConvolutionSquare
				733	- NEConvolutionKernel
				734	- NEDerivative
				735	- NEDerivativeKernel
				736	- NEDilate
				737	- NEDilateKernel
				738	- NEEqualizeHistogram
				739	- NEErode
				740	- NEErodeKernel
				741	- NEFastCorners
				742	- NEFastCornersKernel
				743	- NEGaussian3x3
				744	- NEGaussian3x3Kernel
				745	- NEGaussian5x5
				746	- NEGaussian5x5HorKernel
				747	- NEGaussian5x5VertKernel
				748	- NEGaussianPyramid
				749	- NEGaussianPyramidHalf
				750	- NEGaussianPyramidOrb
				751	- NEHarrisCorners
				752	- NEHarrisScoreKernel
				753	- NEHarrisScoreFP16Kernel
				754	- NEHistogram
				755	- NEHistogramKernel
				756	- NEHOGOrientationBinningKernel
				757	- NEHOGBlockNormalizationKernel
				758	- NEHOGDetectorKernel
				759	- NEHOGNonMaximaSuppressionKernel
				760	- NEHOGDescriptor
				761	- NEHOGDetector
				762	- NEHOGGradient
				763	- NEHOGMultiDetection
				764	- NEHOGOrientationBinningKernel
				765	- NEHOGBlockNormalizationKernel
				766	- NEHOGDetectorKernel
				767	- NEIntegralImage
				768	- NEIntegralImageKernel
				769	- NELaplacianReconstruct
				770	- NELaplacianPyramid
				771	- NEMagnitude
				772	- NEMagnitudePhaseKernel
				773	- NEMedian3x3
				774	- NEMedian3x3Kernel
				775	- NEMinMaxLocation
				776	- NEMinMaxLocationKernel
				777	- NENonLinearFilter
				778	- NENonLinearFilterKernel
				779	- NENonMaximaSuppression3x3
				780	- NENonMaximaSuppression3x3FP16Kernel
				781	- NENonMaximaSuppression3x3Kernel
				782	- NEOpticalFlow
				783	- NEPhase
				784	- NERemap
				785	- NERemapKernel
				786	- NEScharr3x3
				787	- NEScharr3x3Kernel
				788	- NESobel3x3
				789	- NESobel3x3Kernel
				790	- NESobel5x5
				791	- NESobel5x5HorKernel
				792	- NESobel5x5VertKernel
				793	- NESobel7x7
				794	- NESobel7x7HorKernel
				795	- NESobel7x7VertKernel
				796	- NEThreshold
				797	- NEThresholdKernel
				798	- NEWarpAffine
				799	- NEWarpAffineKernel
				800	- NEWarpPerspective
				801	- NEWarpPerspectiveKernel
morgolock	d6ee9ed	2020-11-19 10:07:14 +0000	[diff] [blame]	802	- Deprecated GLES kernels / functions (If a kernel is used only by the function that is being deprecated, the kernel is deprecated together):
				803	- GCAbsoluteDifference
				804	- GCActivationLayer
				805	- GCArithmeticAddition
				806	- GCBatchNormalizationLayer
				807	- GCConcatenateLayer
				808	- GCConvolutionLayer
				809	- GCDepthwiseConvolutionLayer
				810	- GCDirectConvolutionLayer
				811	- GCDropoutLayer
				812	- GCFillBorder
				813	- GCFullyConnectedLayer
				814	- GCGEMM
				815	- GCGEMMInterleave4x4
				816	- GCGEMMTranspose1xW
				817	- GCNormalizationLayer
				818	- GCNormalizePlanarYUVLayer
				819	- GCPixelWiseMultiplication
				820	- GCPoolingLayer
				821	- GCScale
				822	- GCSoftmaxLayer
				823	- GCTensorShift
				824	- GCTranspose
				825
SiCong Li	96209c7	2020-08-21 12:28:30 +0100	[diff] [blame]	826
Georgios Pinitas	25ef721	2020-06-02 23:00:41 +0100	[diff] [blame]	827	v20.08 Public major release
				828	- Various bug fixes.
				829	- Various optimisations.
Sheri Zhang	3ef9b5f	2020-07-09 16:32:58 +0100	[diff] [blame]	830	- Added new data type QASYMM8_SIGNED support for:
Sheri Zhang	dd4cfc0	2020-07-10 14:15:41 +0100	[diff] [blame]	831	- @ref CLArgMinMaxLayer
				832	- @ref CLArgMinMaxLayerKernel
				833	- Added new data type U8 support for:
				834	- @ref NECropKernel
Sheri Zhang	7e20e29	2021-02-02 11:49:34 +0000	[diff] [blame]	835	- CLCropKernel
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	836	- Added align_corner support for nearest neighbor interpolation in:
Manuel Bottini	10b3826	2021-02-19 18:16:44 +0000	[diff] [blame]	837	- NEScaleKernel
Manuel Bottini	3b131ab	2021-02-19 18:16:44 +0000	[diff] [blame]	838	- CLScaleKernel
Sheri Zhang	dd4cfc0	2020-07-10 14:15:41 +0100	[diff] [blame]	839	- New OpenCL kernels / functions:
				840	- @ref CLMaxUnpoolingLayerKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	841	- New Arm® Neon™ kernels / functions:
Dana Zlotnik	149203b	2022-01-26 12:38:03 +0200	[diff] [blame]	842	- NEMaxUnpoolingLayerKernel
Sheri Zhang	3ef9b5f	2020-07-09 16:32:58 +0100	[diff] [blame]	843	- New graph example:
Sheri Zhang	dd4cfc0	2020-07-10 14:15:41 +0100	[diff] [blame]	844	- graph_yolov3_output_detector
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	845	- GEMMTuner improvements:
				846	- Added fp16 support
				847	- Output json files for easier integration
				848	- Enabled tuning for export_to_cl_image_rhs option for RHS tensors
				849	- More robust script for running benchmarks
Sheri Zhang	3ef9b5f	2020-07-09 16:32:58 +0100	[diff] [blame]	850	- Removed padding from:
Sheri Zhang	1e3ab42	2021-03-16 17:35:08 +0000	[diff] [blame]	851	- NEPixelWiseMultiplicationKernel
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	852	- NEHeightConcatenateLayerKernel
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	853	- NEThresholdKernel
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	854	- NEBatchConcatenateLayerKernel
Teresa Charlin	d1dc09c	2021-03-04 15:24:45 +0000	[diff] [blame]	855	- NETransposeKernel
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	856	- @ref NEBatchNormalizationLayerKernel
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	857	- NEArithmeticSubtractionKernel
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	858	- @ref NEBoundingBoxTransformKernel
Michalis Spyrou	373b407	2021-01-20 16:41:12 +0000	[diff] [blame]	859	- NELogits1DMaxKernel
				860	- NELogits1DSoftmaxKernel
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	861	- @ref NEROIPoolingLayerKernel
				862	- @ref NEROIAlignLayerKernel
Georgios Pinitas	0b1c2db	2020-12-04 15:51:34 +0000	[diff] [blame]	863	- NEYOLOLayerKernel
Georgios Pinitas	c53266e	2020-12-09 03:11:53 +0000	[diff] [blame]	864	- NEUpsampleLayerKernel
Georgios Pinitas	70eb53b	2021-01-06 19:42:21 +0000	[diff] [blame]	865	- NEFloorKernel
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	866	- NEWidthConcatenateLayerKernel
				867	- NEDepthConcatenateLayerKernel
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	868	- @ref NENormalizationLayerKernel
				869	- @ref NEL2NormalizeLayerKernel
Georgios Pinitas	c6f9510	2021-03-30 10:03:01 +0100	[diff] [blame]	870	- NEFillArrayKernel
Georgios Pinitas	11d8415	2021-04-28 10:20:18 +0100	[diff] [blame]	871	- NEDepthConvertLayerKernel
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	872	- @ref NERangeKernel
				873	- @ref NEPriorBoxLayer
Sheri Zhang	ed36713	2020-10-08 15:46:16 +0100	[diff] [blame]	874	- Removed OpenCL kernels / functions:
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	875	- CLGEMMLowpQuantizeDownInt32ToUint8Scale
				876	- CLGEMMLowpQuantizeDownInt32ToUint8ScaleByFloat
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	877	- Removed Arm® Neon™ kernels / functions:
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	878	- NEGEMMLowpQuantizeDownInt32ToUint8Scale
				879	- NEGEMMMatrixAccumulateBiasesKernel
SiCong Li	d004a7a	2020-05-28 15:26:41 +0100	[diff] [blame]	880	- Deprecated functions / interfaces:
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	881	- Non-descriptor based interfaces for NEThreshold, CLThreshold
Manuel Bottini	ceaa0bf	2021-02-16 15:15:19 +0000	[diff] [blame]	882	- Non-descriptor based interfaces for @ref NEScale, @ref CLScale and GCScale
				883	- In @ref NESoftmaxLayer, @ref NELogSoftmaxLayer, @ref CLSoftmaxLayer, @ref CLLogSoftmaxLayer and GCSoftmaxLayer :
				884	The default "axis" value for @ref CLSoftmaxLayer, @ref CLLogSoftmaxLayer and GCSoftmaxLayer is changed from 1 to 0.
morgolock	9c7fed8	2020-08-05 12:30:56 +0100	[diff] [blame]	885	Only axis 0 is supported.
				886	The default "axis" value for @ref NESoftmaxLayer, @ref NELogSoftmaxLayer is changed from 1 to 0.
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	887	Only axis 0 is supported.
Sang-Hoon Park	a0205b9	2020-07-07 09:36:09 +0100	[diff] [blame]	888	- The support for quantized data types has been removed from @ref CLLogSoftmaxLayer due to implementation complexity.
Manuel Bottini	d844c08	2021-07-14 12:58:54 +0100	[diff] [blame]	889	- Removed padding requirement for the input (e.g. LHS of GEMM) and output in CLGEMMMatrixMultiplyNativeKernel, CLGEMMMatrixMultiplyReshapedKernel, CLGEMMMatrixMultiplyReshapedOnlyRHSKernel and CLIm2ColKernel (NHWC only)
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	890	- This change allows to use @ref CLGEMMConvolutionLayer without extra padding for the input and output.
				891	- Only the weights/bias of @ref CLGEMMConvolutionLayer could require padding for the computation.
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	892	- Only on Arm® Mali™ Midgard GPUs, @ref CLGEMMConvolutionLayer could require padding since CLGEMMMatrixMultiplyKernel is called and currently requires padding.
				893	- Added support for exporting the OpenCL buffer object to the OpenCL image object in CLGEMMMatrixMultiplyReshapedKernel and CLGEMMMatrixMultiplyReshapedOnlyRHSKernel.
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	894	- This support allows to export the OpenCL buffer used for the reshaped RHS matrix to the OpenCL image object.
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	895	- The padding requirement for the OpenCL image object is considered into the CLGEMMReshapeRHSMatrixKernel.
				896	- The reshaped RHS matrix stores the weights when GEMM is used to accelerate CLGEMMConvolutionLayer.
Georgios Pinitas	25ef721	2020-06-02 23:00:41 +0100	[diff] [blame]	897
Georgios Pinitas	fd7780d	2020-03-17 11:41:00 +0000	[diff] [blame]	898	v20.05 Public major release
Georgios Pinitas	c7b183a	2020-03-06 18:12:09 +0000	[diff] [blame]	899	- Various bug fixes.
				900	- Various optimisations.
Michele Di Giorgio	36a551f	2020-04-23 11:55:29 +0100	[diff] [blame]	901	- Updated recommended NDK version to r18b.
				902	- Updated recommended gcc version to Linaro 6.3.1.
Georgios Pinitas	c7b183a	2020-03-06 18:12:09 +0000	[diff] [blame]	903	- Added Bfloat16 type support
				904	- Added Bfloat16 support in:
Manuel Bottini	29599d0	2021-07-06 15:01:35 +0100	[diff] [blame]	905	- NEWeightsReshapeKernel
				906	- NEConvolutionLayerReshapeWeights
Manuel Bottini	9002899	2021-06-30 18:29:18 +0100	[diff] [blame]	907	- NEIm2ColKernel
Georgios Pinitas	f7c5a41	2020-12-03 14:38:33 +0000	[diff] [blame]	908	- NEIm2Col
Georgios Pinitas	11d8415	2021-04-28 10:20:18 +0100	[diff] [blame]	909	- NEDepthConvertLayerKernel
Georgios Pinitas	c7b183a	2020-03-06 18:12:09 +0000	[diff] [blame]	910	- @ref NEDepthConvertLayer
				911	- @ref NEGEMMConvolutionLayer
Georgios Pinitas	ec2256b	2020-12-03 18:51:58 +0000	[diff] [blame]	912	- NEGEMMAssemblyDispatch
Sheri Zhang	0f2522b	2020-03-25 16:38:19 +0000	[diff] [blame]	913	- Added new data type QASYMM8_SIGNED support for:
				914	- @ref CLDirectConvolutionLayer
				915	- @ref CLDeconvolutionLayer
				916	- @ref CLDirectDeconvolutionLayer
				917	- @ref CLGEMMDeconvolutionLayer
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	918	- CLGEMMLowpMatrixMultiplyReshapedKernel
				919	- CLGEMMLowpQuantizeDownInt32ScaleKernel
				920	- CLGEMMLowpQuantizeDownInt32ScaleByFloatKernel
Sheri Zhang	0f2522b	2020-03-25 16:38:19 +0000	[diff] [blame]	921	- @ref CLReductionOperation
				922	- @ref CLReduceMean
Sheri Zhang	359c48e	2020-04-30 22:53:39 +0100	[diff] [blame]	923	- @ref NEScale
Manuel Bottini	10b3826	2021-02-19 18:16:44 +0000	[diff] [blame]	924	- NEScaleKernel
Georgios Pinitas	c53266e	2020-12-09 03:11:53 +0000	[diff] [blame]	925	- NEUpsampleLayer
Sheri Zhang	0f2522b	2020-03-25 16:38:19 +0000	[diff] [blame]	926	- @ref NECast
				927	- @ref NEReductionOperation
				928	- @ref NEReduceMean
				929	- @ref NEArgMinMaxLayer
				930	- @ref NEDeconvolutionLayer
Manuel Bottini	ae58bdf	2021-06-17 17:18:45 +0100	[diff] [blame]	931	- NEGEMMLowpQuantizeDownInt32ScaleKernel
Sheri Zhang	0f2522b	2020-03-25 16:38:19 +0000	[diff] [blame]	932	- @ref CPPBoxWithNonMaximaSuppressionLimit
				933	- @ref CPPDetectionPostProcessLayer
				934	- @ref CPPPermuteKernel
				935	- @ref CPPPermute
				936	- @ref CPPTopKVKernel
				937	- @ref CPPTopKV
Sheri Zhang	359c48e	2020-04-30 22:53:39 +0100	[diff] [blame]	938	- @ref CPPUpsample
				939	- @ref CPPUpsampleKernel
Sheri Zhang	31b49ca	2020-04-24 11:15:10 +0100	[diff] [blame]	940	- New OpenCL kernels / functions:
				941	- @ref CLQLSTMLayer
				942	- @ref CLQLSTMLayerNormalizationKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	943	- New Arm® Neon™ kernels / functions:
Sheri Zhang	31b49ca	2020-04-24 11:15:10 +0100	[diff] [blame]	944	- @ref NEQLSTMLayer
				945	- @ref NEQLSTMLayerNormalizationKernel
				946	- Added HARD_SWISH support in:
Georgios Pinitas	f47f718	2021-01-15 09:29:50 +0000	[diff] [blame]	947	- CLActivationLayerKernel
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	948	- NEActivationLayerKernel
Sheri Zhang	0f2522b	2020-03-25 16:38:19 +0000	[diff] [blame]	949	- Deprecated OpenCL kernels / functions:
				950	- CLGEMMLowpQuantizeDownInt32ToUint8Scale
				951	- CLGEMMLowpQuantizeDownInt32ToUint8ScaleByFloat
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	952	- Deprecated Arm® Neon™ kernels / functions:
Sheri Zhang	0f2522b	2020-03-25 16:38:19 +0000	[diff] [blame]	953	- NEGEMMLowpQuantizeDownInt32ToUint8Scale
				954	- Removed CPP kernels / functions:
				955	- CPPFlipWeightsKernel
Manuel Bottini	387259a	2020-05-21 17:14:36 +0100	[diff] [blame]	956	- Removed PoolingLayerInfo constructors without Data Layout.
				957	- Removed CLDepthwiseConvolutionLayer3x3
				958	- Removed NEDepthwiseConvolutionLayerOptimized
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	959	- Added support for Winograd 3x3,4x4 on Arm® Neon™ FP16:
Manuel Bottini	075253a	2020-05-22 12:57:18 +0100	[diff] [blame]	960	- @ref NEWinogradConvolutionLayer
Michalis Spyrou	96f977e	2021-07-01 12:20:56 +0100	[diff] [blame]	961	- CpuWinogradConv2dTransformInputKernel
				962	- CpuWinogradConv2dTransformOutputKernel
				963	- CpuWinogradConv2dTransformWeightsKernel
Manuel Bottini	075253a	2020-05-22 12:57:18 +0100	[diff] [blame]	964	- Added CLCompileContext
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	965	- Added Arm® Neon™ GEMM kernel with 2D window support
Georgios Pinitas	c7b183a	2020-03-06 18:12:09 +0000	[diff] [blame]	966
Michele Di Giorgio	740872e	2020-03-04 15:29:49 +0000	[diff] [blame]	967	v20.02.1 Maintenance release
				968	- Added Android-NN build script.
				969
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	970	v20.02 Public major release
				971	- Various bug fixes.
				972	- Various optimisations.
				973	- Added new data type QASYMM8_SIGNED support for:
				974	- @ref CLDepthwiseConvolutionLayer
Manuel Bottini	387259a	2020-05-21 17:14:36 +0100	[diff] [blame]	975	- CLDepthwiseConvolutionLayer3x3
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	976	- @ref CLGEMMConvolutionLayer
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	977	- CLGEMMLowpMatrixMultiplyCore
				978	- CLGEMMLowpMatrixMultiplyReshapedOnlyRHSKernel
				979	- CLGEMMLowpMatrixMultiplyNativeKernel
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	980	- @ref NEActivationLayer
Sang-Hoon Park	63001ac	2021-01-18 14:20:27 +0000	[diff] [blame]	981	- NEComparisonOperationKernel
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	982	- @ref NEConvolutionLayer
				983	- @ref NEDepthwiseConvolutionLayer
Georgios Pinitas	7d0adc6	2020-09-04 15:25:24 +0100	[diff] [blame]	984	- NEDepthwiseConvolutionLayer3x3Kernel
Manuel Bottini	327225d	2021-04-13 13:09:30 +0100	[diff] [blame]	985	- NEDirectConvolutionLayerOutputStageKernel
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	986	- @ref NEElementwiseComparison
				987	- @ref NEElementwiseMax
				988	- @ref NEElementwiseMin
				989	- @ref NEElementwiseSquaredDiff
				990	- @ref NEFullyConnectedLayer
Michele Di Giorgio	f22f672	2020-07-03 16:29:24 +0100	[diff] [blame]	991	- NEGEMMMatrixVectorMultiplyKernel
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	992	- @ref NEPixelWiseMultiplication
				993	- @ref NEPoolingLayer
				994	- @ref NEPReluLayer
				995	- Added support for QSYMM8_PER_CHANNEL in:
Georgios Pinitas	7d0adc6	2020-09-04 15:25:24 +0100	[diff] [blame]	996	- NEDepthwiseConvolutionLayer3x3Kernel
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	997	- Added support for split sizes in:
				998	- @ref CLSplit
				999	- @ref NESplit
				1000	- New OpenCL kernels / functions:
				1001	- @ref CLFill
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	1002	- CLGEMMLowpQuantizeDownInt32ToInt8ScaleByFixedPointKernel / CLGEMMLowpQuantizeDownInt32ToInt8ScaleByFixedPoint
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1003	- New Arm® Neon™ kernels / functions:
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	1004	- @ref NEFill
Manuel Bottini	ae58bdf	2021-06-17 17:18:45 +0100	[diff] [blame]	1005	- NEGEMMLowpQuantizeDownInt32ToInt8ScaleByFixedPointKernel / NEGEMMLowpQuantizeDownInt32ToInt8ScaleByFixedPoint
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1006	- Deprecated Arm® Neon™ functions / interfaces:
Manuel Bottini	387259a	2020-05-21 17:14:36 +0100	[diff] [blame]	1007	- CLDepthwiseConvolutionLayer3x3
				1008	- NEDepthwiseConvolutionLayerOptimized
				1009	- PoolingLayerInfo constructors without Data Layout.
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1010	- Added support for quantization with multiplier greater than 1 on Arm® Neon™ and CL.
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	1011	- Added support for quantized inputs of type QASYMM8_SIGNED and QASYMM8 to @ref CLQuantizationLayer.
				1012	- Added the ability to build bootcode for bare metal.
				1013	- Added support for generating synthetic QASYMM8 graphs.
				1014	- Added support for F16 datatype in VGG16.
				1015	- Removed pre-built binaries for GLES.
				1016
Michele Di Giorgio	d374ff2	2020-01-21 10:03:20 +0000	[diff] [blame]	1017	v19.11.1 Public maintenance release
				1018	- Fix offset calculation in NEReductionOperationKernel.
				1019	- Fix data layout in NEScaleKernel for nhwc.
				1020	- Retain configuration step data layout to avoid side-effects.
				1021	- Perform sqrt in double domain for L2 pooling.
				1022	- Fix output shape calculation for Reduce Mean
				1023	- Restrict cases where optimized NEPadLayer runs.
				1024
Michele Di Giorgio	a046e16	2019-10-08 09:36:26 +0100	[diff] [blame]	1025	v19.11 Public major release
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	1026	- Various bug fixes.
				1027	- Various optimisations.
SiCong Li	1f7f988	2019-11-28 14:59:35 +0000	[diff] [blame]	1028	- Updated recommended NDK version to r17c.
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	1029	- Deprecated OpenCL kernels / functions:
Michele Di Giorgio	a046e16	2019-10-08 09:36:26 +0100	[diff] [blame]	1030	- CLDepthwiseConvolutionLayerReshapeWeightsGenericKernel
				1031	- CLDepthwiseIm2ColKernel
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	1032	- CLDepthwiseSeparableConvolutionLayer
Michele Di Giorgio	a046e16	2019-10-08 09:36:26 +0100	[diff] [blame]	1033	- CLDepthwiseVectorToTensorKernel
				1034	- CLDirectConvolutionLayerOutputStageKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1035	- Deprecated Arm® Neon™ kernels / functions:
Giorgio Arena	d93e263	2019-10-15 11:09:33 +0100	[diff] [blame]	1036	- NEDepthwiseWeightsReshapeKernel
				1037	- NEDepthwiseIm2ColKernel
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	1038	- NEDepthwiseSeparableConvolutionLayer
Giorgio Arena	d93e263	2019-10-15 11:09:33 +0100	[diff] [blame]	1039	- NEDepthwiseVectorToTensorKernel
Manuel Bottini	05069f0	2019-09-26 17:18:26 +0100	[diff] [blame]	1040	- NEDepthwiseConvolutionLayer3x3
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	1041	- New OpenCL kernels / functions:
				1042	- @ref CLInstanceNormalizationLayerKernel / @ref CLInstanceNormalizationLayer
				1043	- @ref CLDepthwiseConvolutionLayerNativeKernel to replace the old generic depthwise convolution (see Deprecated
				1044	OpenCL kernels / functions)
				1045	- @ref CLLogSoftmaxLayer
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1046	- New Arm® Neon™ kernels / functions:
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	1047	- @ref NEBoundingBoxTransformKernel / @ref NEBoundingBoxTransform
Georgios Pinitas	8c3c0e7	2020-12-03 20:11:53 +0000	[diff] [blame]	1048	- @ref NEComputeAllAnchorsKernel / NEComputeAllAnchors
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	1049	- @ref NEDetectionPostProcessLayer
				1050	- @ref NEGenerateProposalsLayer
				1051	- @ref NEInstanceNormalizationLayerKernel / @ref NEInstanceNormalizationLayer
				1052	- @ref NELogSoftmaxLayer
				1053	- @ref NEROIAlignLayerKernel / @ref NEROIAlignLayer
				1054	- Added QASYMM8 support for:
				1055	- @ref CLGenerateProposalsLayer
				1056	- @ref CLROIAlignLayer
				1057	- @ref CPPBoxWithNonMaximaSuppressionLimit
				1058	- Added QASYMM16 support for:
				1059	- @ref CLBoundingBoxTransform
				1060	- Added FP16 support for:
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	1061	- CLGEMMMatrixMultiplyReshapedKernel
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	1062	- Added new data type QASYMM8_PER_CHANNEL support for:
Manuel Bottini	9e73c93	2021-03-02 17:40:42 +0000	[diff] [blame]	1063	- CLDequantizationLayer
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	1064	- @ref NEDequantizationLayer
				1065	- Added new data type QSYMM8_PER_CHANNEL support for:
				1066	- @ref CLConvolutionLayer
				1067	- @ref NEConvolutionLayer
				1068	- @ref CLDepthwiseConvolutionLayer
				1069	- @ref NEDepthwiseConvolutionLayer
				1070	- Added FP16 mixed-precision support for:
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	1071	- CLGEMMMatrixMultiplyReshapedKernel
Michele Di Giorgio	e131466	2021-02-01 17:09:32 +0000	[diff] [blame]	1072	- CLPoolingLayerKernel
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	1073	- Added FP32 and FP16 ELU activation for:
				1074	- @ref CLActivationLayer
				1075	- @ref NEActivationLayer
				1076	- Added asymmetric padding support for:
				1077	- @ref CLDirectDeconvolutionLayer
				1078	- @ref CLGEMMDeconvolutionLayer
				1079	- @ref NEDeconvolutionLayer
				1080	- Added SYMMETRIC and REFLECT modes for @ref CLPadLayerKernel / @ref CLPadLayer.
Georgios Pinitas	0f7ef8a	2021-01-10 04:23:52 +0000	[diff] [blame]	1081	- Replaced the calls to NECopyKernel and NEMemsetKernel with @ref NEPadLayer in @ref NEGenerateProposalsLayer.
				1082	- Replaced the calls to CLCopyKernel and CLMemsetKernel with @ref CLPadLayer in @ref CLGenerateProposalsLayer.
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	1083	- Improved performance for CL Inception V3 - FP16.
				1084	- Improved accuracy for CL Inception V3 - FP16 by enabling FP32 accumulator (mixed-precision).
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1085	- Improved Arm® Neon™ performance by enabling fusing batch normalization with convolution and depth-wise convolution layer.
				1086	- Improved Arm® Neon™ performance for MobileNet-SSD by improving the output detection performance.
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	1087	- Optimized @ref CLPadLayer.
				1088	- Optimized CL generic depthwise convolution layer by introducing @ref CLDepthwiseConvolutionLayerNativeKernel.
				1089	- Reduced memory consumption by implementing weights sharing.
Michele Di Giorgio	a046e16	2019-10-08 09:36:26 +0100	[diff] [blame]	1090
Michele Di Giorgio	d374ff2	2020-01-21 10:03:20 +0000	[diff] [blame]	1091	v19.08.1 Public maintenance release
				1092	- Fix offset calculation in NEReductionOperationKernel.
				1093	- Fix data layout in NEScaleKernel for nhwc.
				1094	- Retain configuration step data layout to avoid side-effects.
				1095	- Perform sqrt in double domain for L2 pooling.
				1096	- Fix output shape calculation for Reduce Mean
				1097	- Fix broadcast CLPixelwiseMultiplication with 5D tensors
				1098
Georgios Pinitas	3d13af8	2019-06-04 13:04:16 +0100	[diff] [blame]	1099	v19.08 Public major release
				1100	- Various bug fixes.
				1101	- Various optimisations.
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1102	- Deprecated Arm® Neon™ functions
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1103	- NEDepthConcatenateLayer
				1104	- NEWidthConcatenateLayer
				1105	- Deprecated OpenCL kernels / functions
				1106	- CLDepthConcatenateLayer
				1107	- CLGEMMInterleave4x4Kernel / CLGEMMInterleave4x4
				1108	- CLGEMMTranspose1xWKernel / CLGEMMTranspose1xW
				1109	- CLWidthConcatenateLayer
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1110	- New Arm® Neon™ kernels / functions:
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	1111	- @ref NEAbsLayer
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1112	- @ref NECast
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	1113	- @ref NEElementwisePower
				1114	- @ref NELogLayer
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1115	- @ref NELSTMLayerQuantized
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	1116	- @ref NENegLayer
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1117	- @ref NEPReluLayer
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	1118	- @ref NESinLayer
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	1119	- NEBatchConcatenateLayerKernel
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1120	- @ref NEDepthToSpaceLayerKernel / @ref NEDepthToSpaceLayer
Michalis Spyrou	60c3b0e	2021-04-08 12:02:58 +0100	[diff] [blame]	1121	- NEDepthwiseConvolutionLayerNativeKernel
Manuel Bottini	ae58bdf	2021-06-17 17:18:45 +0100	[diff] [blame]	1122	- NEGEMMLowpQuantizeDownInt32ToInt16ScaleByFixedPointKernel
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1123	- @ref NEMeanStdDevNormalizationKernel / @ref NEMeanStdDevNormalizationLayer
				1124	- @ref NESpaceToDepthLayerKernel / @ref NESpaceToDepthLayer
				1125	- New OpenCL kernels / functions:
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	1126	- @ref CLAbsLayer
				1127	- @ref CLElementwisePower
				1128	- @ref CLLogLayer
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1129	- @ref CLLSTMLayerQuantized
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	1130	- @ref CLNegLayer
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1131	- @ref CLPReluLayer
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	1132	- @ref CLSinLayer
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	1133	- CLBatchConcatenateLayerKernel
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1134	- @ref CLDepthToSpaceLayerKernel / @ref CLDepthToSpaceLayer
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	1135	- CLGEMMLowpMatrixMultiplyNativeKernel
Michele Di Giorgio	ba14c92	2020-10-12 13:27:57 +0100	[diff] [blame]	1136	- CLGEMMLowpQuantizeDownInt32ToInt16ScaleByFixedPointKernel
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	1137	- CLGEMMMatrixMultiplyNativeKernel
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1138	- CLMeanStdDevNormalizationKernel /CLMeanStdDevNormalizationLayer
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1139	- @ref CLSpaceToDepthLayerKernel / @ref CLSpaceToDepthLayer
				1140	- New examples:
				1141	- neon_opticalflow
				1142	- cl_cache
				1143	- neon_permute
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	1144	- Added support for FP16 in @ref NEDeconvolutionLayer
				1145	- Added support for FP16 in @ref CLDeconvolutionLayer
				1146	- Added support for REDUCE_MIN and REDUCE_MAX in @ref ReductionOperation
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1147	- Enable the fusion of batch normalization with convolution and depthwise convolution layer for FP32 in the graph API (OpenCL only)
				1148	- Added support for fusing activation function and broadcast addition with the matrix multiplication for FP32 (OpenCL only)
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1149	- Re-factored the depthwise convolution layer kernel on Arm® Neon™ for generic cases
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	1150	- Added an optimized depthwise convolution layer kernel for 5x5 filters (Neon™ only)
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1151	- Added support to enable OpenCL kernel cache. Added example showing how to load the prebuilt OpenCL kernels from a binary cache file
				1152	- Altered @ref QuantizationInfo interface to support per-channel quantization.
Manuel Bottini	387259a	2020-05-21 17:14:36 +0100	[diff] [blame]	1153	- The CLDepthwiseConvolutionLayer3x3 will be included by @ref CLDepthwiseConvolutionLayer to accommodate for future optimizations.
				1154	- The NEDepthwiseConvolutionLayerOptimized will be included by @ref NEDepthwiseConvolutionLayer to accommodate for future optimizations.
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1155	- Removed inner_border_right and inner_border_top parameters from @ref CLDeconvolutionLayer interface
				1156	- Removed inner_border_right and inner_border_top parameters from @ref NEDeconvolutionLayer interface
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1157	- Optimized the Arm® Neon™ assembly kernel for GEMMLowp. The new implementation fuses the output stage and quantization with the matrix multiplication kernel
Georgios Pinitas	3d13af8	2019-06-04 13:04:16 +0100	[diff] [blame]	1158
Michalis Spyrou	a9c4472	2019-04-05 17:18:36 +0100	[diff] [blame]	1159	v19.05 Public major release
Michalis Spyrou	c6608ac	2019-05-16 17:40:23 +0100	[diff] [blame]	1160	- Various bug fixes.
				1161	- Various optimisations.
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1162	- New Arm® Neon™ kernels / functions:
Georgios Pinitas	f790fdb	2019-04-24 12:41:25 +0100	[diff] [blame]	1163	- @ref NEBatchToSpaceLayerKernel / @ref NEBatchToSpaceLayer
Sheri Zhang	1e3ab42	2021-03-16 17:35:08 +0000	[diff] [blame]	1164	- NEComplexPixelWiseMultiplicationKernel / @ref NEComplexPixelWiseMultiplication
Georgios Pinitas	f790fdb	2019-04-24 12:41:25 +0100	[diff] [blame]	1165	- @ref NECropKernel / @ref NECropResize
Michalis Spyrou	60c3b0e	2021-04-08 12:02:58 +0100	[diff] [blame]	1166	- NEDepthwiseConvolutionAssemblyDispatch
Michalis Spyrou	ca82e62	2019-05-10 16:43:20 +0100	[diff] [blame]	1167	- @ref NEFFTDigitReverseKernel
				1168	- @ref NEFFTRadixStageKernel
				1169	- @ref NEFFTScaleKernel
Manuel Bottini	cfac51c	2021-06-18 15:47:28 +0100	[diff] [blame]	1170	- NEGEMMLowpOffsetContributionOutputStageKernel
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	1171	- NEHeightConcatenateLayerKernel
Georgios Pinitas	f790fdb	2019-04-24 12:41:25 +0100	[diff] [blame]	1172	- @ref NESpaceToBatchLayerKernel / @ref NESpaceToBatchLayer
Michalis Spyrou	d7dd15c	2019-05-30 14:53:58 +0100	[diff] [blame]	1173	- @ref NEFFT1D
				1174	- @ref NEFFT2D
				1175	- @ref NEFFTConvolutionLayer
Georgios Pinitas	f790fdb	2019-04-24 12:41:25 +0100	[diff] [blame]	1176	- New OpenCL kernels / functions:
Sheri Zhang	f9ab9f9	2021-03-16 12:09:15 +0000	[diff] [blame]	1177	- CLComplexPixelWiseMultiplicationKernel / @ref CLComplexPixelWiseMultiplication
Sheri Zhang	7e20e29	2021-02-02 11:49:34 +0000	[diff] [blame]	1178	- CLCropKernel / @ref CLCropResize
Michalis Spyrou	d7dd15c	2019-05-30 14:53:58 +0100	[diff] [blame]	1179	- @ref CLDeconvolutionReshapeOutputKernel
Georgios Pinitas	f790fdb	2019-04-24 12:41:25 +0100	[diff] [blame]	1180	- @ref CLFFTDigitReverseKernel
				1181	- @ref CLFFTRadixStageKernel
				1182	- @ref CLFFTScaleKernel
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	1183	- CLGEMMLowpMatrixMultiplyReshapedOnlyRHSKernel
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	1184	- CLGEMMMatrixMultiplyReshapedOnlyRHSKernel
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	1185	- CLHeightConcatenateLayerKernel
Georgios Pinitas	f790fdb	2019-04-24 12:41:25 +0100	[diff] [blame]	1186	- @ref CLDirectDeconvolutionLayer
				1187	- @ref CLFFT1D
				1188	- @ref CLFFT2D
				1189	- @ref CLFFTConvolutionLayer
Michalis Spyrou	ca82e62	2019-05-10 16:43:20 +0100	[diff] [blame]	1190	- @ref CLGEMMDeconvolutionLayer
				1191	- New OpenGLES kernels / functions:
Manuel Bottini	ceaa0bf	2021-02-16 15:15:19 +0000	[diff] [blame]	1192	- GCConcatenateLayer
Michalis Spyrou	a9c4472	2019-04-05 17:18:36 +0100	[diff] [blame]	1193	- Deprecated functions/interfaces
Georgios Pinitas	09f2497	2019-05-17 18:14:40 +0100	[diff] [blame]	1194	- GCDepthConcatenateLayer
				1195	- NEWidthConcatenateLayer
				1196	- NEDepthConcatenateLayer
				1197	- CLWidthConcatenateLayer
				1198	- CLDepthConcatenateLayer
Gian Marco Iodice	5fc07aa	2019-05-15 17:08:02 +0100	[diff] [blame]	1199	- CLGEMMInterleave4x4
				1200	- CLGEMMTranspose1xW
Michalis Spyrou	c6608ac	2019-05-16 17:40:23 +0100	[diff] [blame]	1201	- Support different quantization info in CLConcatLayer.
				1202	- Add checks on different input/output quantization info were not supported.
				1203	- Tensors have different quantization information.
				1204	- Add FP16 support checks.
				1205	- Fix output quantization CLDeptwiseConv3x3 when activation is fused.
				1206	- New graph examples:
				1207	- graph_convolution
				1208	- graph_fully_connected
				1209	- graph_depthwise_convolution
				1210	- Deepspeech v0.4.1
				1211	- Add support for QASYMM8 in NEArithmeticSubtractionKernel.
				1212	- Add support for QASYMM8 in NEPixelWiseMultiplicationKernel.
				1213	- Add support for QASYMM8 NEDeconvolution.
Sheri Zhang	ac6499a	2021-02-10 15:32:38 +0000	[diff] [blame]	1214	- Add support for DequantizationLayer for Neon/CL.
Michalis Spyrou	c6608ac	2019-05-16 17:40:23 +0100	[diff] [blame]	1215	- Add support for dilation in CLDepthwiseConvolution.
				1216	- Fuse offset contribution with the output stage when we use NEGEMMLowpMatrixMultiplyCore.
				1217	- Optimize CLDeconvolution.
				1218	- Add StackLayer to the graph API.
				1219	- Add support for "reflect" padding mode in NEPad.
				1220	- Winograd 7x7 NHWC on OpenCL.
				1221	- Rework CL ML layers to run exclusively on CL.
				1222	- Support different quantization info in PoolingLayer.
				1223	- Implement and test import memory interfaces.
				1224	- Added new tests and removed old ones.
				1225	- Various clang-tidy fixes.
Michalis Spyrou	a9c4472	2019-04-05 17:18:36 +0100	[diff] [blame]	1226
giuros01	a69a88b	2019-01-31 16:29:19 +0000	[diff] [blame]	1227	v19.02 Public major release
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1228	- Various bug fixes.
				1229	- Various optimisations.
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1230	- New Arm® Neon™ kernels / functions:
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1231	- @ref NETileKernel / @ref NETile
				1232	- @ref NEFuseBatchNormalizationKernel / @ref NEFuseBatchNormalization
Sang-Hoon Park	63001ac	2021-01-18 14:20:27 +0000	[diff] [blame]	1233	- NEElementwiseOperationKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1234	- @ref NEElementwiseMax
				1235	- @ref NEElementwiseMin
				1236	- @ref NEElementwiseSquaredDiff
				1237	- @ref NESelectKernel / @ref NESelect
				1238	- @ref NESplit
				1239	- @ref NESlice
				1240	- @ref NEUnstack
				1241	- @ref NEStridedSliceKernel / @ref NEStridedSlice
Sang-Hoon Park	7249f15	2021-01-22 11:55:03 +0000	[diff] [blame]	1242	- NEElementwiseUnaryKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1243	- @ref NERsqrtLayer
				1244	- @ref NEExpLayer
				1245	- @ref NEReverseKernel / @ref NEReverse
				1246	- @ref NEArgMinMaxLayer
				1247	- @ref NEStackLayerKernel / @ref NEStackLayer
				1248	- @ref NERangeKernel / @ref NERange
				1249	- @ref NEPadLayer
Georgios Pinitas	0f7ef8a	2021-01-10 04:23:52 +0000	[diff] [blame]	1250	- NEMemsetKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1251	- @ref NEGatherKernel / @ref NEGather
				1252	- @ref NEElementwiseComparison
				1253	- @ref NEElementwiseComparisonStatic
Sang-Hoon Park	63001ac	2021-01-18 14:20:27 +0000	[diff] [blame]	1254	- NEComparisonOperationKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1255	- @ref NEElementwiseDivision
				1256	- New OpenCL kernels / functions:
				1257	- @ref CLSelectKernel / @ref CLSelect
				1258	- @ref CLTileKernel / @ref CLTile
				1259	- @ref CLComparisonKernel / @ref CLComparison
				1260	- @ref CLArgMinMaxLayer
				1261	- @ref CLElementwiseMax
				1262	- @ref CLElementwiseMin
				1263	- @ref CLElementwiseSquaredDiff
				1264	- @ref CLStackLayerKernel / @ref CLStackLayer
				1265	- @ref CLReverse / @ref CLReverseKernel
				1266	- @ref CLRsqrtLayer
				1267	- @ref CLExpLayer
Michele Di Giorgio	c9c8905	2021-01-26 10:20:17 +0000	[diff] [blame]	1268	- CLElementWiseUnaryLayerKernel
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	1269	- CLGEMMReshapeLHSMatrixKernel
				1270	- CLGEMMReshapeRHSMatrixKernel
				1271	- CLGEMMMatrixMultiplyReshapedKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1272	- @ref CLRangeKernel / @ref CLRange
				1273	- @ref CLUnstack
				1274	- @ref CLGatherKernel / @ref CLGather
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	1275	- CLGEMMLowpMatrixMultiplyReshapedKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1276	- New CPP kernels / functions:
				1277	- @ref CPPDetectionOutputLayer
				1278	- @ref CPPTopKV / @ref CPPTopKVKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1279	- Added new examples:
				1280	- graph_ssd_mobilenet.cpp
				1281	- graph_mobilenet_v2.cpp
				1282	- graph_resnet12.cpp
				1283	- graph_srcnn955.cpp
				1284	- graph_vgg_vdsr.cpp
				1285	- graph_inception_resnet_v1.cpp
				1286	- Add 4D tensors support to
				1287	- @ref NESoftmaxLayer
				1288	- Fused activation in @ref CLWinogradConvolutionLayer
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	1289	- Extended @ref NEPermute to support more cases
				1290	- Added Neon™/SVE GEMM Hybrid kernels
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1291	- Added u8 and s8 hybrid assembly kernels
				1292	- Introduced GEMM strategy name in NEGEMMAssemblyWrapper
				1293	- Improved @ref CLTuner
				1294	- Fused the bias addition within @ref CLGEMM
				1295	- Added support for QASYMM8 LOGISTIC activation in @ref NEActivationLayer
				1296	- Added NHWC data layout support to:
				1297	- @ref NEScale for F16
				1298	- @ref CLNormalizationLayer IN_MAP_2D for FP32/FP16
				1299	- @ref NEL2NormalizeLayer for FP32/FP16
				1300	- @ref NENormalizationLayer IN_MAP_2D for FP32/FP16
				1301	- @ref CLROIAlignLayer
Manuel Bottini	5209be5	2019-02-13 16:34:56 +0000	[diff] [blame]	1302	- @ref CLGenerateProposalsLayer
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1303	- Added QASYMM8 support to the following kernels:
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	1304	- NEArithmeticAdditionKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1305	- @ref NEScale
				1306	- Added new tests and improved validation and benchmarking suites.
giuros01	a69a88b	2019-01-31 16:29:19 +0000	[diff] [blame]	1307	- Deprecated functions/interfaces
				1308	- Usage of inner_border_right and inner_border_top has been deprecated in @ref CLDeconvolutionLayer and @ref NEDeconvolutionLayer
				1309
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1310	v18.11 Public major release
				1311	- Various bug fixes.
				1312	- Various optimisations.
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1313	- New Arm® Neon™ kernels / functions:
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1314	- @ref NEChannelShuffleLayer / @ref NEChannelShuffleLayerKernel
				1315	- @ref NEReduceMean
				1316	- @ref NEReorgLayer / @ref NEReorgLayerKernel
				1317	- @ref NEPriorBoxLayer / @ref NEPriorBoxLayerKernel
Georgios Pinitas	c53266e	2020-12-09 03:11:53 +0000	[diff] [blame]	1318	- NEUpsampleLayer / NEUpsampleLayerKernel
Georgios Pinitas	0b1c2db	2020-12-04 15:51:34 +0000	[diff] [blame]	1319	- NEYOLOLayer / NEYOLOLayerKernel
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1320	- New OpenCL kernels / functions:
				1321	- @ref CLBatchToSpaceLayer / @ref CLBatchToSpaceLayerKernel
				1322	- @ref CLBoundingBoxTransform / @ref CLBoundingBoxTransformKernel
Manuel Bottini	5209be5	2019-02-13 16:34:56 +0000	[diff] [blame]	1323	- @ref CLComputeAllAnchorsKernel
				1324	- @ref CLGenerateProposalsLayer
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1325	- @ref CLNormalizePlanarYUVLayer / @ref CLNormalizePlanarYUVLayerKernel
				1326	- @ref CLReorgLayer / @ref CLReorgLayerKernel
				1327	- @ref CLSpaceToBatchLayer / @ref CLSpaceToBatchLayerKernel
				1328	- @ref CLPadLayer
				1329	- @ref CLReduceMean
				1330	- @ref CLPriorBoxLayer / @ref CLPriorBoxLayerKernel
				1331	- @ref CLROIAlignLayer / @ref CLROIAlignLayerKernel
				1332	- @ref CLSlice
				1333	- @ref CLSplit
				1334	- @ref CLStridedSlice / @ref CLStridedSliceKernel
Georgios Pinitas	c53266e	2020-12-09 03:11:53 +0000	[diff] [blame]	1335	- CLUpsampleLayer / CLUpsampleLayerKernel
Georgios Pinitas	0b1c2db	2020-12-04 15:51:34 +0000	[diff] [blame]	1336	- CLYOLOLayer / CLYOLOLayerKernel
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1337	- New CPP kernels / functions:
				1338	- @ref CPPBoxWithNonMaximaSuppressionLimit / @ref CPPBoxWithNonMaximaSuppressionLimitKernel
				1339	- Added the validate method in:
				1340	- @ref NEDepthConvertLayer
				1341	- @ref NEFloor / @ref CLFloor
Michele Di Giorgio	93b75e0	2021-06-21 12:00:43 +0100	[diff] [blame]	1342	- NEGEMMMatrixAdditionKernel
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1343	- @ref NEReshapeLayer / @ref CLReshapeLayer
				1344	- @ref CLScale
				1345	- Added new examples:
				1346	- graph_shufflenet.cpp
				1347	- graph_yolov3.cpp
				1348	- Added documentation for add a new function or kernel.
				1349	- Improved doxygen documentation adding a list of the existing functions.
				1350	- Add 4D tensors support to
Georgios Pinitas	09f2497	2019-05-17 18:14:40 +0100	[diff] [blame]	1351	- CLWidthConcatenateLayer
Georgios Pinitas	e2696b1	2020-12-03 20:37:43 +0000	[diff] [blame]	1352	- CLFlattenLayer
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1353	- @ref CLSoftmaxLayer
Gian Marco Iodice	8155c02	2021-04-16 15:08:59 +0100	[diff] [blame]	1354	- Add dot product support for CLDepthwiseConvolutionLayer3x3NHWCKernel non-unit stride
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1355	- Add SVE support
				1356	- Fused batch normalization into convolution layer weights in @ref CLFuseBatchNormalization
Gian Marco Iodice	8155c02	2021-04-16 15:08:59 +0100	[diff] [blame]	1357	- Fuses activation in CLDepthwiseConvolutionLayer3x3NCHWKernel, CLDepthwiseConvolutionLayer3x3NHWCKernel and @ref NEGEMMConvolutionLayer
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1358	- Added NHWC data layout support to:
				1359	- @ref CLChannelShuffleLayer
				1360	- @ref CLDeconvolutionLayer
				1361	- @ref CLL2NormalizeLayer
				1362	- Added QASYMM8 support to the following kernels:
Manuel Bottini	3b131ab	2021-02-19 18:16:44 +0000	[diff] [blame]	1363	- CLScaleKernel
Georgios Pinitas	7d0adc6	2020-09-04 15:25:24 +0100	[diff] [blame]	1364	- NEDepthwiseConvolutionLayer3x3Kernel
Sheri Zhang	f9ab9f9	2021-03-16 12:09:15 +0000	[diff] [blame]	1365	- CLPixelWiseMultiplicationKernel
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1366	- Added FP16 support to the following kernels:
Gian Marco Iodice	8155c02	2021-04-16 15:08:59 +0100	[diff] [blame]	1367	- CLDepthwiseConvolutionLayer3x3NHWCKernel
Georgios Pinitas	7d0adc6	2020-09-04 15:25:24 +0100	[diff] [blame]	1368	- NEDepthwiseConvolutionLayer3x3Kernel
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1369	- @ref CLNormalizePlanarYUVLayerKernel
				1370	- @ref CLWinogradConvolutionLayer (5x5 kernel)
				1371	- More tests added to both validation and benchmarking suites.
				1372
Anthony Barbier	d51ea0a	2018-08-07 17:48:03 +0100	[diff] [blame]	1373	v18.08 Public major release
				1374	- Various bug fixes.
Michele Di Giorgio	02baf01	2018-08-20 18:10:38 +0100	[diff] [blame]	1375	- Various optimisations.
Anthony Barbier	d51ea0a	2018-08-07 17:48:03 +0100	[diff] [blame]	1376	- Updated recommended NDK version to r17b.
Michele Di Giorgio	02baf01	2018-08-20 18:10:38 +0100	[diff] [blame]	1377	- Removed support for QS8/QS16 data types.
				1378	- Added support for grouped convolution in @ref CLConvolutionLayer.
				1379	- Added NHWC data layout support to:
Georgios Pinitas	09f2497	2019-05-17 18:14:40 +0100	[diff] [blame]	1380	- NEDepthConcatenateLayer / CLDepthConcatenateLayer
Michele Di Giorgio	02baf01	2018-08-20 18:10:38 +0100	[diff] [blame]	1381	- @ref NEWinogradConvolutionLayer / @ref CLWinogradConvolutionLayer
				1382	- @ref CLDepthwiseConvolutionLayer
				1383	- @ref CLDirectConvolutionLayer
				1384	- @ref CLConvolutionLayer
				1385	- @ref CLScale
Manuel Bottini	d844c08	2021-07-14 12:58:54 +0100	[diff] [blame]	1386	- CLIm2ColKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1387	- New Arm® Neon™ kernels / functions:
Michele Di Giorgio	02baf01	2018-08-20 18:10:38 +0100	[diff] [blame]	1388	- @ref NERNNLayer
				1389	- New OpenCL kernels / functions:
				1390	- @ref CLArithmeticDivision
				1391	- Introduced prepare() stage support in the graph API for GLES.
				1392	- Added support for memory reusage when trying to allocate smaller CLTensors.
				1393	- Enabled NHWC execution on graph examples.
				1394	- Added JPEG accessor for validation purposes.
				1395	- Added validate methods to some kernels / functions.
Anthony Barbier	d51ea0a	2018-08-07 17:48:03 +0100	[diff] [blame]	1396
				1397	v18.05 Public major release
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1398	- Various bug fixes.
				1399	- Various optimisations.
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	1400	- Major redesign in the interface for the Neon™ kernels implemented in assembly.
Pablo Tello	eb82fd2	2018-02-23 13:43:50 +0000	[diff] [blame]	1401	- Removed arm_compute::NEGEMMLowpAArch64A53Kernel / arm_compute::NEGEMMLowpAArch64Kernel / arm_compute::NEGEMMLowpAArch64V8P4Kernel / arm_compute::NEGEMMInterleavedBlockedKernel / arm_compute::NEGEMMLowpAssemblyMatrixMultiplyCore / arm_compute::NEHGEMMAArch64FP16Kernel
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	1402	- Added NEGEMMAssemblyWrapper and AssemblyKernelGlue which are used to execute assembly kernels in Neon™ functions.
Pablo Tello	eb82fd2	2018-02-23 13:43:50 +0000	[diff] [blame]	1403	- Minor changes to the CPUInfo type to make it compatible with the new assembly gemm interface.
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	1404	- Moved Neon™ assembly kernels to the folder src/core/Neon/kernels/arm_gemm.
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1405	- Improved doxygen documentation.
				1406	- Improved memory management for layer's transitions.
				1407	- Added support for NHWC data layout in tensors.
				1408	- Added NHWC data layout support to:
				1409	- @ref NEGEMMConvolutionLayer
				1410	- @ref NEDirectConvolutionLayer
				1411	- @ref NEPoolingLayer / @ref CLPoolingLayer
				1412	- @ref NEBatchNormalizationLayer / @ref CLBatchNormalizationLayer
				1413	- @ref NEDepthwiseConvolutionLayer
				1414	- @ref NEScale
Georgios Pinitas	f7c5a41	2020-12-03 14:38:33 +0000	[diff] [blame]	1415	- NEIm2Col
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1416	- Added support for dilated convolutions in @ref NEConvolutionLayer and @ref CLConvolutionLayer.
				1417	- New OpenCL kernels / functions:
				1418	- @ref CLChannelShuffleLayer / @ref CLChannelShuffleLayerKernel
Teresa Charlin	91b7f74	2021-04-12 13:57:00 +0100	[diff] [blame]	1419	- CLConvertFullyConnectedWeightsKernel / @ref CLConvertFullyConnectedWeights
Sheri Zhang	7e20e29	2021-02-02 11:49:34 +0000	[diff] [blame]	1420	- @ref CLCopy / CLCopyKernel
Anthony Barbier	38e7f1f	2018-05-21 13:37:47 +0100	[diff] [blame]	1421	- @ref CLLSTMLayer
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1422	- @ref CLRNNLayer
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	1423	- CLWidthConcatenateLayer / CLWidthConcatenateLayerKernel
Manuel Bottini	c6f4ec3	2021-05-18 18:41:56 +0100	[diff] [blame]	1424	- CLWinogradFilterTransformKernel / @ref CLWinogradConvolutionLayer
				1425	- CLWinogradInputTransformKernel / CLWinogradInputTransform
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1426	- New Arm® Neon™ kernels / functions:
Teresa Charlin	562bee5	2021-04-13 17:44:15 +0100	[diff] [blame]	1427	- NEConvertFullyConnectedWeightsKernel / @ref NEConvertFullyConnectedWeights.
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1428	- Created the validate method in @ref CLDepthwiseConvolutionLayer.
				1429	- Beta and gamma are no longer mandatory arguments in @ref NEBatchNormalizationLayer and @ref CLBatchNormalizationLayer.
				1430	- Added depth multiplier support in @ref NEDepthwiseConvolutionLayer and @ref CLDepthwiseConvolutionLayer.
Sheri Zhang	1e3ab42	2021-03-16 17:35:08 +0000	[diff] [blame]	1431	- Added broadcast multiply support in @ref NEPixelWiseMultiplication / NEPixelWiseMultiplicationKernel.
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1432	- Port mobilenet example to NHWC data layout.
				1433	- Enabled Winograd method in @ref CLConvolutionLayer.
				1434	- Renamed NEWinogradLayer to @ref NEWinogradConvolutionLayer.
Sheri Zhang	ac6499a	2021-02-10 15:32:38 +0000	[diff] [blame]	1435	- Updated @ref NEWinogradConvolutionLayer to use highly optimised assembly kernels in src/core/Neon/kernels/arm_gemm.
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1436	- Added memory manager support in GLES functions.
				1437	- Major refactoring of the graph API.
				1438	- Added GLES backend in the graph API.
				1439	- Added support for the memory manager in the graph API.
				1440	- Enabled Winograd Convolution method in the graph API.
				1441	- Added support for grouped convolutions in the graph API.
Manuel Bottini	10b3826	2021-02-19 18:16:44 +0000	[diff] [blame]	1442	- Replaced NEDeconvolutionLayerUpsampleKernel with NEScaleKernel in @ref NEDeconvolutionLayer.
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1443	- Added fast maths flag in @ref CLConvolutionLayer.
				1444	- Added new tests and benchmarks in validation and benchmark frameworks
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	1445	- Merge Activation layer with Convolution Layer (Neon™, CL, GLES)
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1446	- Added support to OpenCL 2.0 SVM
				1447	- Added support to import memory in OpenCL tensors.
				1448	- Added the prepare() method to perform any one off pre-processing before running the function.
				1449	- Added new examples:
				1450	- graph_inception_v4.cpp
Anthony Barbier	38e7f1f	2018-05-21 13:37:47 +0100	[diff] [blame]	1451	- graph_resnext50.cpp
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1452	- Added memory measurement instrument for CL.
Pablo Tello	eb82fd2	2018-02-23 13:43:50 +0000	[diff] [blame]	1453
Anthony Barbier	577fbdf	2018-03-01 15:17:54 +0000	[diff] [blame]	1454	v18.03 Public maintenance release
				1455	- Various bug fixes.
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1456	- Fixed bug in @ref NEActivationLayer
				1457	- Fix in @ref CLTuner when using batches.
Anthony Barbier	577fbdf	2018-03-01 15:17:54 +0000	[diff] [blame]	1458	- Updated recommended NDK version to r16b (And fixed warnings).
				1459	- Fixed bug in validation code.
				1460	- Added Inception v4 graph example.
Georgios Pinitas	9fb1159	2018-04-26 20:34:58 +0100	[diff] [blame]	1461	- Renamed NEWinogradLayer.cpp to @ref NEWinogradConvolutionLayer
Anthony Barbier	577fbdf	2018-03-01 15:17:54 +0000	[diff] [blame]	1462
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1463	v18.02 Public major release
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1464	- Various Arm® Neon™ / OpenCL / GLES optimisations.
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1465	- Various bug fixes.
				1466	- Changed default number of threads on big LITTLE systems.
				1467	- Refactored examples and added:
				1468	- graph_mobilenet_qassym8
				1469	- graph_resnet
				1470	- graph_squeezenet_v1_1
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1471	- Renamed @ref CLConvolutionLayer into @ref CLGEMMConvolutionLayer and created a new @ref CLConvolutionLayer to select the fastest convolution method.
				1472	- Renamed @ref NEConvolutionLayer into @ref NEGEMMConvolutionLayer and created a new @ref NEConvolutionLayer to select the fastest convolution method.
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1473	- Added in place support to:
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1474	- @ref CLActivationLayer
				1475	- @ref CLBatchNormalizationLayer
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1476	- Added QASYMM8 support to:
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1477	- @ref CLActivationLayer
				1478	- @ref CLDepthwiseConvolutionLayer
				1479	- @ref NEDepthwiseConvolutionLayer
				1480	- @ref NESoftmaxLayer
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1481	- Added FP16 support to:
Manuel Bottini	387259a	2020-05-21 17:14:36 +0100	[diff] [blame]	1482	- CLDepthwiseConvolutionLayer3x3
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1483	- @ref CLDepthwiseConvolutionLayer
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	1484	- Added broadcasting support to NEArithmeticAddition / @ref CLArithmeticAddition / @ref CLPixelWiseMultiplication
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1485	- Added fused batched normalization and activation to @ref CLBatchNormalizationLayer and @ref NEBatchNormalizationLayer
				1486	- Added support for non-square pooling to @ref NEPoolingLayer and @ref CLPoolingLayer
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1487	- New OpenCL kernels / functions:
Michele Di Giorgio	a046e16	2019-10-08 09:36:26 +0100	[diff] [blame]	1488	- CLDirectConvolutionLayerOutputStageKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1489	- New Arm® Neon™ kernels / functions
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1490	- Added name() method to all kernels.
				1491	- Added support for Winograd 5x5.
Georgios Pinitas	0f7ef8a	2021-01-10 04:23:52 +0000	[diff] [blame]	1492	- NEPermuteKernel / @ref NEPermute
Michalis Spyrou	96f977e	2021-07-01 12:20:56 +0100	[diff] [blame]	1493	- CpuWinogradConv2dTransformInputKernel / NEWinogradLayer
				1494	- CpuWinogradConv2dTransformOutputKernel / NEWinogradLayer
				1495	- CpuWinogradConv2dTransformWeightsKernel / NEWinogradLayer
Anthony Barbier	e155337	2018-07-16 18:53:52 +0100	[diff] [blame]	1496	- Renamed NEWinogradLayerKernel into NEWinogradLayerBatchedGEMMKernel
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1497	- New GLES kernels / functions:
Manuel Bottini	ceaa0bf	2021-02-16 15:15:19 +0000	[diff] [blame]	1498	- GCTensorShiftKernel / GCTensorShift
Pablo Tello	f6c572c	2018-02-14 12:47:30 +0000	[diff] [blame]	1499
Anthony Barbier	64c95a0	2018-01-22 18:48:55 +0000	[diff] [blame]	1500	v18.01 Public maintenance release
				1501	- Various bug fixes
				1502	- Added some of the missing validate() methods
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1503	- Added @ref CLDeconvolutionLayerUpsampleKernel / @ref CLDeconvolutionLayer @ref CLDeconvolutionLayerUpsample
Sheri Zhang	7e20e29	2021-02-02 11:49:34 +0000	[diff] [blame]	1504	- Added CLPermuteKernel / @ref CLPermute
Anthony Barbier	64c95a0	2018-01-22 18:48:55 +0000	[diff] [blame]	1505	- Added method to clean the programs cache in the CL Kernel library.
Manuel Bottini	ceaa0bf	2021-02-16 15:15:19 +0000	[diff] [blame]	1506	- Added GCArithmeticAdditionKernel / GCArithmeticAddition
				1507	- Added GCDepthwiseConvolutionLayer3x3Kernel / GCDepthwiseConvolutionLayer3x3
				1508	- Added GCNormalizePlanarYUVLayerKernel / GCNormalizePlanarYUVLayer
				1509	- Added GCScaleKernel / GCScale
				1510	- Added GCWeightsReshapeKernel / GCConvolutionLayer
Anthony Barbier	64c95a0	2018-01-22 18:48:55 +0000	[diff] [blame]	1511	- Added FP16 support to the following GLES compute kernels:
Manuel Bottini	ceaa0bf	2021-02-16 15:15:19 +0000	[diff] [blame]	1512	- GCCol2ImKernel
				1513	- GCGEMMInterleave4x4Kernel
				1514	- GCGEMMTranspose1xWKernel
				1515	- GCIm2ColKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1516	- Refactored Arm® Neon™ Winograd (NEWinogradLayerKernel)
Manuel Bottini	327225d	2021-04-13 13:09:30 +0100	[diff] [blame]	1517	- Added NEDirectConvolutionLayerOutputStageKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1518	- Added QASYMM8 support to the following Arm® Neon™ kernels:
Georgios Pinitas	7d0adc6	2020-09-04 15:25:24 +0100	[diff] [blame]	1519	- NEDepthwiseConvolutionLayer3x3Kernel
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1520	- @ref NEFillBorderKernel
Michele Di Giorgio	1928904	2021-02-03 16:05:00 +0000	[diff] [blame]	1521	- NEPoolingLayerKernel
Anthony Barbier	64c95a0	2018-01-22 18:48:55 +0000	[diff] [blame]	1522	- Added new examples:
				1523	- graph_cl_mobilenet_qasymm8.cpp
				1524	- graph_inception_v3.cpp
				1525	- gc_dc.cpp
				1526	- More tests added to both validation and benchmarking suites.
				1527
Gian Marco	ff85093	2017-12-11 12:37:17 +0000	[diff] [blame]	1528	v17.12 Public major release
				1529	- Most machine learning functions on OpenCL support the new data type QASYMM8
				1530	- Introduced logging interface
				1531	- Introduced opencl timer
				1532	- Reworked GEMMLowp interface
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1533	- Added new Arm® Neon™ assembly kernels for GEMMLowp, SGEMM and HGEMM
Gian Marco	ff85093	2017-12-11 12:37:17 +0000	[diff] [blame]	1534	- Added validation method for most Machine Learning kernels / functions
				1535	- Added new graph examples such as googlenet, mobilenet, squeezenet, vgg16 and vgg19
				1536	- Added sgemm example for OpenCL
				1537	- Added absolute difference example for GLES compute
				1538	- Added new tests and benchmarks in validation and benchmark frameworks
				1539	- Added new kernels / functions for GLES compute
				1540
				1541	- New OpenGL ES kernels / functions
Manuel Bottini	ceaa0bf	2021-02-16 15:15:19 +0000	[diff] [blame]	1542	- GCAbsoluteDifferenceKernel / GCAbsoluteDifference
				1543	- GCActivationLayerKernel / GCActivationLayer
				1544	- GCBatchNormalizationLayerKernel / GCBatchNormalizationLayer
				1545	- GCCol2ImKernel
				1546	- GCDepthConcatenateLayerKernel / GCDepthConcatenateLayer
				1547	- GCDirectConvolutionLayerKernel / GCDirectConvolutionLayer
				1548	- GCDropoutLayerKernel / GCDropoutLayer
				1549	- GCFillBorderKernel / GCFillBorder
				1550	- GCGEMMInterleave4x4Kernel / GCGEMMInterleave4x4
				1551	- GCGEMMMatrixAccumulateBiasesKernel / GCGEMMMatrixAdditionKernel / GCGEMMMatrixMultiplyKernel / GCGEMM
				1552	- GCGEMMTranspose1xWKernel / GCGEMMTranspose1xW
				1553	- GCIm2ColKernel
				1554	- GCNormalizationLayerKernel / GCNormalizationLayer
				1555	- GCPixelWiseMultiplicationKernel / GCPixelWiseMultiplication
				1556	- GCPoolingLayerKernel / GCPoolingLayer
				1557	- GCLogits1DMaxKernel / GCLogits1DShiftExpSumKernel / GCLogits1DNormKernel / GCSoftmaxLayer
				1558	- GCTransposeKernel / GCTranspose
Gian Marco	ff85093	2017-12-11 12:37:17 +0000	[diff] [blame]	1559
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1560	- New Arm® Neon™ kernels / functions
Pablo Tello	eb82fd2	2018-02-23 13:43:50 +0000	[diff] [blame]	1561	- arm_compute::NEGEMMLowpAArch64A53Kernel / arm_compute::NEGEMMLowpAArch64Kernel / arm_compute::NEGEMMLowpAArch64V8P4Kernel / arm_compute::NEGEMMInterleavedBlockedKernel / arm_compute::NEGEMMLowpAssemblyMatrixMultiplyCore
				1562	- arm_compute::NEHGEMMAArch64FP16Kernel
Georgios Pinitas	7d0adc6	2020-09-04 15:25:24 +0100	[diff] [blame]	1563	- NEDepthwiseConvolutionLayer3x3Kernel / NEDepthwiseIm2ColKernel / NEGEMMMatrixVectorMultiplyKernel / NEDepthwiseVectorToTensorKernel / @ref NEDepthwiseConvolutionLayer
Manuel Bottini	cfac51c	2021-06-18 15:47:28 +0100	[diff] [blame]	1564	- NEGEMMLowpOffsetContributionKernel / NEGEMMLowpMatrixAReductionKernel / NEGEMMLowpMatrixBReductionKernel / NEGEMMLowpMatrixMultiplyCore
Manuel Bottini	ae58bdf	2021-06-17 17:18:45 +0100	[diff] [blame]	1565	- NEGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPointKernel / NEGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPoint
Georgios Pinitas	9fb1159	2018-04-26 20:34:58 +0100	[diff] [blame]	1566	- NEWinogradLayer / NEWinogradLayerKernel
Gian Marco	ff85093	2017-12-11 12:37:17 +0000	[diff] [blame]	1567
				1568	- New OpenCL kernels / functions
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	1569	- CLGEMMLowpOffsetContributionKernel / CLGEMMLowpMatrixAReductionKernel / CLGEMMLowpMatrixBReductionKernel / CLGEMMLowpMatrixMultiplyCore
				1570	- CLGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPointKernel / CLGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPoint
Gian Marco	ff85093	2017-12-11 12:37:17 +0000	[diff] [blame]	1571
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1572	- New graph nodes for Arm® Neon™ and OpenCL
Georgios Pinitas	d9eb275	2018-04-03 13:44:29 +0100	[diff] [blame]	1573	- graph::BranchLayer
				1574	- graph::DepthConvertLayer
				1575	- graph::DepthwiseConvolutionLayer
				1576	- graph::DequantizationLayer
				1577	- graph::FlattenLayer
				1578	- graph::QuantizationLayer
				1579	- graph::ReshapeLayer
Gian Marco	ff85093	2017-12-11 12:37:17 +0000	[diff] [blame]	1580
Anthony Barbier	3c5b4ff	2017-10-12 13:20:52 +0100	[diff] [blame]	1581	v17.10 Public maintenance release
				1582	- Bug fixes:
				1583	- Check the maximum local workgroup size supported by OpenCL devices
				1584	- Minor documentation updates (Fixed instructions to build the examples)
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1585	- Introduced a graph::GraphContext
Anthony Barbier	3c5b4ff	2017-10-12 13:20:52 +0100	[diff] [blame]	1586	- Added a few new Graph nodes, support for branches and grouping.
				1587	- Automatically enable cl_printf in debug builds
				1588	- Fixed bare metal builds for armv7a
				1589	- Added AlexNet and cartoon effect examples
				1590	- Fixed library builds: libraries are no longer built as supersets of each other.(It means application using the Runtime part of the library now need to link against both libarm_compute_core and libarm_compute)
				1591
Anthony Barbier	6a5627a	2017-09-26 14:42:02 +0100	[diff] [blame]	1592	v17.09 Public major release
				1593	- Experimental Graph support: initial implementation of a simple stream API to easily chain machine learning layers.
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1594	- Memory Manager (@ref BlobLifetimeManager, @ref BlobMemoryPool, @ref ILifetimeManager, @ref IMemoryGroup, @ref IMemoryManager, @ref IMemoryPool, @ref IPoolManager, @ref MemoryManagerOnDemand, @ref PoolManager)
Anthony Barbier	6a5627a	2017-09-26 14:42:02 +0100	[diff] [blame]	1595	- New validation and benchmark frameworks (Boost and Google frameworks replaced by homemade framework).
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1596	- Most machine learning functions support both fixed point 8 and 16 bit (QS8, QS16) for both Arm® Neon™ and OpenCL.
				1597	- New Arm® Neon™ kernels / functions:
Pablo Tello	eb82fd2	2018-02-23 13:43:50 +0000	[diff] [blame]	1598	- arm_compute::NEGEMMAssemblyBaseKernel arm_compute::NEGEMMAArch64Kernel
Manuel Bottini	00f4dfc	2021-03-10 09:55:14 +0000	[diff] [blame]	1599	- NEDequantizationLayerKernel / @ref NEDequantizationLayer
Georgios Pinitas	70eb53b	2021-01-06 19:42:21 +0000	[diff] [blame]	1600	- NEFloorKernel / @ref NEFloor
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1601	- @ref NEL2NormalizeLayerKernel / @ref NEL2NormalizeLayer
Georgios Pinitas	b6af482	2021-09-14 12:33:34 +0100	[diff] [blame]	1602	- NEQuantizationLayerKernel NEMinMaxLayerKernel / @ref NEQuantizationLayer
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1603	- @ref NEROIPoolingLayerKernel / @ref NEROIPoolingLayer
				1604	- @ref NEReductionOperationKernel / @ref NEReductionOperation
Georgios Pinitas	0f7ef8a	2021-01-10 04:23:52 +0000	[diff] [blame]	1605	- NEReshapeLayerKernel / @ref NEReshapeLayer
Anthony Barbier	6a5627a	2017-09-26 14:42:02 +0100	[diff] [blame]	1606
				1607	- New OpenCL kernels / functions:
Gian Marco Iodice	8155c02	2021-04-16 15:08:59 +0100	[diff] [blame]	1608	- CLDepthwiseConvolutionLayer3x3NCHWKernel CLDepthwiseConvolutionLayer3x3NHWCKernel CLDepthwiseIm2ColKernel CLDepthwiseVectorToTensorKernel CLDepthwiseWeightsReshapeKernel / CLDepthwiseConvolutionLayer3x3 @ref CLDepthwiseConvolutionLayer CLDepthwiseSeparableConvolutionLayer
Manuel Bottini	9e73c93	2021-03-02 17:40:42 +0000	[diff] [blame]	1609	- CLDequantizationLayerKernel / CLDequantizationLayer
Sheri Zhang	1efed92	2021-03-10 22:43:38 +0000	[diff] [blame]	1610	- CLDirectConvolutionLayerKernel / @ref CLDirectConvolutionLayer
Georgios Pinitas	e2696b1	2020-12-03 20:37:43 +0000	[diff] [blame]	1611	- CLFlattenLayer
Georgios Pinitas	f47f718	2021-01-15 09:29:50 +0000	[diff] [blame]	1612	- CLFloorKernel / @ref CLFloor
Gian Marco Iodice	5fc07aa	2019-05-15 17:08:02 +0100	[diff] [blame]	1613	- CLGEMMTranspose1xW
Michele Di Giorgio	ee82d34	2021-01-05 16:14:28 +0000	[diff] [blame]	1614	- CLGEMMMatrixVectorMultiplyKernel
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1615	- @ref CLL2NormalizeLayerKernel / @ref CLL2NormalizeLayer
Georgios Pinitas	b6af482	2021-09-14 12:33:34 +0100	[diff] [blame]	1616	- CLQuantizationLayerKernel CLMinMaxLayerKernel / @ref CLQuantizationLayer
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1617	- @ref CLROIPoolingLayerKernel / @ref CLROIPoolingLayer
				1618	- @ref CLReductionOperationKernel / @ref CLReductionOperation
Sheri Zhang	7e20e29	2021-02-02 11:49:34 +0000	[diff] [blame]	1619	- CLReshapeLayerKernel / @ref CLReshapeLayer
Anthony Barbier	6a5627a	2017-09-26 14:42:02 +0100	[diff] [blame]	1620
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1621	v17.06 Public major release
				1622	- Various bug fixes
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1623	- Added support for fixed point 8 bit (QS8) to the various Arm® Neon™ machine learning kernels.
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1624	- Added unit tests and benchmarks (AlexNet, LeNet)
				1625	- Added support for sub tensors.
				1626	- Added infrastructure to provide GPU specific optimisation for some OpenCL kernels.
Sheri Zhang	ac6499a	2021-02-10 15:32:38 +0000	[diff] [blame]	1627	- Added @ref OMPScheduler (OpenMP) scheduler for Neon
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1628	- Added @ref SingleThreadScheduler scheduler for Arm® Neon™ (For bare metal)
ramelg01	b2eba7f	2021-12-23 08:32:08 +0000	[diff] [blame]	1629	- User can specify their own scheduler by implementing the @ref IScheduler interface.
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1630	- New OpenCL kernels / functions:
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1631	- @ref CLBatchNormalizationLayerKernel / @ref CLBatchNormalizationLayer
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	1632	- CLDepthConcatenateLayerKernel / CLDepthConcatenateLayer
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1633	- CLHOGOrientationBinningKernel CLHOGBlockNormalizationKernel, CLHOGDetectorKernel / CLHOGDescriptor CLHOGDetector CLHOGGradient CLHOGMultiDetection
Georgios Pinitas	96b16b6	2020-12-01 17:41:34 +0000	[diff] [blame]	1634	- CLLocallyConnectedMatrixMultiplyKernel / CLLocallyConnectedLayer
Manuel Bottini	d87aded	2021-07-16 10:23:31 +0100	[diff] [blame]	1635	- CLWeightsReshapeKernel / CLConvolutionLayerReshapeWeights
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1636	- New C++ kernels:
Georgios Pinitas	c6f9510	2021-03-30 10:03:01 +0100	[diff] [blame]	1637	- CPPDetectionWindowNonMaximaSuppressionKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1638	- New Arm® Neon™ kernels / functions:
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1639	- @ref NEBatchNormalizationLayerKernel / @ref NEBatchNormalizationLayer
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	1640	- NEDepthConcatenateLayerKernel / NEDepthConcatenateLayer
Manuel Bottini	327225d	2021-04-13 13:09:30 +0100	[diff] [blame]	1641	- NEDirectConvolutionLayerKernel / @ref NEDirectConvolutionLayer
Georgios Pinitas	96b16b6	2020-12-01 17:41:34 +0000	[diff] [blame]	1642	- NELocallyConnectedMatrixMultiplyKernel / NELocallyConnectedLayer
Manuel Bottini	29599d0	2021-07-06 15:01:35 +0100	[diff] [blame]	1643	- NEWeightsReshapeKernel / NEConvolutionLayerReshapeWeights
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1644
				1645	v17.05 Public bug fixes release
				1646	- Various bug fixes
				1647	- Remaining of the functions ported to use accurate padding.
				1648	- Library does not link against OpenCL anymore (It uses dlopen / dlsym at runtime instead to determine whether or not OpenCL is available).
				1649	- Added "free" method to allocator.
				1650	- Minimum version of g++ required for armv7 Linux changed from 4.8 to 4.9
				1651
				1652	v17.04 Public bug fixes release
				1653
				1654	The following functions have been ported to use the new accurate padding:
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1655	- CLColorConvertKernel
				1656	- CLEdgeNonMaxSuppressionKernel
				1657	- CLEdgeTraceKernel
				1658	- CLGaussianPyramidHorKernel
				1659	- CLGaussianPyramidVertKernel
				1660	- CLGradientKernel
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	1661	- NEChannelCombineKernel
Georgios Pinitas	c6f9510	2021-03-30 10:03:01 +0100	[diff] [blame]	1662	- NEFillArrayKernel
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	1663	- NEGaussianPyramidHorKernel
				1664	- NEGaussianPyramidVertKernel
Georgios Pinitas	09d3451	2018-08-30 16:02:11 +0100	[diff] [blame]	1665	- NEHarrisScoreFP16Kernel
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	1666	- NEHarrisScoreKernel
				1667	- NEHOGDetectorKernel
Michalis Spyrou	373b407	2021-01-20 16:41:12 +0000	[diff] [blame]	1668	- NELogits1DMaxKernel
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1669	- NELogits1DShiftExpSumKernel
				1670	- NELogits1DNormKernel
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1671	- NENonMaximaSuppression3x3FP16Kernel
				1672	- NENonMaximaSuppression3x3Kernel
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1673
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1674	v17.03.1 First Major public release of the sources
				1675	- Renamed the library to arm_compute
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1676	- New CPP target introduced for C++ kernels shared between Arm® Neon™ and CL functions.
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1677	- New padding calculation interface introduced and ported most kernels / functions to use it.
				1678	- New OpenCL kernels / functions:
Gian Marco Iodice	eb65f6d	2020-04-15 11:42:15 +0100	[diff] [blame]	1679	- CLGEMMLowpMatrixMultiplyKernel / CLGEMMLowp
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1680	- New Arm® Neon™ kernels / functions:
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1681	- @ref NENormalizationLayerKernel / @ref NENormalizationLayer
Teresa Charlin	d1dc09c	2021-03-04 15:24:45 +0000	[diff] [blame]	1682	- NETransposeKernel / @ref NETranspose
Michalis Spyrou	373b407	2021-01-20 16:41:12 +0000	[diff] [blame]	1683	- NELogits1DMaxKernel, NELogits1DShiftExpSumKernel, NELogits1DNormKernel / @ref NESoftmaxLayer
Manuel Bottini	24b8920	2021-07-01 18:13:33 +0100	[diff] [blame]	1684	- NEIm2ColKernel, NECol2ImKernel, NEConvolutionLayerWeightsReshapeKernel / @ref NEConvolutionLayer
Michele Di Giorgio	f22f672	2020-07-03 16:29:24 +0100	[diff] [blame]	1685	- NEGEMMMatrixAccumulateBiasesKernel / @ref NEFullyConnectedLayer
Manuel Bottini	cfac51c	2021-06-18 15:47:28 +0100	[diff] [blame]	1686	- NEGEMMLowpMatrixMultiplyKernel / NEGEMMLowp
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1687
				1688	v17.03 Sources preview
				1689	- New OpenCL kernels / functions:
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1690	- CLGradientKernel, CLEdgeNonMaxSuppressionKernel, CLEdgeTraceKernel / CLCannyEdge
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	1691	- GEMM refactoring + FP16 support: CLGEMMInterleave4x4Kernel, CLGEMMTranspose1xWKernel, CLGEMMMatrixMultiplyKernel, CLGEMMMatrixAdditionKernel / @ref CLGEMM
Michele Di Giorgio	f6f7876	2020-07-06 11:27:21 +0100	[diff] [blame]	1692	- CLGEMMMatrixAccumulateBiasesKernel / @ref CLFullyConnectedLayer
Teresa Charlin	2788609	2021-02-25 20:15:01 +0000	[diff] [blame]	1693	- CLTransposeKernel / @ref CLTranspose
Georgios Pinitas	c6f9510	2021-03-30 10:03:01 +0100	[diff] [blame]	1694	- CLLKTrackerInitKernel, CLLKTrackerStage0Kernel, CLLKTrackerStage1Kernel, CLLKTrackerFinalizeKernel / CLOpticalFlow
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1695	- @ref CLNormalizationLayerKernel / @ref CLNormalizationLayer
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1696	- CLLaplacianPyramid, CLLaplacianReconstruct
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1697	- New Arm® Neon™ kernels / functions:
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	1698	- NEActivationLayerKernel / @ref NEActivationLayer
Michele Di Giorgio	93b75e0	2021-06-21 12:00:43 +0100	[diff] [blame]	1699	- GEMM refactoring + FP16 support (Requires armv8.2 CPU): NEGEMMInterleave4x4Kernel, NEGEMMTranspose1xWKernel, NEGEMMMatrixMultiplyKernel, NEGEMMMatrixAdditionKernel / @ref NEGEMM
Michele Di Giorgio	1928904	2021-02-03 16:05:00 +0000	[diff] [blame]	1700	- NEPoolingLayerKernel / @ref NEPoolingLayer
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1701
				1702	v17.02.1 Sources preview
				1703	- New OpenCL kernels / functions:
Sang-Hoon Park	201e0fe	2021-01-27 13:14:56 +0000	[diff] [blame]	1704	- CLLogits1DMaxKernel, CLLogits1DShiftExpSumKernel, CLLogits1DNormKernel / @ref CLSoftmaxLayer
Michele Di Giorgio	e131466	2021-02-01 17:09:32 +0000	[diff] [blame]	1705	- CLPoolingLayerKernel / @ref CLPoolingLayer
Manuel Bottini	d844c08	2021-07-14 12:58:54 +0100	[diff] [blame]	1706	- CLIm2ColKernel, CLCol2ImKernel, CLConvolutionLayerWeightsReshapeKernel / CLConvolutionLayer
Adnan AlSinan	6863fa0	2022-02-04 13:04:55 +0000	[diff] [blame]	1707	- CLRemapKernel / CLRemap
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1708	- CLGaussianPyramidHorKernel, CLGaussianPyramidVertKernel / CLGaussianPyramid, CLGaussianPyramidHalf, CLGaussianPyramidOrb
				1709	- CLMinMaxKernel, CLMinMaxLocationKernel / CLMinMaxLocation
				1710	- CLNonLinearFilterKernel / CLNonLinearFilter
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1711	- New Arm® Neon™ FP16 kernels (Requires armv8.2 CPU)
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	1712	- NEAccumulateWeightedFP16Kernel
				1713	- NEBox3x3FP16Kernel
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1714	- NENonMaximaSuppression3x3FP16Kernel
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1715
				1716	v17.02 Sources preview
				1717	- New OpenCL kernels / functions:
Georgios Pinitas	f47f718	2021-01-15 09:29:50 +0000	[diff] [blame]	1718	- CLActivationLayerKernel / @ref CLActivationLayer
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1719	- CLChannelCombineKernel / CLChannelCombine
				1720	- CLDerivativeKernel / CLChannelExtract
				1721	- CLFastCornersKernel / CLFastCorners
				1722	- CLMeanStdDevKernel / CLMeanStdDev
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1723	- New Arm® Neon™ kernels / functions:
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	1724	- HOG / SVM: NEHOGOrientationBinningKernel, NEHOGBlockNormalizationKernel, NEHOGDetectorKernel, NEHOGNonMaximaSuppressionKernel / NEHOGDescriptor, NEHOGDetector, NEHOGGradient, NEHOGMultiDetection
				1725	- NENonLinearFilterKernel / NENonLinearFilter
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1726	- Introduced a CLScheduler to manage the default context and command queue used by the runtime library and create synchronisation events.
				1727	- Switched all the kernels / functions to use tensors instead of images.
				1728	- Updated documentation to include instructions to build the library from sources.
				1729
				1730	v16.12 Binary preview release
				1731	- Original release
				1732
Sheri Zhang	d813bab	2021-04-30 16:53:41 +0100	[diff] [blame]	1733	*/
Ramy Elgammal	0d274b7	2022-08-05 13:14:57 +0100	[diff] [blame]	1734	} // namespace arm_compute