Blame - docs/user_guide/release_version_and_change_log.dox - ml/ComputeLibrary

blob: 1bfb468ef1b12df77a8d7a99c96b9264f33433c8 [file] [log] [blame]

Vidhya Sudhan Loganathan	d646ae1	2018-11-19 15:18:20 +0000	[diff] [blame]	1	///
SiCong Li	90e5720	2023-02-01 14:39:41 +0000	[diff] [blame]	2	/// Copyright (c) 2017-2023 Arm Limited.
Vidhya Sudhan Loganathan	d646ae1	2018-11-19 15:18:20 +0000	[diff] [blame]	3	///
				4	/// SPDX-License-Identifier: MIT
				5	///
				6	/// Permission is hereby granted, free of charge, to any person obtaining a copy
				7	/// of this software and associated documentation files (the "Software"), to
				8	/// deal in the Software without restriction, including without limitation the
				9	/// rights to use, copy, modify, merge, publish, distribute, sublicense, and/or
				10	/// sell copies of the Software, and to permit persons to whom the Software is
				11	/// furnished to do so, subject to the following conditions:
				12	///
				13	/// The above copyright notice and this permission notice shall be included in all
				14	/// copies or substantial portions of the Software.
				15	///
				16	/// THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
				17	/// IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
				18	/// FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
				19	/// AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
				20	/// LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
				21	/// OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
				22	/// SOFTWARE.
				23	///
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	24	namespace arm_compute
				25	{
Sheri Zhang	d813bab	2021-04-30 16:53:41 +0100	[diff] [blame]	26	/** @page versions_changelogs Release Versions and Changelog
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	27
				28	@tableofcontents
				29
Sheri Zhang	d813bab	2021-04-30 16:53:41 +0100	[diff] [blame]	30	@section S2_1_versions Release versions
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	31
				32	All releases are numbered vYY.MM Where YY are the last two digits of the year, and MM the month number.
				33	If there is more than one release in a month then an extra sequential number is appended at the end:
				34
				35	v17.03 (First release of March 2017)
				36	v17.03.1 (Second release of March 2017)
				37	v17.04 (First release of April 2017)
				38
				39	@note We're aiming at releasing one major public release with new features per quarter. All releases in between will only contain bug fixes.
Ramy Elgammal	fa8ff8e	2022-08-12 16:57:10 +0100	[diff] [blame]	40	@note Starting from release 22.05, 'master' branch is no longer being used, it has been replaced by 'main'. Please update your clone jobs accordingly.
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	41
Sheri Zhang	d813bab	2021-04-30 16:53:41 +0100	[diff] [blame]	42	@section S2_2_changelog Changelog
Jakub Sujak	22e7613	2023-03-13 17:27:51 +0000	[diff] [blame^]	43	v23.02.1 Public patch release
				44	- Allow mismatching data layouts between the source tensor and weights for \link cpu::CpuGemmDirectConv2d CpuGemmDirectConv2d \endlink with fixed format kernels.
				45	- Fixes for experimental CPU only Bazel and CMake builds.
				46
SiCong Li	90e5720	2023-02-01 14:39:41 +0000	[diff] [blame]	47	v23.02 Public major release
Jakub Sujak	06db85e	2023-02-06 17:42:47 +0000	[diff] [blame]	48	- New features:
				49	- Rework the experimental dynamic fusion interface by identifying auxiliary and intermediate tensors, and specifying an explicit output operator.
				50	- Add the following operators to the experimental dynamic fusion API:
				51	- GpuAdd, GpuCast, GpuClamp, GpuDepthwiseConv2d, GpuMul, GpuOutput, GpuPool2d, GpuReshape, GpuResize, GpuSoftmax, GpuSub.
				52	- Add SME/SME2 kernels for GeMM, Winograd convolution, Depthwise convolution and Pooling.
Jakub Sujak	9eefd4b	2023-02-10 14:36:48 +0000	[diff] [blame]	53	- Add new CPU operator AddMulAdd for float and quantized types.
Jakub Sujak	06db85e	2023-02-06 17:42:47 +0000	[diff] [blame]	54	- Add new flag @ref ITensorInfo::lock_paddings() to tensors to prevent extending tensor paddings.
Jakub Sujak	06db85e	2023-02-06 17:42:47 +0000	[diff] [blame]	55	- Add experimental support for CPU only Bazel and CMake builds.
				56	- Performance optimizations:
				57	- Optimize CPU base-e exponential functions for FP32.
				58	- Optimize CPU StridedSlice by copying first dimension elements in bulk where possible.
				59	- Optimize CPU quantized Subtraction by reusing the quantized Addition kernel.
				60	- Optimize CPU ReduceMean by removing quantization steps and performing the operation in integer domain.
				61	- Optimize GPU Scale and Dynamic Fusion GpuResize by removing quantization steps and performing the operation in integer domain.
Jakub Sujak	9eefd4b	2023-02-10 14:36:48 +0000	[diff] [blame]	62	- Update the heuristic for CLDepthwiseConvolutionNative kernel.
				63	- Add new optimized OpenCL kernel to compute indirect convolution:
				64	- \link opencl::kernels::ClIndirectConv2dKernel ClIndirectConv2dKernel \endlink
				65	- Add new optimized OpenCL kernel to compute transposed convolution:
				66	- \link opencl::kernels::ClTransposedConvolutionKernel ClTransposedConvolutionKernel \endlink
SiCong Li	90e5720	2023-02-01 14:39:41 +0000	[diff] [blame]	67	- Update recommended/minimum NDK version to r20b.
Jakub Sujak	06db85e	2023-02-06 17:42:47 +0000	[diff] [blame]	68	- Various optimizations and bug fixes.
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	69
Viet-Hoa Do	b1f8288	2022-11-11 11:29:50 +0000	[diff] [blame]	70	v22.11 Public major release
				71	- New features:
				72	- Add new experimental dynamic fusion API.
Viet-Hoa Do	293ab60	2022-11-15 10:51:26 +0000	[diff] [blame]	73	- Add CPU batch matrix multiplication with adj_x = false and adj_y = false for FP32.
Viet-Hoa Do	b1f8288	2022-11-11 11:29:50 +0000	[diff] [blame]	74	- Add CPU MeanStdDevNorm for QASYMM8.
				75	- Add CPU and GPU GELU activation function for FP32 and FP16.
				76	- Add CPU swish activation function for FP32 and FP16.
				77	- Performance optimizations:
				78	- Optimize CPU bilinear scale for FP32, FP16, QASYMM8, QASYMM8_SIGNED, U8 and S8.
				79	- Optimize CPU activation functions using LUT-based implementation:
				80	- Sigmoid function for QASYMM8 and QASYMM8_SIGNED.
				81	- Hard swish function for QASYMM8_SIGNED.
				82	- Optimize CPU addition for QASYMM8 and QASYMM8_SIGNED using fixed-point arithmetic.
				83	- Optimize CPU multiplication, subtraction and activation layers by considering tensors as 1D.
				84	- Optimize GPU depthwise convolution kernel and heuristic.
				85	- Optimize GPU Conv2d heuristic.
				86	- Optimize CPU MeanStdDevNorm for FP16.
				87	- Optimize CPU tanh activation function for FP16 using rational approximation.
				88	- Improve GPU GeMMLowp start-up time.
				89	- Various optimizations and bug fixes.
				90
SiCong Li	fe1b1f6	2022-05-19 18:58:31 +0100	[diff] [blame]	91	v22.08 Public major release
Ramy Elgammal	0d274b7	2022-08-05 13:14:57 +0100	[diff] [blame]	92	- Various bug fixes.
				93	- Disable unsafe FP optimizations causing accuracy issues in:
				94	- \link opencl::kernels::ClDirectConv2dKernel ClDirectConv2dKernel \endlink
				95	- \link opencl::kernels::ClDirectConv2dKernel ClDirectConv3dKernel \endlink
				96	- @ref CLDepthwiseConvolutionLayerNativeKernel
				97	- Add Dynamic Fusion of Elementwise Operators: Div, Floor, Add.
				98	- Optimize the gemm_reshaped_rhs_nly_nt OpenCL kernel using the arm_matrix_multiply extension available for Arm® Mali™-G715 and Arm® Mali™-G615.
				99	- Add support for the arm_matrix_multiply extension in the gemmlowp_mm_reshaped_only_rhs_t OpenCL kernel.
				100	- Expand GPUTarget list with missing Mali™ GPUs product names: G57, G68, G78AE, G610, G510, G310.
				101	- Extend the direct convolution 2d interface to configure the block size.
				102	- Update ClConv2D heuristic to use direct convolution.
				103	- Use official Khronos® OpenCL extensions:
				104	- Add cl_khr_integer_dot_product extension support.
				105	- Add support of OpenCL 3.0 non-uniform workgroup.
				106	- Cpu performance optimizations:
				107	- Add LUT-based implementation of Hard Swish and Leaky ReLU activation function for aarch64 build.
				108	- Optimize Add layer by considering the input tensors as 1D array.
				109	- Add fixed-format BF16, FP16 and FP32 Neon™ GEMM kernels to support variable weights.
				110	- Add new winograd convolution kernels implementation and update the ACL \link arm_compute::cpu::CpuWinogradConv2d CpuWinogradConv2d\endlink operator.
Jakub Sujak	117e17e	2023-02-21 10:52:57 +0000	[diff] [blame]	111	- Add experimental support for native builds for Windows® on Arm™.
Ramy Elgammal	966218d	2022-08-11 16:23:22 +0100	[diff] [blame]	112	- Build flag interpretation change: arch=armv8.6-a now translates to -march=armv8.6-a CXX flag instead of march=armv8.2-a + explicit selection of feature extensions.
SiCong Li	fe1b1f6	2022-05-19 18:58:31 +0100	[diff] [blame]	113	- Build flag change: toolchain_prefix, compiler_prefix:
Ramy Elgammal	0d274b7	2022-08-05 13:14:57 +0100	[diff] [blame]	114	- Use empty string "" to suppress any prefixes.
				115	- Use "auto" to use default (auto) prefixes chosen by the build script. This is the default behavior when unspecified.
				116	- Any other string will be used as custom prefixes to the compiler and the rest of toolchain tools.
				117	- The default behaviour when prefix is unspecified does not change, but its signifier has been changed from empty string "" to "auto".
				118	- armv7a with Android build will no longer be tested or maintained.
SiCong Li	fe1b1f6	2022-05-19 18:58:31 +0100	[diff] [blame]	119
Adnan AlSinan	2921e5b	2022-05-16 14:30:41 +0100	[diff] [blame]	120	v22.05 Public major release
				121	- Various bug fixes.
				122	- Various optimizations.
				123	- Add support for NDK r23b.
				124	- Inclusive language adjustment. Please refer to @ref S5_0_inc_lang for details.
				125	- New Arm® Neon™ kernels / functions :
				126	- \link opencl::kernels::ClPool3dKernel ClPool3dKernel \endlink
				127	- New OpenCL kernels / functions :
				128	- \link cpu::kernels::CpuPool3dKernel CpuPool3dKernel \endlink
				129	- Improve the start-up times for the following OpenCL kernels:
				130	- \link opencl::kernels::ClWinogradInputTransformKernel ClWinogradInputTransformKernel \endlink
				131	- \link opencl::kernels::ClWinogradOutputTransformKernel ClWinogradOutputTransformKernel \endlink
				132	- \link opencl::kernels::ClWinogradFilterTransformKernel ClWinogradFilterTransformKernel \endlink
				133	- \link opencl::kernels::ClHeightConcatenateKernel ClHeightConcatenateKernel \endlink
				134	- Decouple the implementation of the following Cpu kernels into various data types (fp32, fp16, int):
				135	- \link cpu::kernels::CpuDirectConv2dKernel CpuDirectConv2dKernel \endlink
				136	- \link cpu::kernels::CpuDepthwiseConv2dNativeKernel CpuDepthwiseConv2dNativeKernel \endlink
				137	- \link cpu::kernels::CpuGemmMatrixAdditionKernel CpuGemmMatrixAdditionKernel \endlink
				138	- \link cpu::kernels::CpuGemmMatrixMultiplyKernel CpuGemmMatrixMultiplyKernel \endlink
				139	- @ref NEFuseBatchNormalizationKernel
				140	- @ref NEL2NormalizeLayerKernel
				141
Adnan AlSinan	69854ba	2022-02-07 15:28:56 +0000	[diff] [blame]	142	v22.02 Public major release
				143	- Various bug fixes.
				144	- Various optimizations.
				145	- Update A510 arm_gemm cpu Kernels.
				146	- Inclusive language adjustment. Please refer to @ref S5_0_inc_lang for details.
				147	- Improve the start-up time for the following OpenCL kernels:
				148	- @ref CLScale
				149	- @ref CLGEMM
				150	- @ref CLDepthwiseConvolutionLayer
				151	- \link opencl::kernels::ClIm2ColKernel ClIm2ColKernel \endlink
				152	- \link opencl::kernels::ClDirectConv2dKernel ClDirectConv2dKernel \endlink
				153	- Remove functions:
				154	- CLRemap
				155	- NERemap
				156	- Remove padding from OpenCL kernels:
				157	- \link opencl::kernels::ClDirectConv2dKernel ClDirectConv2dKernel \endlink
				158	- Remove padding from Cpu kernels:
				159	- \link cpu::kernels::CpuDirectConv2dKernel CpuDirectConv2dKernel \endlink
				160	- Decouple the implementation of the following Cpu kernels into various data types (fp32, fp16, int):
				161	- \link cpu::kernels::CpuActivationKernel CpuActivationKernel \endlink
				162	- \link cpu::kernels::CpuAddKernel CpuAddKernel \endlink
				163	- \link cpu::kernels::CpuElementwiseKernel CpuElementwiseKernel \endlink
				164	- \link cpu::CpuSoftmaxGeneric CpuSoftmaxKernel \endlink
				165	- @ref NEBoundingBoxTransformKernel
				166	- @ref NECropKernel
				167	- @ref NEComputeAllAnchorsKernel
				168	- @ref NEInstanceNormalizationLayerKernel
Adnan AlSinan	bb8b235	2022-02-14 14:30:38 +0000	[diff] [blame]	169	- NEMaxUnpoolingLayerKernel
Adnan AlSinan	69854ba	2022-02-07 15:28:56 +0000	[diff] [blame]	170	- @ref NEMeanStdDevNormalizationKernel
				171	- @ref NERangeKernel
				172	- @ref NEROIAlignLayerKernel
				173	- @ref NESelectKernel
				174
Sheri Zhang	5dda217	2021-10-15 19:54:17 +0100	[diff] [blame]	175	v21.11 Public major release
				176	- Various bug fixes.
Gunes Bayir	0877370	2021-11-05 12:34:34 +0000	[diff] [blame]	177	- Various optimizations:
				178	- Improve performance of bilinear and nearest neighbor Scale on both CPU and GPU for FP32, FP16, Int8, Uint8 data types
Adnan AlSinan	abc093b	2022-02-08 16:57:06 +0000	[diff] [blame]	179	- Improve performance of Softmax on GPU for Uint8/Int8
Sheri Zhang	5dda217	2021-10-15 19:54:17 +0100	[diff] [blame]	180	- New OpenCL kernels / functions:
				181	- @ref CLConv3D
				182	- New Arm® Neon™ kernels / functions:
				183	- @ref NEConv3D
Gunes Bayir	0877370	2021-11-05 12:34:34 +0000	[diff] [blame]	184	- Support configurable build by a selected subset of operator list
				185	- Support MobileBert on Neon™ backend
				186	- Improve operator/function logging
				187	- Remove padding from OpenCL kernels:
				188	- ClPool2dKernel
				189	- ClScaleKernel
				190	- ClGemmMatrixMultiplyReshapedKernel
				191	- Remove padding from Cpu kernels:
				192	- CpuPool2dKernel
				193	- Remove Y padding from OpenCL kernels:
				194	- ClGemmMatrixMultiplyKernel
				195	- ClGemmReshapedRHSMatrixKernel
				196	- Remove legacy GeMM kernels in gemm_v1.cl
Sheri Zhang	5dda217	2021-10-15 19:54:17 +0100	[diff] [blame]	197
Freddie Liardet	77014ff	2021-08-05 15:50:31 +0100	[diff] [blame]	198	v21.08 Public major release
				199	- Various bug fixes.
				200	- Various optimizations:
				201	- Improve LWS (Local-Workgroup-Size) heuristic in OpenCL for GeMM, Direct Convolution and Winograd Transformations when OpenCL tuner is not used
				202	- Improve QASYMM8/QSYMM8 performance on OpenCL for various Arm® Mali™ GPU architectures
				203	- Add dynamic weights support in Fully connected layer (CPU/GPU)
				204	- Various performance optimizations for floating-point data types (CPU/GPU)
				205	- Add a reduced core library build arm_compute_core_v2
				206	- Expose Operator API
				207	- Support fat binary build for arm8.2-a via fat_binary build flag
				208	- Add CPU discovery capabilities
				209	- Add data type f16 support for:
Adnan AlSinan	6863fa0	2022-02-04 13:04:55 +0000	[diff] [blame]	210	- CLRemapKernel
Freddie Liardet	77014ff	2021-08-05 15:50:31 +0100	[diff] [blame]	211	- Port the following functions to stateless API:
				212	- @ref CLConvolutionLayer
				213	- @ref CLFlattenLayer
				214	- @ref CLFullyConnectedLayer
				215	- @ref CLGEMM
				216	- @ref CLGEMMConvolutionLayer
				217	- @ref CLGEMMLowpMatrixMultiplyCore
				218	- @ref CLWinogradConvolutionLayer
				219	- @ref NEConvolutionLayer
				220	- @ref NEFlattenLayer
				221	- @ref NEFullyConnectedLayer
				222	- @ref NEGEMM
				223	- @ref NEGEMMConv2d
				224	- @ref NEGEMMConvolutionLayer
				225	- @ref NEGEMMLowpMatrixMultiplyCore
				226	- @ref NEWinogradConvolutionLayer
				227	- Remove the following functions:
				228	- CLWinogradInputTransform
				229	- Remove CLCoreRuntimeContext
				230	- Remove ICPPSimpleKernel
				231	- Rename file arm_compute/runtime/CL/functions/CLElementWiseUnaryLayer.h to arm_compute/runtime/CL/functions/CLElementwiseUnaryLayer.h
				232
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	233	v21.05 Public major release
Sheri Zhang	c2bed95	2021-05-06 12:12:38 +0100	[diff] [blame]	234	- Various bug fixes.
				235	- Various optimisations.
				236	- Various documentation updates:
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	237	- Add supported operators and corresponding Android NNAPI operators.
				238	- Documentation reorg into user guide and contributor guide.
Sheri Zhang	c2bed95	2021-05-06 12:12:38 +0100	[diff] [blame]	239	- Add support for a global allocator for OpenCL tensors
				240	- Add experimental support for [CLVK](https://github.com/kpet/clvk).
				241	- Add data type S32 support for:
				242	- @ref opencl::kernels::ClArithmeticKernel
				243	- Add data type QASYMM8 support for:
				244	- @ref CLROIPoolingLayer
				245	- @ref CLROIPoolingLayerKernel
				246	- @ref NEROIPoolingLayer
				247	- @ref NEROIPoolingLayerKernel
				248	- Add per-channel quantization support for:
				249	- @ref CLDeconvolutionLayer
				250	- @ref CLDirectDeconvolutionLayer
				251	- @ref NEConvolutionLayer
				252	- @ref NEDeconvolutionLayer
				253	- Remove padding from OpenCL kernels:
				254	- @ref CLL2NormalizeLayerKernel
Gian Marco Iodice	8155c02	2021-04-16 15:08:59 +0100	[diff] [blame]	255	- CLDepthwiseConvolutionLayer3x3NHWCKernel
Sheri Zhang	c2bed95	2021-05-06 12:12:38 +0100	[diff] [blame]	256	- @ref CLNormalizationLayerKernel
				257	- @ref CLNormalizePlanarYUVLayerKernel
				258	- @ref opencl::kernels::ClMulKernel
				259	- @ref CLReductionOperationKernel
				260	- @ref CLROIPoolingLayerKernel
				261	- Remove computer vision support from Arm® Neon™ backend
				262	- Remove the following functions:
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	263	- NEAbsoluteDifference
				264	- NEAccumulate
				265	- NEBox3x3
				266	- NECannyEdge
				267	- NEChannelCombine
				268	- NEChannelExtract
				269	- NEColorConvert
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	270	- NEConvolution
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	271	- NEDerivative
				272	- NEDilate
				273	- NEEqualizeHistogram
				274	- NEErode
				275	- NEFastCorners
				276	- NEGaussian3x3
				277	- NEGaussian5x5
				278	- NEGaussianPyramid
				279	- NEHOGDescriptor
				280	- NEHOGDetector
				281	- NEHOGGradient
				282	- NEHOGMultiDetection
				283	- NEHarrisCorners
				284	- NEHistogram
				285	- NEIntegralImage
				286	- NELaplacianPyramid
				287	- NELaplacianReconstruct
				288	- NEMagnitude
				289	- NEMeanStdDev
				290	- NEMedian3x3
				291	- NEMinMaxLocation
				292	- NENonLinearFilter
				293	- NEOpticalFlow
				294	- NEPhase
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	295	- NEScharr3x3
				296	- NESobel3x3
				297	- NESobel5x5
				298	- NESobel7x7
				299	- NETableLookup
				300	- NEThreshold
				301	- NEWarpAffine
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	302	- NEWarpPerspectiveKernel
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	303	- Remove all GLES kernels / functions / tests / examples
Sheri Zhang	c2bed95	2021-05-06 12:12:38 +0100	[diff] [blame]	304	- Remove computer vision support from CL backend
				305	- Remove the following functions:
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	306	- CLAbsoluteDifference
				307	- CLAccumulate
				308	- CLBox3x3
				309	- CLCannyEdge
				310	- CLChannelCombine
				311	- CLChannelExtract
				312	- CLColorConvert
				313	- CLConvolution
				314	- CLDerivative
				315	- CLDilate
				316	- CLEqualizeHistogram
				317	- CLErode
				318	- CLFastCorners
				319	- CLGaussian3x3
				320	- CLGaussian5x5
				321	- CLGaussianPyramid
				322	- CLHOGDescriptor
				323	- CLHOGDetector
				324	- CLHOGGradient
				325	- CLHOGMultiDetection
				326	- CLHarrisCorners
				327	- CLHistogram
				328	- CLIntegralImage
				329	- CLLaplacianPyramid
				330	- CLLaplacianReconstruct
				331	- CLMagnitude
				332	- CLMeanStdDev
				333	- CLMedian3x3
				334	- CLMinMaxLocation
				335	- CLNonLinearFilter
				336	- CLOpticalFlow
				337	- CLPhase
				338	- CLScharr3x3
				339	- CLSobel3x3
				340	- CLSobel5x5
				341	- CLSobel7x7
				342	- CLTableLookup
				343	- CLThreshold
				344	- CLWarpAffine
				345	- CLWarpPerspective
Ramy Elgammal	0d274b7	2022-08-05 13:14:57 +0100	[diff] [blame]	346
Georgios Pinitas	40f51a6	2020-11-21 03:04:18 +0000	[diff] [blame]	347	v21.02 Public major release
Sheri Zhang	da6a6eb	2021-01-06 11:15:06 +0000	[diff] [blame]	348	- Various bug fixes.
				349	- Various optimisations.
Georgios Pinitas	4551403	2020-12-30 00:03:09 +0000	[diff] [blame]	350	- Upgrade C++ standard to C++14
				351	- Add macOS support
Giorgio Arena	1055dc1	2021-02-19 09:53:06 +0000	[diff] [blame]	352	- Add Armv8-R AArch64 architecture support
Sheri Zhang	da6a6eb	2021-01-06 11:15:06 +0000	[diff] [blame]	353	- Add SVE/SVE2 support for:
Manuel Bottini	10b3826	2021-02-19 18:16:44 +0000	[diff] [blame]	354	- NEScaleKernel
Sheri Zhang	da6a6eb	2021-01-06 11:15:06 +0000	[diff] [blame]	355	- @ref NEActivationLayer
				356	- @ref NEArithmeticAddition
				357	- @ref NEBatchNormalizationLayerKernel
Giorgio Arena	1055dc1	2021-02-19 09:53:06 +0000	[diff] [blame]	358	- @ref cpu::kernels::CpuLogits1DSoftmaxKernel
				359	- @ref cpu::kernels::CpuLogits1DMaxKernel
				360	- @ref cpu::kernels::CpuElementwiseUnaryKernel
Sheri Zhang	dda6914	2021-02-01 19:06:57 +0000	[diff] [blame]	361	- Remove padding from OpenCL kernels:
Sheri Zhang	1efed92	2021-03-10 22:43:38 +0000	[diff] [blame]	362	- CLDirectConvolutionLayerKernel
Sheri Zhang	dda6914	2021-02-01 19:06:57 +0000	[diff] [blame]	363	- @ref CLArgMinMaxLayerKernel
				364	- @ref CLPadLayerKernel
				365	- @ref CLROIAlignLayerKernel
				366	- @ref CLRangeKernel
Manuel Bottini	3b131ab	2021-02-19 18:16:44 +0000	[diff] [blame]	367	- CLScaleKernel
Sheri Zhang	dda6914	2021-02-01 19:06:57 +0000	[diff] [blame]	368	- @ref CLSelectKernel
				369	- @ref CLBitwiseKernel
Giorgio Arena	1055dc1	2021-02-19 09:53:06 +0000	[diff] [blame]	370	- @ref opencl::kernels::ClFloorKernel
Teresa Charlin	2788609	2021-02-25 20:15:01 +0000	[diff] [blame]	371	- CLTransposeKernel
Giorgio Arena	5b50f42	2021-02-17 11:43:05 +0000	[diff] [blame]	372	- Deprecate functions in CLTuner:
				373	- add_lws_to_table
				374	- import_lws_table
				375	- lws_table
Sheri Zhang	da6a6eb	2021-01-06 11:15:06 +0000	[diff] [blame]	376	- Remove functions:
Georgios Pinitas	96b16b6	2020-12-01 17:41:34 +0000	[diff] [blame]	377	- NELocallyConnectedLayer / CLLocallyConnectedLayer
Georgios Pinitas	f7c5a41	2020-12-03 14:38:33 +0000	[diff] [blame]	378	- NEIm2Col
				379	- NECol2Im
				380	- NEGEMMInterleave4x4
				381	- NEGEMMTranspose1xW
Georgios Pinitas	8c3c0e7	2020-12-03 20:11:53 +0000	[diff] [blame]	382	- NEComputeAllAnchors / CLComputeAllAnchors
Georgios Pinitas	ec2256b	2020-12-03 18:51:58 +0000	[diff] [blame]	383	- NEGEMMAssemblyDispatch
Georgios Pinitas	c53266e	2020-12-09 03:11:53 +0000	[diff] [blame]	384	- NEUpsampleLayer / CLUpsampleLayer
Sheri Zhang	da6a6eb	2021-01-06 11:15:06 +0000	[diff] [blame]	385	- Remove kernels:
Georgios Pinitas	d308df3	2020-12-01 16:56:36 +0000	[diff] [blame]	386	- NEGEMMMatrixVectorMultiplyKernel
Georgios Pinitas	96b16b6	2020-12-01 17:41:34 +0000	[diff] [blame]	387	- NELocallyConnectedMatrixMultiplyKernel / CLLocallyConnectedMatrixMultiplyKernel
Georgios Pinitas	c53266e	2020-12-09 03:11:53 +0000	[diff] [blame]	388	- NEUpsampleLayerKernel / CLUpsampleLayerKernel
Gian Marco Iodice	f5aad51	2021-02-08 17:34:40 +0000	[diff] [blame]	389	- Extend OpenCL tuner with workgroup batch size support
				390	- Experimental extension for the OpenCL tuner to tune the batches of work groups distribute to compute units
Gian Marco Iodice	716b1be	2021-02-10 17:33:27 +0000	[diff] [blame]	391	- Add functionality to load the OpenCL GEMM heuristics at runtime
				392	- The GEMM heuristic file (MLGO) can be used to update the default GEMM heuristics available for OpenCL
Giorgio Arena	cd7d178	2021-02-22 14:58:37 +0000	[diff] [blame]	393	- Note: there might be performance regressions against v20.08 in Inception v3 using int8 data types on Arm Mali-G77 GPUs. Currently under investigation
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	394	- Note: data-type decoupling is in progress and experimental. Warning of unused symbols might be raised
Georgios Pinitas	40f51a6	2020-11-21 03:04:18 +0000	[diff] [blame]	395
SiCong Li	96209c7	2020-08-21 12:28:30 +0100	[diff] [blame]	396	v20.11 Public major release
morgolock	70b1eb8	2020-11-24 13:54:19 +0000	[diff] [blame]	397	- Various bug fixes.
				398	- Various optimisations.
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	399	- Performance regressions can be noted when executing Depthwise Convolution on Arm® Neon™ with a depth multiplier > 1 for quantized data type.
morgolock	0e72849	2020-11-20 11:03:33 +0000	[diff] [blame]	400	This is planned to be resolved in 21.02 release.
morgolock	70b1eb8	2020-11-24 13:54:19 +0000	[diff] [blame]	401	- Added new data type QASYMM8_SIGNED support for @ref NEROIAlignLayer.
SiCong Li	903f8cc	2020-08-27 10:17:10 +0100	[diff] [blame]	402	- Added new data type S32 support for:
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	403	- NEArithmeticSubtraction
				404	- NEArithmeticSubtractionKernel
SiCong Li	bb88f89	2020-08-28 11:18:47 +0100	[diff] [blame]	405	- @ref NEPixelWiseMultiplication
Sheri Zhang	1e3ab42	2021-03-16 17:35:08 +0000	[diff] [blame]	406	- NEPixelWiseMultiplicationKernel
Sang-Hoon Park	63001ac	2021-01-18 14:20:27 +0000	[diff] [blame]	407	- NEElementwiseDivision
				408	- NEDivisionOperationKernel
SiCong Li	96209c7	2020-08-21 12:28:30 +0100	[diff] [blame]	409	- Interface change
				410	- Properly support softmax axis to have the same meaning as other major frameworks. That is, axis now defines the dimension
				411	on which Softmax/Logsoftmax is performed. E.g. for input of shape 4x5x6 and axis=1, softmax will be applied to 4x6=24 vectors of size 5.
				412	The supported value range of axis is [-rank, rank).
				413	This change applies to the following functions:
				414	- @ref NESoftmaxLayer
				415	- @ref NELogSoftmaxLayer
				416	- @ref CLSoftmaxLayer
				417	- @ref CLLogSoftmaxLayer
Manuel Bottini	ceaa0bf	2021-02-16 15:15:19 +0000	[diff] [blame]	418	- GCSoftmaxLayer
Sheri Zhang	824061d	2020-10-26 15:46:37 +0000	[diff] [blame]	419	- New OpenCL kernels / functions:
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	420	- CLGEMMLowpQuantizeDownInt32ScaleByFixedPointKernel
morgolock	0e72849	2020-11-20 11:03:33 +0000	[diff] [blame]	421	- @ref CLLogicalNot
				422	- @ref CLLogicalAnd
				423	- @ref CLLogicalOr
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	424	- New Arm® Neon™ kernels / functions:
morgolock	0e72849	2020-11-20 11:03:33 +0000	[diff] [blame]	425	- @ref NELogicalNot
				426	- @ref NELogicalAnd
				427	- @ref NELogicalOr
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	428	- Removed padding from Arm® Neon™ kernels:
Sheri Zhang	1e3ab42	2021-03-16 17:35:08 +0000	[diff] [blame]	429	- NEComplexPixelWiseMultiplicationKernel
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	430	- NENonMaximaSuppression3x3Kernel
Adnan AlSinan	6863fa0	2022-02-04 13:04:55 +0000	[diff] [blame]	431	- NERemapKernel
Michele Di Giorgio	93b75e0	2021-06-21 12:00:43 +0100	[diff] [blame]	432	- NEGEMMInterleave4x4Kernel
Manuel Bottini	327225d	2021-04-13 13:09:30 +0100	[diff] [blame]	433	- NEDirectConvolutionLayerKernel
Manuel Bottini	10b3826	2021-02-19 18:16:44 +0000	[diff] [blame]	434	- NEScaleKernel
Georgios Pinitas	96b16b6	2020-12-01 17:41:34 +0000	[diff] [blame]	435	- NELocallyConnectedMatrixMultiplyKernel
Manuel Bottini	cfac51c	2021-06-18 15:47:28 +0100	[diff] [blame]	436	- NEGEMMLowpOffsetContributionKernel
Michele Di Giorgio	93b75e0	2021-06-21 12:00:43 +0100	[diff] [blame]	437	- NEGEMMTranspose1xWKernel
Michele Di Giorgio	1928904	2021-02-03 16:05:00 +0000	[diff] [blame]	438	- NEPoolingLayerKernel
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	439	- NEConvolutionKernel
Michalis Spyrou	60c3b0e	2021-04-08 12:02:58 +0100	[diff] [blame]	440	- NEDepthwiseConvolutionLayerNativeKernel
Manuel Bottini	cfac51c	2021-06-18 15:47:28 +0100	[diff] [blame]	441	- NEGEMMLowpMatrixMultiplyKernel
Michele Di Giorgio	53832b2	2021-06-21 14:45:44 +0100	[diff] [blame]	442	- NEGEMMMatrixMultiplyKernel
Manuel Bottini	327225d	2021-04-13 13:09:30 +0100	[diff] [blame]	443	- NEDirectConvolutionLayerOutputStageKernel
Sheri Zhang	ed36713	2020-10-08 15:46:16 +0100	[diff] [blame]	444	- @ref NEReductionOperationKernel
Manuel Bottini	cfac51c	2021-06-18 15:47:28 +0100	[diff] [blame]	445	- NEGEMMLowpMatrixAReductionKernel
				446	- NEGEMMLowpMatrixBReductionKernel
Sheri Zhang	824061d	2020-10-26 15:46:37 +0000	[diff] [blame]	447	- Removed padding from OpenCL kernels:
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	448	- CLBatchConcatenateLayerKernel
Michele Di Giorgio	1e0208a	2021-01-22 15:42:59 +0000	[diff] [blame]	449	- CLElementwiseOperationKernel
Sheri Zhang	824061d	2020-10-26 15:46:37 +0000	[diff] [blame]	450	- @ref CLBatchNormalizationLayerKernel
Michele Di Giorgio	e131466	2021-02-01 17:09:32 +0000	[diff] [blame]	451	- CLPoolingLayerKernel
Manuel Bottini	c6f4ec3	2021-05-18 18:41:56 +0100	[diff] [blame]	452	- CLWinogradInputTransformKernel
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	453	- CLGEMMLowpMatrixMultiplyNativeKernel
				454	- CLGEMMLowpMatrixAReductionKernel
				455	- CLGEMMLowpMatrixBReductionKernel
				456	- CLGEMMLowpOffsetContributionOutputStageKernel
				457	- CLGEMMLowpOffsetContributionKernel
Manuel Bottini	c6f4ec3	2021-05-18 18:41:56 +0100	[diff] [blame]	458	- CLWinogradOutputTransformKernel
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	459	- CLGEMMLowpMatrixMultiplyReshapedKernel
Sheri Zhang	824061d	2020-10-26 15:46:37 +0000	[diff] [blame]	460	- @ref CLFuseBatchNormalizationKernel
				461	- @ref CLDepthwiseConvolutionLayerNativeKernel
Georgios Pinitas	11d8415	2021-04-28 10:20:18 +0100	[diff] [blame]	462	- CLDepthConvertLayerKernel
Sheri Zhang	7e20e29	2021-02-02 11:49:34 +0000	[diff] [blame]	463	- CLCopyKernel
Gian Marco Iodice	8155c02	2021-04-16 15:08:59 +0100	[diff] [blame]	464	- CLDepthwiseConvolutionLayer3x3NHWCKernel
Georgios Pinitas	f47f718	2021-01-15 09:29:50 +0000	[diff] [blame]	465	- CLActivationLayerKernel
Manuel Bottini	c6f4ec3	2021-05-18 18:41:56 +0100	[diff] [blame]	466	- CLWinogradFilterTransformKernel
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	467	- CLWidthConcatenateLayerKernel
				468	- CLWidthConcatenate4TensorsKernel
				469	- CLWidthConcatenate2TensorsKernel
Sang-Hoon Park	201e0fe	2021-01-27 13:14:56 +0000	[diff] [blame]	470	- CLLogits1DMaxShiftExpSumKernel
				471	- CLLogits1DNormKernel
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	472	- CLHeightConcatenateLayerKernel
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	473	- CLGEMMMatrixMultiplyKernel
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	474	- CLGEMMLowpQuantizeDownInt32ScaleKernel
				475	- CLGEMMLowpQuantizeDownInt32ScaleByFloatKernel
				476	- CLGEMMLowpMatrixMultiplyReshapedOnlyRHSKernel
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	477	- CLDepthConcatenateLayerKernel
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	478	- CLGEMMLowpQuantizeDownInt32ScaleByFixedPointKernel
Sheri Zhang	824061d	2020-10-26 15:46:37 +0000	[diff] [blame]	479	- Removed OpenCL kernels / functions:
				480	- CLGEMMLowpQuantizeDownInt32ToInt16ScaleByFixedPointKernel
				481	- CLGEMMLowpQuantizeDownInt32ToInt8ScaleByFixedPointKernel
				482	- CLGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPointKernel
morgolock	00c7601	2020-11-06 10:40:12 +0000	[diff] [blame]	483	- Deprecated OpenCL kernels / functions (If a kernel is used only by the function that is being deprecated, the kernel is deprecated together):
Georgios Pinitas	2d22139	2020-09-03 15:16:37 +0100	[diff] [blame]	484	- CLLocallyConnectedLayer
				485	- CLLocallyConnectedMatrixMultiplyKernel
morgolock	00c7601	2020-11-06 10:40:12 +0000	[diff] [blame]	486	- CLAbsoluteDifference
				487	- CLAbsoluteDifferenceKernel
				488	- CLAccumulate
				489	- CLAccumulateKernel
				490	- CLAccumulateSquared
				491	- CLAccumulateSquaredKernel
				492	- CLAccumulateWeighted
				493	- CLAccumulateWeightedKernel
				494	- CLAccumulateWeightedFP16Kernel
				495	- CLBox3x3
				496	- CLBox3x3Kernel
				497	- CLBox3x3FP16Kernel
				498	- CLCannyEdge
				499	- CLChannelCombine
				500	- CLChannelCombineKernel
				501	- CLChannelExtract
				502	- CLChannelExtractKernel
				503	- CLColorConvert
				504	- CLColorConvertKernel
				505	- CLConvolution3x3
				506	- CLConvolutionRectangle
				507	- CLConvolutionRectangleKernel
				508	- CLConvolutionSquare
				509	- CLConvolutionKernel
				510	- CLDerivative
				511	- CLDerivativeKernel
				512	- CLDilate
				513	- CLDilateKernel
				514	- CLEqualizeHistogram
				515	- CLErode
				516	- CLErodeKernel
				517	- CLFastCorners
				518	- CLFastCornersKernel
				519	- CLGaussian3x3
				520	- CLGaussian3x3Kernel
				521	- CLGaussian5x5
				522	- CLGaussian5x5HorKernel
				523	- CLGaussian5x5VertKernel
				524	- CLGaussianPyramid
				525	- CLGaussianPyramidHalf
				526	- CLGaussianPyramidOrb
				527	- CLHarrisCorners
				528	- CLHarrisScoreKernel
				529	- CLHarrisScoreFP16Kernel
				530	- CLHistogram
				531	- CLHistogramKernel
				532	- CLHOGOrientationBinningKernel
				533	- CLHOGBlockNormalizationKernel
				534	- CLHOGDetectorKernel
				535	- CLHOGNonMaximaSuppressionKernel
				536	- CLHOGDescriptor
				537	- CLHOGDetector
				538	- CLHOGGradient
				539	- CLHOGMultiDetection
				540	- CLHOGOrientationBinningKernel
				541	- CLHOGBlockNormalizationKernel
				542	- CLHOGDetectorKernel
				543	- CLIntegralImage
				544	- CLIntegralImageKernel
				545	- CLLaplacianReconstruct
				546	- CLLaplacianPyramid
				547	- CLMagnitude
				548	- CLMagnitudePhaseKernel
				549	- CLMedian3x3
				550	- CLMedian3x3Kernel
				551	- CLMinMaxLocation
				552	- CLMinMaxLocationKernel
				553	- CLNonLinearFilter
				554	- CLNonLinearFilterKernel
				555	- CLNonMaximaSuppression3x3
				556	- CLNonMaximaSuppression3x3FP16Kernel
				557	- CLNonMaximaSuppression3x3Kernel
				558	- CLOpticalFlow
				559	- CLPhase
				560	- CLRemap
				561	- CLRemapKernel
				562	- CLScharr3x3
				563	- CLScharr3x3Kernel
				564	- CLSobel3x3
				565	- CLSobel3x3Kernel
				566	- CLSobel5x5
				567	- CLSobel5x5HorKernel
				568	- CLSobel5x5VertKernel
				569	- CLSobel7x7
				570	- CLSobel7x7HorKernel
				571	- CLSobel7x7VertKernel
				572	- CLThreshold
				573	- CLThresholdKernel
				574	- CLWarpAffine
				575	- CLWarpAffineKernel
				576	- CLWarpPerspective
				577	- CLWarpPerspectiveKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	578	- Deprecated Arm® Neon™ kernels / functions (If a kernel is used only by the function that is being deprecated, the kernel is deprecated together):
Georgios Pinitas	2d22139	2020-09-03 15:16:37 +0100	[diff] [blame]	579	- NELocallyConnectedLayer
				580	- NELocallyConnectedMatrixMultiplyKernel
morgolock	0c86265	2020-11-06 08:59:45 +0000	[diff] [blame]	581	- NEAbsoluteDifference
				582	- NEAbsoluteDifferenceKernel
				583	- NEAccumulate
				584	- NEAccumulateKernel
				585	- NEAccumulateSquared
				586	- NEAccumulateSquaredKernel
				587	- NEAccumulateWeighted
				588	- NEAccumulateWeightedKernel
				589	- NEAccumulateWeightedFP16Kernel
				590	- NEBox3x3
				591	- NEBox3x3Kernel
				592	- NEBox3x3FP16Kernel
				593	- NECannyEdge
				594	- NEChannelCombine
				595	- NEChannelCombineKernel
				596	- NEChannelExtract
				597	- NEChannelExtractKernel
				598	- NEColorConvert
				599	- NEColorConvertKernel
				600	- NEConvolution3x3
				601	- NEConvolutionRectangle
				602	- NEConvolutionRectangleKernel
				603	- NEConvolutionSquare
				604	- NEConvolutionKernel
				605	- NEDerivative
				606	- NEDerivativeKernel
				607	- NEDilate
				608	- NEDilateKernel
				609	- NEEqualizeHistogram
				610	- NEErode
				611	- NEErodeKernel
				612	- NEFastCorners
				613	- NEFastCornersKernel
				614	- NEGaussian3x3
				615	- NEGaussian3x3Kernel
				616	- NEGaussian5x5
				617	- NEGaussian5x5HorKernel
				618	- NEGaussian5x5VertKernel
				619	- NEGaussianPyramid
				620	- NEGaussianPyramidHalf
				621	- NEGaussianPyramidOrb
				622	- NEHarrisCorners
				623	- NEHarrisScoreKernel
				624	- NEHarrisScoreFP16Kernel
				625	- NEHistogram
				626	- NEHistogramKernel
				627	- NEHOGOrientationBinningKernel
				628	- NEHOGBlockNormalizationKernel
				629	- NEHOGDetectorKernel
				630	- NEHOGNonMaximaSuppressionKernel
				631	- NEHOGDescriptor
				632	- NEHOGDetector
				633	- NEHOGGradient
				634	- NEHOGMultiDetection
				635	- NEHOGOrientationBinningKernel
				636	- NEHOGBlockNormalizationKernel
				637	- NEHOGDetectorKernel
				638	- NEIntegralImage
				639	- NEIntegralImageKernel
				640	- NELaplacianReconstruct
				641	- NELaplacianPyramid
				642	- NEMagnitude
				643	- NEMagnitudePhaseKernel
				644	- NEMedian3x3
				645	- NEMedian3x3Kernel
				646	- NEMinMaxLocation
				647	- NEMinMaxLocationKernel
				648	- NENonLinearFilter
				649	- NENonLinearFilterKernel
				650	- NENonMaximaSuppression3x3
				651	- NENonMaximaSuppression3x3FP16Kernel
				652	- NENonMaximaSuppression3x3Kernel
				653	- NEOpticalFlow
				654	- NEPhase
				655	- NERemap
				656	- NERemapKernel
				657	- NEScharr3x3
				658	- NEScharr3x3Kernel
				659	- NESobel3x3
				660	- NESobel3x3Kernel
				661	- NESobel5x5
				662	- NESobel5x5HorKernel
				663	- NESobel5x5VertKernel
				664	- NESobel7x7
				665	- NESobel7x7HorKernel
				666	- NESobel7x7VertKernel
				667	- NEThreshold
				668	- NEThresholdKernel
				669	- NEWarpAffine
				670	- NEWarpAffineKernel
				671	- NEWarpPerspective
				672	- NEWarpPerspectiveKernel
morgolock	d6ee9ed	2020-11-19 10:07:14 +0000	[diff] [blame]	673	- Deprecated GLES kernels / functions (If a kernel is used only by the function that is being deprecated, the kernel is deprecated together):
				674	- GCAbsoluteDifference
				675	- GCActivationLayer
				676	- GCArithmeticAddition
				677	- GCBatchNormalizationLayer
				678	- GCConcatenateLayer
				679	- GCConvolutionLayer
				680	- GCDepthwiseConvolutionLayer
				681	- GCDirectConvolutionLayer
				682	- GCDropoutLayer
				683	- GCFillBorder
				684	- GCFullyConnectedLayer
				685	- GCGEMM
				686	- GCGEMMInterleave4x4
				687	- GCGEMMTranspose1xW
				688	- GCNormalizationLayer
				689	- GCNormalizePlanarYUVLayer
				690	- GCPixelWiseMultiplication
				691	- GCPoolingLayer
				692	- GCScale
				693	- GCSoftmaxLayer
				694	- GCTensorShift
				695	- GCTranspose
				696
SiCong Li	96209c7	2020-08-21 12:28:30 +0100	[diff] [blame]	697
Georgios Pinitas	25ef721	2020-06-02 23:00:41 +0100	[diff] [blame]	698	v20.08 Public major release
				699	- Various bug fixes.
				700	- Various optimisations.
Sheri Zhang	3ef9b5f	2020-07-09 16:32:58 +0100	[diff] [blame]	701	- Added new data type QASYMM8_SIGNED support for:
Sheri Zhang	dd4cfc0	2020-07-10 14:15:41 +0100	[diff] [blame]	702	- @ref CLArgMinMaxLayer
				703	- @ref CLArgMinMaxLayerKernel
				704	- Added new data type U8 support for:
				705	- @ref NECropKernel
Sheri Zhang	7e20e29	2021-02-02 11:49:34 +0000	[diff] [blame]	706	- CLCropKernel
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	707	- Added align_corner support for nearest neighbor interpolation in:
Manuel Bottini	10b3826	2021-02-19 18:16:44 +0000	[diff] [blame]	708	- NEScaleKernel
Manuel Bottini	3b131ab	2021-02-19 18:16:44 +0000	[diff] [blame]	709	- CLScaleKernel
Sheri Zhang	dd4cfc0	2020-07-10 14:15:41 +0100	[diff] [blame]	710	- New OpenCL kernels / functions:
				711	- @ref CLMaxUnpoolingLayerKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	712	- New Arm® Neon™ kernels / functions:
Dana Zlotnik	149203b	2022-01-26 12:38:03 +0200	[diff] [blame]	713	- NEMaxUnpoolingLayerKernel
Sheri Zhang	3ef9b5f	2020-07-09 16:32:58 +0100	[diff] [blame]	714	- New graph example:
Sheri Zhang	dd4cfc0	2020-07-10 14:15:41 +0100	[diff] [blame]	715	- graph_yolov3_output_detector
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	716	- GEMMTuner improvements:
				717	- Added fp16 support
				718	- Output json files for easier integration
				719	- Enabled tuning for export_to_cl_image_rhs option for RHS tensors
				720	- More robust script for running benchmarks
Sheri Zhang	3ef9b5f	2020-07-09 16:32:58 +0100	[diff] [blame]	721	- Removed padding from:
Sheri Zhang	1e3ab42	2021-03-16 17:35:08 +0000	[diff] [blame]	722	- NEPixelWiseMultiplicationKernel
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	723	- NEHeightConcatenateLayerKernel
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	724	- NEThresholdKernel
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	725	- NEBatchConcatenateLayerKernel
Teresa Charlin	d1dc09c	2021-03-04 15:24:45 +0000	[diff] [blame]	726	- NETransposeKernel
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	727	- @ref NEBatchNormalizationLayerKernel
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	728	- NEArithmeticSubtractionKernel
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	729	- @ref NEBoundingBoxTransformKernel
Michalis Spyrou	373b407	2021-01-20 16:41:12 +0000	[diff] [blame]	730	- NELogits1DMaxKernel
				731	- NELogits1DSoftmaxKernel
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	732	- @ref NEROIPoolingLayerKernel
				733	- @ref NEROIAlignLayerKernel
Georgios Pinitas	0b1c2db	2020-12-04 15:51:34 +0000	[diff] [blame]	734	- NEYOLOLayerKernel
Georgios Pinitas	c53266e	2020-12-09 03:11:53 +0000	[diff] [blame]	735	- NEUpsampleLayerKernel
Georgios Pinitas	70eb53b	2021-01-06 19:42:21 +0000	[diff] [blame]	736	- NEFloorKernel
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	737	- NEWidthConcatenateLayerKernel
				738	- NEDepthConcatenateLayerKernel
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	739	- @ref NENormalizationLayerKernel
				740	- @ref NEL2NormalizeLayerKernel
Georgios Pinitas	c6f9510	2021-03-30 10:03:01 +0100	[diff] [blame]	741	- NEFillArrayKernel
Georgios Pinitas	11d8415	2021-04-28 10:20:18 +0100	[diff] [blame]	742	- NEDepthConvertLayerKernel
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	743	- @ref NERangeKernel
				744	- @ref NEPriorBoxLayer
Sheri Zhang	ed36713	2020-10-08 15:46:16 +0100	[diff] [blame]	745	- Removed OpenCL kernels / functions:
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	746	- CLGEMMLowpQuantizeDownInt32ToUint8Scale
				747	- CLGEMMLowpQuantizeDownInt32ToUint8ScaleByFloat
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	748	- Removed Arm® Neon™ kernels / functions:
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	749	- NEGEMMLowpQuantizeDownInt32ToUint8Scale
				750	- NEGEMMMatrixAccumulateBiasesKernel
SiCong Li	d004a7a	2020-05-28 15:26:41 +0100	[diff] [blame]	751	- Deprecated functions / interfaces:
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	752	- Non-descriptor based interfaces for NEThreshold, CLThreshold
Manuel Bottini	ceaa0bf	2021-02-16 15:15:19 +0000	[diff] [blame]	753	- Non-descriptor based interfaces for @ref NEScale, @ref CLScale and GCScale
				754	- In @ref NESoftmaxLayer, @ref NELogSoftmaxLayer, @ref CLSoftmaxLayer, @ref CLLogSoftmaxLayer and GCSoftmaxLayer :
				755	The default "axis" value for @ref CLSoftmaxLayer, @ref CLLogSoftmaxLayer and GCSoftmaxLayer is changed from 1 to 0.
morgolock	9c7fed8	2020-08-05 12:30:56 +0100	[diff] [blame]	756	Only axis 0 is supported.
				757	The default "axis" value for @ref NESoftmaxLayer, @ref NELogSoftmaxLayer is changed from 1 to 0.
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	758	Only axis 0 is supported.
Sang-Hoon Park	a0205b9	2020-07-07 09:36:09 +0100	[diff] [blame]	759	- The support for quantized data types has been removed from @ref CLLogSoftmaxLayer due to implementation complexity.
Manuel Bottini	d844c08	2021-07-14 12:58:54 +0100	[diff] [blame]	760	- Removed padding requirement for the input (e.g. LHS of GEMM) and output in CLGEMMMatrixMultiplyNativeKernel, CLGEMMMatrixMultiplyReshapedKernel, CLGEMMMatrixMultiplyReshapedOnlyRHSKernel and CLIm2ColKernel (NHWC only)
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	761	- This change allows to use @ref CLGEMMConvolutionLayer without extra padding for the input and output.
				762	- Only the weights/bias of @ref CLGEMMConvolutionLayer could require padding for the computation.
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	763	- Only on Arm® Mali™ Midgard GPUs, @ref CLGEMMConvolutionLayer could require padding since CLGEMMMatrixMultiplyKernel is called and currently requires padding.
				764	- Added support for exporting the OpenCL buffer object to the OpenCL image object in CLGEMMMatrixMultiplyReshapedKernel and CLGEMMMatrixMultiplyReshapedOnlyRHSKernel.
Sang-Hoon Park	adfaefb	2020-08-18 09:13:05 +0100	[diff] [blame]	765	- This support allows to export the OpenCL buffer used for the reshaped RHS matrix to the OpenCL image object.
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	766	- The padding requirement for the OpenCL image object is considered into the CLGEMMReshapeRHSMatrixKernel.
				767	- The reshaped RHS matrix stores the weights when GEMM is used to accelerate CLGEMMConvolutionLayer.
Georgios Pinitas	25ef721	2020-06-02 23:00:41 +0100	[diff] [blame]	768
Georgios Pinitas	fd7780d	2020-03-17 11:41:00 +0000	[diff] [blame]	769	v20.05 Public major release
Georgios Pinitas	c7b183a	2020-03-06 18:12:09 +0000	[diff] [blame]	770	- Various bug fixes.
				771	- Various optimisations.
Michele Di Giorgio	36a551f	2020-04-23 11:55:29 +0100	[diff] [blame]	772	- Updated recommended NDK version to r18b.
				773	- Updated recommended gcc version to Linaro 6.3.1.
Georgios Pinitas	c7b183a	2020-03-06 18:12:09 +0000	[diff] [blame]	774	- Added Bfloat16 type support
				775	- Added Bfloat16 support in:
Manuel Bottini	29599d0	2021-07-06 15:01:35 +0100	[diff] [blame]	776	- NEWeightsReshapeKernel
				777	- NEConvolutionLayerReshapeWeights
Manuel Bottini	9002899	2021-06-30 18:29:18 +0100	[diff] [blame]	778	- NEIm2ColKernel
Georgios Pinitas	f7c5a41	2020-12-03 14:38:33 +0000	[diff] [blame]	779	- NEIm2Col
Georgios Pinitas	11d8415	2021-04-28 10:20:18 +0100	[diff] [blame]	780	- NEDepthConvertLayerKernel
Georgios Pinitas	c7b183a	2020-03-06 18:12:09 +0000	[diff] [blame]	781	- @ref NEDepthConvertLayer
				782	- @ref NEGEMMConvolutionLayer
Georgios Pinitas	ec2256b	2020-12-03 18:51:58 +0000	[diff] [blame]	783	- NEGEMMAssemblyDispatch
Sheri Zhang	0f2522b	2020-03-25 16:38:19 +0000	[diff] [blame]	784	- Added new data type QASYMM8_SIGNED support for:
				785	- @ref CLDirectConvolutionLayer
				786	- @ref CLDeconvolutionLayer
				787	- @ref CLDirectDeconvolutionLayer
				788	- @ref CLGEMMDeconvolutionLayer
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	789	- CLGEMMLowpMatrixMultiplyReshapedKernel
				790	- CLGEMMLowpQuantizeDownInt32ScaleKernel
				791	- CLGEMMLowpQuantizeDownInt32ScaleByFloatKernel
Sheri Zhang	0f2522b	2020-03-25 16:38:19 +0000	[diff] [blame]	792	- @ref CLReductionOperation
				793	- @ref CLReduceMean
Sheri Zhang	359c48e	2020-04-30 22:53:39 +0100	[diff] [blame]	794	- @ref NEScale
Manuel Bottini	10b3826	2021-02-19 18:16:44 +0000	[diff] [blame]	795	- NEScaleKernel
Georgios Pinitas	c53266e	2020-12-09 03:11:53 +0000	[diff] [blame]	796	- NEUpsampleLayer
Sheri Zhang	0f2522b	2020-03-25 16:38:19 +0000	[diff] [blame]	797	- @ref NECast
				798	- @ref NEReductionOperation
				799	- @ref NEReduceMean
				800	- @ref NEArgMinMaxLayer
				801	- @ref NEDeconvolutionLayer
Manuel Bottini	ae58bdf	2021-06-17 17:18:45 +0100	[diff] [blame]	802	- NEGEMMLowpQuantizeDownInt32ScaleKernel
Sheri Zhang	0f2522b	2020-03-25 16:38:19 +0000	[diff] [blame]	803	- @ref CPPBoxWithNonMaximaSuppressionLimit
				804	- @ref CPPDetectionPostProcessLayer
				805	- @ref CPPPermuteKernel
				806	- @ref CPPPermute
				807	- @ref CPPTopKVKernel
				808	- @ref CPPTopKV
Sheri Zhang	359c48e	2020-04-30 22:53:39 +0100	[diff] [blame]	809	- @ref CPPUpsample
				810	- @ref CPPUpsampleKernel
Sheri Zhang	31b49ca	2020-04-24 11:15:10 +0100	[diff] [blame]	811	- New OpenCL kernels / functions:
				812	- @ref CLQLSTMLayer
				813	- @ref CLQLSTMLayerNormalizationKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	814	- New Arm® Neon™ kernels / functions:
Sheri Zhang	31b49ca	2020-04-24 11:15:10 +0100	[diff] [blame]	815	- @ref NEQLSTMLayer
				816	- @ref NEQLSTMLayerNormalizationKernel
				817	- Added HARD_SWISH support in:
Georgios Pinitas	f47f718	2021-01-15 09:29:50 +0000	[diff] [blame]	818	- CLActivationLayerKernel
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	819	- NEActivationLayerKernel
Sheri Zhang	0f2522b	2020-03-25 16:38:19 +0000	[diff] [blame]	820	- Deprecated OpenCL kernels / functions:
				821	- CLGEMMLowpQuantizeDownInt32ToUint8Scale
				822	- CLGEMMLowpQuantizeDownInt32ToUint8ScaleByFloat
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	823	- Deprecated Arm® Neon™ kernels / functions:
Sheri Zhang	0f2522b	2020-03-25 16:38:19 +0000	[diff] [blame]	824	- NEGEMMLowpQuantizeDownInt32ToUint8Scale
				825	- Removed CPP kernels / functions:
				826	- CPPFlipWeightsKernel
Manuel Bottini	387259a	2020-05-21 17:14:36 +0100	[diff] [blame]	827	- Removed PoolingLayerInfo constructors without Data Layout.
				828	- Removed CLDepthwiseConvolutionLayer3x3
				829	- Removed NEDepthwiseConvolutionLayerOptimized
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	830	- Added support for Winograd 3x3,4x4 on Arm® Neon™ FP16:
Manuel Bottini	075253a	2020-05-22 12:57:18 +0100	[diff] [blame]	831	- @ref NEWinogradConvolutionLayer
Michalis Spyrou	96f977e	2021-07-01 12:20:56 +0100	[diff] [blame]	832	- CpuWinogradConv2dTransformInputKernel
				833	- CpuWinogradConv2dTransformOutputKernel
				834	- CpuWinogradConv2dTransformWeightsKernel
Manuel Bottini	075253a	2020-05-22 12:57:18 +0100	[diff] [blame]	835	- Added CLCompileContext
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	836	- Added Arm® Neon™ GEMM kernel with 2D window support
Georgios Pinitas	c7b183a	2020-03-06 18:12:09 +0000	[diff] [blame]	837
Michele Di Giorgio	740872e	2020-03-04 15:29:49 +0000	[diff] [blame]	838	v20.02.1 Maintenance release
				839	- Added Android-NN build script.
				840
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	841	v20.02 Public major release
				842	- Various bug fixes.
				843	- Various optimisations.
				844	- Added new data type QASYMM8_SIGNED support for:
				845	- @ref CLDepthwiseConvolutionLayer
Manuel Bottini	387259a	2020-05-21 17:14:36 +0100	[diff] [blame]	846	- CLDepthwiseConvolutionLayer3x3
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	847	- @ref CLGEMMConvolutionLayer
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	848	- CLGEMMLowpMatrixMultiplyCore
				849	- CLGEMMLowpMatrixMultiplyReshapedOnlyRHSKernel
				850	- CLGEMMLowpMatrixMultiplyNativeKernel
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	851	- @ref NEActivationLayer
Sang-Hoon Park	63001ac	2021-01-18 14:20:27 +0000	[diff] [blame]	852	- NEComparisonOperationKernel
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	853	- @ref NEConvolutionLayer
				854	- @ref NEDepthwiseConvolutionLayer
Georgios Pinitas	7d0adc6	2020-09-04 15:25:24 +0100	[diff] [blame]	855	- NEDepthwiseConvolutionLayer3x3Kernel
Manuel Bottini	327225d	2021-04-13 13:09:30 +0100	[diff] [blame]	856	- NEDirectConvolutionLayerOutputStageKernel
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	857	- @ref NEElementwiseComparison
				858	- @ref NEElementwiseMax
				859	- @ref NEElementwiseMin
				860	- @ref NEElementwiseSquaredDiff
				861	- @ref NEFullyConnectedLayer
Michele Di Giorgio	f22f672	2020-07-03 16:29:24 +0100	[diff] [blame]	862	- NEGEMMMatrixVectorMultiplyKernel
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	863	- @ref NEPixelWiseMultiplication
				864	- @ref NEPoolingLayer
				865	- @ref NEPReluLayer
				866	- Added support for QSYMM8_PER_CHANNEL in:
Georgios Pinitas	7d0adc6	2020-09-04 15:25:24 +0100	[diff] [blame]	867	- NEDepthwiseConvolutionLayer3x3Kernel
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	868	- Added support for split sizes in:
				869	- @ref CLSplit
				870	- @ref NESplit
				871	- New OpenCL kernels / functions:
				872	- @ref CLFill
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	873	- CLGEMMLowpQuantizeDownInt32ToInt8ScaleByFixedPointKernel / CLGEMMLowpQuantizeDownInt32ToInt8ScaleByFixedPoint
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	874	- New Arm® Neon™ kernels / functions:
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	875	- @ref NEFill
Manuel Bottini	ae58bdf	2021-06-17 17:18:45 +0100	[diff] [blame]	876	- NEGEMMLowpQuantizeDownInt32ToInt8ScaleByFixedPointKernel / NEGEMMLowpQuantizeDownInt32ToInt8ScaleByFixedPoint
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	877	- Deprecated Arm® Neon™ functions / interfaces:
Manuel Bottini	387259a	2020-05-21 17:14:36 +0100	[diff] [blame]	878	- CLDepthwiseConvolutionLayer3x3
				879	- NEDepthwiseConvolutionLayerOptimized
				880	- PoolingLayerInfo constructors without Data Layout.
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	881	- Added support for quantization with multiplier greater than 1 on Arm® Neon™ and CL.
Giuseppe Rossini	f04ddbc	2020-02-17 17:22:49 +0000	[diff] [blame]	882	- Added support for quantized inputs of type QASYMM8_SIGNED and QASYMM8 to @ref CLQuantizationLayer.
				883	- Added the ability to build bootcode for bare metal.
				884	- Added support for generating synthetic QASYMM8 graphs.
				885	- Added support for F16 datatype in VGG16.
				886	- Removed pre-built binaries for GLES.
				887
Michele Di Giorgio	d374ff2	2020-01-21 10:03:20 +0000	[diff] [blame]	888	v19.11.1 Public maintenance release
				889	- Fix offset calculation in NEReductionOperationKernel.
				890	- Fix data layout in NEScaleKernel for nhwc.
				891	- Retain configuration step data layout to avoid side-effects.
				892	- Perform sqrt in double domain for L2 pooling.
				893	- Fix output shape calculation for Reduce Mean
				894	- Restrict cases where optimized NEPadLayer runs.
				895
Michele Di Giorgio	a046e16	2019-10-08 09:36:26 +0100	[diff] [blame]	896	v19.11 Public major release
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	897	- Various bug fixes.
				898	- Various optimisations.
SiCong Li	1f7f988	2019-11-28 14:59:35 +0000	[diff] [blame]	899	- Updated recommended NDK version to r17c.
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	900	- Deprecated OpenCL kernels / functions:
Michele Di Giorgio	a046e16	2019-10-08 09:36:26 +0100	[diff] [blame]	901	- CLDepthwiseConvolutionLayerReshapeWeightsGenericKernel
				902	- CLDepthwiseIm2ColKernel
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	903	- CLDepthwiseSeparableConvolutionLayer
Michele Di Giorgio	a046e16	2019-10-08 09:36:26 +0100	[diff] [blame]	904	- CLDepthwiseVectorToTensorKernel
				905	- CLDirectConvolutionLayerOutputStageKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	906	- Deprecated Arm® Neon™ kernels / functions:
Giorgio Arena	d93e263	2019-10-15 11:09:33 +0100	[diff] [blame]	907	- NEDepthwiseWeightsReshapeKernel
				908	- NEDepthwiseIm2ColKernel
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	909	- NEDepthwiseSeparableConvolutionLayer
Giorgio Arena	d93e263	2019-10-15 11:09:33 +0100	[diff] [blame]	910	- NEDepthwiseVectorToTensorKernel
Manuel Bottini	05069f0	2019-09-26 17:18:26 +0100	[diff] [blame]	911	- NEDepthwiseConvolutionLayer3x3
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	912	- New OpenCL kernels / functions:
				913	- @ref CLInstanceNormalizationLayerKernel / @ref CLInstanceNormalizationLayer
				914	- @ref CLDepthwiseConvolutionLayerNativeKernel to replace the old generic depthwise convolution (see Deprecated
				915	OpenCL kernels / functions)
				916	- @ref CLLogSoftmaxLayer
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	917	- New Arm® Neon™ kernels / functions:
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	918	- @ref NEBoundingBoxTransformKernel / @ref NEBoundingBoxTransform
Georgios Pinitas	8c3c0e7	2020-12-03 20:11:53 +0000	[diff] [blame]	919	- @ref NEComputeAllAnchorsKernel / NEComputeAllAnchors
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	920	- @ref NEDetectionPostProcessLayer
				921	- @ref NEGenerateProposalsLayer
				922	- @ref NEInstanceNormalizationLayerKernel / @ref NEInstanceNormalizationLayer
				923	- @ref NELogSoftmaxLayer
				924	- @ref NEROIAlignLayerKernel / @ref NEROIAlignLayer
				925	- Added QASYMM8 support for:
				926	- @ref CLGenerateProposalsLayer
				927	- @ref CLROIAlignLayer
				928	- @ref CPPBoxWithNonMaximaSuppressionLimit
				929	- Added QASYMM16 support for:
				930	- @ref CLBoundingBoxTransform
				931	- Added FP16 support for:
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	932	- CLGEMMMatrixMultiplyReshapedKernel
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	933	- Added new data type QASYMM8_PER_CHANNEL support for:
Manuel Bottini	9e73c93	2021-03-02 17:40:42 +0000	[diff] [blame]	934	- CLDequantizationLayer
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	935	- @ref NEDequantizationLayer
				936	- Added new data type QSYMM8_PER_CHANNEL support for:
				937	- @ref CLConvolutionLayer
				938	- @ref NEConvolutionLayer
				939	- @ref CLDepthwiseConvolutionLayer
				940	- @ref NEDepthwiseConvolutionLayer
				941	- Added FP16 mixed-precision support for:
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	942	- CLGEMMMatrixMultiplyReshapedKernel
Michele Di Giorgio	e131466	2021-02-01 17:09:32 +0000	[diff] [blame]	943	- CLPoolingLayerKernel
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	944	- Added FP32 and FP16 ELU activation for:
				945	- @ref CLActivationLayer
				946	- @ref NEActivationLayer
				947	- Added asymmetric padding support for:
				948	- @ref CLDirectDeconvolutionLayer
				949	- @ref CLGEMMDeconvolutionLayer
				950	- @ref NEDeconvolutionLayer
				951	- Added SYMMETRIC and REFLECT modes for @ref CLPadLayerKernel / @ref CLPadLayer.
Georgios Pinitas	0f7ef8a	2021-01-10 04:23:52 +0000	[diff] [blame]	952	- Replaced the calls to NECopyKernel and NEMemsetKernel with @ref NEPadLayer in @ref NEGenerateProposalsLayer.
				953	- Replaced the calls to CLCopyKernel and CLMemsetKernel with @ref CLPadLayer in @ref CLGenerateProposalsLayer.
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	954	- Improved performance for CL Inception V3 - FP16.
				955	- Improved accuracy for CL Inception V3 - FP16 by enabling FP32 accumulator (mixed-precision).
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	956	- Improved Arm® Neon™ performance by enabling fusing batch normalization with convolution and depth-wise convolution layer.
				957	- Improved Arm® Neon™ performance for MobileNet-SSD by improving the output detection performance.
SiCong Li	ca1f98c	2019-11-28 11:06:11 +0000	[diff] [blame]	958	- Optimized @ref CLPadLayer.
				959	- Optimized CL generic depthwise convolution layer by introducing @ref CLDepthwiseConvolutionLayerNativeKernel.
				960	- Reduced memory consumption by implementing weights sharing.
Michele Di Giorgio	a046e16	2019-10-08 09:36:26 +0100	[diff] [blame]	961
Michele Di Giorgio	d374ff2	2020-01-21 10:03:20 +0000	[diff] [blame]	962	v19.08.1 Public maintenance release
				963	- Fix offset calculation in NEReductionOperationKernel.
				964	- Fix data layout in NEScaleKernel for nhwc.
				965	- Retain configuration step data layout to avoid side-effects.
				966	- Perform sqrt in double domain for L2 pooling.
				967	- Fix output shape calculation for Reduce Mean
				968	- Fix broadcast CLPixelwiseMultiplication with 5D tensors
				969
Georgios Pinitas	3d13af8	2019-06-04 13:04:16 +0100	[diff] [blame]	970	v19.08 Public major release
				971	- Various bug fixes.
				972	- Various optimisations.
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	973	- Deprecated Arm® Neon™ functions
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	974	- NEDepthConcatenateLayer
				975	- NEWidthConcatenateLayer
				976	- Deprecated OpenCL kernels / functions
				977	- CLDepthConcatenateLayer
				978	- CLGEMMInterleave4x4Kernel / CLGEMMInterleave4x4
				979	- CLGEMMTranspose1xWKernel / CLGEMMTranspose1xW
				980	- CLWidthConcatenateLayer
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	981	- New Arm® Neon™ kernels / functions:
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	982	- @ref NEAbsLayer
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	983	- @ref NECast
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	984	- @ref NEElementwisePower
				985	- @ref NELogLayer
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	986	- @ref NELSTMLayerQuantized
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	987	- @ref NENegLayer
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	988	- @ref NEPReluLayer
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	989	- @ref NESinLayer
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	990	- NEBatchConcatenateLayerKernel
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	991	- @ref NEDepthToSpaceLayerKernel / @ref NEDepthToSpaceLayer
Michalis Spyrou	60c3b0e	2021-04-08 12:02:58 +0100	[diff] [blame]	992	- NEDepthwiseConvolutionLayerNativeKernel
Manuel Bottini	ae58bdf	2021-06-17 17:18:45 +0100	[diff] [blame]	993	- NEGEMMLowpQuantizeDownInt32ToInt16ScaleByFixedPointKernel
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	994	- @ref NEMeanStdDevNormalizationKernel / @ref NEMeanStdDevNormalizationLayer
				995	- @ref NESpaceToDepthLayerKernel / @ref NESpaceToDepthLayer
				996	- New OpenCL kernels / functions:
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	997	- @ref CLAbsLayer
				998	- @ref CLElementwisePower
				999	- @ref CLLogLayer
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1000	- @ref CLLSTMLayerQuantized
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	1001	- @ref CLNegLayer
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1002	- @ref CLPReluLayer
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	1003	- @ref CLSinLayer
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	1004	- CLBatchConcatenateLayerKernel
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1005	- @ref CLDepthToSpaceLayerKernel / @ref CLDepthToSpaceLayer
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	1006	- CLGEMMLowpMatrixMultiplyNativeKernel
Michele Di Giorgio	ba14c92	2020-10-12 13:27:57 +0100	[diff] [blame]	1007	- CLGEMMLowpQuantizeDownInt32ToInt16ScaleByFixedPointKernel
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	1008	- CLGEMMMatrixMultiplyNativeKernel
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1009	- CLMeanStdDevNormalizationKernel /CLMeanStdDevNormalizationLayer
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1010	- @ref CLSpaceToDepthLayerKernel / @ref CLSpaceToDepthLayer
				1011	- New examples:
				1012	- neon_opticalflow
				1013	- cl_cache
				1014	- neon_permute
Gian Marco Iodice	c5f48ad	2019-09-02 09:52:12 +0100	[diff] [blame]	1015	- Added support for FP16 in @ref NEDeconvolutionLayer
				1016	- Added support for FP16 in @ref CLDeconvolutionLayer
				1017	- Added support for REDUCE_MIN and REDUCE_MAX in @ref ReductionOperation
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1018	- Enable the fusion of batch normalization with convolution and depthwise convolution layer for FP32 in the graph API (OpenCL only)
				1019	- Added support for fusing activation function and broadcast addition with the matrix multiplication for FP32 (OpenCL only)
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1020	- Re-factored the depthwise convolution layer kernel on Arm® Neon™ for generic cases
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	1021	- Added an optimized depthwise convolution layer kernel for 5x5 filters (Neon™ only)
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1022	- Added support to enable OpenCL kernel cache. Added example showing how to load the prebuilt OpenCL kernels from a binary cache file
				1023	- Altered @ref QuantizationInfo interface to support per-channel quantization.
Manuel Bottini	387259a	2020-05-21 17:14:36 +0100	[diff] [blame]	1024	- The CLDepthwiseConvolutionLayer3x3 will be included by @ref CLDepthwiseConvolutionLayer to accommodate for future optimizations.
				1025	- The NEDepthwiseConvolutionLayerOptimized will be included by @ref NEDepthwiseConvolutionLayer to accommodate for future optimizations.
Gian Marco Iodice	cc2f54b	2019-08-22 10:10:52 +0100	[diff] [blame]	1026	- Removed inner_border_right and inner_border_top parameters from @ref CLDeconvolutionLayer interface
				1027	- Removed inner_border_right and inner_border_top parameters from @ref NEDeconvolutionLayer interface
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1028	- Optimized the Arm® Neon™ assembly kernel for GEMMLowp. The new implementation fuses the output stage and quantization with the matrix multiplication kernel
Georgios Pinitas	3d13af8	2019-06-04 13:04:16 +0100	[diff] [blame]	1029
Michalis Spyrou	a9c4472	2019-04-05 17:18:36 +0100	[diff] [blame]	1030	v19.05 Public major release
Michalis Spyrou	c6608ac	2019-05-16 17:40:23 +0100	[diff] [blame]	1031	- Various bug fixes.
				1032	- Various optimisations.
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1033	- New Arm® Neon™ kernels / functions:
Georgios Pinitas	f790fdb	2019-04-24 12:41:25 +0100	[diff] [blame]	1034	- @ref NEBatchToSpaceLayerKernel / @ref NEBatchToSpaceLayer
Sheri Zhang	1e3ab42	2021-03-16 17:35:08 +0000	[diff] [blame]	1035	- NEComplexPixelWiseMultiplicationKernel / @ref NEComplexPixelWiseMultiplication
Georgios Pinitas	f790fdb	2019-04-24 12:41:25 +0100	[diff] [blame]	1036	- @ref NECropKernel / @ref NECropResize
Michalis Spyrou	60c3b0e	2021-04-08 12:02:58 +0100	[diff] [blame]	1037	- NEDepthwiseConvolutionAssemblyDispatch
Michalis Spyrou	ca82e62	2019-05-10 16:43:20 +0100	[diff] [blame]	1038	- @ref NEFFTDigitReverseKernel
				1039	- @ref NEFFTRadixStageKernel
				1040	- @ref NEFFTScaleKernel
Manuel Bottini	cfac51c	2021-06-18 15:47:28 +0100	[diff] [blame]	1041	- NEGEMMLowpOffsetContributionOutputStageKernel
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	1042	- NEHeightConcatenateLayerKernel
Georgios Pinitas	f790fdb	2019-04-24 12:41:25 +0100	[diff] [blame]	1043	- @ref NESpaceToBatchLayerKernel / @ref NESpaceToBatchLayer
Michalis Spyrou	d7dd15c	2019-05-30 14:53:58 +0100	[diff] [blame]	1044	- @ref NEFFT1D
				1045	- @ref NEFFT2D
				1046	- @ref NEFFTConvolutionLayer
Georgios Pinitas	f790fdb	2019-04-24 12:41:25 +0100	[diff] [blame]	1047	- New OpenCL kernels / functions:
Sheri Zhang	f9ab9f9	2021-03-16 12:09:15 +0000	[diff] [blame]	1048	- CLComplexPixelWiseMultiplicationKernel / @ref CLComplexPixelWiseMultiplication
Sheri Zhang	7e20e29	2021-02-02 11:49:34 +0000	[diff] [blame]	1049	- CLCropKernel / @ref CLCropResize
Michalis Spyrou	d7dd15c	2019-05-30 14:53:58 +0100	[diff] [blame]	1050	- @ref CLDeconvolutionReshapeOutputKernel
Georgios Pinitas	f790fdb	2019-04-24 12:41:25 +0100	[diff] [blame]	1051	- @ref CLFFTDigitReverseKernel
				1052	- @ref CLFFTRadixStageKernel
				1053	- @ref CLFFTScaleKernel
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	1054	- CLGEMMLowpMatrixMultiplyReshapedOnlyRHSKernel
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	1055	- CLGEMMMatrixMultiplyReshapedOnlyRHSKernel
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	1056	- CLHeightConcatenateLayerKernel
Georgios Pinitas	f790fdb	2019-04-24 12:41:25 +0100	[diff] [blame]	1057	- @ref CLDirectDeconvolutionLayer
				1058	- @ref CLFFT1D
				1059	- @ref CLFFT2D
				1060	- @ref CLFFTConvolutionLayer
Michalis Spyrou	ca82e62	2019-05-10 16:43:20 +0100	[diff] [blame]	1061	- @ref CLGEMMDeconvolutionLayer
				1062	- New OpenGLES kernels / functions:
Manuel Bottini	ceaa0bf	2021-02-16 15:15:19 +0000	[diff] [blame]	1063	- GCConcatenateLayer
Michalis Spyrou	a9c4472	2019-04-05 17:18:36 +0100	[diff] [blame]	1064	- Deprecated functions/interfaces
Georgios Pinitas	09f2497	2019-05-17 18:14:40 +0100	[diff] [blame]	1065	- GCDepthConcatenateLayer
				1066	- NEWidthConcatenateLayer
				1067	- NEDepthConcatenateLayer
				1068	- CLWidthConcatenateLayer
				1069	- CLDepthConcatenateLayer
Gian Marco Iodice	5fc07aa	2019-05-15 17:08:02 +0100	[diff] [blame]	1070	- CLGEMMInterleave4x4
				1071	- CLGEMMTranspose1xW
Michalis Spyrou	c6608ac	2019-05-16 17:40:23 +0100	[diff] [blame]	1072	- Support different quantization info in CLConcatLayer.
				1073	- Add checks on different input/output quantization info were not supported.
				1074	- Tensors have different quantization information.
				1075	- Add FP16 support checks.
				1076	- Fix output quantization CLDeptwiseConv3x3 when activation is fused.
				1077	- New graph examples:
				1078	- graph_convolution
				1079	- graph_fully_connected
				1080	- graph_depthwise_convolution
				1081	- Deepspeech v0.4.1
				1082	- Add support for QASYMM8 in NEArithmeticSubtractionKernel.
				1083	- Add support for QASYMM8 in NEPixelWiseMultiplicationKernel.
				1084	- Add support for QASYMM8 NEDeconvolution.
Sheri Zhang	ac6499a	2021-02-10 15:32:38 +0000	[diff] [blame]	1085	- Add support for DequantizationLayer for Neon/CL.
Michalis Spyrou	c6608ac	2019-05-16 17:40:23 +0100	[diff] [blame]	1086	- Add support for dilation in CLDepthwiseConvolution.
				1087	- Fuse offset contribution with the output stage when we use NEGEMMLowpMatrixMultiplyCore.
				1088	- Optimize CLDeconvolution.
				1089	- Add StackLayer to the graph API.
				1090	- Add support for "reflect" padding mode in NEPad.
				1091	- Winograd 7x7 NHWC on OpenCL.
				1092	- Rework CL ML layers to run exclusively on CL.
				1093	- Support different quantization info in PoolingLayer.
				1094	- Implement and test import memory interfaces.
				1095	- Added new tests and removed old ones.
				1096	- Various clang-tidy fixes.
Michalis Spyrou	a9c4472	2019-04-05 17:18:36 +0100	[diff] [blame]	1097
giuros01	a69a88b	2019-01-31 16:29:19 +0000	[diff] [blame]	1098	v19.02 Public major release
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1099	- Various bug fixes.
				1100	- Various optimisations.
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1101	- New Arm® Neon™ kernels / functions:
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1102	- @ref NETileKernel / @ref NETile
				1103	- @ref NEFuseBatchNormalizationKernel / @ref NEFuseBatchNormalization
Sang-Hoon Park	63001ac	2021-01-18 14:20:27 +0000	[diff] [blame]	1104	- NEElementwiseOperationKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1105	- @ref NEElementwiseMax
				1106	- @ref NEElementwiseMin
				1107	- @ref NEElementwiseSquaredDiff
				1108	- @ref NESelectKernel / @ref NESelect
				1109	- @ref NESplit
				1110	- @ref NESlice
				1111	- @ref NEUnstack
				1112	- @ref NEStridedSliceKernel / @ref NEStridedSlice
Sang-Hoon Park	7249f15	2021-01-22 11:55:03 +0000	[diff] [blame]	1113	- NEElementwiseUnaryKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1114	- @ref NERsqrtLayer
				1115	- @ref NEExpLayer
				1116	- @ref NEReverseKernel / @ref NEReverse
				1117	- @ref NEArgMinMaxLayer
				1118	- @ref NEStackLayerKernel / @ref NEStackLayer
				1119	- @ref NERangeKernel / @ref NERange
				1120	- @ref NEPadLayer
Georgios Pinitas	0f7ef8a	2021-01-10 04:23:52 +0000	[diff] [blame]	1121	- NEMemsetKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1122	- @ref NEGatherKernel / @ref NEGather
				1123	- @ref NEElementwiseComparison
				1124	- @ref NEElementwiseComparisonStatic
Sang-Hoon Park	63001ac	2021-01-18 14:20:27 +0000	[diff] [blame]	1125	- NEComparisonOperationKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1126	- @ref NEElementwiseDivision
				1127	- New OpenCL kernels / functions:
				1128	- @ref CLSelectKernel / @ref CLSelect
				1129	- @ref CLTileKernel / @ref CLTile
				1130	- @ref CLComparisonKernel / @ref CLComparison
				1131	- @ref CLArgMinMaxLayer
				1132	- @ref CLElementwiseMax
				1133	- @ref CLElementwiseMin
				1134	- @ref CLElementwiseSquaredDiff
				1135	- @ref CLStackLayerKernel / @ref CLStackLayer
				1136	- @ref CLReverse / @ref CLReverseKernel
				1137	- @ref CLRsqrtLayer
				1138	- @ref CLExpLayer
Michele Di Giorgio	c9c8905	2021-01-26 10:20:17 +0000	[diff] [blame]	1139	- CLElementWiseUnaryLayerKernel
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	1140	- CLGEMMReshapeLHSMatrixKernel
				1141	- CLGEMMReshapeRHSMatrixKernel
				1142	- CLGEMMMatrixMultiplyReshapedKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1143	- @ref CLRangeKernel / @ref CLRange
				1144	- @ref CLUnstack
				1145	- @ref CLGatherKernel / @ref CLGather
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	1146	- CLGEMMLowpMatrixMultiplyReshapedKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1147	- New CPP kernels / functions:
				1148	- @ref CPPDetectionOutputLayer
				1149	- @ref CPPTopKV / @ref CPPTopKVKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1150	- Added new examples:
				1151	- graph_ssd_mobilenet.cpp
				1152	- graph_mobilenet_v2.cpp
				1153	- graph_resnet12.cpp
				1154	- graph_srcnn955.cpp
				1155	- graph_vgg_vdsr.cpp
				1156	- graph_inception_resnet_v1.cpp
				1157	- Add 4D tensors support to
				1158	- @ref NESoftmaxLayer
				1159	- Fused activation in @ref CLWinogradConvolutionLayer
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	1160	- Extended @ref NEPermute to support more cases
				1161	- Added Neon™/SVE GEMM Hybrid kernels
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1162	- Added u8 and s8 hybrid assembly kernels
				1163	- Introduced GEMM strategy name in NEGEMMAssemblyWrapper
				1164	- Improved @ref CLTuner
				1165	- Fused the bias addition within @ref CLGEMM
				1166	- Added support for QASYMM8 LOGISTIC activation in @ref NEActivationLayer
				1167	- Added NHWC data layout support to:
				1168	- @ref NEScale for F16
				1169	- @ref CLNormalizationLayer IN_MAP_2D for FP32/FP16
				1170	- @ref NEL2NormalizeLayer for FP32/FP16
				1171	- @ref NENormalizationLayer IN_MAP_2D for FP32/FP16
				1172	- @ref CLROIAlignLayer
Manuel Bottini	5209be5	2019-02-13 16:34:56 +0000	[diff] [blame]	1173	- @ref CLGenerateProposalsLayer
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1174	- Added QASYMM8 support to the following kernels:
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	1175	- NEArithmeticAdditionKernel
Isabella Gottardi	6253897	2019-02-12 19:52:44 +0000	[diff] [blame]	1176	- @ref NEScale
				1177	- Added new tests and improved validation and benchmarking suites.
giuros01	a69a88b	2019-01-31 16:29:19 +0000	[diff] [blame]	1178	- Deprecated functions/interfaces
				1179	- Usage of inner_border_right and inner_border_top has been deprecated in @ref CLDeconvolutionLayer and @ref NEDeconvolutionLayer
				1180
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1181	v18.11 Public major release
				1182	- Various bug fixes.
				1183	- Various optimisations.
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1184	- New Arm® Neon™ kernels / functions:
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1185	- @ref NEChannelShuffleLayer / @ref NEChannelShuffleLayerKernel
				1186	- @ref NEReduceMean
				1187	- @ref NEReorgLayer / @ref NEReorgLayerKernel
				1188	- @ref NEPriorBoxLayer / @ref NEPriorBoxLayerKernel
Georgios Pinitas	c53266e	2020-12-09 03:11:53 +0000	[diff] [blame]	1189	- NEUpsampleLayer / NEUpsampleLayerKernel
Georgios Pinitas	0b1c2db	2020-12-04 15:51:34 +0000	[diff] [blame]	1190	- NEYOLOLayer / NEYOLOLayerKernel
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1191	- New OpenCL kernels / functions:
				1192	- @ref CLBatchToSpaceLayer / @ref CLBatchToSpaceLayerKernel
				1193	- @ref CLBoundingBoxTransform / @ref CLBoundingBoxTransformKernel
Manuel Bottini	5209be5	2019-02-13 16:34:56 +0000	[diff] [blame]	1194	- @ref CLComputeAllAnchorsKernel
				1195	- @ref CLGenerateProposalsLayer
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1196	- @ref CLNormalizePlanarYUVLayer / @ref CLNormalizePlanarYUVLayerKernel
				1197	- @ref CLReorgLayer / @ref CLReorgLayerKernel
				1198	- @ref CLSpaceToBatchLayer / @ref CLSpaceToBatchLayerKernel
				1199	- @ref CLPadLayer
				1200	- @ref CLReduceMean
				1201	- @ref CLPriorBoxLayer / @ref CLPriorBoxLayerKernel
				1202	- @ref CLROIAlignLayer / @ref CLROIAlignLayerKernel
				1203	- @ref CLSlice
				1204	- @ref CLSplit
				1205	- @ref CLStridedSlice / @ref CLStridedSliceKernel
Georgios Pinitas	c53266e	2020-12-09 03:11:53 +0000	[diff] [blame]	1206	- CLUpsampleLayer / CLUpsampleLayerKernel
Georgios Pinitas	0b1c2db	2020-12-04 15:51:34 +0000	[diff] [blame]	1207	- CLYOLOLayer / CLYOLOLayerKernel
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1208	- New CPP kernels / functions:
				1209	- @ref CPPBoxWithNonMaximaSuppressionLimit / @ref CPPBoxWithNonMaximaSuppressionLimitKernel
				1210	- Added the validate method in:
				1211	- @ref NEDepthConvertLayer
				1212	- @ref NEFloor / @ref CLFloor
Michele Di Giorgio	93b75e0	2021-06-21 12:00:43 +0100	[diff] [blame]	1213	- NEGEMMMatrixAdditionKernel
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1214	- @ref NEReshapeLayer / @ref CLReshapeLayer
				1215	- @ref CLScale
				1216	- Added new examples:
				1217	- graph_shufflenet.cpp
				1218	- graph_yolov3.cpp
				1219	- Added documentation for add a new function or kernel.
				1220	- Improved doxygen documentation adding a list of the existing functions.
				1221	- Add 4D tensors support to
Georgios Pinitas	09f2497	2019-05-17 18:14:40 +0100	[diff] [blame]	1222	- CLWidthConcatenateLayer
Georgios Pinitas	e2696b1	2020-12-03 20:37:43 +0000	[diff] [blame]	1223	- CLFlattenLayer
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1224	- @ref CLSoftmaxLayer
Gian Marco Iodice	8155c02	2021-04-16 15:08:59 +0100	[diff] [blame]	1225	- Add dot product support for CLDepthwiseConvolutionLayer3x3NHWCKernel non-unit stride
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1226	- Add SVE support
				1227	- Fused batch normalization into convolution layer weights in @ref CLFuseBatchNormalization
Gian Marco Iodice	8155c02	2021-04-16 15:08:59 +0100	[diff] [blame]	1228	- Fuses activation in CLDepthwiseConvolutionLayer3x3NCHWKernel, CLDepthwiseConvolutionLayer3x3NHWCKernel and @ref NEGEMMConvolutionLayer
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1229	- Added NHWC data layout support to:
				1230	- @ref CLChannelShuffleLayer
				1231	- @ref CLDeconvolutionLayer
				1232	- @ref CLL2NormalizeLayer
				1233	- Added QASYMM8 support to the following kernels:
Manuel Bottini	3b131ab	2021-02-19 18:16:44 +0000	[diff] [blame]	1234	- CLScaleKernel
Georgios Pinitas	7d0adc6	2020-09-04 15:25:24 +0100	[diff] [blame]	1235	- NEDepthwiseConvolutionLayer3x3Kernel
Sheri Zhang	f9ab9f9	2021-03-16 12:09:15 +0000	[diff] [blame]	1236	- CLPixelWiseMultiplicationKernel
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1237	- Added FP16 support to the following kernels:
Gian Marco Iodice	8155c02	2021-04-16 15:08:59 +0100	[diff] [blame]	1238	- CLDepthwiseConvolutionLayer3x3NHWCKernel
Georgios Pinitas	7d0adc6	2020-09-04 15:25:24 +0100	[diff] [blame]	1239	- NEDepthwiseConvolutionLayer3x3Kernel
Isabella Gottardi	8773d7c	2018-11-20 09:56:46 +0000	[diff] [blame]	1240	- @ref CLNormalizePlanarYUVLayerKernel
				1241	- @ref CLWinogradConvolutionLayer (5x5 kernel)
				1242	- More tests added to both validation and benchmarking suites.
				1243
Anthony Barbier	d51ea0a	2018-08-07 17:48:03 +0100	[diff] [blame]	1244	v18.08 Public major release
				1245	- Various bug fixes.
Michele Di Giorgio	02baf01	2018-08-20 18:10:38 +0100	[diff] [blame]	1246	- Various optimisations.
Anthony Barbier	d51ea0a	2018-08-07 17:48:03 +0100	[diff] [blame]	1247	- Updated recommended NDK version to r17b.
Michele Di Giorgio	02baf01	2018-08-20 18:10:38 +0100	[diff] [blame]	1248	- Removed support for QS8/QS16 data types.
				1249	- Added support for grouped convolution in @ref CLConvolutionLayer.
				1250	- Added NHWC data layout support to:
Georgios Pinitas	09f2497	2019-05-17 18:14:40 +0100	[diff] [blame]	1251	- NEDepthConcatenateLayer / CLDepthConcatenateLayer
Michele Di Giorgio	02baf01	2018-08-20 18:10:38 +0100	[diff] [blame]	1252	- @ref NEWinogradConvolutionLayer / @ref CLWinogradConvolutionLayer
				1253	- @ref CLDepthwiseConvolutionLayer
				1254	- @ref CLDirectConvolutionLayer
				1255	- @ref CLConvolutionLayer
				1256	- @ref CLScale
Manuel Bottini	d844c08	2021-07-14 12:58:54 +0100	[diff] [blame]	1257	- CLIm2ColKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1258	- New Arm® Neon™ kernels / functions:
Michele Di Giorgio	02baf01	2018-08-20 18:10:38 +0100	[diff] [blame]	1259	- @ref NERNNLayer
				1260	- New OpenCL kernels / functions:
				1261	- @ref CLArithmeticDivision
				1262	- Introduced prepare() stage support in the graph API for GLES.
				1263	- Added support for memory reusage when trying to allocate smaller CLTensors.
				1264	- Enabled NHWC execution on graph examples.
				1265	- Added JPEG accessor for validation purposes.
				1266	- Added validate methods to some kernels / functions.
Anthony Barbier	d51ea0a	2018-08-07 17:48:03 +0100	[diff] [blame]	1267
				1268	v18.05 Public major release
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1269	- Various bug fixes.
				1270	- Various optimisations.
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	1271	- Major redesign in the interface for the Neon™ kernels implemented in assembly.
Pablo Tello	eb82fd2	2018-02-23 13:43:50 +0000	[diff] [blame]	1272	- Removed arm_compute::NEGEMMLowpAArch64A53Kernel / arm_compute::NEGEMMLowpAArch64Kernel / arm_compute::NEGEMMLowpAArch64V8P4Kernel / arm_compute::NEGEMMInterleavedBlockedKernel / arm_compute::NEGEMMLowpAssemblyMatrixMultiplyCore / arm_compute::NEHGEMMAArch64FP16Kernel
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	1273	- Added NEGEMMAssemblyWrapper and AssemblyKernelGlue which are used to execute assembly kernels in Neon™ functions.
Pablo Tello	eb82fd2	2018-02-23 13:43:50 +0000	[diff] [blame]	1274	- Minor changes to the CPUInfo type to make it compatible with the new assembly gemm interface.
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	1275	- Moved Neon™ assembly kernels to the folder src/core/Neon/kernels/arm_gemm.
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1276	- Improved doxygen documentation.
				1277	- Improved memory management for layer's transitions.
				1278	- Added support for NHWC data layout in tensors.
				1279	- Added NHWC data layout support to:
				1280	- @ref NEGEMMConvolutionLayer
				1281	- @ref NEDirectConvolutionLayer
				1282	- @ref NEPoolingLayer / @ref CLPoolingLayer
				1283	- @ref NEBatchNormalizationLayer / @ref CLBatchNormalizationLayer
				1284	- @ref NEDepthwiseConvolutionLayer
				1285	- @ref NEScale
Georgios Pinitas	f7c5a41	2020-12-03 14:38:33 +0000	[diff] [blame]	1286	- NEIm2Col
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1287	- Added support for dilated convolutions in @ref NEConvolutionLayer and @ref CLConvolutionLayer.
				1288	- New OpenCL kernels / functions:
				1289	- @ref CLChannelShuffleLayer / @ref CLChannelShuffleLayerKernel
Teresa Charlin	91b7f74	2021-04-12 13:57:00 +0100	[diff] [blame]	1290	- CLConvertFullyConnectedWeightsKernel / @ref CLConvertFullyConnectedWeights
Sheri Zhang	7e20e29	2021-02-02 11:49:34 +0000	[diff] [blame]	1291	- @ref CLCopy / CLCopyKernel
Anthony Barbier	38e7f1f	2018-05-21 13:37:47 +0100	[diff] [blame]	1292	- @ref CLLSTMLayer
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1293	- @ref CLRNNLayer
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	1294	- CLWidthConcatenateLayer / CLWidthConcatenateLayerKernel
Manuel Bottini	c6f4ec3	2021-05-18 18:41:56 +0100	[diff] [blame]	1295	- CLWinogradFilterTransformKernel / @ref CLWinogradConvolutionLayer
				1296	- CLWinogradInputTransformKernel / CLWinogradInputTransform
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1297	- New Arm® Neon™ kernels / functions:
Teresa Charlin	562bee5	2021-04-13 17:44:15 +0100	[diff] [blame]	1298	- NEConvertFullyConnectedWeightsKernel / @ref NEConvertFullyConnectedWeights.
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1299	- Created the validate method in @ref CLDepthwiseConvolutionLayer.
				1300	- Beta and gamma are no longer mandatory arguments in @ref NEBatchNormalizationLayer and @ref CLBatchNormalizationLayer.
				1301	- Added depth multiplier support in @ref NEDepthwiseConvolutionLayer and @ref CLDepthwiseConvolutionLayer.
Sheri Zhang	1e3ab42	2021-03-16 17:35:08 +0000	[diff] [blame]	1302	- Added broadcast multiply support in @ref NEPixelWiseMultiplication / NEPixelWiseMultiplicationKernel.
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1303	- Port mobilenet example to NHWC data layout.
				1304	- Enabled Winograd method in @ref CLConvolutionLayer.
				1305	- Renamed NEWinogradLayer to @ref NEWinogradConvolutionLayer.
Sheri Zhang	ac6499a	2021-02-10 15:32:38 +0000	[diff] [blame]	1306	- Updated @ref NEWinogradConvolutionLayer to use highly optimised assembly kernels in src/core/Neon/kernels/arm_gemm.
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1307	- Added memory manager support in GLES functions.
				1308	- Major refactoring of the graph API.
				1309	- Added GLES backend in the graph API.
				1310	- Added support for the memory manager in the graph API.
				1311	- Enabled Winograd Convolution method in the graph API.
				1312	- Added support for grouped convolutions in the graph API.
Manuel Bottini	10b3826	2021-02-19 18:16:44 +0000	[diff] [blame]	1313	- Replaced NEDeconvolutionLayerUpsampleKernel with NEScaleKernel in @ref NEDeconvolutionLayer.
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1314	- Added fast maths flag in @ref CLConvolutionLayer.
				1315	- Added new tests and benchmarks in validation and benchmark frameworks
Jakub Sujak	ee301b3	2021-06-04 09:46:08 +0100	[diff] [blame]	1316	- Merge Activation layer with Convolution Layer (Neon™, CL, GLES)
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1317	- Added support to OpenCL 2.0 SVM
				1318	- Added support to import memory in OpenCL tensors.
				1319	- Added the prepare() method to perform any one off pre-processing before running the function.
				1320	- Added new examples:
				1321	- graph_inception_v4.cpp
Anthony Barbier	38e7f1f	2018-05-21 13:37:47 +0100	[diff] [blame]	1322	- graph_resnext50.cpp
Pablo Tello	b5cc95b	2018-05-15 11:49:33 +0100	[diff] [blame]	1323	- Added memory measurement instrument for CL.
Pablo Tello	eb82fd2	2018-02-23 13:43:50 +0000	[diff] [blame]	1324
Anthony Barbier	577fbdf	2018-03-01 15:17:54 +0000	[diff] [blame]	1325	v18.03 Public maintenance release
				1326	- Various bug fixes.
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1327	- Fixed bug in @ref NEActivationLayer
				1328	- Fix in @ref CLTuner when using batches.
Anthony Barbier	577fbdf	2018-03-01 15:17:54 +0000	[diff] [blame]	1329	- Updated recommended NDK version to r16b (And fixed warnings).
				1330	- Fixed bug in validation code.
				1331	- Added Inception v4 graph example.
Georgios Pinitas	9fb1159	2018-04-26 20:34:58 +0100	[diff] [blame]	1332	- Renamed NEWinogradLayer.cpp to @ref NEWinogradConvolutionLayer
Anthony Barbier	577fbdf	2018-03-01 15:17:54 +0000	[diff] [blame]	1333
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1334	v18.02 Public major release
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1335	- Various Arm® Neon™ / OpenCL / GLES optimisations.
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1336	- Various bug fixes.
				1337	- Changed default number of threads on big LITTLE systems.
				1338	- Refactored examples and added:
				1339	- graph_mobilenet_qassym8
				1340	- graph_resnet
				1341	- graph_squeezenet_v1_1
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1342	- Renamed @ref CLConvolutionLayer into @ref CLGEMMConvolutionLayer and created a new @ref CLConvolutionLayer to select the fastest convolution method.
				1343	- Renamed @ref NEConvolutionLayer into @ref NEGEMMConvolutionLayer and created a new @ref NEConvolutionLayer to select the fastest convolution method.
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1344	- Added in place support to:
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1345	- @ref CLActivationLayer
				1346	- @ref CLBatchNormalizationLayer
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1347	- Added QASYMM8 support to:
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1348	- @ref CLActivationLayer
				1349	- @ref CLDepthwiseConvolutionLayer
				1350	- @ref NEDepthwiseConvolutionLayer
				1351	- @ref NESoftmaxLayer
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1352	- Added FP16 support to:
Manuel Bottini	387259a	2020-05-21 17:14:36 +0100	[diff] [blame]	1353	- CLDepthwiseConvolutionLayer3x3
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1354	- @ref CLDepthwiseConvolutionLayer
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	1355	- Added broadcasting support to NEArithmeticAddition / @ref CLArithmeticAddition / @ref CLPixelWiseMultiplication
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1356	- Added fused batched normalization and activation to @ref CLBatchNormalizationLayer and @ref NEBatchNormalizationLayer
				1357	- Added support for non-square pooling to @ref NEPoolingLayer and @ref CLPoolingLayer
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1358	- New OpenCL kernels / functions:
Michele Di Giorgio	a046e16	2019-10-08 09:36:26 +0100	[diff] [blame]	1359	- CLDirectConvolutionLayerOutputStageKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1360	- New Arm® Neon™ kernels / functions
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1361	- Added name() method to all kernels.
				1362	- Added support for Winograd 5x5.
Georgios Pinitas	0f7ef8a	2021-01-10 04:23:52 +0000	[diff] [blame]	1363	- NEPermuteKernel / @ref NEPermute
Michalis Spyrou	96f977e	2021-07-01 12:20:56 +0100	[diff] [blame]	1364	- CpuWinogradConv2dTransformInputKernel / NEWinogradLayer
				1365	- CpuWinogradConv2dTransformOutputKernel / NEWinogradLayer
				1366	- CpuWinogradConv2dTransformWeightsKernel / NEWinogradLayer
Anthony Barbier	e155337	2018-07-16 18:53:52 +0100	[diff] [blame]	1367	- Renamed NEWinogradLayerKernel into NEWinogradLayerBatchedGEMMKernel
Anthony Barbier	2d0ce77	2018-02-21 15:35:36 +0000	[diff] [blame]	1368	- New GLES kernels / functions:
Manuel Bottini	ceaa0bf	2021-02-16 15:15:19 +0000	[diff] [blame]	1369	- GCTensorShiftKernel / GCTensorShift
Pablo Tello	f6c572c	2018-02-14 12:47:30 +0000	[diff] [blame]	1370
Anthony Barbier	64c95a0	2018-01-22 18:48:55 +0000	[diff] [blame]	1371	v18.01 Public maintenance release
				1372	- Various bug fixes
				1373	- Added some of the missing validate() methods
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1374	- Added @ref CLDeconvolutionLayerUpsampleKernel / @ref CLDeconvolutionLayer @ref CLDeconvolutionLayerUpsample
Sheri Zhang	7e20e29	2021-02-02 11:49:34 +0000	[diff] [blame]	1375	- Added CLPermuteKernel / @ref CLPermute
Anthony Barbier	64c95a0	2018-01-22 18:48:55 +0000	[diff] [blame]	1376	- Added method to clean the programs cache in the CL Kernel library.
Manuel Bottini	ceaa0bf	2021-02-16 15:15:19 +0000	[diff] [blame]	1377	- Added GCArithmeticAdditionKernel / GCArithmeticAddition
				1378	- Added GCDepthwiseConvolutionLayer3x3Kernel / GCDepthwiseConvolutionLayer3x3
				1379	- Added GCNormalizePlanarYUVLayerKernel / GCNormalizePlanarYUVLayer
				1380	- Added GCScaleKernel / GCScale
				1381	- Added GCWeightsReshapeKernel / GCConvolutionLayer
Anthony Barbier	64c95a0	2018-01-22 18:48:55 +0000	[diff] [blame]	1382	- Added FP16 support to the following GLES compute kernels:
Manuel Bottini	ceaa0bf	2021-02-16 15:15:19 +0000	[diff] [blame]	1383	- GCCol2ImKernel
				1384	- GCGEMMInterleave4x4Kernel
				1385	- GCGEMMTranspose1xWKernel
				1386	- GCIm2ColKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1387	- Refactored Arm® Neon™ Winograd (NEWinogradLayerKernel)
Manuel Bottini	327225d	2021-04-13 13:09:30 +0100	[diff] [blame]	1388	- Added NEDirectConvolutionLayerOutputStageKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1389	- Added QASYMM8 support to the following Arm® Neon™ kernels:
Georgios Pinitas	7d0adc6	2020-09-04 15:25:24 +0100	[diff] [blame]	1390	- NEDepthwiseConvolutionLayer3x3Kernel
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1391	- @ref NEFillBorderKernel
Michele Di Giorgio	1928904	2021-02-03 16:05:00 +0000	[diff] [blame]	1392	- NEPoolingLayerKernel
Anthony Barbier	64c95a0	2018-01-22 18:48:55 +0000	[diff] [blame]	1393	- Added new examples:
				1394	- graph_cl_mobilenet_qasymm8.cpp
				1395	- graph_inception_v3.cpp
				1396	- gc_dc.cpp
				1397	- More tests added to both validation and benchmarking suites.
				1398
Gian Marco	ff85093	2017-12-11 12:37:17 +0000	[diff] [blame]	1399	v17.12 Public major release
				1400	- Most machine learning functions on OpenCL support the new data type QASYMM8
				1401	- Introduced logging interface
				1402	- Introduced opencl timer
				1403	- Reworked GEMMLowp interface
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1404	- Added new Arm® Neon™ assembly kernels for GEMMLowp, SGEMM and HGEMM
Gian Marco	ff85093	2017-12-11 12:37:17 +0000	[diff] [blame]	1405	- Added validation method for most Machine Learning kernels / functions
				1406	- Added new graph examples such as googlenet, mobilenet, squeezenet, vgg16 and vgg19
				1407	- Added sgemm example for OpenCL
				1408	- Added absolute difference example for GLES compute
				1409	- Added new tests and benchmarks in validation and benchmark frameworks
				1410	- Added new kernels / functions for GLES compute
				1411
				1412	- New OpenGL ES kernels / functions
Manuel Bottini	ceaa0bf	2021-02-16 15:15:19 +0000	[diff] [blame]	1413	- GCAbsoluteDifferenceKernel / GCAbsoluteDifference
				1414	- GCActivationLayerKernel / GCActivationLayer
				1415	- GCBatchNormalizationLayerKernel / GCBatchNormalizationLayer
				1416	- GCCol2ImKernel
				1417	- GCDepthConcatenateLayerKernel / GCDepthConcatenateLayer
				1418	- GCDirectConvolutionLayerKernel / GCDirectConvolutionLayer
				1419	- GCDropoutLayerKernel / GCDropoutLayer
				1420	- GCFillBorderKernel / GCFillBorder
				1421	- GCGEMMInterleave4x4Kernel / GCGEMMInterleave4x4
				1422	- GCGEMMMatrixAccumulateBiasesKernel / GCGEMMMatrixAdditionKernel / GCGEMMMatrixMultiplyKernel / GCGEMM
				1423	- GCGEMMTranspose1xWKernel / GCGEMMTranspose1xW
				1424	- GCIm2ColKernel
				1425	- GCNormalizationLayerKernel / GCNormalizationLayer
				1426	- GCPixelWiseMultiplicationKernel / GCPixelWiseMultiplication
				1427	- GCPoolingLayerKernel / GCPoolingLayer
				1428	- GCLogits1DMaxKernel / GCLogits1DShiftExpSumKernel / GCLogits1DNormKernel / GCSoftmaxLayer
				1429	- GCTransposeKernel / GCTranspose
Gian Marco	ff85093	2017-12-11 12:37:17 +0000	[diff] [blame]	1430
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1431	- New Arm® Neon™ kernels / functions
Pablo Tello	eb82fd2	2018-02-23 13:43:50 +0000	[diff] [blame]	1432	- arm_compute::NEGEMMLowpAArch64A53Kernel / arm_compute::NEGEMMLowpAArch64Kernel / arm_compute::NEGEMMLowpAArch64V8P4Kernel / arm_compute::NEGEMMInterleavedBlockedKernel / arm_compute::NEGEMMLowpAssemblyMatrixMultiplyCore
				1433	- arm_compute::NEHGEMMAArch64FP16Kernel
Georgios Pinitas	7d0adc6	2020-09-04 15:25:24 +0100	[diff] [blame]	1434	- NEDepthwiseConvolutionLayer3x3Kernel / NEDepthwiseIm2ColKernel / NEGEMMMatrixVectorMultiplyKernel / NEDepthwiseVectorToTensorKernel / @ref NEDepthwiseConvolutionLayer
Manuel Bottini	cfac51c	2021-06-18 15:47:28 +0100	[diff] [blame]	1435	- NEGEMMLowpOffsetContributionKernel / NEGEMMLowpMatrixAReductionKernel / NEGEMMLowpMatrixBReductionKernel / NEGEMMLowpMatrixMultiplyCore
Manuel Bottini	ae58bdf	2021-06-17 17:18:45 +0100	[diff] [blame]	1436	- NEGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPointKernel / NEGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPoint
Georgios Pinitas	9fb1159	2018-04-26 20:34:58 +0100	[diff] [blame]	1437	- NEWinogradLayer / NEWinogradLayerKernel
Gian Marco	ff85093	2017-12-11 12:37:17 +0000	[diff] [blame]	1438
				1439	- New OpenCL kernels / functions
Georgios Pinitas	4a578b9	2021-06-25 12:13:49 +0100	[diff] [blame]	1440	- CLGEMMLowpOffsetContributionKernel / CLGEMMLowpMatrixAReductionKernel / CLGEMMLowpMatrixBReductionKernel / CLGEMMLowpMatrixMultiplyCore
				1441	- CLGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPointKernel / CLGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPoint
Gian Marco	ff85093	2017-12-11 12:37:17 +0000	[diff] [blame]	1442
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1443	- New graph nodes for Arm® Neon™ and OpenCL
Georgios Pinitas	d9eb275	2018-04-03 13:44:29 +0100	[diff] [blame]	1444	- graph::BranchLayer
				1445	- graph::DepthConvertLayer
				1446	- graph::DepthwiseConvolutionLayer
				1447	- graph::DequantizationLayer
				1448	- graph::FlattenLayer
				1449	- graph::QuantizationLayer
				1450	- graph::ReshapeLayer
Gian Marco	ff85093	2017-12-11 12:37:17 +0000	[diff] [blame]	1451
Anthony Barbier	3c5b4ff	2017-10-12 13:20:52 +0100	[diff] [blame]	1452	v17.10 Public maintenance release
				1453	- Bug fixes:
				1454	- Check the maximum local workgroup size supported by OpenCL devices
				1455	- Minor documentation updates (Fixed instructions to build the examples)
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1456	- Introduced a graph::GraphContext
Anthony Barbier	3c5b4ff	2017-10-12 13:20:52 +0100	[diff] [blame]	1457	- Added a few new Graph nodes, support for branches and grouping.
				1458	- Automatically enable cl_printf in debug builds
				1459	- Fixed bare metal builds for armv7a
				1460	- Added AlexNet and cartoon effect examples
				1461	- Fixed library builds: libraries are no longer built as supersets of each other.(It means application using the Runtime part of the library now need to link against both libarm_compute_core and libarm_compute)
				1462
Anthony Barbier	6a5627a	2017-09-26 14:42:02 +0100	[diff] [blame]	1463	v17.09 Public major release
				1464	- Experimental Graph support: initial implementation of a simple stream API to easily chain machine learning layers.
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1465	- Memory Manager (@ref BlobLifetimeManager, @ref BlobMemoryPool, @ref ILifetimeManager, @ref IMemoryGroup, @ref IMemoryManager, @ref IMemoryPool, @ref IPoolManager, @ref MemoryManagerOnDemand, @ref PoolManager)
Anthony Barbier	6a5627a	2017-09-26 14:42:02 +0100	[diff] [blame]	1466	- New validation and benchmark frameworks (Boost and Google frameworks replaced by homemade framework).
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1467	- Most machine learning functions support both fixed point 8 and 16 bit (QS8, QS16) for both Arm® Neon™ and OpenCL.
				1468	- New Arm® Neon™ kernels / functions:
Pablo Tello	eb82fd2	2018-02-23 13:43:50 +0000	[diff] [blame]	1469	- arm_compute::NEGEMMAssemblyBaseKernel arm_compute::NEGEMMAArch64Kernel
Manuel Bottini	00f4dfc	2021-03-10 09:55:14 +0000	[diff] [blame]	1470	- NEDequantizationLayerKernel / @ref NEDequantizationLayer
Georgios Pinitas	70eb53b	2021-01-06 19:42:21 +0000	[diff] [blame]	1471	- NEFloorKernel / @ref NEFloor
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1472	- @ref NEL2NormalizeLayerKernel / @ref NEL2NormalizeLayer
Georgios Pinitas	b6af482	2021-09-14 12:33:34 +0100	[diff] [blame]	1473	- NEQuantizationLayerKernel NEMinMaxLayerKernel / @ref NEQuantizationLayer
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1474	- @ref NEROIPoolingLayerKernel / @ref NEROIPoolingLayer
				1475	- @ref NEReductionOperationKernel / @ref NEReductionOperation
Georgios Pinitas	0f7ef8a	2021-01-10 04:23:52 +0000	[diff] [blame]	1476	- NEReshapeLayerKernel / @ref NEReshapeLayer
Anthony Barbier	6a5627a	2017-09-26 14:42:02 +0100	[diff] [blame]	1477
				1478	- New OpenCL kernels / functions:
Gian Marco Iodice	8155c02	2021-04-16 15:08:59 +0100	[diff] [blame]	1479	- CLDepthwiseConvolutionLayer3x3NCHWKernel CLDepthwiseConvolutionLayer3x3NHWCKernel CLDepthwiseIm2ColKernel CLDepthwiseVectorToTensorKernel CLDepthwiseWeightsReshapeKernel / CLDepthwiseConvolutionLayer3x3 @ref CLDepthwiseConvolutionLayer CLDepthwiseSeparableConvolutionLayer
Manuel Bottini	9e73c93	2021-03-02 17:40:42 +0000	[diff] [blame]	1480	- CLDequantizationLayerKernel / CLDequantizationLayer
Sheri Zhang	1efed92	2021-03-10 22:43:38 +0000	[diff] [blame]	1481	- CLDirectConvolutionLayerKernel / @ref CLDirectConvolutionLayer
Georgios Pinitas	e2696b1	2020-12-03 20:37:43 +0000	[diff] [blame]	1482	- CLFlattenLayer
Georgios Pinitas	f47f718	2021-01-15 09:29:50 +0000	[diff] [blame]	1483	- CLFloorKernel / @ref CLFloor
Gian Marco Iodice	5fc07aa	2019-05-15 17:08:02 +0100	[diff] [blame]	1484	- CLGEMMTranspose1xW
Michele Di Giorgio	ee82d34	2021-01-05 16:14:28 +0000	[diff] [blame]	1485	- CLGEMMMatrixVectorMultiplyKernel
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1486	- @ref CLL2NormalizeLayerKernel / @ref CLL2NormalizeLayer
Georgios Pinitas	b6af482	2021-09-14 12:33:34 +0100	[diff] [blame]	1487	- CLQuantizationLayerKernel CLMinMaxLayerKernel / @ref CLQuantizationLayer
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1488	- @ref CLROIPoolingLayerKernel / @ref CLROIPoolingLayer
				1489	- @ref CLReductionOperationKernel / @ref CLReductionOperation
Sheri Zhang	7e20e29	2021-02-02 11:49:34 +0000	[diff] [blame]	1490	- CLReshapeLayerKernel / @ref CLReshapeLayer
Anthony Barbier	6a5627a	2017-09-26 14:42:02 +0100	[diff] [blame]	1491
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1492	v17.06 Public major release
				1493	- Various bug fixes
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1494	- Added support for fixed point 8 bit (QS8) to the various Arm® Neon™ machine learning kernels.
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1495	- Added unit tests and benchmarks (AlexNet, LeNet)
				1496	- Added support for sub tensors.
				1497	- Added infrastructure to provide GPU specific optimisation for some OpenCL kernels.
Sheri Zhang	ac6499a	2021-02-10 15:32:38 +0000	[diff] [blame]	1498	- Added @ref OMPScheduler (OpenMP) scheduler for Neon
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1499	- Added @ref SingleThreadScheduler scheduler for Arm® Neon™ (For bare metal)
ramelg01	b2eba7f	2021-12-23 08:32:08 +0000	[diff] [blame]	1500	- User can specify their own scheduler by implementing the @ref IScheduler interface.
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1501	- New OpenCL kernels / functions:
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1502	- @ref CLBatchNormalizationLayerKernel / @ref CLBatchNormalizationLayer
Michele Di Giorgio	7d61ff0	2021-01-18 21:15:59 +0000	[diff] [blame]	1503	- CLDepthConcatenateLayerKernel / CLDepthConcatenateLayer
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1504	- CLHOGOrientationBinningKernel CLHOGBlockNormalizationKernel, CLHOGDetectorKernel / CLHOGDescriptor CLHOGDetector CLHOGGradient CLHOGMultiDetection
Georgios Pinitas	96b16b6	2020-12-01 17:41:34 +0000	[diff] [blame]	1505	- CLLocallyConnectedMatrixMultiplyKernel / CLLocallyConnectedLayer
Manuel Bottini	d87aded	2021-07-16 10:23:31 +0100	[diff] [blame]	1506	- CLWeightsReshapeKernel / CLConvolutionLayerReshapeWeights
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1507	- New C++ kernels:
Georgios Pinitas	c6f9510	2021-03-30 10:03:01 +0100	[diff] [blame]	1508	- CPPDetectionWindowNonMaximaSuppressionKernel
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1509	- New Arm® Neon™ kernels / functions:
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1510	- @ref NEBatchNormalizationLayerKernel / @ref NEBatchNormalizationLayer
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	1511	- NEDepthConcatenateLayerKernel / NEDepthConcatenateLayer
Manuel Bottini	327225d	2021-04-13 13:09:30 +0100	[diff] [blame]	1512	- NEDirectConvolutionLayerKernel / @ref NEDirectConvolutionLayer
Georgios Pinitas	96b16b6	2020-12-01 17:41:34 +0000	[diff] [blame]	1513	- NELocallyConnectedMatrixMultiplyKernel / NELocallyConnectedLayer
Manuel Bottini	29599d0	2021-07-06 15:01:35 +0100	[diff] [blame]	1514	- NEWeightsReshapeKernel / NEConvolutionLayerReshapeWeights
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1515
				1516	v17.05 Public bug fixes release
				1517	- Various bug fixes
				1518	- Remaining of the functions ported to use accurate padding.
				1519	- Library does not link against OpenCL anymore (It uses dlopen / dlsym at runtime instead to determine whether or not OpenCL is available).
				1520	- Added "free" method to allocator.
				1521	- Minimum version of g++ required for armv7 Linux changed from 4.8 to 4.9
				1522
				1523	v17.04 Public bug fixes release
				1524
				1525	The following functions have been ported to use the new accurate padding:
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1526	- CLColorConvertKernel
				1527	- CLEdgeNonMaxSuppressionKernel
				1528	- CLEdgeTraceKernel
				1529	- CLGaussianPyramidHorKernel
				1530	- CLGaussianPyramidVertKernel
				1531	- CLGradientKernel
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	1532	- NEChannelCombineKernel
Georgios Pinitas	c6f9510	2021-03-30 10:03:01 +0100	[diff] [blame]	1533	- NEFillArrayKernel
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	1534	- NEGaussianPyramidHorKernel
				1535	- NEGaussianPyramidVertKernel
Georgios Pinitas	09d3451	2018-08-30 16:02:11 +0100	[diff] [blame]	1536	- NEHarrisScoreFP16Kernel
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	1537	- NEHarrisScoreKernel
				1538	- NEHOGDetectorKernel
Michalis Spyrou	373b407	2021-01-20 16:41:12 +0000	[diff] [blame]	1539	- NELogits1DMaxKernel
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1540	- NELogits1DShiftExpSumKernel
				1541	- NELogits1DNormKernel
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1542	- NENonMaximaSuppression3x3FP16Kernel
				1543	- NENonMaximaSuppression3x3Kernel
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1544
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1545	v17.03.1 First Major public release of the sources
				1546	- Renamed the library to arm_compute
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1547	- New CPP target introduced for C++ kernels shared between Arm® Neon™ and CL functions.
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1548	- New padding calculation interface introduced and ported most kernels / functions to use it.
				1549	- New OpenCL kernels / functions:
Gian Marco Iodice	eb65f6d	2020-04-15 11:42:15 +0100	[diff] [blame]	1550	- CLGEMMLowpMatrixMultiplyKernel / CLGEMMLowp
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1551	- New Arm® Neon™ kernels / functions:
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1552	- @ref NENormalizationLayerKernel / @ref NENormalizationLayer
Teresa Charlin	d1dc09c	2021-03-04 15:24:45 +0000	[diff] [blame]	1553	- NETransposeKernel / @ref NETranspose
Michalis Spyrou	373b407	2021-01-20 16:41:12 +0000	[diff] [blame]	1554	- NELogits1DMaxKernel, NELogits1DShiftExpSumKernel, NELogits1DNormKernel / @ref NESoftmaxLayer
Manuel Bottini	24b8920	2021-07-01 18:13:33 +0100	[diff] [blame]	1555	- NEIm2ColKernel, NECol2ImKernel, NEConvolutionLayerWeightsReshapeKernel / @ref NEConvolutionLayer
Michele Di Giorgio	f22f672	2020-07-03 16:29:24 +0100	[diff] [blame]	1556	- NEGEMMMatrixAccumulateBiasesKernel / @ref NEFullyConnectedLayer
Manuel Bottini	cfac51c	2021-06-18 15:47:28 +0100	[diff] [blame]	1557	- NEGEMMLowpMatrixMultiplyKernel / NEGEMMLowp
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1558
				1559	v17.03 Sources preview
				1560	- New OpenCL kernels / functions:
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1561	- CLGradientKernel, CLEdgeNonMaxSuppressionKernel, CLEdgeTraceKernel / CLCannyEdge
Georgios Pinitas	856f66e	2021-04-22 21:13:21 +0100	[diff] [blame]	1562	- GEMM refactoring + FP16 support: CLGEMMInterleave4x4Kernel, CLGEMMTranspose1xWKernel, CLGEMMMatrixMultiplyKernel, CLGEMMMatrixAdditionKernel / @ref CLGEMM
Michele Di Giorgio	f6f7876	2020-07-06 11:27:21 +0100	[diff] [blame]	1563	- CLGEMMMatrixAccumulateBiasesKernel / @ref CLFullyConnectedLayer
Teresa Charlin	2788609	2021-02-25 20:15:01 +0000	[diff] [blame]	1564	- CLTransposeKernel / @ref CLTranspose
Georgios Pinitas	c6f9510	2021-03-30 10:03:01 +0100	[diff] [blame]	1565	- CLLKTrackerInitKernel, CLLKTrackerStage0Kernel, CLLKTrackerStage1Kernel, CLLKTrackerFinalizeKernel / CLOpticalFlow
Anthony Barbier	3762e74	2018-03-02 11:49:33 +0000	[diff] [blame]	1566	- @ref CLNormalizationLayerKernel / @ref CLNormalizationLayer
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1567	- CLLaplacianPyramid, CLLaplacianReconstruct
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1568	- New Arm® Neon™ kernels / functions:
Michele Di Giorgio	bd2c8e1	2021-01-19 15:29:02 +0000	[diff] [blame]	1569	- NEActivationLayerKernel / @ref NEActivationLayer
Michele Di Giorgio	93b75e0	2021-06-21 12:00:43 +0100	[diff] [blame]	1570	- GEMM refactoring + FP16 support (Requires armv8.2 CPU): NEGEMMInterleave4x4Kernel, NEGEMMTranspose1xWKernel, NEGEMMMatrixMultiplyKernel, NEGEMMMatrixAdditionKernel / @ref NEGEMM
Michele Di Giorgio	1928904	2021-02-03 16:05:00 +0000	[diff] [blame]	1571	- NEPoolingLayerKernel / @ref NEPoolingLayer
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1572
				1573	v17.02.1 Sources preview
				1574	- New OpenCL kernels / functions:
Sang-Hoon Park	201e0fe	2021-01-27 13:14:56 +0000	[diff] [blame]	1575	- CLLogits1DMaxKernel, CLLogits1DShiftExpSumKernel, CLLogits1DNormKernel / @ref CLSoftmaxLayer
Michele Di Giorgio	e131466	2021-02-01 17:09:32 +0000	[diff] [blame]	1576	- CLPoolingLayerKernel / @ref CLPoolingLayer
Manuel Bottini	d844c08	2021-07-14 12:58:54 +0100	[diff] [blame]	1577	- CLIm2ColKernel, CLCol2ImKernel, CLConvolutionLayerWeightsReshapeKernel / CLConvolutionLayer
Adnan AlSinan	6863fa0	2022-02-04 13:04:55 +0000	[diff] [blame]	1578	- CLRemapKernel / CLRemap
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1579	- CLGaussianPyramidHorKernel, CLGaussianPyramidVertKernel / CLGaussianPyramid, CLGaussianPyramidHalf, CLGaussianPyramidOrb
				1580	- CLMinMaxKernel, CLMinMaxLocationKernel / CLMinMaxLocation
				1581	- CLNonLinearFilterKernel / CLNonLinearFilter
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1582	- New Arm® Neon™ FP16 kernels (Requires armv8.2 CPU)
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	1583	- NEAccumulateWeightedFP16Kernel
				1584	- NEBox3x3FP16Kernel
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1585	- NENonMaximaSuppression3x3FP16Kernel
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1586
				1587	v17.02 Sources preview
				1588	- New OpenCL kernels / functions:
Georgios Pinitas	f47f718	2021-01-15 09:29:50 +0000	[diff] [blame]	1589	- CLActivationLayerKernel / @ref CLActivationLayer
Michalis Spyrou	473cb01	2021-02-23 11:48:12 +0000	[diff] [blame]	1590	- CLChannelCombineKernel / CLChannelCombine
				1591	- CLDerivativeKernel / CLChannelExtract
				1592	- CLFastCornersKernel / CLFastCorners
				1593	- CLMeanStdDevKernel / CLMeanStdDev
Michele Di Giorgio	33f41fa	2021-03-09 14:09:08 +0000	[diff] [blame]	1594	- New Arm® Neon™ kernels / functions:
Michalis Spyrou	27e67f0	2021-02-16 11:34:39 +0000	[diff] [blame]	1595	- HOG / SVM: NEHOGOrientationBinningKernel, NEHOGBlockNormalizationKernel, NEHOGDetectorKernel, NEHOGNonMaximaSuppressionKernel / NEHOGDescriptor, NEHOGDetector, NEHOGGradient, NEHOGMultiDetection
				1596	- NENonLinearFilterKernel / NENonLinearFilter
Anthony Barbier	6ff3b19	2017-09-04 18:44:23 +0100	[diff] [blame]	1597	- Introduced a CLScheduler to manage the default context and command queue used by the runtime library and create synchronisation events.
				1598	- Switched all the kernels / functions to use tensors instead of images.
				1599	- Updated documentation to include instructions to build the library from sources.
				1600
				1601	v16.12 Binary preview release
				1602	- Original release
				1603
Sheri Zhang	d813bab	2021-04-30 16:53:41 +0100	[diff] [blame]	1604	*/
Ramy Elgammal	0d274b7	2022-08-05 13:14:57 +0100	[diff] [blame]	1605	} // namespace arm_compute