Blame - src/backends/neon/test/NeonTensorHandleTests.cpp - ml/armnn

blob: c8e781b71db386beda491b02328a804ef5c3181a [file] [log] [blame]

Narumol Prangnawarat	1a26896	2020-07-27 15:52:13 +0100	[diff] [blame]	1	//
				2	// Copyright © 2020 Arm Ltd and Contributors. All rights reserved.
				3	// SPDX-License-Identifier: MIT
				4	//
Sadik Armagan	76615a5	2020-08-04 14:01:05 +0100	[diff] [blame]	5	#include <Graph.hpp>
				6	#include <Network.hpp>
				7
Narumol Prangnawarat	1a26896	2020-07-27 15:52:13 +0100	[diff] [blame]	8	#include <neon/NeonTensorHandle.hpp>
				9	#include <neon/NeonTensorHandleFactory.hpp>
				10
Matthew Sloyan	171214c	2020-09-09 09:07:37 +0100	[diff] [blame]	11	#include <armnn/utility/NumericCast.hpp>
Sadik Armagan	76615a5	2020-08-04 14:01:05 +0100	[diff] [blame]	12	#include <armnn/utility/PolymorphicDowncast.hpp>
				13
Sadik Armagan	a097d2a	2021-11-24 15:47:28 +0000	[diff] [blame]	14	#include <GraphUtils.hpp>
Narumol Prangnawarat	b8d771a	2020-08-14 11:51:12 +0100	[diff] [blame]	15	#include <arm_compute/runtime/Allocator.h>
Sadik Armagan	a097d2a	2021-11-24 15:47:28 +0000	[diff] [blame]	16	#include <CommonTestUtils.hpp>
Sadik Armagan	76615a5	2020-08-04 14:01:05 +0100	[diff] [blame]	17
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	18	#include <doctest/doctest.h>
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	19	#include <armnn/utility/Assert.hpp>
Narumol Prangnawarat	1a26896	2020-07-27 15:52:13 +0100	[diff] [blame]	20
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	21	TEST_SUITE("NeonTensorHandleTests")
				22	{
Narumol Prangnawarat	1a26896	2020-07-27 15:52:13 +0100	[diff] [blame]	23	using namespace armnn;
				24
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	25	TEST_CASE("NeonTensorHandleGetCapabilitiesNoPadding")
Narumol Prangnawarat	1a26896	2020-07-27 15:52:13 +0100	[diff] [blame]	26	{
				27	std::shared_ptr<NeonMemoryManager> memoryManager = std::make_shared<NeonMemoryManager>();
				28	NeonTensorHandleFactory handleFactory(memoryManager);
				29
				30	INetworkPtr network(INetwork::Create());
				31
				32	// Add the layers
				33	IConnectableLayer* input = network->AddInputLayer(0);
				34	SoftmaxDescriptor descriptor;
				35	descriptor.m_Beta = 1.0f;
				36	IConnectableLayer* softmax = network->AddSoftmaxLayer(descriptor);
				37	IConnectableLayer* output = network->AddOutputLayer(2);
				38
				39	// Establish connections
				40	input->GetOutputSlot(0).Connect(softmax->GetInputSlot(0));
				41	softmax->GetOutputSlot(0).Connect(output->GetInputSlot(0));
				42
				43	// No padding required for input
				44	std::vector<Capability> capabilities = handleFactory.GetCapabilities(input,
				45	softmax,
				46	CapabilityClass::PaddingRequired);
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	47	CHECK(capabilities.empty());
Narumol Prangnawarat	1a26896	2020-07-27 15:52:13 +0100	[diff] [blame]	48
				49	// No padding required for Softmax
				50	capabilities = handleFactory.GetCapabilities(softmax, output, CapabilityClass::PaddingRequired);
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	51	CHECK(capabilities.empty());
Narumol Prangnawarat	1a26896	2020-07-27 15:52:13 +0100	[diff] [blame]	52
				53	// No padding required for output
				54	capabilities = handleFactory.GetCapabilities(output, nullptr, CapabilityClass::PaddingRequired);
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	55	CHECK(capabilities.empty());
Narumol Prangnawarat	1a26896	2020-07-27 15:52:13 +0100	[diff] [blame]	56	}
				57
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	58	TEST_CASE("NeonTensorHandleGetCapabilitiesPadding")
Narumol Prangnawarat	1a26896	2020-07-27 15:52:13 +0100	[diff] [blame]	59	{
				60	std::shared_ptr<NeonMemoryManager> memoryManager = std::make_shared<NeonMemoryManager>();
				61	NeonTensorHandleFactory handleFactory(memoryManager);
				62
				63	INetworkPtr network(INetwork::Create());
				64
				65	// Add the layers
				66	IConnectableLayer* input = network->AddInputLayer(0);
				67	Pooling2dDescriptor descriptor;
				68	IConnectableLayer* pooling = network->AddPooling2dLayer(descriptor);
				69	IConnectableLayer* output = network->AddOutputLayer(2);
				70
				71	// Establish connections
				72	input->GetOutputSlot(0).Connect(pooling->GetInputSlot(0));
				73	pooling->GetOutputSlot(0).Connect(output->GetInputSlot(0));
				74
				75	// No padding required for input
				76	std::vector<Capability> capabilities = handleFactory.GetCapabilities(input,
				77	pooling,
				78	CapabilityClass::PaddingRequired);
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	79	CHECK(capabilities.empty());
Narumol Prangnawarat	1a26896	2020-07-27 15:52:13 +0100	[diff] [blame]	80
				81	// No padding required for output
				82	capabilities = handleFactory.GetCapabilities(output, nullptr, CapabilityClass::PaddingRequired);
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	83	CHECK(capabilities.empty());
Narumol Prangnawarat	1a26896	2020-07-27 15:52:13 +0100	[diff] [blame]	84
				85	// Padding required for Pooling2d
				86	capabilities = handleFactory.GetCapabilities(pooling, output, CapabilityClass::PaddingRequired);
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	87	CHECK(capabilities.size() == 1);
				88	CHECK((capabilities[0].m_CapabilityClass == CapabilityClass::PaddingRequired));
				89	CHECK(capabilities[0].m_Value);
Narumol Prangnawarat	1a26896	2020-07-27 15:52:13 +0100	[diff] [blame]	90	}
				91
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	92	TEST_CASE("ConcatOnXorYSubTensorsNoPaddingRequiredTest")
Sadik Armagan	76615a5	2020-08-04 14:01:05 +0100	[diff] [blame]	93	{
				94	armnn::INetworkPtr net(armnn::INetwork::Create());
				95
				96	// Set up tensor infos
				97	const armnn::TensorInfo inputInfo = armnn::TensorInfo({2, 3, 2, 2}, armnn::DataType::Float32);
				98	const armnn::TensorInfo intermediateInfo = armnn::TensorInfo({2, 3, 2, 2}, armnn::DataType::Float32);
				99	const armnn::TensorInfo outputInfo = armnn::TensorInfo({2, 3, 4, 2}, armnn::DataType::Float32);
				100
				101	armnn::ElementwiseUnaryDescriptor descriptor(armnn::UnaryOperation::Abs);
				102
				103	// Create the network
				104	armnn::IConnectableLayer* const input0Layer = net->AddInputLayer(0, "input_0");
				105	input0Layer->GetOutputSlot(0).SetTensorInfo(inputInfo);
				106	armnn::IConnectableLayer* elementwiseUnaryLayer0 = net->AddElementwiseUnaryLayer(descriptor, "elementwiseUnary_0");
				107	elementwiseUnaryLayer0->GetOutputSlot(0).SetTensorInfo(intermediateInfo);
				108	input0Layer->GetOutputSlot(0).Connect(elementwiseUnaryLayer0->GetInputSlot(0));
				109
				110	armnn::IConnectableLayer* const input1Layer = net->AddInputLayer(1, "input_1");
				111	input1Layer->GetOutputSlot(0).SetTensorInfo(inputInfo);
				112	armnn::IConnectableLayer* elementwiseUnaryLayer1 = net->AddElementwiseUnaryLayer(descriptor, "elementwiseUnary_1");
				113	elementwiseUnaryLayer1->GetOutputSlot(0).SetTensorInfo(intermediateInfo);
				114	input1Layer->GetOutputSlot(0).Connect(elementwiseUnaryLayer1->GetInputSlot(0));
				115
				116	std::array<armnn::TensorShape, 2> concatInputShapes = { intermediateInfo.GetShape(), intermediateInfo.GetShape() };
				117	armnn::IConnectableLayer* const concatLayer = net->AddConcatLayer(armnn::CreateDescriptorForConcatenation(
				118	concatInputShapes.begin(), concatInputShapes.end(), 2), "concatenation");
				119	concatLayer->GetOutputSlot(0).SetTensorInfo(outputInfo);
				120	elementwiseUnaryLayer0->GetOutputSlot(0).Connect(concatLayer->GetInputSlot(0));
				121	elementwiseUnaryLayer1->GetOutputSlot(0).Connect(concatLayer->GetInputSlot(1));
				122
				123	armnn::IConnectableLayer* const outputLayer = net->AddOutputLayer(0, "output");
				124	concatLayer->GetOutputSlot(0).Connect(outputLayer->GetInputSlot(0));
				125
				126	armnn::IRuntime::CreationOptions options;
				127	armnn::IRuntimePtr runtime(armnn::IRuntime::Create(options));
				128
				129	std::vector<armnn::BackendId> backends = { armnn::Compute::CpuAcc };
				130	armnn::IOptimizedNetworkPtr optimizedNet = armnn::Optimize(*net, backends, runtime->GetDeviceSpec());
				131
Francis Murtagh	3d2b4b2	2021-02-15 18:23:17 +0000	[diff] [blame]	132	const armnn::Graph& theGraph = GetGraphForTesting(optimizedNet.get());
Sadik Armagan	76615a5	2020-08-04 14:01:05 +0100	[diff] [blame]	133
				134	// Load graph into runtime
				135	armnn::NetworkId networkIdentifier;
				136	runtime->LoadNetwork(networkIdentifier, std::move(optimizedNet));
				137
				138	// now check the concat how many sub-tensors it is using..
				139	auto TraceSubTensorHandleAncestry = [](armnn::ITensorHandle* const subTensorHandle)
				140	{
				141	if (subTensorHandle && subTensorHandle->GetParent())
				142	{
				143	return true;
				144	}
				145	return false;
				146	};
				147
				148	for (auto&& layer : theGraph)
				149	{
				150	if(layer->GetType() == armnn::LayerType::Concat)
				151	{
				152	unsigned int numberOfSubTensors = 0;
				153	for (unsigned int i = 0; i < layer->GetNumInputSlots(); ++i)
				154	{
				155	const armnn::OutputSlot* slot = layer->GetInputSlot(i).GetConnectedOutputSlot();
				156	if (TraceSubTensorHandleAncestry(slot->GetOutputHandler().GetData()))
				157	{
				158	++numberOfSubTensors;
				159	}
				160	}
				161	// sub-tensors should be supported in this configuration
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	162	ARMNN_ASSERT(numberOfSubTensors > 0);
				163	}
				164	}
				165	}
				166
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	167	TEST_CASE("ConcatonXorYPaddingRequiredTest")
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	168	{
				169	armnn::INetworkPtr net(armnn::INetwork::Create());
				170
				171	// Set up tensor infos
				172	const armnn::TensorInfo inputInfo = armnn::TensorInfo({2, 3, 2, 2}, armnn::DataType::Float32);
				173	const armnn::TensorInfo intermediateInfo = armnn::TensorInfo({2, 3, 2, 2}, armnn::DataType::Float32);
				174	const armnn::TensorInfo outputInfo = armnn::TensorInfo({2, 3, 4, 2}, armnn::DataType::Float32);
				175
				176	armnn::Pooling2dDescriptor descriptor;
				177	descriptor.m_PoolType = armnn::PoolingAlgorithm::Average;
				178	descriptor.m_PoolWidth = descriptor.m_PoolHeight = 3;
				179	descriptor.m_StrideX = descriptor.m_StrideY = 1;
				180	descriptor.m_PadLeft = 1;
				181	descriptor.m_PadRight = 1;
				182	descriptor.m_PadTop = 1;
				183	descriptor.m_PadBottom = 1;
				184	descriptor.m_PaddingMethod = armnn::PaddingMethod::IgnoreValue;
				185
				186	// Create the network
				187	armnn::IConnectableLayer* const input0Layer = net->AddInputLayer(0, "input_0");
				188	input0Layer->GetOutputSlot(0).SetTensorInfo(inputInfo);
				189	armnn::IConnectableLayer* pooling2dLayer0 = net->AddPooling2dLayer(descriptor, "pooling2d_0");
				190	pooling2dLayer0->GetOutputSlot(0).SetTensorInfo(intermediateInfo);
				191	input0Layer->GetOutputSlot(0).Connect(pooling2dLayer0->GetInputSlot(0));
				192
				193	armnn::IConnectableLayer* const input1Layer = net->AddInputLayer(1, "input_1");
				194	input1Layer->GetOutputSlot(0).SetTensorInfo(inputInfo);
				195	armnn::IConnectableLayer* pooling2dLayer1 = net->AddPooling2dLayer(descriptor, "pooling2d_1");
				196	pooling2dLayer1->GetOutputSlot(0).SetTensorInfo(intermediateInfo);
				197	input1Layer->GetOutputSlot(0).Connect(pooling2dLayer1->GetInputSlot(0));
				198
				199	std::array<armnn::TensorShape, 2> concatInputShapes = { intermediateInfo.GetShape(), intermediateInfo.GetShape() };
				200	armnn::IConnectableLayer* const concatLayer = net->AddConcatLayer(armnn::CreateDescriptorForConcatenation(
				201	concatInputShapes.begin(), concatInputShapes.end(), 2), "concatenation");
				202	concatLayer->GetOutputSlot(0).SetTensorInfo(outputInfo);
				203	pooling2dLayer0->GetOutputSlot(0).Connect(concatLayer->GetInputSlot(0));
				204	pooling2dLayer1->GetOutputSlot(0).Connect(concatLayer->GetInputSlot(1));
				205
				206	armnn::IConnectableLayer* const outputLayer = net->AddOutputLayer(0, "output");
				207	concatLayer->GetOutputSlot(0).Connect(outputLayer->GetInputSlot(0));
				208
				209	armnn::IRuntime::CreationOptions options;
				210	armnn::IRuntimePtr runtime(armnn::IRuntime::Create(options));
				211
				212	std::vector<armnn::BackendId> backends = { armnn::Compute::CpuAcc };
				213	armnn::IOptimizedNetworkPtr optimizedNet = armnn::Optimize(*net, backends, runtime->GetDeviceSpec());
				214
Francis Murtagh	3d2b4b2	2021-02-15 18:23:17 +0000	[diff] [blame]	215	const armnn::Graph& theGraph = GetGraphForTesting(optimizedNet.get());
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	216
				217	// Load graph into runtime
				218	armnn::NetworkId networkIdentifier;
				219	runtime->LoadNetwork(networkIdentifier, std::move(optimizedNet));
				220
				221	// now check the concat how many sub-tensors it is using..
				222	auto TraceSubTensorHandleAncestry = [](armnn::ITensorHandle* const subTensorHandle)
				223	{
				224	if (subTensorHandle && subTensorHandle->GetParent())
				225	{
				226	return true;
				227	}
				228	return false;
				229	};
				230
				231	unsigned int numberOfSubTensors = 0;
				232	for (auto&& layer : theGraph)
				233	{
				234	if(layer->GetType() == armnn::LayerType::Concat)
				235	{
				236	for (unsigned int i = 0; i < layer->GetNumInputSlots(); ++i)
				237	{
				238	const armnn::OutputSlot* slot = layer->GetInputSlot(i).GetConnectedOutputSlot();
				239	if (TraceSubTensorHandleAncestry(slot->GetOutputHandler().GetData()))
				240	{
				241	++numberOfSubTensors;
				242	}
				243	}
				244	}
				245	}
				246	// sub-tensors should not be supported in this configuration
				247	ARMNN_ASSERT(numberOfSubTensors == 0);
				248	}
				249
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	250	TEST_CASE("SplitteronXorYNoPaddingRequiredTest")
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	251	{
				252	using namespace armnn;
				253
				254	unsigned int splitAxis = 2;
				255	unsigned int numSplit = 2;
				256
				257	const TensorShape& inputShape = { 2, 3, 4, 2 };
				258	const armnn::TensorInfo intermediateInfo = armnn::TensorInfo({ 2, 3, 2, 2 }, armnn::DataType::Float32);
				259	const std::vector<TensorShape> outputShapes{{ 2, 3, 2, 2 },
				260	{ 2, 3, 2, 2 }};
				261	const float qScale = 1.0f;
				262	const int32_t qOffset = 0;
				263
				264	// Creates structures for input & output.
				265	std::vector<float> inputData{
				266	1, 2,
				267	3, 4,
				268	5, 6,
				269	7, 8,
				270	9, 10,
				271	11, 12,
				272	13, 14,
				273	15, 16,
				274	17, 18,
				275	19, 20,
				276	21, 22,
				277	23, 24,
				278	25, 26,
				279	27, 28,
				280	29, 30,
				281	31, 32,
				282	33, 34,
				283	35, 36,
				284	37, 38,
				285	39, 40,
				286	41, 42,
				287	43, 44,
				288	45, 46,
				289	47, 48
				290	};
				291
				292	std::vector<float> expectedOutput0{
				293	1, 2,
				294	3, 4,
				295	9, 10,
				296	11, 12,
				297	17, 18,
				298	19, 20,
				299	25, 26,
				300	27, 28,
				301	33, 34,
				302	35, 36,
				303	41, 42,
				304	43, 44
				305	};
				306
				307	std::vector<float> expectedOutput1{
				308	5, 6,
				309	7, 8,
				310	13, 14,
				311	15, 16,
				312	21, 22,
				313	23, 24,
				314	29, 30,
				315	31, 32,
				316	37, 38,
				317	39, 40,
				318	45, 46,
				319	47, 48
				320	};
				321
				322	// Builds up the structure of the network.
				323	INetworkPtr net(INetwork::Create());
				324
				325	TensorInfo inputTensorInfo(inputShape, armnn::DataType::Float32, qScale, qOffset);
				326
				327	armnn::ElementwiseUnaryDescriptor descriptor(armnn::UnaryOperation::Abs);
				328
				329	// Splitter
				330	std::vector<unsigned int> splitterDimSizes(inputShape.GetNumDimensions());
				331
				332	// Add current input shape to splitterDimSizes
				333	for (unsigned int i = 0; i < inputShape.GetNumDimensions(); ++i)
				334	{
				335	splitterDimSizes[i] = inputTensorInfo.GetShape()[i];
				336	}
				337
				338	if (splitterDimSizes[splitAxis] % numSplit != 0)
				339	{
				340	throw ParseException("Number of splits must evenly divide the dimension");
				341	}
				342
				343	splitterDimSizes[splitAxis] /= numSplit;
				344
				345	SplitterDescriptor splitDesc(numSplit, inputShape.GetNumDimensions());
				346
				347	for (unsigned int g = 0; g < numSplit; ++g)
				348	{
				349	// Set the size of the views.
				350	for (unsigned int dimIdx = 0; dimIdx < splitterDimSizes.size(); ++dimIdx)
				351	{
				352	splitDesc.SetViewSize(g, dimIdx, splitterDimSizes[dimIdx]);
				353	}
				354	splitDesc.SetViewOriginCoord(g, splitAxis, splitterDimSizes[splitAxis] * g);
				355	}
				356	IConnectableLayer* input = net->AddInputLayer(0, "input");
				357	IConnectableLayer* elementWiseUnary0 = net->AddElementwiseUnaryLayer(descriptor, "elementwiseunary_0");
				358	IConnectableLayer* elementWiseUnary1 = net->AddElementwiseUnaryLayer(descriptor, "elementwiseunary_0");
				359	IConnectableLayer* splitter = net->AddSplitterLayer(splitDesc, "splitter");
				360
				361	// Connections
				362	Connect(input, splitter, inputTensorInfo, 0, 0);
				363	Connect(splitter, elementWiseUnary0, intermediateInfo, 0, 0);
				364	Connect(splitter, elementWiseUnary1, intermediateInfo, 1, 0);
				365
				366	std::vector<IConnectableLayer*> pooling2dLayers{elementWiseUnary0, elementWiseUnary1};
				367
				368	for (unsigned int i = 0; i < outputShapes.size(); ++i)
				369	{
				370	TensorInfo outputTensorInfo(outputShapes[i], armnn::DataType::Float32, qScale, qOffset);
Matthew Sloyan	171214c	2020-09-09 09:07:37 +0100	[diff] [blame]	371	IConnectableLayer* output = net->AddOutputLayer(armnn::numeric_cast<LayerBindingId>(i));
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	372	Connect(pooling2dLayers[i], output, outputTensorInfo, 0, 0);
				373	}
				374
				375	std::map<int, std::vector<float>> inputTensorData = {{ 0,inputData }};
				376	std::map<int, std::vector<float>> expectedOutputData = {{ 0, expectedOutput0 }, { 1, expectedOutput1 }};
				377
				378	armnn::IRuntime::CreationOptions options;
				379	armnn::IRuntimePtr runtime(armnn::IRuntime::Create(options));
				380
				381	std::vector<armnn::BackendId> backends = { armnn::Compute::CpuAcc };
				382	armnn::IOptimizedNetworkPtr optimizedNet = armnn::Optimize(*net, backends, runtime->GetDeviceSpec());
				383
Francis Murtagh	3d2b4b2	2021-02-15 18:23:17 +0000	[diff] [blame]	384	const armnn::Graph& theGraph = GetGraphForTesting(optimizedNet.get());
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	385
				386	// Load graph into runtime
				387	armnn::NetworkId networkIdentifier;
				388	runtime->LoadNetwork(networkIdentifier, std::move(optimizedNet));
				389
				390	// now check the concat how many sub-tensors it is using..
				391	auto TraceSubTensorHandleAncestry = [](armnn::ITensorHandle* const subTensorHandle)
				392	{
				393	if (subTensorHandle && subTensorHandle->GetParent())
				394	{
				395	return true;
				396	}
				397	return false;
				398	};
				399
				400	for (auto&& layer : theGraph)
				401	{
				402	if(layer->GetType() == armnn::LayerType::ElementwiseUnary)
				403	{
				404	unsigned int numberOfSubTensors = 0;
				405	for (unsigned int i = 0; i < layer->GetNumInputSlots(); ++i)
				406	{
				407	const armnn::OutputSlot* slot = layer->GetInputSlot(i).GetConnectedOutputSlot();
				408	if (TraceSubTensorHandleAncestry(slot->GetOutputHandler().GetData()))
				409	{
				410	++numberOfSubTensors;
				411	}
				412	}
				413	// sub-tensors should be supported in this configuration
				414	ARMNN_ASSERT(numberOfSubTensors > 0);
				415	}
				416	}
				417
				418	InputTensors inputTensors;
				419	inputTensors.reserve(inputTensorData.size());
				420	for (auto&& it : inputTensorData)
				421	{
Cathal Corbett	5b8093c	2021-10-22 11:12:07 +0100	[diff] [blame]	422	TensorInfo inputTensorInfo = runtime->GetInputTensorInfo(networkIdentifier, it.first);
				423	inputTensorInfo.SetConstant(true);
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	424	inputTensors.push_back({it.first,
Cathal Corbett	019da94	2021-11-10 12:50:57 +0000	[diff] [blame]	425	ConstTensor(inputTensorInfo, it.second.data())});
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	426	}
				427	OutputTensors outputTensors;
				428	outputTensors.reserve(expectedOutputData.size());
				429	std::map<int, std::vector<float>> outputStorage;
				430	for (auto&& it : expectedOutputData)
				431	{
				432	std::vector<float> out(it.second.size());
				433	outputStorage.emplace(it.first, out);
				434	outputTensors.push_back({it.first,
				435	Tensor(runtime->GetOutputTensorInfo(networkIdentifier, it.first),
				436	outputStorage.at(it.first).data())});
				437	}
				438
				439	// Does the inference.
				440	runtime->EnqueueWorkload(networkIdentifier, inputTensors, outputTensors);
				441
				442	// Checks the results.
				443	float tolerance = 0.000001f;
				444	for (auto&& it : expectedOutputData)
				445	{
				446	std::vector<float> out = outputStorage.at(it.first);
				447	for (unsigned int i = 0; i < out.size(); ++i)
				448	{
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	449	CHECK_MESSAGE(Compare<armnn::DataType::Float32>(it.second[i], out[i], tolerance) == true,
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	450	"Actual output: " << out[i] << ". Expected output:" << it.second[i]);
				451
				452	}
				453	}
				454	}
				455
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	456	TEST_CASE("SplitteronXorYPaddingRequiredTest")
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	457	{
				458	using namespace armnn;
				459
				460	unsigned int splitAxis = 2;
				461	unsigned int numSplit = 2;
				462
				463	const TensorShape& inputShape = { 1, 1, 4, 4 };
				464	const armnn::TensorInfo intermediateInfo = armnn::TensorInfo({ 1, 1, 2, 4 }, armnn::DataType::Float32);
				465	const std::vector<TensorShape> outputShapes{{ 1, 1, 2, 4 },
				466	{ 1, 1, 2, 4 }};
				467
				468	const float qScale = 1.0f;
				469	const int32_t qOffset = 0;
				470
				471	// Creates structures for input & output.
				472	std::vector<float> inputData{
				473	9.0f, 27.0f, 18.0f, 36.0f,
				474	18.0f, 9.0f, 18.0f, 9.0f,
				475	27.0f, 18.0f, 9.0f, 27.0f,
				476	9.0f, 27.0f, 9.0f, 18.0f,
				477	};
				478
				479	std::vector<float> expectedOutput0{
				480	7.0f, 11.0f, 13.0f, 9.0f,
				481	7.0f, 11.0f, 13.0f, 9.0f
				482	};
				483
				484	std::vector<float> expectedOutput1{
				485	9.0f, 11.0f, 12.0f, 7.0f,
				486	9.0f, 11.0f, 12.0f, 7.0f
				487	};
				488
				489	// Builds up the structure of the network.
				490	INetworkPtr net(INetwork::Create());
				491
				492	TensorInfo inputTensorInfo(inputShape, armnn::DataType::Float32, qScale, qOffset);
				493
				494	// Pooling
				495	armnn::Pooling2dDescriptor descriptor;
				496	descriptor.m_PoolType = armnn::PoolingAlgorithm::Average;
				497	descriptor.m_PoolWidth = descriptor.m_PoolHeight = 3;
				498	descriptor.m_StrideX = descriptor.m_StrideY = 1;
				499	descriptor.m_PadLeft = 1;
				500	descriptor.m_PadRight = 1;
				501	descriptor.m_PadTop = 1;
				502	descriptor.m_PadBottom = 1;
				503	descriptor.m_PaddingMethod = armnn::PaddingMethod::IgnoreValue;
				504
				505	// Splitter
				506	std::vector<unsigned int> splitterDimSizes(inputShape.GetNumDimensions());
				507
				508	// Add current input shape to splitterDimSizes
				509	for (unsigned int i = 0; i < inputShape.GetNumDimensions(); ++i)
				510	{
				511	splitterDimSizes[i] = inputTensorInfo.GetShape()[i];
				512	}
				513
				514	if (splitterDimSizes[splitAxis] % numSplit != 0)
				515	{
				516	throw ParseException("Number of splits must evenly divide the dimension");
				517	}
				518
				519	splitterDimSizes[splitAxis] /= numSplit;
				520
				521	SplitterDescriptor splitDesc(numSplit, inputShape.GetNumDimensions());
				522
				523	for (unsigned int g = 0; g < numSplit; ++g)
				524	{
				525	// Set the size of the views.
				526	for (unsigned int dimIdx = 0; dimIdx < splitterDimSizes.size(); ++dimIdx)
				527	{
				528	splitDesc.SetViewSize(g, dimIdx, splitterDimSizes[dimIdx]);
				529	}
				530	splitDesc.SetViewOriginCoord(g, splitAxis, splitterDimSizes[splitAxis] * g);
				531	}
				532
				533	IConnectableLayer* input = net->AddInputLayer(0, "input");
				534	IConnectableLayer* pooling2d0 = net->AddPooling2dLayer(descriptor, "pooling2d_0");
				535	IConnectableLayer* pooling2d1 = net->AddPooling2dLayer(descriptor, "pooling2d_1");
				536	IConnectableLayer* splitter = net->AddSplitterLayer(splitDesc, "splitter");
				537
				538	// Connections
				539	Connect(input, splitter, inputTensorInfo, 0, 0);
				540	Connect(splitter, pooling2d0, intermediateInfo, 0, 0);
				541	Connect(splitter, pooling2d1, intermediateInfo, 1, 0);
				542
				543	std::vector<IConnectableLayer*> pooling2dLayers{pooling2d0, pooling2d1};
				544
				545	for (unsigned int i = 0; i < outputShapes.size(); ++i)
				546	{
				547	TensorInfo outputTensorInfo(outputShapes[i], armnn::DataType::Float32, qScale, qOffset);
Matthew Sloyan	171214c	2020-09-09 09:07:37 +0100	[diff] [blame]	548	IConnectableLayer* output = net->AddOutputLayer(armnn::numeric_cast<LayerBindingId>(i));
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	549	Connect(pooling2dLayers[i], output, outputTensorInfo, 0, 0);
				550	}
				551
				552	std::map<int, std::vector<float>> inputTensorData = {{ 0,inputData }};
				553	std::map<int, std::vector<float>> expectedOutputData = {{ 0, expectedOutput0 }, { 1, expectedOutput1 }};
				554
				555	armnn::IRuntime::CreationOptions options;
				556	armnn::IRuntimePtr runtime(armnn::IRuntime::Create(options));
				557
				558	std::vector<armnn::BackendId> backends = { armnn::Compute::CpuAcc };
				559	armnn::IOptimizedNetworkPtr optimizedNet = armnn::Optimize(*net, backends, runtime->GetDeviceSpec());
				560
Francis Murtagh	3d2b4b2	2021-02-15 18:23:17 +0000	[diff] [blame]	561	const armnn::Graph& theGraph = GetGraphForTesting(optimizedNet.get());
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	562
				563	// Load graph into runtime
				564	armnn::NetworkId networkIdentifier;
				565	runtime->LoadNetwork(networkIdentifier, std::move(optimizedNet));
				566
				567	// now check the concat how many sub-tensors it is using..
				568	auto TraceSubTensorHandleAncestry = [](armnn::ITensorHandle* const subTensorHandle)
				569	{
				570	if (subTensorHandle && subTensorHandle->GetParent())
				571	{
				572	return true;
				573	}
				574	return false;
				575	};
				576
				577	for (auto&& layer : theGraph)
				578	{
				579	if(layer->GetType() == armnn::LayerType::Pooling2d)
				580	{
				581	unsigned int numberOfSubTensors = 0;
				582	for (unsigned int i = 0; i < layer->GetNumInputSlots(); ++i)
				583	{
				584	const armnn::OutputSlot* slot = layer->GetInputSlot(i).GetConnectedOutputSlot();
				585	if (TraceSubTensorHandleAncestry(slot->GetOutputHandler().GetData()))
				586	{
				587	++numberOfSubTensors;
				588	}
				589	}
				590	// sub-tensors should be supported in this configuration
				591	ARMNN_ASSERT(numberOfSubTensors == 0);
				592	}
				593	}
				594
				595	InputTensors inputTensors;
				596	inputTensors.reserve(inputTensorData.size());
				597	for (auto&& it : inputTensorData)
				598	{
Cathal Corbett	5b8093c	2021-10-22 11:12:07 +0100	[diff] [blame]	599	TensorInfo inputTensorInfo = runtime->GetInputTensorInfo(networkIdentifier, it.first);
				600	inputTensorInfo.SetConstant(true);
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	601	inputTensors.push_back({it.first,
Cathal Corbett	5b8093c	2021-10-22 11:12:07 +0100	[diff] [blame]	602	ConstTensor(inputTensorInfo, it.second.data())});
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	603	}
				604	OutputTensors outputTensors;
				605	outputTensors.reserve(expectedOutputData.size());
				606	std::map<int, std::vector<float>> outputStorage;
				607	for (auto&& it : expectedOutputData)
				608	{
				609	std::vector<float> out(it.second.size());
				610	outputStorage.emplace(it.first, out);
				611	outputTensors.push_back({it.first,
				612	Tensor(runtime->GetOutputTensorInfo(networkIdentifier, it.first),
				613	outputStorage.at(it.first).data())});
				614	}
				615
				616	// Does the inference.
				617	runtime->EnqueueWorkload(networkIdentifier, inputTensors, outputTensors);
				618
				619	// Checks the results.
				620	float tolerance = 0.000001f;
				621	for (auto&& it : expectedOutputData)
				622	{
				623	std::vector<float> out = outputStorage.at(it.first);
				624	for (unsigned int i = 0; i < out.size(); ++i)
				625	{
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	626	CHECK_MESSAGE(Compare<armnn::DataType::Float32>(it.second[i], out[i], tolerance) == true,
Keith Davis	3674f14	2020-08-16 23:44:15 +0100	[diff] [blame]	627	"Actual output: " << out[i] << ". Expected output:" << it.second[i]);
				628
Sadik Armagan	76615a5	2020-08-04 14:01:05 +0100	[diff] [blame]	629	}
				630	}
				631	}
				632
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	633	TEST_CASE("NeonTensorHandleFactoryMemoryManaged")
Narumol Prangnawarat	b8d771a	2020-08-14 11:51:12 +0100	[diff] [blame]	634	{
				635	std::shared_ptr<NeonMemoryManager> memoryManager = std::make_shared<NeonMemoryManager>(
				636	std::make_unique<arm_compute::Allocator>(),
				637	BaseMemoryManager::MemoryAffinity::Offset);
				638	NeonTensorHandleFactory handleFactory(memoryManager);
				639	TensorInfo info({ 1, 1, 2, 1 }, DataType::Float32);
				640
				641	// create TensorHandle with memory managed
				642	auto handle = handleFactory.CreateTensorHandle(info, true);
				643	handle->Manage();
				644	handle->Allocate();
				645
				646	memoryManager->Acquire();
				647	{
				648	float* buffer = reinterpret_cast<float*>(handle->Map());
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	649	CHECK(buffer != nullptr); // Yields a valid pointer
Narumol Prangnawarat	b8d771a	2020-08-14 11:51:12 +0100	[diff] [blame]	650	buffer[0] = 1.5f;
				651	buffer[1] = 2.5f;
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	652	CHECK(buffer[0] == 1.5f); // Memory is writable and readable
				653	CHECK(buffer[1] == 2.5f); // Memory is writable and readable
Narumol Prangnawarat	b8d771a	2020-08-14 11:51:12 +0100	[diff] [blame]	654	}
				655	memoryManager->Release();
				656
				657	memoryManager->Acquire();
				658	{
				659	float* buffer = reinterpret_cast<float*>(handle->Map());
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	660	CHECK(buffer != nullptr); // Yields a valid pointer
Narumol Prangnawarat	b8d771a	2020-08-14 11:51:12 +0100	[diff] [blame]	661	buffer[0] = 3.5f;
				662	buffer[1] = 4.5f;
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	663	CHECK(buffer[0] == 3.5f); // Memory is writable and readable
				664	CHECK(buffer[1] == 4.5f); // Memory is writable and readable
Narumol Prangnawarat	b8d771a	2020-08-14 11:51:12 +0100	[diff] [blame]	665	}
				666	memoryManager->Release();
				667
				668	float testPtr[2] = { 2.5f, 5.5f };
				669	// Cannot import as import is disabled
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	670	CHECK_THROWS_AS(handle->Import(static_cast<void*>(testPtr), MemorySource::Malloc), MemoryImportException);
Narumol Prangnawarat	b8d771a	2020-08-14 11:51:12 +0100	[diff] [blame]	671	}
				672
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	673	TEST_CASE("NeonTensorHandleFactoryImport")
Narumol Prangnawarat	b8d771a	2020-08-14 11:51:12 +0100	[diff] [blame]	674	{
				675	std::shared_ptr<NeonMemoryManager> memoryManager = std::make_shared<NeonMemoryManager>(
				676	std::make_unique<arm_compute::Allocator>(),
				677	BaseMemoryManager::MemoryAffinity::Offset);
				678	NeonTensorHandleFactory handleFactory(memoryManager);
				679	TensorInfo info({ 1, 1, 2, 1 }, DataType::Float32);
				680
				681	// create TensorHandle without memory managed
				682	auto handle = handleFactory.CreateTensorHandle(info, false);
				683	handle->Manage();
				684	handle->Allocate();
				685	memoryManager->Acquire();
				686
				687	// No buffer allocated when import is enabled
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	688	CHECK((PolymorphicDowncast<NeonTensorHandle*>(handle.get()))->GetTensor().buffer() == nullptr);
Narumol Prangnawarat	b8d771a	2020-08-14 11:51:12 +0100	[diff] [blame]	689
				690	float testPtr[2] = { 2.5f, 5.5f };
				691	// Correctly import
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	692	CHECK(handle->Import(static_cast<void*>(testPtr), MemorySource::Malloc));
Narumol Prangnawarat	b8d771a	2020-08-14 11:51:12 +0100	[diff] [blame]	693	float* buffer = reinterpret_cast<float*>(handle->Map());
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	694	CHECK(buffer != nullptr); // Yields a valid pointer after import
				695	CHECK(buffer == testPtr); // buffer is pointing to testPtr
Narumol Prangnawarat	b8d771a	2020-08-14 11:51:12 +0100	[diff] [blame]	696	// Memory is writable and readable with correct value
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	697	CHECK(buffer[0] == 2.5f);
				698	CHECK(buffer[1] == 5.5f);
Narumol Prangnawarat	b8d771a	2020-08-14 11:51:12 +0100	[diff] [blame]	699	buffer[0] = 3.5f;
				700	buffer[1] = 10.0f;
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	701	CHECK(buffer[0] == 3.5f);
				702	CHECK(buffer[1] == 10.0f);
Narumol Prangnawarat	b8d771a	2020-08-14 11:51:12 +0100	[diff] [blame]	703	memoryManager->Release();
				704	}
				705
David Monahan	0fa1050	2022-01-13 10:48:33 +0000	[diff] [blame^]	706	TEST_CASE("NeonTensorHandleCanBeImported")
				707	{
				708	std::shared_ptr<NeonMemoryManager> memoryManager = std::make_shared<NeonMemoryManager>(
				709	std::make_unique<arm_compute::Allocator>(),
				710	BaseMemoryManager::MemoryAffinity::Offset);
				711	NeonTensorHandleFactory handleFactory(memoryManager);
				712	TensorInfo info({ 1, 1, 2, 1 }, DataType::Float32);
				713
				714	// create TensorHandle (Memory Managed status is irrelevant)
				715	auto handle = handleFactory.CreateTensorHandle(info, false);
				716
				717	// Create an aligned buffer
				718	float alignedBuffer[2] = { 2.5f, 5.5f };
				719	// Check aligned buffers return true
				720	CHECK(handle->CanBeImported(&alignedBuffer, MemorySource::Malloc) == true);
				721
				722	// Create a misaligned buffer from the aligned one
				723	float* misalignedBuffer = reinterpret_cast<float>(reinterpret_cast<char>(alignedBuffer) + 1);
				724	// Check misaligned buffers return false
				725	CHECK(handle->CanBeImported(static_cast<void*>(misalignedBuffer), MemorySource::Malloc) == false);
				726	}
				727
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	728	TEST_CASE("NeonTensorHandleSupportsInPlaceComputation")
Sadik Armagan	ab3bd4d	2020-08-25 11:48:00 +0100	[diff] [blame]	729	{
				730	std::shared_ptr<NeonMemoryManager> memoryManager = std::make_shared<NeonMemoryManager>();
				731	NeonTensorHandleFactory handleFactory(memoryManager);
				732
				733	// NeonTensorHandleFactory supports InPlaceComputation
				734	ARMNN_ASSERT(handleFactory.SupportsInPlaceComputation());
				735	}
				736
Sadik Armagan	1625efc	2021-06-10 18:24:34 +0100	[diff] [blame]	737	}