Blame - src/backends/neon/workloads/NeonConcatWorkload.cpp - ml/armnn

blob: 4a9f68798c63a30124277685052a7ddab0ec1ec4 [file] [log] [blame]

Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	1	//
				2	// Copyright © 2017 Arm Ltd. All rights reserved.
				3	// SPDX-License-Identifier: MIT
				4	//
				5
Jim Flynn	39d487d	2019-05-17 15:44:36 +0100	[diff] [blame]	6	#include "NeonConcatWorkload.hpp"
Matthew Bentham	d80a712	2019-01-08 17:52:37 +0000	[diff] [blame]	7
				8	#include "NeonWorkloadUtils.hpp"
				9
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	10	#include <aclCommon/ArmComputeTensorUtils.hpp>
				11	#include <backendsCommon/CpuTensorHandle.hpp>
				12	#include <neon/NeonTensorHandle.hpp>
				13
Derek Lamberti	0790dce	2019-04-15 18:37:35 +0100	[diff] [blame]	14
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	15
				16	namespace armnn
				17	{
				18	using namespace armcomputetensorutils;
				19
Derek Lamberti	0790dce	2019-04-15 18:37:35 +0100	[diff] [blame]	20	namespace
				21	{
Jim Flynn	e242f2d	2019-05-22 14:24:13 +0100	[diff] [blame]	22	size_t CalcAxis(const armnn::OriginsDescriptor& desc)
Derek Lamberti	0790dce	2019-04-15 18:37:35 +0100	[diff] [blame]	23	{
				24	return (desc.GetNumDimensions() - desc.GetConcatAxis()) - 1;
				25	}
				26	} //namespace
				27
Jim Flynn	39d487d	2019-05-17 15:44:36 +0100	[diff] [blame]	28	arm_compute::Status NeonConcatWorkloadValidate(const std::vector<const TensorInfo*>& inputs,
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	29	const TensorInfo& output,
Jim Flynn	e242f2d	2019-05-22 14:24:13 +0100	[diff] [blame]	30	const OriginsDescriptor& descriptor)
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	31
				32	{
				33	std::vector<arm_compute::TensorInfo> aclInputs;
				34	for (const TensorInfo* input : inputs)
				35	{
Derek Lamberti	0790dce	2019-04-15 18:37:35 +0100	[diff] [blame]	36	arm_compute::TensorInfo aclInputInfo = BuildArmComputeTensorInfo(*input, armnn::DataLayout::NCHW);
				37	aclInputs.emplace_back(aclInputInfo);
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	38	}
				39	const arm_compute::TensorInfo aclOutputInfo = BuildArmComputeTensorInfo(output);
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	40	std::vector<arm_compute::ITensorInfo*> aclInputPtrs;
				41	for (arm_compute::ITensorInfo& input : aclInputs)
				42	{
				43	aclInputPtrs.emplace_back(&input);
				44	}
				45
Derek Lamberti	0790dce	2019-04-15 18:37:35 +0100	[diff] [blame]	46	size_t aclAxis = CalcAxis(descriptor);
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	47	return arm_compute::NEConcatenateLayer::validate(aclInputPtrs, &aclOutputInfo, aclAxis);
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	48	}
				49
Jim Flynn	39d487d	2019-05-17 15:44:36 +0100	[diff] [blame]	50	NeonConcatWorkload::NeonConcatWorkload(
Jim Flynn	e242f2d	2019-05-22 14:24:13 +0100	[diff] [blame]	51	const ConcatQueueDescriptor& descriptor, const WorkloadInfo& info)
				52	: BaseWorkload<ConcatQueueDescriptor>(descriptor, info)
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	53	{
Derek Lamberti	0790dce	2019-04-15 18:37:35 +0100	[diff] [blame]	54	bool allInputsAreSubtensors = true;
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	55
Derek Lamberti	0790dce	2019-04-15 18:37:35 +0100	[diff] [blame]	56	// Check that all inputs are sub-tensors
				57	for (auto input : descriptor.m_Inputs)
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	58	{
Derek Lamberti	0790dce	2019-04-15 18:37:35 +0100	[diff] [blame]	59	if (!input->GetParent())
				60	{
Jim Flynn	e242f2d	2019-05-22 14:24:13 +0100	[diff] [blame]	61	// Non sub-tensor input found so we need to execute the concat function
Derek Lamberti	0790dce	2019-04-15 18:37:35 +0100	[diff] [blame]	62	allInputsAreSubtensors = false;
				63	break;
				64	}
				65	}
				66
				67	if (allInputsAreSubtensors)
				68	{
Jim Flynn	e242f2d	2019-05-22 14:24:13 +0100	[diff] [blame]	69	// Can skip configuring the concat function since it's not executed
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	70	return;
				71	}
				72
				73	std::vector<arm_compute::ITensor *> aclInputs;
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	74	for (auto input : m_Data.m_Inputs)
				75	{
Derek Lamberti	c81855f	2019-06-13 17:34:19 +0100	[diff] [blame]	76	arm_compute::ITensor& aclInput = boost::polymorphic_pointer_downcast<IAclTensorHandle>(input)->GetTensor();
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	77	aclInputs.emplace_back(&aclInput);
				78	}
Derek Lamberti	c81855f	2019-06-13 17:34:19 +0100	[diff] [blame]	79	arm_compute::ITensor& output = boost::polymorphic_pointer_downcast<IAclTensorHandle>(
Derek Lamberti	0790dce	2019-04-15 18:37:35 +0100	[diff] [blame]	80	m_Data.m_Outputs[0])->GetTensor();
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	81
Derek Lamberti	0790dce	2019-04-15 18:37:35 +0100	[diff] [blame]	82	// Create the layer function
				83	m_Layer.reset(new arm_compute::NEConcatenateLayer());
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	84
Derek Lamberti	0790dce	2019-04-15 18:37:35 +0100	[diff] [blame]	85	// Configure input and output tensors
				86	size_t aclAxis = CalcAxis(descriptor.m_Parameters);
				87	m_Layer->configure(aclInputs, &output, aclAxis);
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	88
Derek Lamberti	0790dce	2019-04-15 18:37:35 +0100	[diff] [blame]	89	// Prepare
Matthew Bentham	d80a712	2019-01-08 17:52:37 +0000	[diff] [blame]	90	m_Layer->prepare();
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	91	}
				92
Jim Flynn	39d487d	2019-05-17 15:44:36 +0100	[diff] [blame]	93	void NeonConcatWorkload::Execute() const
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	94	{
Derek Lamberti	0790dce	2019-04-15 18:37:35 +0100	[diff] [blame]	95	if (m_Layer)
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	96	{
Jim Flynn	39d487d	2019-05-17 15:44:36 +0100	[diff] [blame]	97	ARMNN_SCOPED_PROFILING_EVENT_NEON("NeonConcatWorkload_Execute");
Matthew Bentham	d80a712	2019-01-08 17:52:37 +0000	[diff] [blame]	98	m_Layer->run();
Nikhil Raj	8599a41	2018-11-19 14:51:07 +0000	[diff] [blame]	99	}
				100	}
				101
				102	} //namespace armnn
				103