Blame - src/backends/neon/workloads/NeonConvertFp32ToFp16Workload.cpp - ml/armnn

blob: 4b6f97bb789b54ce44111afb2e1d03efca0efd18 [file] [log] [blame]

telsoa01	c577f2c	2018-08-31 09:22:23 +0100	[diff] [blame]	1	//
				2	// Copyright © 2017 Arm Ltd. All rights reserved.
David Beck	ecb56cd	2018-09-05 12:52:57 +0100	[diff] [blame]	3	// SPDX-License-Identifier: MIT
telsoa01	c577f2c	2018-08-31 09:22:23 +0100	[diff] [blame]	4	//
				5
				6	#include "NeonConvertFp32ToFp16Workload.hpp"
				7
Aron Virginas-Tar	c9cc804	2018-11-01 16:15:57 +0000	[diff] [blame]	8	#include <Half.hpp>
David Beck	ac42efd	2018-09-26 17:41:13 +0100	[diff] [blame]	9	#include <FloatingPointConverter.hpp>
David Beck	ac42efd	2018-09-26 17:41:13 +0100	[diff] [blame]	10	#include <Profiling.hpp>
Aron Virginas-Tar	c9cc804	2018-11-01 16:15:57 +0000	[diff] [blame]	11	#include <backendsCommon/WorkloadUtils.hpp>
telsoa01	c577f2c	2018-08-31 09:22:23 +0100	[diff] [blame]	12
				13	namespace armnn
				14	{
				15
				16	NeonConvertFp32ToFp16Workload::NeonConvertFp32ToFp16Workload(const ConvertFp32ToFp16QueueDescriptor& descriptor,
				17	const WorkloadInfo& info)
				18	: Float32ToFloat16Workload<ConvertFp32ToFp16QueueDescriptor>(descriptor, info)
				19	{
				20	this->m_Data.ValidateInputsOutputs("NeonConvertFp32ToFp16Workload", 1, 1);
				21	GatherTensorHandlePairs(descriptor, m_TensorHandlePairs);
				22	}
				23
				24	void NeonConvertFp32ToFp16Workload::Execute() const
				25	{
				26	ARMNN_SCOPED_PROFILING_EVENT_NEON("NeonConvertFp32ToFp16Workload_Execute");
				27
				28	auto convertFunc = [](uint8_t* dst, const uint8_t* src, size_t size)
				29	{
				30	auto input = reinterpret_cast<const float*>(src);
				31	auto output = reinterpret_cast<Half*>(dst);
				32	size_t numElements = size/2; // 2 bytes per fp16
				33	armnnUtils::FloatingPointConverter::ConvertFloat32To16(input, numElements, output);
				34	};
				35
				36	for (const auto& pair : m_TensorHandlePairs)
				37	{
				38	CopyTensorContentsGeneric(pair.first, pair.second, convertFunc);
				39	}
				40	}
				41
				42	} //namespace armnn