src/backends/neon/workloads/NeonLstmFloatWorkload.hpp - ml/armnn - Gitiles

 //
 // Copyright © 2017 Arm Ltd and Contributors. All rights reserved.
 // SPDX-License-Identifier: MIT
 //

 #pragma once

 #include <armnn/Descriptors.hpp>
 #include <armnn/LstmParams.hpp>
 #include <armnn/backends/Workload.hpp>
 #include <armnn/backends/WorkloadData.hpp>

 #include "arm_compute/graph/Tensor.h"
 #include "arm_compute/runtime/NEON/functions/NELSTMLayer.h"

 namespace armnn
 {

 class NeonLstmFloatWorkload : public FloatWorkload<LstmQueueDescriptor>
 {
 public:
     NeonLstmFloatWorkload(const LstmQueueDescriptor& descriptor, const WorkloadInfo& info);
     virtual void Execute() const override;
     // Replace input tensor handle with the given TensorHandle
     void ReplaceInputTensorHandle(ITensorHandle* tensorHandle, unsigned int slot) override;

     // Replace output tensor handle with the given TensorHandle
     void ReplaceOutputTensorHandle(ITensorHandle* tensorHandle, unsigned int slot) override;
 private:
     mutable arm_compute::NELSTMLayer m_LstmLayer;

     std::unique_ptr<arm_compute::Tensor> m_InputToInputWeightsTensor;
     std::unique_ptr<arm_compute::Tensor> m_InputToForgetWeightsTensor;
     std::unique_ptr<arm_compute::Tensor> m_InputToCellWeightsTensor;
     std::unique_ptr<arm_compute::Tensor> m_InputToOutputWeightsTensor;
     std::unique_ptr<arm_compute::Tensor> m_RecurrentToInputWeightsTensor;
     std::unique_ptr<arm_compute::Tensor> m_RecurrentToForgetWeightsTensor;
     std::unique_ptr<arm_compute::Tensor> m_RecurrentToCellWeightsTensor;
     std::unique_ptr<arm_compute::Tensor> m_RecurrentToOutputWeightsTensor;
     std::unique_ptr<arm_compute::Tensor> m_CellToInputWeightsTensor;
     std::unique_ptr<arm_compute::Tensor> m_CellToForgetWeightsTensor;
     std::unique_ptr<arm_compute::Tensor> m_CellToOutputWeightsTensor;
     std::unique_ptr<arm_compute::Tensor> m_InputGateBiasTensor;
     std::unique_ptr<arm_compute::Tensor> m_ForgetGateBiasTensor;
     std::unique_ptr<arm_compute::Tensor> m_CellBiasTensor;
     std::unique_ptr<arm_compute::Tensor> m_OutputGateBiasTensor;
     std::unique_ptr<arm_compute::Tensor> m_ProjectionWeightsTensor;
     std::unique_ptr<arm_compute::Tensor> m_ProjectionBiasTensor;

     std::unique_ptr<arm_compute::Tensor> m_ScratchBuffer;

     std::unique_ptr<arm_compute::Tensor> m_InputLayerNormWeightsTensor;
     std::unique_ptr<arm_compute::Tensor> m_ForgetLayerNormWeightsTensor;
     std::unique_ptr<arm_compute::Tensor> m_CellLayerNormWeightsTensor;
     std::unique_ptr<arm_compute::Tensor> m_OutputLayerNormWeightsTensor;

     void FreeUnusedTensors();
     virtual void Reconfigure();
 };

 arm_compute::Status NeonLstmFloatWorkloadValidate(const TensorInfo& input, const TensorInfo& outputStateIn,
                                                   const TensorInfo& cellStateIn, const TensorInfo& scratchBuffer,
                                                   const TensorInfo& outputStateOut, const TensorInfo& cellStateOut,
                                                   const TensorInfo& output, const LstmDescriptor &descriptor,
                                                   const LstmInputParamsInfo& paramsInfo);

 } //namespace armnn
	//
	// Copyright © 2017 Arm Ltd and Contributors. All rights reserved.
	// SPDX-License-Identifier: MIT
	//

	#pragma once

	#include <armnn/Descriptors.hpp>
	#include <armnn/LstmParams.hpp>
	#include <armnn/backends/Workload.hpp>
	#include <armnn/backends/WorkloadData.hpp>

	#include "arm_compute/graph/Tensor.h"
	#include "arm_compute/runtime/NEON/functions/NELSTMLayer.h"

	namespace armnn
	{

	class NeonLstmFloatWorkload : public FloatWorkload<LstmQueueDescriptor>
	{
	public:
	NeonLstmFloatWorkload(const LstmQueueDescriptor& descriptor, const WorkloadInfo& info);
	virtual void Execute() const override;
	// Replace input tensor handle with the given TensorHandle
	void ReplaceInputTensorHandle(ITensorHandle* tensorHandle, unsigned int slot) override;

	// Replace output tensor handle with the given TensorHandle
	void ReplaceOutputTensorHandle(ITensorHandle* tensorHandle, unsigned int slot) override;
	private:
	mutable arm_compute::NELSTMLayer m_LstmLayer;

	std::unique_ptr<arm_compute::Tensor> m_InputToInputWeightsTensor;
	std::unique_ptr<arm_compute::Tensor> m_InputToForgetWeightsTensor;
	std::unique_ptr<arm_compute::Tensor> m_InputToCellWeightsTensor;
	std::unique_ptr<arm_compute::Tensor> m_InputToOutputWeightsTensor;
	std::unique_ptr<arm_compute::Tensor> m_RecurrentToInputWeightsTensor;
	std::unique_ptr<arm_compute::Tensor> m_RecurrentToForgetWeightsTensor;
	std::unique_ptr<arm_compute::Tensor> m_RecurrentToCellWeightsTensor;
	std::unique_ptr<arm_compute::Tensor> m_RecurrentToOutputWeightsTensor;
	std::unique_ptr<arm_compute::Tensor> m_CellToInputWeightsTensor;
	std::unique_ptr<arm_compute::Tensor> m_CellToForgetWeightsTensor;
	std::unique_ptr<arm_compute::Tensor> m_CellToOutputWeightsTensor;
	std::unique_ptr<arm_compute::Tensor> m_InputGateBiasTensor;
	std::unique_ptr<arm_compute::Tensor> m_ForgetGateBiasTensor;
	std::unique_ptr<arm_compute::Tensor> m_CellBiasTensor;
	std::unique_ptr<arm_compute::Tensor> m_OutputGateBiasTensor;
	std::unique_ptr<arm_compute::Tensor> m_ProjectionWeightsTensor;
	std::unique_ptr<arm_compute::Tensor> m_ProjectionBiasTensor;

	std::unique_ptr<arm_compute::Tensor> m_ScratchBuffer;

	std::unique_ptr<arm_compute::Tensor> m_InputLayerNormWeightsTensor;
	std::unique_ptr<arm_compute::Tensor> m_ForgetLayerNormWeightsTensor;
	std::unique_ptr<arm_compute::Tensor> m_CellLayerNormWeightsTensor;
	std::unique_ptr<arm_compute::Tensor> m_OutputLayerNormWeightsTensor;

	void FreeUnusedTensors();
	virtual void Reconfigure();
	};

	arm_compute::Status NeonLstmFloatWorkloadValidate(const TensorInfo& input, const TensorInfo& outputStateIn,
	const TensorInfo& cellStateIn, const TensorInfo& scratchBuffer,
	const TensorInfo& outputStateOut, const TensorInfo& cellStateOut,
	const TensorInfo& output, const LstmDescriptor &descriptor,
	const LstmInputParamsInfo& paramsInfo);

	} //namespace armnn