Blame - src/backends/neon/workloads/NeonConvolution2dBaseWorkload.cpp - ml/armnn

2018-03-09 14:13:49 +0000

[diff] [blame]

1

//

2

David Beck

ecb56cd

2018-09-05 12:52:57 +0100

[diff] [blame]

3

// SPDX-License-Identifier: MIT

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

5

David Beck

711fa31

2018-09-24 10:46:38 +0100

[diff] [blame]

6

#include <backends/CpuTensorHandle.hpp>

7

#include <backends/aclCommon/ArmComputeTensorUtils.hpp>

David Beck

0dbe0ee

2018-09-24 15:59:27 +0100

[diff] [blame]

8

#include <backends/neon/NeonLayerSupport.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

9

10

#include "NeonConvolution2dBaseWorkload.hpp"

11

David Beck

711fa31

2018-09-24 10:46:38 +0100

[diff] [blame]

12

#include <armnn/Types.hpp>

arovir01

616e775

2018-10-01 17:08:59 +0100

[diff] [blame]

13

#include <armnnUtils/Half.hpp>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

14

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

namespace armnn

{

surmeh01

2018-05-18 16:31:43 +0100

[diff] [blame]

18

using namespace armcomputetensorutils;

19

20

arm_compute::Status NeonConvolution2dWorkloadValidate(const TensorInfo& input,

21

const TensorInfo& output,

22

const Convolution2dDescriptor& descriptor,

23

const TensorInfo& weights,

David Beck

5eec11d

2018-10-04 15:43:17 +0100

[diff] [blame^]

24

const Optional<TensorInfo>& biases)

surmeh01

2018-05-18 16:31:43 +0100

[diff] [blame]

25

{

Francis Murtagh

351d13d

2018-09-24 15:01:18 +0100

[diff] [blame]

26

const arm_compute::TensorInfo aclInputInfo = BuildArmComputeTensorInfo(input, descriptor.m_DataLayout);

27

const arm_compute::TensorInfo aclOutputInfo = BuildArmComputeTensorInfo(output, descriptor.m_DataLayout);

28

const arm_compute::TensorInfo aclWeightsInfo = BuildArmComputeTensorInfo(weights, descriptor.m_DataLayout);

arovir01

a682410

2018-08-28 17:40:45 +0100

[diff] [blame]

29

surmeh01

2018-05-18 16:31:43 +0100

[diff] [blame]

30

arm_compute::TensorInfo aclBiasesInfo;

31

arm_compute::TensorInfo *optionalAclBiasesInfo = nullptr;

32

33

if (descriptor.m_BiasEnabled)

34

{

David Beck

5eec11d

2018-10-04 15:43:17 +0100

[diff] [blame^]

35

BOOST_ASSERT(biases.has_value());

arovir01

a682410

2018-08-28 17:40:45 +0100

[diff] [blame]

36

David Beck

5eec11d

2018-10-04 15:43:17 +0100

[diff] [blame^]

37

aclBiasesInfo = BuildArmComputeTensorInfo(biases.value(), descriptor.m_DataLayout);

surmeh01

2018-05-18 16:31:43 +0100

[diff] [blame]

38

optionalAclBiasesInfo = &aclBiasesInfo;

39

}

40

41

arm_compute::PadStrideInfo layerInfo = BuildArmComputePadStrideInfo(descriptor);

42

43

return arm_compute::NEConvolutionLayer::validate(&aclInputInfo,

44

&aclWeightsInfo,

45

optionalAclBiasesInfo,

&aclOutputInfo,

layerInfo);

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

50

template<armnn::DataType... dataTypes>

51

NeonConvolution2dBaseWorkload<dataTypes...>::NeonConvolution2dBaseWorkload(

52

const Convolution2dQueueDescriptor& descriptor, const WorkloadInfo& info,

53

std::shared_ptr<arm_compute::MemoryManagerOnDemand>& memoryManager)

54

: TypedWorkload<Convolution2dQueueDescriptor, dataTypes...>(descriptor, info)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

55

{

56

using arm_compute::NEDirectConvolutionLayer;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

ValidateData();

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

60

// todo: check tensor shapes match.

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

61

62

arm_compute::ITensor& input = boost::polymorphic_downcast<INeonTensorHandle*>(m_Data.m_Inputs[0])->GetTensor();

63

arm_compute::ITensor& output = boost::polymorphic_downcast<INeonTensorHandle*>(m_Data.m_Outputs[0])->GetTensor();

64

Francis Murtagh

d59116e

2018-10-04 16:03:07 +0100

[diff] [blame]

65

arm_compute::DataLayout aclDataLayout = ConvertDataLayout(m_Data.m_Parameters.m_DataLayout);

66

input.info()->set_data_layout(aclDataLayout);

67

output.info()->set_data_layout(aclDataLayout);

68

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

69

m_KernelTensor = std::make_unique<arm_compute::Tensor>();

Francis Murtagh

d59116e

2018-10-04 16:03:07 +0100

[diff] [blame]

70

BuildArmComputeTensor(*m_KernelTensor, m_Data.m_Weight->GetTensorInfo(), m_Data.m_Parameters.m_DataLayout);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

71

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

72

if (m_Data.m_Parameters.m_BiasEnabled)

73

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

74

m_BiasTensor = std::make_unique<arm_compute::Tensor>();

Francis Murtagh

d59116e

2018-10-04 16:03:07 +0100

[diff] [blame]

75

BuildArmComputeTensor(*m_BiasTensor, m_Data.m_Bias->GetTensorInfo(), m_Data.m_Parameters.m_DataLayout);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

76

}

77

78

arm_compute::PadStrideInfo padStrideInfo(m_Data.m_Parameters.m_StrideX,

79

m_Data.m_Parameters.m_StrideY,

80

m_Data.m_Parameters.m_PadLeft,

81

m_Data.m_Parameters.m_PadRight,

82

m_Data.m_Parameters.m_PadTop,

83

m_Data.m_Parameters.m_PadBottom,

84

arm_compute::DimensionRoundingType::FLOOR);

85

86

const bool preferDirectConvolution =

87

IsNeonDirectConvolutionPreferred(m_Data.m_Weight->GetTensorInfo(),

88

m_Data.m_Parameters);

89

90

if (preferDirectConvolution)

91

{

surmeh01

2018-05-18 16:31:43 +0100

[diff] [blame]

92

auto directConvolutionLayer = std::make_unique<arm_compute::NEDirectConvolutionLayer>(memoryManager);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

93

directConvolutionLayer->configure(&input,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

94

m_KernelTensor.get(),

95

m_BiasTensor.get(),

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

96

&output,

97

padStrideInfo);

98

m_ConvolutionLayer.reset(directConvolutionLayer.release());

99

}

100

else

101

{

surmeh01

2018-05-18 16:31:43 +0100

[diff] [blame]

102

auto convolutionLayer = std::make_unique<arm_compute::NEConvolutionLayer>(memoryManager);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

103

convolutionLayer->configure(&input,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

104

m_KernelTensor.get(),

105

m_BiasTensor.get(),

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

106

&output,

107

padStrideInfo);

108

m_ConvolutionLayer.reset(convolutionLayer.release());

109

}

110

BOOST_ASSERT(m_ConvolutionLayer);

111

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

112

armnn::DataType dataType = m_Data.m_Weight->GetTensorInfo().GetDataType();

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

113

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

114

switch (dataType)

115

{

116

case DataType::Float16:

117

{

118

InitialiseArmComputeTensorData(*m_KernelTensor, m_Data.m_Weight->template GetConstTensor<Half>());

119

break;

120

}

121

case DataType::Float32:

122

{

123

InitialiseArmComputeTensorData(*m_KernelTensor, m_Data.m_Weight->template GetConstTensor<float>());

124

break;

125

}

126

case DataType::QuantisedAsymm8:

127

{

128

InitialiseArmComputeTensorData(*m_KernelTensor, m_Data.m_Weight->template GetConstTensor<uint8_t>());

break;

}

default:

{

BOOST_ASSERT_MSG(false, "Unknown DataType.");

134

}

135

}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

136

}

137

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

138

template<armnn::DataType... dataTypes>

139

void NeonConvolution2dBaseWorkload<dataTypes...>::FreeUnusedTensors()

140

{

141

FreeTensorIfUnused(m_KernelTensor);

142

FreeTensorIfUnused(m_BiasTensor);

143

}

144

145

// Generates known implementations for linker.

146

template class NeonConvolution2dBaseWorkload<armnn::DataType::Float16, armnn::DataType::Float32>;

147

template class NeonConvolution2dBaseWorkload<armnn::DataType::QuantisedAsymm8>;

telsoa01