Blame - src/backends/neon/NeonBackend.cpp - ml/armnn

2018-10-04 10:46:04 +0100

[diff] [blame]

1

//

2

3

// SPDX-License-Identifier: MIT

4

//

5

6

#include "NeonBackend.hpp"

David Beck

3e9e115

2018-10-17 14:17:50 +0100

[diff] [blame]

7

#include "NeonBackendId.hpp"

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

8

#include "NeonBackendModelContext.hpp"

arovir01

a094479

2018-10-11 15:00:58 +0100

[diff] [blame]

9

#include "NeonWorkloadFactory.hpp"

David Beck

111b5d9

2018-11-12 14:59:37 +0000

[diff] [blame]

10

#include "NeonLayerSupport.hpp"

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

11

#include "NeonTensorHandleFactory.hpp"

arovir01

a094479

2018-10-11 15:00:58 +0100

[diff] [blame]

12

Matteo Martincigh

c601aa6

2019-10-29 15:03:22 +0000

[diff] [blame]

13

#include <armnn/BackendRegistry.hpp>

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

14

#include <armnn/Descriptors.hpp>

Matteo Martincigh

c601aa6

2019-10-29 15:03:22 +0000

[diff] [blame]

15

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

16

#include <aclCommon/ArmComputeSubgraphUtils.hpp>

17

#include <aclCommon/ArmComputeUtils.hpp>

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

18

#include <aclCommon/BaseMemoryManager.hpp>

19

Matteo Martincigh

e5b8eb9

2019-11-28 15:45:42 +0000

[diff] [blame]

20

#include <armnn/backends/IBackendContext.hpp>

21

#include <armnn/backends/IMemoryManager.hpp>

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

22

Jan Eilers

3c9e045

2020-04-10 13:00:44 +0100

[diff] [blame]

23

#include <armnn/utility/PolymorphicDowncast.hpp>

24

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

25

#include "workloads/NeonAdditionWorkload.hpp"

26

#include "workloads/NeonBatchNormalizationWorkload.hpp"

27

#include "workloads/NeonConvolution2dWorkload.hpp"

28

#include "workloads/NeonDepthwiseConvolutionWorkload.hpp"

29

#include "workloads/NeonDivisionWorkload.hpp"

30

#include "workloads/NeonFullyConnectedWorkload.hpp"

31

#include "workloads/NeonMultiplicationWorkload.hpp"

32

#include "workloads/NeonSubtractionWorkload.hpp"

33

David Beck

263e349

2018-11-09 14:46:40 +0000

[diff] [blame]

34

#include <Optimizer.hpp>

arovir01

a094479

2018-10-11 15:00:58 +0100

[diff] [blame]

35

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

36

#include <arm_compute/core/Types.h>

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

37

#include <arm_compute/runtime/Allocator.h>

38

arovir01

2018-10-04 10:46:04 +0100

[diff] [blame]

namespace armnn

{

David Beck

2018-10-12 10:38:31 +0100

[diff] [blame]

42

const BackendId& NeonBackend::GetIdStatic()

arovir01

2018-10-04 10:46:04 +0100

[diff] [blame]

43

{

David Beck

3e9e115

2018-10-17 14:17:50 +0100

[diff] [blame]

44

static const BackendId s_Id{NeonBackendId()};

arovir01

2018-10-04 10:46:04 +0100

[diff] [blame]

return s_Id;

}

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

48

IBackendInternal::IMemoryManagerUniquePtr NeonBackend::CreateMemoryManager() const

arovir01

2018-10-04 10:46:04 +0100

[diff] [blame]

49

{

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

50

return std::make_unique<NeonMemoryManager>(std::make_unique<arm_compute::Allocator>(),

Sadik Armagan

13a9fa6

2019-04-26 16:04:34 +0100

[diff] [blame]

51

BaseMemoryManager::MemoryAffinity::Offset);

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

52

}

53

54

IBackendInternal::IWorkloadFactoryPtr NeonBackend::CreateWorkloadFactory(

55

const IBackendInternal::IMemoryManagerSharedPtr& memoryManager) const

56

{

57

return std::make_unique<NeonWorkloadFactory>(

Jan Eilers

3c9e045

2020-04-10 13:00:44 +0100

[diff] [blame]

58

PolymorphicPointerDowncast<NeonMemoryManager>(memoryManager));

arovir01

2018-10-04 10:46:04 +0100

[diff] [blame]

59

}

60

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

61

IBackendInternal::IWorkloadFactoryPtr NeonBackend::CreateWorkloadFactory(

Sadik Armagan

04a7297

2020-09-14 15:44:18 +0100

[diff] [blame]

62

const IBackendInternal::IMemoryManagerSharedPtr& memoryManager, const ModelOptions& modelOptions) const

63

{

64

return std::make_unique<NeonWorkloadFactory>(

65

PolymorphicPointerDowncast<NeonMemoryManager>(memoryManager), CreateBackendSpecificModelContext(modelOptions));

66

}

67

68

IBackendInternal::IWorkloadFactoryPtr NeonBackend::CreateWorkloadFactory(

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

69

class TensorHandleFactoryRegistry& tensorHandleFactoryRegistry) const

70

{

71

auto memoryManager = std::make_shared<NeonMemoryManager>(std::make_unique<arm_compute::Allocator>(),

72

BaseMemoryManager::MemoryAffinity::Offset);

73

74

tensorHandleFactoryRegistry.RegisterMemoryManager(memoryManager);

Narumol Prangnawarat

549cb7a

2020-07-10 17:50:53 +0100

[diff] [blame]

75

tensorHandleFactoryRegistry.RegisterFactory(std::make_unique<NeonTensorHandleFactory>(memoryManager));

76

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

77

return std::make_unique<NeonWorkloadFactory>(

Jan Eilers

3c9e045

2020-04-10 13:00:44 +0100

[diff] [blame]

78

PolymorphicPointerDowncast<NeonMemoryManager>(memoryManager));

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

79

}

80

Sadik Armagan

04a7297

2020-09-14 15:44:18 +0100

[diff] [blame]

81

IBackendInternal::IWorkloadFactoryPtr NeonBackend::CreateWorkloadFactory(

82

TensorHandleFactoryRegistry& tensorHandleFactoryRegistry, const ModelOptions& modelOptions) const

83

{

84

auto memoryManager = std::make_shared<NeonMemoryManager>(std::make_unique<arm_compute::Allocator>(),

85

BaseMemoryManager::MemoryAffinity::Offset);

86

87

tensorHandleFactoryRegistry.RegisterMemoryManager(memoryManager);

88

tensorHandleFactoryRegistry.RegisterFactory(std::make_unique<NeonTensorHandleFactory>(memoryManager));

89

90

return std::make_unique<NeonWorkloadFactory>(

91

PolymorphicPointerDowncast<NeonMemoryManager>(memoryManager), CreateBackendSpecificModelContext(modelOptions));

92

}

93

David Beck

263e349

2018-11-09 14:46:40 +0000

[diff] [blame]

94

IBackendInternal::IBackendContextPtr NeonBackend::CreateBackendContext(const IRuntime::CreationOptions&) const

95

{

96

return IBackendContextPtr{};

97

}

98

Colm Donelan

e49755b

2020-01-29 15:22:43 +0000

[diff] [blame]

99

IBackendInternal::IBackendProfilingContextPtr NeonBackend::CreateBackendProfilingContext(

Colm Donelan

1aff393

2020-02-05 17:48:59 +0000

[diff] [blame]

100

const IRuntime::CreationOptions&, IBackendProfilingPtr&)

Colm Donelan

e49755b

2020-01-29 15:22:43 +0000

[diff] [blame]

101

{

102

return IBackendProfilingContextPtr{};

103

}

104

David Beck

263e349

2018-11-09 14:46:40 +0000

[diff] [blame]

105

IBackendInternal::Optimizations NeonBackend::GetOptimizations() const

106

{

107

return Optimizations{};

108

}

109

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

110

IBackendInternal::IBackendSpecificModelContextPtr NeonBackend::CreateBackendSpecificModelContext(

111

const ModelOptions& modelOptions) const

112

{

113

return IBackendSpecificModelContextPtr{new NeonBackendModelContext{modelOptions}};

114

}

115

David Beck

111b5d9

2018-11-12 14:59:37 +0000

[diff] [blame]

116

IBackendInternal::ILayerSupportSharedPtr NeonBackend::GetLayerSupport() const

117

{

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

118

static ILayerSupportSharedPtr layerSupport

119

{

120

new NeonLayerSupport(IBackendInternal::IBackendSpecificModelContextPtr{})

};

return layerSupport;

}

IBackendInternal::ILayerSupportSharedPtr NeonBackend::GetLayerSupport(const ModelOptions& modelOptions) const

126

{

127

static ILayerSupportSharedPtr layerSupport

128

{

129

new NeonLayerSupport(CreateBackendSpecificModelContext(modelOptions))

130

};

David Beck

111b5d9

2018-11-12 14:59:37 +0000

[diff] [blame]

return layerSupport;

}

Matteo Martincigh

2019-05-22 14:28:16 +0100

[diff] [blame]

134

OptimizationViews NeonBackend::OptimizeSubgraphView(const SubgraphView& subgraph) const

Matteo Martincigh

adddddb

2019-01-24 14:06:23 +0000

[diff] [blame]

135

{

Matteo Martincigh

c3ba50e

2019-05-22 14:28:16 +0100

[diff] [blame]

136

OptimizationViews optimizationViews;

Matteo Martincigh

adddddb

2019-01-24 14:06:23 +0000

[diff] [blame]

137

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

138

auto it = subgraph.end();

139

140

while (it != subgraph.begin())

{

--it;

Layer& base = **it;

if ((base.GetType() == LayerType::DepthwiseConvolution2d || base.GetType() == LayerType::Convolution2d

146

|| base.GetType() == LayerType::BatchNormalization || base.GetType() == LayerType::FullyConnected

147

|| base.GetType() == LayerType::Addition || base.GetType() == LayerType::Multiplication

148

|| base.GetType() == LayerType::Subtraction || base.GetType() == LayerType::Division)

149

&& (base.GetAdditionalInformation<ActivationDescriptor>() == nullptr))

150

{

151

for (auto output = base.BeginOutputSlots(); output != base.EndOutputSlots(); ++output)

152

{

153

if (output->GetNumConnections() == 1)

154

{

155

for (auto&& childInput : output->GetConnections())

156

{

157

if (childInput->GetOwningLayer().GetType() == LayerType::Activation)

158

{

159

Layer& child = childInput->GetOwningLayer();

160

161

auto* activationLayer = PolymorphicDowncast<ActivationLayer*>(&child);

162

163

const std::string name = std::string("fused-") + child.GetName() + std::string("-into-") +

164

base.GetName();

165

166

// Get params from activation layer

167

ActivationDescriptor activationDesc = activationLayer->GetParameters();

168

169

if (base.GetType() == LayerType::Convolution2d)

170

{

171

Convolution2dLayer* baseLayer = PolymorphicDowncast<Convolution2dLayer*>(&base);

172

173

Optional<TensorInfo> biases;

174

175

if (baseLayer->GetParameters().m_BiasEnabled)

176

{

177

biases = GetOverriddenDataType(baseLayer->m_Bias->GetTensorInfo(),

178

GetOptionalBiasTypeFromWeightsType(

179

baseLayer->m_Weight->GetTensorInfo().GetDataType()));

180

}

181

182

arm_compute::Status status = NeonConvolution2dWorkloadValidate(

183

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

184

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

185

baseLayer->GetParameters(),

186

baseLayer->m_Weight->GetTensorInfo(),

biases,

false,

&activationDesc);

if (status)

{

FuseLayerWithWeightsAndBiases<Convolution2dLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

}

}

else if (base.GetType() == LayerType::DepthwiseConvolution2d)

201

{

202

DepthwiseConvolution2dLayer* baseLayer =

203

PolymorphicDowncast<DepthwiseConvolution2dLayer*>(&base);

204

205

Optional<TensorInfo> biases;

206

207

if (baseLayer->GetParameters().m_BiasEnabled)

208

{

209

biases = GetOverriddenDataType(baseLayer->m_Bias->GetTensorInfo(),

210

GetOptionalBiasTypeFromWeightsType(

211

baseLayer->m_Weight->GetTensorInfo().GetDataType()));

212

}

213

214

arm_compute::Status status = NeonDepthwiseConvolutionWorkloadValidate(

215

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

216

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

217

baseLayer->GetParameters(),

218

baseLayer->m_Weight->GetTensorInfo(),

biases,

&activationDesc);

if (status)

{

FuseLayerWithWeightsAndBiases<DepthwiseConvolution2dLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

}

}

else if (base.GetType() == LayerType::FullyConnected)

232

{

233

FullyConnectedLayer* baseLayer = PolymorphicDowncast<FullyConnectedLayer*>(&base);

234

235

arm_compute::Status status = NeonFullyConnectedWorkloadValidate(

236

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

237

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

238

baseLayer->m_Weight->GetTensorInfo(),

239

baseLayer->m_Bias->GetTensorInfo(),

240

baseLayer->GetParameters(),

&activationDesc);

if (status)

{

FuseLayerWithWeightsAndBiases<FullyConnectedLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

}

}

else if (base.GetType() == LayerType::BatchNormalization)

253

{

254

BatchNormalizationLayer* baseLayer =

255

PolymorphicDowncast<BatchNormalizationLayer*>(&base);

256

257

arm_compute::Status status = NeonBatchNormalizationValidate(

258

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

259

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

260

baseLayer->m_Mean->GetTensorInfo(),

261

baseLayer->m_Variance->GetTensorInfo(),

262

baseLayer->m_Beta->GetTensorInfo(),

263

baseLayer->m_Gamma->GetTensorInfo(),

264

baseLayer->GetParameters(),

&activationDesc);

if (status)

{

BatchNormalizationLayer* replacementLayer =

270

FuseLayerWithParameters<BatchNormalizationLayer>(

optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

replacementLayer->m_Beta = std::move(baseLayer->m_Beta);

278

replacementLayer->m_Gamma = std::move(baseLayer->m_Gamma);

279

replacementLayer->m_Mean = std::move(baseLayer->m_Mean);

280

replacementLayer->m_Variance = std::move(baseLayer->m_Variance);

281

}

282

}

283

else if (base.GetType() == LayerType::Addition)

284

{

285

AdditionLayer* baseLayer = PolymorphicDowncast<AdditionLayer*>(&base);

286

287

arm_compute::Status status = NeonAdditionWorkloadValidate(

288

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

289

baseLayer->GetInputSlot(1).GetConnectedOutputSlot()->GetTensorInfo(),

290

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

&activationDesc);

if (status)

{

FuseLayerWithoutParameters<AdditionLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

}

}

else if (base.GetType() == LayerType::Division)

303

{

304

DivisionLayer* baseLayer = PolymorphicDowncast<DivisionLayer*>(&base);

305

306

arm_compute::Status status = NeonDivisionWorkloadValidate(

307

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

308

baseLayer->GetInputSlot(1).GetConnectedOutputSlot()->GetTensorInfo(),

309

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

&activationDesc);

if (status)

{

FuseLayerWithoutParameters<DivisionLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

}

}

else if (base.GetType() == LayerType::Multiplication)

322

{

323

MultiplicationLayer* baseLayer = PolymorphicDowncast<MultiplicationLayer*>(&base);

324

325

arm_compute::Status status = NeonMultiplicationWorkloadValidate(

326

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

327

baseLayer->GetInputSlot(1).GetConnectedOutputSlot()->GetTensorInfo(),

328

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

&activationDesc);

if (status)

{

FuseLayerWithoutParameters<MultiplicationLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

}

}

else if (base.GetType() == LayerType::Subtraction)

341

{

342

SubtractionLayer* baseLayer = PolymorphicDowncast<SubtractionLayer*>(&base);

343

344

arm_compute::Status status = NeonSubtractionWorkloadValidate(

345

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

346

baseLayer->GetInputSlot(1).GetConnectedOutputSlot()->GetTensorInfo(),

347

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

&activationDesc);

if (status)

{

FuseLayerWithoutParameters<SubtractionLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

}

}

}

}

}

}

}

}

if (optimizationViews.GetSubstitutions().empty())

367

{

368

optimizationViews.AddUntouchedSubgraph(SubgraphView(subgraph));

369

}

Matteo Martincigh

c3ba50e

2019-05-22 14:28:16 +0100

[diff] [blame]

370

371

return optimizationViews;

Matteo Martincigh

adddddb

2019-01-24 14:06:23 +0000

[diff] [blame]

372

}

373

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

374

std::vector<ITensorHandleFactory::FactoryId> NeonBackend::GetHandleFactoryPreferences() const

375

{

Narumol Prangnawarat

265e53e

2020-10-30 16:06:55 +0000

[diff] [blame]

376

return std::vector<ITensorHandleFactory::FactoryId>() = { NeonTensorHandleFactory::GetIdStatic() };

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

377

}

378

379

void NeonBackend::RegisterTensorHandleFactories(class TensorHandleFactoryRegistry& registry)

380

{

381

auto memoryManager = std::make_shared<NeonMemoryManager>(std::make_unique<arm_compute::Allocator>(),

382

BaseMemoryManager::MemoryAffinity::Offset);

383

384

registry.RegisterMemoryManager(memoryManager);

Jan Eilers

e9f0f0f

2019-08-16 10:28:37 +0100

[diff] [blame]

385

registry.RegisterFactory(std::make_unique<NeonTensorHandleFactory>(memoryManager));

Narumol Prangnawarat