Blame - src/backends/neon/NeonBackend.cpp - ml/armnn

2018-10-04 10:46:04 +0100

[diff] [blame]

1

//

2

3

// SPDX-License-Identifier: MIT

4

//

5

6

#include "NeonBackend.hpp"

David Beck

3e9e115

2018-10-17 14:17:50 +0100

[diff] [blame]

7

#include "NeonBackendId.hpp"

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

8

#include "NeonBackendModelContext.hpp"

arovir01

a094479

2018-10-11 15:00:58 +0100

[diff] [blame]

9

#include "NeonWorkloadFactory.hpp"

David Beck

111b5d9

2018-11-12 14:59:37 +0000

[diff] [blame]

10

#include "NeonLayerSupport.hpp"

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

11

#include "NeonTensorHandleFactory.hpp"

arovir01

a094479

2018-10-11 15:00:58 +0100

[diff] [blame]

12

Matteo Martincigh

c601aa6

2019-10-29 15:03:22 +0000

[diff] [blame]

13

#include <armnn/BackendRegistry.hpp>

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

14

#include <armnn/Descriptors.hpp>

Matteo Martincigh

c601aa6

2019-10-29 15:03:22 +0000

[diff] [blame]

15

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

16

#include <aclCommon/ArmComputeSubgraphUtils.hpp>

17

#include <aclCommon/ArmComputeUtils.hpp>

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

18

#include <aclCommon/BaseMemoryManager.hpp>

19

Matteo Martincigh

e5b8eb9

2019-11-28 15:45:42 +0000

[diff] [blame]

20

#include <armnn/backends/IBackendContext.hpp>

21

#include <armnn/backends/IMemoryManager.hpp>

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

22

Jan Eilers

3c9e045

2020-04-10 13:00:44 +0100

[diff] [blame]

23

#include <armnn/utility/PolymorphicDowncast.hpp>

24

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

25

#include "workloads/NeonAdditionWorkload.hpp"

26

#include "workloads/NeonBatchNormalizationWorkload.hpp"

27

#include "workloads/NeonConvolution2dWorkload.hpp"

28

#include "workloads/NeonDepthwiseConvolutionWorkload.hpp"

29

#include "workloads/NeonDivisionWorkload.hpp"

30

#include "workloads/NeonFullyConnectedWorkload.hpp"

31

#include "workloads/NeonMultiplicationWorkload.hpp"

32

#include "workloads/NeonSubtractionWorkload.hpp"

33

David Beck

263e349

2018-11-09 14:46:40 +0000

[diff] [blame]

34

#include <Optimizer.hpp>

arovir01

a094479

2018-10-11 15:00:58 +0100

[diff] [blame]

35

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

36

#include <arm_compute/core/Types.h>

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

37

#include <arm_compute/runtime/Allocator.h>

38

arovir01

2018-10-04 10:46:04 +0100

[diff] [blame]

namespace armnn

{

David Beck

2018-10-12 10:38:31 +0100

[diff] [blame]

42

const BackendId& NeonBackend::GetIdStatic()

arovir01

2018-10-04 10:46:04 +0100

[diff] [blame]

43

{

David Beck

3e9e115

2018-10-17 14:17:50 +0100

[diff] [blame]

44

static const BackendId s_Id{NeonBackendId()};

arovir01

2018-10-04 10:46:04 +0100

[diff] [blame]

return s_Id;

}

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

48

IBackendInternal::IMemoryManagerUniquePtr NeonBackend::CreateMemoryManager() const

arovir01

2018-10-04 10:46:04 +0100

[diff] [blame]

49

{

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

50

return std::make_unique<NeonMemoryManager>(std::make_unique<arm_compute::Allocator>(),

Sadik Armagan

13a9fa6

2019-04-26 16:04:34 +0100

[diff] [blame]

51

BaseMemoryManager::MemoryAffinity::Offset);

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

52

}

53

54

IBackendInternal::IWorkloadFactoryPtr NeonBackend::CreateWorkloadFactory(

55

const IBackendInternal::IMemoryManagerSharedPtr& memoryManager) const

56

{

57

return std::make_unique<NeonWorkloadFactory>(

Jan Eilers

3c9e045

2020-04-10 13:00:44 +0100

[diff] [blame]

58

PolymorphicPointerDowncast<NeonMemoryManager>(memoryManager));

arovir01

2018-10-04 10:46:04 +0100

[diff] [blame]

59

}

60

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

61

IBackendInternal::IWorkloadFactoryPtr NeonBackend::CreateWorkloadFactory(

Sadik Armagan

04a7297

2020-09-14 15:44:18 +0100

[diff] [blame]

62

const IBackendInternal::IMemoryManagerSharedPtr& memoryManager, const ModelOptions& modelOptions) const

63

{

64

return std::make_unique<NeonWorkloadFactory>(

65

PolymorphicPointerDowncast<NeonMemoryManager>(memoryManager), CreateBackendSpecificModelContext(modelOptions));

66

}

67

68

IBackendInternal::IWorkloadFactoryPtr NeonBackend::CreateWorkloadFactory(

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

69

class TensorHandleFactoryRegistry& tensorHandleFactoryRegistry) const

70

{

71

auto memoryManager = std::make_shared<NeonMemoryManager>(std::make_unique<arm_compute::Allocator>(),

72

BaseMemoryManager::MemoryAffinity::Offset);

73

74

tensorHandleFactoryRegistry.RegisterMemoryManager(memoryManager);

Narumol Prangnawarat

549cb7a

2020-07-10 17:50:53 +0100

[diff] [blame]

75

tensorHandleFactoryRegistry.RegisterFactory(std::make_unique<NeonTensorHandleFactory>(memoryManager));

76

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

77

return std::make_unique<NeonWorkloadFactory>(

Jan Eilers

3c9e045

2020-04-10 13:00:44 +0100

[diff] [blame]

78

PolymorphicPointerDowncast<NeonMemoryManager>(memoryManager));

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

79

}

80

Sadik Armagan

04a7297

2020-09-14 15:44:18 +0100

[diff] [blame]

81

IBackendInternal::IWorkloadFactoryPtr NeonBackend::CreateWorkloadFactory(

82

TensorHandleFactoryRegistry& tensorHandleFactoryRegistry, const ModelOptions& modelOptions) const

83

{

84

auto memoryManager = std::make_shared<NeonMemoryManager>(std::make_unique<arm_compute::Allocator>(),

85

BaseMemoryManager::MemoryAffinity::Offset);

86

87

tensorHandleFactoryRegistry.RegisterMemoryManager(memoryManager);

88

tensorHandleFactoryRegistry.RegisterFactory(std::make_unique<NeonTensorHandleFactory>(memoryManager));

89

90

return std::make_unique<NeonWorkloadFactory>(

91

PolymorphicPointerDowncast<NeonMemoryManager>(memoryManager), CreateBackendSpecificModelContext(modelOptions));

92

}

93

David Beck

263e349

2018-11-09 14:46:40 +0000

[diff] [blame]

94

IBackendInternal::IBackendContextPtr NeonBackend::CreateBackendContext(const IRuntime::CreationOptions&) const

95

{

96

return IBackendContextPtr{};

97

}

98

Colm Donelan

e49755b

2020-01-29 15:22:43 +0000

[diff] [blame]

99

IBackendInternal::IBackendProfilingContextPtr NeonBackend::CreateBackendProfilingContext(

Colm Donelan

1aff393

2020-02-05 17:48:59 +0000

[diff] [blame]

100

const IRuntime::CreationOptions&, IBackendProfilingPtr&)

Colm Donelan

e49755b

2020-01-29 15:22:43 +0000

[diff] [blame]

101

{

102

return IBackendProfilingContextPtr{};

103

}

104

David Beck

263e349

2018-11-09 14:46:40 +0000

[diff] [blame]

105

IBackendInternal::Optimizations NeonBackend::GetOptimizations() const

106

{

107

return Optimizations{};

108

}

109

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

110

IBackendInternal::IBackendSpecificModelContextPtr NeonBackend::CreateBackendSpecificModelContext(

111

const ModelOptions& modelOptions) const

112

{

113

return IBackendSpecificModelContextPtr{new NeonBackendModelContext{modelOptions}};

114

}

115

David Beck

111b5d9

2018-11-12 14:59:37 +0000

[diff] [blame]

116

IBackendInternal::ILayerSupportSharedPtr NeonBackend::GetLayerSupport() const

117

{

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

118

static ILayerSupportSharedPtr layerSupport

119

{

120

new NeonLayerSupport(IBackendInternal::IBackendSpecificModelContextPtr{})

};

return layerSupport;

}

IBackendInternal::ILayerSupportSharedPtr NeonBackend::GetLayerSupport(const ModelOptions& modelOptions) const

126

{

127

static ILayerSupportSharedPtr layerSupport

128

{

129

new NeonLayerSupport(CreateBackendSpecificModelContext(modelOptions))

130

};

David Beck

111b5d9

2018-11-12 14:59:37 +0000

[diff] [blame]

return layerSupport;

}

Matteo Martincigh

2019-05-22 14:28:16 +0100

[diff] [blame]

134

OptimizationViews NeonBackend::OptimizeSubgraphView(const SubgraphView& subgraph) const

Matteo Martincigh

adddddb

2019-01-24 14:06:23 +0000

[diff] [blame]

135

{

Matteo Martincigh

c3ba50e

2019-05-22 14:28:16 +0100

[diff] [blame]

136

OptimizationViews optimizationViews;

Matteo Martincigh

adddddb

2019-01-24 14:06:23 +0000

[diff] [blame]

137

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

138

auto it = subgraph.end();

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

139

std::map<LayerGuid, Layer*> untouched;

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

140

141

while (it != subgraph.begin())

142

{

143

--it;

144

Layer& base = **it;

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

145

untouched.insert({base.GetGuid(), &base});

}

it = subgraph.end();

while (it != subgraph.begin())

150

{

151

--it;

152

Layer& base = **it;

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

153

154

if ((base.GetType() == LayerType::DepthwiseConvolution2d || base.GetType() == LayerType::Convolution2d

155

|| base.GetType() == LayerType::BatchNormalization || base.GetType() == LayerType::FullyConnected

156

|| base.GetType() == LayerType::Addition || base.GetType() == LayerType::Multiplication

157

|| base.GetType() == LayerType::Subtraction || base.GetType() == LayerType::Division)

158

&& (base.GetAdditionalInformation<ActivationDescriptor>() == nullptr))

159

{

160

for (auto output = base.BeginOutputSlots(); output != base.EndOutputSlots(); ++output)

161

{

162

if (output->GetNumConnections() == 1)

163

{

164

for (auto&& childInput : output->GetConnections())

165

{

166

if (childInput->GetOwningLayer().GetType() == LayerType::Activation)

167

{

168

Layer& child = childInput->GetOwningLayer();

169

170

auto* activationLayer = PolymorphicDowncast<ActivationLayer*>(&child);

171

172

const std::string name = std::string("fused-") + child.GetName() + std::string("-into-") +

173

base.GetName();

174

175

// Get params from activation layer

176

ActivationDescriptor activationDesc = activationLayer->GetParameters();

177

178

if (base.GetType() == LayerType::Convolution2d)

179

{

180

Convolution2dLayer* baseLayer = PolymorphicDowncast<Convolution2dLayer*>(&base);

181

182

Optional<TensorInfo> biases;

183

184

if (baseLayer->GetParameters().m_BiasEnabled)

185

{

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

186

biases = baseLayer->m_Bias->GetTensorInfo();

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

187

}

188

189

arm_compute::Status status = NeonConvolution2dWorkloadValidate(

190

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

191

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

192

baseLayer->GetParameters(),

193

baseLayer->m_Weight->GetTensorInfo(),

biases,

false,

&activationDesc);

if (status)

{

FuseLayerWithWeightsAndBiases<Convolution2dLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

205

untouched.erase(baseLayer->GetGuid());

206

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

207

}

208

}

209

else if (base.GetType() == LayerType::DepthwiseConvolution2d)

210

{

211

DepthwiseConvolution2dLayer* baseLayer =

212

PolymorphicDowncast<DepthwiseConvolution2dLayer*>(&base);

213

214

Optional<TensorInfo> biases;

215

216

if (baseLayer->GetParameters().m_BiasEnabled)

217

{

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

218

biases = baseLayer->m_Bias->GetTensorInfo();

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

219

}

220

221

arm_compute::Status status = NeonDepthwiseConvolutionWorkloadValidate(

222

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

223

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

224

baseLayer->GetParameters(),

225

baseLayer->m_Weight->GetTensorInfo(),

biases,

&activationDesc);

if (status)

{

FuseLayerWithWeightsAndBiases<DepthwiseConvolution2dLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

236

untouched.erase(baseLayer->GetGuid());

237

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

238

}

239

}

240

else if (base.GetType() == LayerType::FullyConnected)

241

{

242

FullyConnectedLayer* baseLayer = PolymorphicDowncast<FullyConnectedLayer*>(&base);

243

244

arm_compute::Status status = NeonFullyConnectedWorkloadValidate(

245

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

246

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

247

baseLayer->m_Weight->GetTensorInfo(),

248

baseLayer->m_Bias->GetTensorInfo(),

249

baseLayer->GetParameters(),

&activationDesc);

if (status)

{

FuseLayerWithWeightsAndBiases<FullyConnectedLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

259

untouched.erase(baseLayer->GetGuid());

260

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

261

}

262

}

263

else if (base.GetType() == LayerType::BatchNormalization)

264

{

265

BatchNormalizationLayer* baseLayer =

266

PolymorphicDowncast<BatchNormalizationLayer*>(&base);

267

268

arm_compute::Status status = NeonBatchNormalizationValidate(

269

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

270

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

271

baseLayer->m_Mean->GetTensorInfo(),

272

baseLayer->m_Variance->GetTensorInfo(),

273

baseLayer->m_Beta->GetTensorInfo(),

274

baseLayer->m_Gamma->GetTensorInfo(),

275

baseLayer->GetParameters(),

&activationDesc);

if (status)

{

BatchNormalizationLayer* replacementLayer =

281

FuseLayerWithParameters<BatchNormalizationLayer>(

optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

replacementLayer->m_Beta = std::move(baseLayer->m_Beta);

289

replacementLayer->m_Gamma = std::move(baseLayer->m_Gamma);

290

replacementLayer->m_Mean = std::move(baseLayer->m_Mean);

291

replacementLayer->m_Variance = std::move(baseLayer->m_Variance);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

292

untouched.erase(baseLayer->GetGuid());

293

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

294

}

295

}

296

else if (base.GetType() == LayerType::Addition)

297

{

298

AdditionLayer* baseLayer = PolymorphicDowncast<AdditionLayer*>(&base);

299

300

arm_compute::Status status = NeonAdditionWorkloadValidate(

301

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

302

baseLayer->GetInputSlot(1).GetConnectedOutputSlot()->GetTensorInfo(),

303

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

&activationDesc);

if (status)

{

FuseLayerWithoutParameters<AdditionLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

313

untouched.erase(baseLayer->GetGuid());

314

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

315

}

316

}

317

else if (base.GetType() == LayerType::Division)

318

{

319

DivisionLayer* baseLayer = PolymorphicDowncast<DivisionLayer*>(&base);

320

321

arm_compute::Status status = NeonDivisionWorkloadValidate(

322

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

323

baseLayer->GetInputSlot(1).GetConnectedOutputSlot()->GetTensorInfo(),

324

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

&activationDesc);

if (status)

{

FuseLayerWithoutParameters<DivisionLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

334

untouched.erase(baseLayer->GetGuid());

335

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

336

}

337

}

338

else if (base.GetType() == LayerType::Multiplication)

339

{

340

MultiplicationLayer* baseLayer = PolymorphicDowncast<MultiplicationLayer*>(&base);

341

342

arm_compute::Status status = NeonMultiplicationWorkloadValidate(

343

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

344

baseLayer->GetInputSlot(1).GetConnectedOutputSlot()->GetTensorInfo(),

345

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

&activationDesc);

if (status)

{

FuseLayerWithoutParameters<MultiplicationLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

355

untouched.erase(baseLayer->GetGuid());

356

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

357

}

358

}

359

else if (base.GetType() == LayerType::Subtraction)

360

{

361

SubtractionLayer* baseLayer = PolymorphicDowncast<SubtractionLayer*>(&base);

362

363

arm_compute::Status status = NeonSubtractionWorkloadValidate(

364

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

365

baseLayer->GetInputSlot(1).GetConnectedOutputSlot()->GetTensorInfo(),

366

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

&activationDesc);

if (status)

{

FuseLayerWithoutParameters<SubtractionLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

376

untouched.erase(baseLayer->GetGuid());

377

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

}

}

}

}

}

}

}

}

if (optimizationViews.GetSubstitutions().empty())

388

{

389

optimizationViews.AddUntouchedSubgraph(SubgraphView(subgraph));

390

}

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

391

else

392

{

393

ReportUntouchedLayers(optimizationViews, untouched);

394

}

Matteo Martincigh

c3ba50e

2019-05-22 14:28:16 +0100

[diff] [blame]

395

396

return optimizationViews;

Matteo Martincigh

adddddb

2019-01-24 14:06:23 +0000

[diff] [blame]

397

}

398

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

399

std::vector<ITensorHandleFactory::FactoryId> NeonBackend::GetHandleFactoryPreferences() const

400

{

Narumol Prangnawarat

265e53e

2020-10-30 16:06:55 +0000

[diff] [blame]

401

return std::vector<ITensorHandleFactory::FactoryId>() = { NeonTensorHandleFactory::GetIdStatic() };

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

402

}

403

404

void NeonBackend::RegisterTensorHandleFactories(class TensorHandleFactoryRegistry& registry)

405

{

406

auto memoryManager = std::make_shared<NeonMemoryManager>(std::make_unique<arm_compute::Allocator>(),

407

BaseMemoryManager::MemoryAffinity::Offset);

408

409

registry.RegisterMemoryManager(memoryManager);

Jan Eilers

e9f0f0f

2019-08-16 10:28:37 +0100

[diff] [blame]

410

registry.RegisterFactory(std::make_unique<NeonTensorHandleFactory>(memoryManager));

Narumol Prangnawarat