Blame - src/backends/neon/NeonBackend.cpp - ml/armnn

2018-10-04 10:46:04 +0100

[diff] [blame]

1

//

2

3

// SPDX-License-Identifier: MIT

4

//

5

6

#include "NeonBackend.hpp"

David Beck

3e9e115

2018-10-17 14:17:50 +0100

[diff] [blame]

7

#include "NeonBackendId.hpp"

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

8

#include "NeonBackendModelContext.hpp"

arovir01

a094479

2018-10-11 15:00:58 +0100

[diff] [blame]

9

#include "NeonWorkloadFactory.hpp"

David Beck

111b5d9

2018-11-12 14:59:37 +0000

[diff] [blame]

10

#include "NeonLayerSupport.hpp"

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

11

#include "NeonTensorHandleFactory.hpp"

arovir01

a094479

2018-10-11 15:00:58 +0100

[diff] [blame]

12

Matteo Martincigh

c601aa6

2019-10-29 15:03:22 +0000

[diff] [blame]

13

#include <armnn/BackendRegistry.hpp>

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

14

#include <armnn/Descriptors.hpp>

Matteo Martincigh

c601aa6

2019-10-29 15:03:22 +0000

[diff] [blame]

15

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

16

#include <aclCommon/ArmComputeSubgraphUtils.hpp>

17

#include <aclCommon/ArmComputeUtils.hpp>

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

18

#include <aclCommon/BaseMemoryManager.hpp>

19

Matteo Martincigh

e5b8eb9

2019-11-28 15:45:42 +0000

[diff] [blame]

20

#include <armnn/backends/IBackendContext.hpp>

21

#include <armnn/backends/IMemoryManager.hpp>

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

22

Jan Eilers

3c9e045

2020-04-10 13:00:44 +0100

[diff] [blame]

23

#include <armnn/utility/PolymorphicDowncast.hpp>

24

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

25

#include "workloads/NeonAdditionWorkload.hpp"

26

#include "workloads/NeonBatchNormalizationWorkload.hpp"

27

#include "workloads/NeonConvolution2dWorkload.hpp"

28

#include "workloads/NeonDepthwiseConvolutionWorkload.hpp"

29

#include "workloads/NeonDivisionWorkload.hpp"

30

#include "workloads/NeonFullyConnectedWorkload.hpp"

31

#include "workloads/NeonMultiplicationWorkload.hpp"

32

#include "workloads/NeonSubtractionWorkload.hpp"

33

David Beck

263e349

2018-11-09 14:46:40 +0000

[diff] [blame]

34

#include <Optimizer.hpp>

arovir01

a094479

2018-10-11 15:00:58 +0100

[diff] [blame]

35

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

36

#include <arm_compute/core/Types.h>

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

37

#include <arm_compute/runtime/Allocator.h>

38

arovir01

2018-10-04 10:46:04 +0100

[diff] [blame]

namespace armnn

{

David Beck

2018-10-12 10:38:31 +0100

[diff] [blame]

42

const BackendId& NeonBackend::GetIdStatic()

arovir01

2018-10-04 10:46:04 +0100

[diff] [blame]

43

{

David Beck

3e9e115

2018-10-17 14:17:50 +0100

[diff] [blame]

44

static const BackendId s_Id{NeonBackendId()};

arovir01

2018-10-04 10:46:04 +0100

[diff] [blame]

return s_Id;

}

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

48

IBackendInternal::IMemoryManagerUniquePtr NeonBackend::CreateMemoryManager() const

arovir01

2018-10-04 10:46:04 +0100

[diff] [blame]

49

{

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

50

return std::make_unique<NeonMemoryManager>(std::make_unique<arm_compute::Allocator>(),

Sadik Armagan

13a9fa6

2019-04-26 16:04:34 +0100

[diff] [blame]

51

BaseMemoryManager::MemoryAffinity::Offset);

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

52

}

53

54

IBackendInternal::IWorkloadFactoryPtr NeonBackend::CreateWorkloadFactory(

55

const IBackendInternal::IMemoryManagerSharedPtr& memoryManager) const

56

{

57

return std::make_unique<NeonWorkloadFactory>(

Jan Eilers

3c9e045

2020-04-10 13:00:44 +0100

[diff] [blame]

58

PolymorphicPointerDowncast<NeonMemoryManager>(memoryManager));

arovir01

2018-10-04 10:46:04 +0100

[diff] [blame]

59

}

60

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

61

IBackendInternal::IWorkloadFactoryPtr NeonBackend::CreateWorkloadFactory(

Sadik Armagan

04a7297

2020-09-14 15:44:18 +0100

[diff] [blame]

62

const IBackendInternal::IMemoryManagerSharedPtr& memoryManager, const ModelOptions& modelOptions) const

63

{

64

return std::make_unique<NeonWorkloadFactory>(

65

PolymorphicPointerDowncast<NeonMemoryManager>(memoryManager), CreateBackendSpecificModelContext(modelOptions));

66

}

67

68

IBackendInternal::IWorkloadFactoryPtr NeonBackend::CreateWorkloadFactory(

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

69

class TensorHandleFactoryRegistry& tensorHandleFactoryRegistry) const

70

{

71

auto memoryManager = std::make_shared<NeonMemoryManager>(std::make_unique<arm_compute::Allocator>(),

72

BaseMemoryManager::MemoryAffinity::Offset);

73

74

tensorHandleFactoryRegistry.RegisterMemoryManager(memoryManager);

Narumol Prangnawarat

549cb7a

2020-07-10 17:50:53 +0100

[diff] [blame]

75

tensorHandleFactoryRegistry.RegisterFactory(std::make_unique<NeonTensorHandleFactory>(memoryManager));

76

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

77

return std::make_unique<NeonWorkloadFactory>(

Jan Eilers

3c9e045

2020-04-10 13:00:44 +0100

[diff] [blame]

78

PolymorphicPointerDowncast<NeonMemoryManager>(memoryManager));

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

79

}

80

Sadik Armagan

04a7297

2020-09-14 15:44:18 +0100

[diff] [blame]

81

IBackendInternal::IWorkloadFactoryPtr NeonBackend::CreateWorkloadFactory(

82

TensorHandleFactoryRegistry& tensorHandleFactoryRegistry, const ModelOptions& modelOptions) const

83

{

84

auto memoryManager = std::make_shared<NeonMemoryManager>(std::make_unique<arm_compute::Allocator>(),

85

BaseMemoryManager::MemoryAffinity::Offset);

86

87

tensorHandleFactoryRegistry.RegisterMemoryManager(memoryManager);

88

tensorHandleFactoryRegistry.RegisterFactory(std::make_unique<NeonTensorHandleFactory>(memoryManager));

89

90

return std::make_unique<NeonWorkloadFactory>(

91

PolymorphicPointerDowncast<NeonMemoryManager>(memoryManager), CreateBackendSpecificModelContext(modelOptions));

92

}

93

David Beck

263e349

2018-11-09 14:46:40 +0000

[diff] [blame]

94

IBackendInternal::IBackendContextPtr NeonBackend::CreateBackendContext(const IRuntime::CreationOptions&) const

95

{

96

return IBackendContextPtr{};

97

}

98

Colm Donelan

e49755b

2020-01-29 15:22:43 +0000

[diff] [blame]

99

IBackendInternal::IBackendProfilingContextPtr NeonBackend::CreateBackendProfilingContext(

Colm Donelan

1aff393

2020-02-05 17:48:59 +0000

[diff] [blame]

100

const IRuntime::CreationOptions&, IBackendProfilingPtr&)

Colm Donelan

e49755b

2020-01-29 15:22:43 +0000

[diff] [blame]

101

{

102

return IBackendProfilingContextPtr{};

103

}

104

David Beck

263e349

2018-11-09 14:46:40 +0000

[diff] [blame]

105

IBackendInternal::Optimizations NeonBackend::GetOptimizations() const

106

{

107

return Optimizations{};

108

}

109

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

110

IBackendInternal::IBackendSpecificModelContextPtr NeonBackend::CreateBackendSpecificModelContext(

111

const ModelOptions& modelOptions) const

112

{

113

return IBackendSpecificModelContextPtr{new NeonBackendModelContext{modelOptions}};

114

}

115

David Beck

111b5d9

2018-11-12 14:59:37 +0000

[diff] [blame]

116

IBackendInternal::ILayerSupportSharedPtr NeonBackend::GetLayerSupport() const

117

{

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

118

static ILayerSupportSharedPtr layerSupport

119

{

120

new NeonLayerSupport(IBackendInternal::IBackendSpecificModelContextPtr{})

};

return layerSupport;

}

IBackendInternal::ILayerSupportSharedPtr NeonBackend::GetLayerSupport(const ModelOptions& modelOptions) const

126

{

127

static ILayerSupportSharedPtr layerSupport

128

{

129

new NeonLayerSupport(CreateBackendSpecificModelContext(modelOptions))

130

};

David Beck

111b5d9

2018-11-12 14:59:37 +0000

[diff] [blame]

return layerSupport;

}

Matteo Martincigh

2019-05-22 14:28:16 +0100

[diff] [blame]

134

OptimizationViews NeonBackend::OptimizeSubgraphView(const SubgraphView& subgraph) const

Matteo Martincigh

adddddb

2019-01-24 14:06:23 +0000

[diff] [blame]

135

{

Matteo Martincigh

c3ba50e

2019-05-22 14:28:16 +0100

[diff] [blame]

136

OptimizationViews optimizationViews;

Matteo Martincigh

adddddb

2019-01-24 14:06:23 +0000

[diff] [blame]

137

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

138

auto it = subgraph.end();

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

139

std::map<LayerGuid, Layer*> untouched;

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

140

141

while (it != subgraph.begin())

142

{

143

--it;

144

Layer& base = **it;

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

145

untouched.insert({base.GetGuid(), &base});

}

it = subgraph.end();

while (it != subgraph.begin())

150

{

151

--it;

152

Layer& base = **it;

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

153

154

if ((base.GetType() == LayerType::DepthwiseConvolution2d || base.GetType() == LayerType::Convolution2d

155

|| base.GetType() == LayerType::BatchNormalization || base.GetType() == LayerType::FullyConnected

156

|| base.GetType() == LayerType::Addition || base.GetType() == LayerType::Multiplication

157

|| base.GetType() == LayerType::Subtraction || base.GetType() == LayerType::Division)

158

&& (base.GetAdditionalInformation<ActivationDescriptor>() == nullptr))

159

{

160

for (auto output = base.BeginOutputSlots(); output != base.EndOutputSlots(); ++output)

161

{

162

if (output->GetNumConnections() == 1)

163

{

164

for (auto&& childInput : output->GetConnections())

165

{

Teresa Charlin

d672f5d

2021-01-18 18:07:57 +0000

[diff] [blame]

166

if ((childInput->GetOwningLayer().GetType() == LayerType::Activation) &&

167

(checkDataTypeInputandOutput(childInput->GetOwningLayer())))

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

168

{

169

Layer& child = childInput->GetOwningLayer();

170

171

auto* activationLayer = PolymorphicDowncast<ActivationLayer*>(&child);

172

173

const std::string name = std::string("fused-") + child.GetName() + std::string("-into-") +

174

base.GetName();

175

176

// Get params from activation layer

177

ActivationDescriptor activationDesc = activationLayer->GetParameters();

178

179

if (base.GetType() == LayerType::Convolution2d)

180

{

181

Convolution2dLayer* baseLayer = PolymorphicDowncast<Convolution2dLayer*>(&base);

182

183

Optional<TensorInfo> biases;

184

185

if (baseLayer->GetParameters().m_BiasEnabled)

186

{

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

187

biases = baseLayer->m_Bias->GetTensorInfo();

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

188

}

189

190

arm_compute::Status status = NeonConvolution2dWorkloadValidate(

191

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

192

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

193

baseLayer->GetParameters(),

194

baseLayer->m_Weight->GetTensorInfo(),

biases,

false,

&activationDesc);

if (status)

{

FuseLayerWithWeightsAndBiases<Convolution2dLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

206

untouched.erase(baseLayer->GetGuid());

207

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

208

}

209

}

210

else if (base.GetType() == LayerType::DepthwiseConvolution2d)

211

{

212

DepthwiseConvolution2dLayer* baseLayer =

213

PolymorphicDowncast<DepthwiseConvolution2dLayer*>(&base);

214

215

Optional<TensorInfo> biases;

216

217

if (baseLayer->GetParameters().m_BiasEnabled)

218

{

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

219

biases = baseLayer->m_Bias->GetTensorInfo();

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

220

}

221

222

arm_compute::Status status = NeonDepthwiseConvolutionWorkloadValidate(

223

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

224

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

225

baseLayer->GetParameters(),

226

baseLayer->m_Weight->GetTensorInfo(),

biases,

&activationDesc);

if (status)

{

FuseLayerWithWeightsAndBiases<DepthwiseConvolution2dLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

237

untouched.erase(baseLayer->GetGuid());

238

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

239

}

240

}

241

else if (base.GetType() == LayerType::FullyConnected)

242

{

243

FullyConnectedLayer* baseLayer = PolymorphicDowncast<FullyConnectedLayer*>(&base);

244

245

arm_compute::Status status = NeonFullyConnectedWorkloadValidate(

246

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

247

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

248

baseLayer->m_Weight->GetTensorInfo(),

249

baseLayer->m_Bias->GetTensorInfo(),

250

baseLayer->GetParameters(),

&activationDesc);

if (status)

{

FuseLayerWithWeightsAndBiases<FullyConnectedLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

260

untouched.erase(baseLayer->GetGuid());

261

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

262

}

263

}

264

else if (base.GetType() == LayerType::BatchNormalization)

265

{

266

BatchNormalizationLayer* baseLayer =

267

PolymorphicDowncast<BatchNormalizationLayer*>(&base);

268

269

arm_compute::Status status = NeonBatchNormalizationValidate(

270

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

271

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

272

baseLayer->m_Mean->GetTensorInfo(),

273

baseLayer->m_Variance->GetTensorInfo(),

274

baseLayer->m_Beta->GetTensorInfo(),

275

baseLayer->m_Gamma->GetTensorInfo(),

276

baseLayer->GetParameters(),

&activationDesc);

if (status)

{

BatchNormalizationLayer* replacementLayer =

282

FuseLayerWithParameters<BatchNormalizationLayer>(

optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

replacementLayer->m_Beta = std::move(baseLayer->m_Beta);

290

replacementLayer->m_Gamma = std::move(baseLayer->m_Gamma);

291

replacementLayer->m_Mean = std::move(baseLayer->m_Mean);

292

replacementLayer->m_Variance = std::move(baseLayer->m_Variance);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

293

untouched.erase(baseLayer->GetGuid());

294

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

295

}

296

}

297

else if (base.GetType() == LayerType::Addition)

298

{

299

AdditionLayer* baseLayer = PolymorphicDowncast<AdditionLayer*>(&base);

300

301

arm_compute::Status status = NeonAdditionWorkloadValidate(

302

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

303

baseLayer->GetInputSlot(1).GetConnectedOutputSlot()->GetTensorInfo(),

304

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

&activationDesc);

if (status)

{

FuseLayerWithoutParameters<AdditionLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

314

untouched.erase(baseLayer->GetGuid());

315

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

316

}

317

}

318

else if (base.GetType() == LayerType::Division)

319

{

320

DivisionLayer* baseLayer = PolymorphicDowncast<DivisionLayer*>(&base);

321

322

arm_compute::Status status = NeonDivisionWorkloadValidate(

323

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

324

baseLayer->GetInputSlot(1).GetConnectedOutputSlot()->GetTensorInfo(),

325

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

&activationDesc);

if (status)

{

FuseLayerWithoutParameters<DivisionLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

335

untouched.erase(baseLayer->GetGuid());

336

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

337

}

338

}

339

else if (base.GetType() == LayerType::Multiplication)

340

{

341

MultiplicationLayer* baseLayer = PolymorphicDowncast<MultiplicationLayer*>(&base);

342

343

arm_compute::Status status = NeonMultiplicationWorkloadValidate(

344

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

345

baseLayer->GetInputSlot(1).GetConnectedOutputSlot()->GetTensorInfo(),

346

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

&activationDesc);

if (status)

{

FuseLayerWithoutParameters<MultiplicationLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

356

untouched.erase(baseLayer->GetGuid());

357

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

358

}

359

}

360

else if (base.GetType() == LayerType::Subtraction)

361

{

362

SubtractionLayer* baseLayer = PolymorphicDowncast<SubtractionLayer*>(&base);

363

364

arm_compute::Status status = NeonSubtractionWorkloadValidate(

365

baseLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

366

baseLayer->GetInputSlot(1).GetConnectedOutputSlot()->GetTensorInfo(),

367

activationLayer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo(),

&activationDesc);

if (status)

{

FuseLayerWithoutParameters<SubtractionLayer>(optimizationViews,

baseLayer,

activationLayer,

activationDesc,

name);

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

377

untouched.erase(baseLayer->GetGuid());

378

untouched.erase(activationLayer->GetGuid());

Mike Kelly

2020-11-12 10:58:48 +0000

[diff] [blame]

}

}

}

}

}

}

}

}

if (optimizationViews.GetSubstitutions().empty())

389

{

390

optimizationViews.AddUntouchedSubgraph(SubgraphView(subgraph));

391

}

Mike Kelly

2020-11-17 11:41:38 +0000

[diff] [blame]

392

else

393

{

394

ReportUntouchedLayers(optimizationViews, untouched);

395

}

Matteo Martincigh

c3ba50e

2019-05-22 14:28:16 +0100

[diff] [blame]

396

397

return optimizationViews;

Matteo Martincigh

adddddb

2019-01-24 14:06:23 +0000

[diff] [blame]

398

}

399

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

400

std::vector<ITensorHandleFactory::FactoryId> NeonBackend::GetHandleFactoryPreferences() const

401

{

Narumol Prangnawarat

265e53e

2020-10-30 16:06:55 +0000

[diff] [blame]

402

return std::vector<ITensorHandleFactory::FactoryId>() = { NeonTensorHandleFactory::GetIdStatic() };

Narumol Prangnawarat

2019-08-14 12:25:50 +0100

[diff] [blame]

403

}

404

405

void NeonBackend::RegisterTensorHandleFactories(class TensorHandleFactoryRegistry& registry)

406

{

407

auto memoryManager = std::make_shared<NeonMemoryManager>(std::make_unique<arm_compute::Allocator>(),

408

BaseMemoryManager::MemoryAffinity::Offset);

409

410

registry.RegisterMemoryManager(memoryManager);

Jan Eilers

e9f0f0f

2019-08-16 10:28:37 +0100

[diff] [blame]

411

registry.RegisterFactory(std::make_unique<NeonTensorHandleFactory>(memoryManager));

Narumol Prangnawarat