Blame - src/backends/neon/NeonWorkloadFactory.cpp - ml/armnn

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

5

David Beck

79141b9

2018-10-23 16:09:36 +0100

[diff] [blame]

6

#include "NeonBackendId.hpp"

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

7

#include "NeonBackendModelContext.hpp"

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

8

#include "NeonTensorHandle.hpp"

9

#include "NeonWorkloadFactory.hpp"

10

David Beck

0dbe0ee

2018-09-24 15:59:27 +0100

[diff] [blame]

11

#include <Layer.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

12

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

13

#include <armnn/Utils.hpp>

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

14

#include <armnn/utility/IgnoreUnused.hpp>

Matthew Sloyan

171214c

2020-09-09 09:07:37 +0100

[diff] [blame]

15

#include <armnn/utility/NumericCast.hpp>

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

16

#include <armnn/utility/PolymorphicDowncast.hpp>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

17

Aron Virginas-Tar

c9cc804

2018-11-01 16:15:57 +0000

[diff] [blame]

18

#include <backendsCommon/MakeWorkloadHelper.hpp>

Colm Donelan

0c47974

2021-12-10 12:43:54 +0000

[diff] [blame]

19

#include <armnn/backends/MemCopyWorkload.hpp>

Derek Lamberti

f674aa0

2019-08-01 15:56:25 +0100

[diff] [blame]

20

#include <backendsCommon/MemImportWorkload.hpp>

Colm Donelan

0c47974

2021-12-10 12:43:54 +0000

[diff] [blame]

21

#include <armnn/backends/TensorHandle.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

22

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

23

#include <neon/workloads/NeonWorkloadUtils.hpp>

24

#include <neon/workloads/NeonWorkloads.hpp>

25

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

namespace armnn

{

David Beck

2018-10-23 16:09:36 +0100

[diff] [blame]

29

namespace

30

{

31

static const BackendId s_Id{NeonBackendId()};

32

}

33

David Beck

29c75de

2018-10-23 13:35:58 +0100

[diff] [blame]

34

bool NeonWorkloadFactory::IsLayerSupported(const Layer& layer,

35

Optional<DataType> dataType,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

36

std::string& outReasonIfUnsupported)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

37

{

David Beck

79141b9

2018-10-23 16:09:36 +0100

[diff] [blame]

38

return IWorkloadFactory::IsLayerSupported(s_Id, layer, dataType, outReasonIfUnsupported);

39

}

40

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

41

bool NeonWorkloadFactory::IsLayerSupported(const IConnectableLayer& layer,

42

Optional<DataType> dataType,

43

std::string& outReasonIfUnsupported,

44

const ModelOptions& modelOptions)

45

{

46

return IWorkloadFactory::IsLayerSupported(s_Id, layer, dataType, outReasonIfUnsupported, modelOptions);

47

}

48

David Beck

79141b9

2018-10-23 16:09:36 +0100

[diff] [blame]

49

const BackendId& NeonWorkloadFactory::GetBackendId() const

50

{

51

return s_Id;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

52

}

53

Matthew Sloyan

0a7dc6b

2021-02-10 16:50:53 +0000

[diff] [blame]

54

void NeonWorkloadFactory::SetNumberOfThreads()

55

{

56

if (m_ModelContextPtr)

57

{

58

const unsigned int MIN_THREADS = 1;

59

const unsigned int MAX_THREADS = 64;

60

61

// Set the number of threads to be used if the user has set NumberOfThreads param

62

// Only set if within limit or valid input

63

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

64

auto numberOfThreads = modelOptions->GetNumberOfThreads();

65

66

if (numberOfThreads != 0 && numberOfThreads >= MIN_THREADS && numberOfThreads <= MAX_THREADS)

67

{

68

arm_compute::Scheduler::get().set_num_threads(numberOfThreads);

}

}

}

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

73

NeonWorkloadFactory::NeonWorkloadFactory(const std::shared_ptr<NeonMemoryManager>& memoryManager)

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

74

: m_MemoryManager(memoryManager), m_ModelContextPtr(IBackendInternal::IBackendSpecificModelContextPtr{})

75

{

Matthew Sloyan

0a7dc6b

2021-02-10 16:50:53 +0000

[diff] [blame]

76

SetNumberOfThreads();

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

77

}

78

79

NeonWorkloadFactory::NeonWorkloadFactory(const std::shared_ptr<NeonMemoryManager>& memoryManager,

80

const IBackendInternal::IBackendSpecificModelContextPtr& modelContextPtr)

81

: m_MemoryManager(memoryManager), m_ModelContextPtr(modelContextPtr)

surmeh01

3537c2c

2018-05-18 16:31:43 +0100

[diff] [blame]

82

{

Matthew Sloyan

0a7dc6b

2021-02-10 16:50:53 +0000

[diff] [blame]

83

SetNumberOfThreads();

surmeh01

3537c2c

2018-05-18 16:31:43 +0100

[diff] [blame]

84

}

85

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

86

std::unique_ptr<ITensorHandle> NeonWorkloadFactory::CreateSubTensorHandle(ITensorHandle& parent,

87

TensorShape const& subTensorShape,

88

unsigned int const* subTensorOrigin) const

89

{

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

90

const arm_compute::TensorShape shape = armcomputetensorutils::BuildArmComputeTensorShape(subTensorShape);

91

92

arm_compute::Coordinates coords;

93

coords.set_num_dimensions(subTensorShape.GetNumDimensions());

94

for (unsigned int i = 0; i < subTensorShape.GetNumDimensions(); i++)

95

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

96

// Arm compute indexes tensor coords in reverse order.

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

97

unsigned int revertedIndex = subTensorShape.GetNumDimensions() - i - 1;

Matthew Sloyan

171214c

2020-09-09 09:07:37 +0100

[diff] [blame]

98

coords.set(i, armnn::numeric_cast<int>(subTensorOrigin[revertedIndex]));

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

99

}

100

Derek Lamberti

0790dce

2019-04-15 18:37:35 +0100

[diff] [blame]

101

const arm_compute::TensorShape parentShape = armcomputetensorutils::BuildArmComputeTensorShape(parent.GetShape());

102

if (!::arm_compute::error_on_invalid_subtensor(__func__, __FILE__, __LINE__, parentShape, coords, shape))

{

return nullptr;

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

107

return std::make_unique<NeonSubTensorHandle>(

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

108

PolymorphicDowncast<IAclTensorHandle*>(&parent), shape, coords);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

109

}

110

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

111

std::unique_ptr<ITensorHandle> NeonWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,

112

const bool IsMemoryManaged) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

113

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

114

auto tensorHandle = std::make_unique<NeonTensorHandle>(tensorInfo);

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

115

if (IsMemoryManaged)

116

{

117

tensorHandle->SetMemoryGroup(m_MemoryManager->GetInterLayerMemoryGroup());

118

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

119

return tensorHandle;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

120

}

121

Francis Murtagh

351d13d

2018-09-24 15:01:18 +0100

[diff] [blame]

122

std::unique_ptr<ITensorHandle> NeonWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

123

DataLayout dataLayout,

124

const bool IsMemoryManaged) const

Francis Murtagh

351d13d

2018-09-24 15:01:18 +0100

[diff] [blame]

125

{

126

auto tensorHandle = std::make_unique<NeonTensorHandle>(tensorInfo, dataLayout);

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

127

if (IsMemoryManaged)

128

{

129

tensorHandle->SetMemoryGroup(m_MemoryManager->GetInterLayerMemoryGroup());

130

}

Francis Murtagh

351d13d

2018-09-24 15:01:18 +0100

[diff] [blame]

return tensorHandle;

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

134

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateWorkload(LayerType type,

135

const QueueDescriptor& descriptor,

136

const WorkloadInfo& info) const

{

switch(type)

{

case LayerType::Activation :

141

{

142

auto activationQueueDescriptor = PolymorphicDowncast<const ActivationQueueDescriptor*>(&descriptor);

143

return std::make_unique<NeonActivationWorkload>(*activationQueueDescriptor, info);

144

}

145

case LayerType::Addition :

146

{

147

auto additionQueueDescriptor = PolymorphicDowncast<const AdditionQueueDescriptor*>(&descriptor);

148

return std::make_unique<NeonAdditionWorkload>(*additionQueueDescriptor, info);

149

}

150

case LayerType::ArgMinMax :

151

{

152

auto argMinMaxQueueDescriptor = PolymorphicDowncast<const ArgMinMaxQueueDescriptor*>(&descriptor);

153

return std::make_unique<NeonArgMinMaxWorkload>(*argMinMaxQueueDescriptor, info);

154

}

Teresa Charlin

0f86ecf

2022-10-13 15:47:08 +0100

[diff] [blame]

155

case LayerType::BatchMatMul :

156

{

157

auto batchMatMulQueueDescriptor = PolymorphicDowncast<const BatchMatMulQueueDescriptor*>(&descriptor);

Teresa Charlin

1fe6c81

2022-11-01 15:59:50 +0000

[diff] [blame]

158

bool isFastMathEnabled = false;

159

if (m_ModelContextPtr)

160

{

161

if (m_ModelContextPtr.get() != nullptr)

162

{

163

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

164

if (modelOptions)

165

{

166

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonBatchMatMulWorkload>(*batchMatMulQueueDescriptor, info, isFastMathEnabled);

Teresa Charlin

0f86ecf

2022-10-13 15:47:08 +0100

[diff] [blame]

171

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

172

case LayerType::BatchNormalization :

173

{

174

auto batchNormalizationQueueDescriptor

175

= PolymorphicDowncast<const BatchNormalizationQueueDescriptor*>(&descriptor);

176

return std::make_unique<NeonBatchNormalizationWorkload>(*batchNormalizationQueueDescriptor, info);

177

}

178

case LayerType::BatchToSpaceNd :

179

{

180

auto batchToSpaceNdQueueDescriptor

181

= PolymorphicDowncast<const BatchToSpaceNdQueueDescriptor*>(&descriptor);

182

return std::make_unique<NeonBatchToSpaceNdWorkload>(*batchToSpaceNdQueueDescriptor, info);

183

}

184

case LayerType::Cast :

185

{

186

auto castQueueDescriptor = PolymorphicDowncast<const CastQueueDescriptor*>(&descriptor);

187

return std::make_unique<NeonCastWorkload>(*castQueueDescriptor, info);

188

}

189

case LayerType::ChannelShuffle :

190

{

191

auto channelShuffleQueueDescriptor = PolymorphicDowncast<const ChannelShuffleQueueDescriptor*>(&descriptor);

192

return std::make_unique<NeonChannelShuffleWorkload>(*channelShuffleQueueDescriptor, info);

193

}

194

case LayerType::Comparison :

195

{

196

auto comparisonQueueDescriptor = PolymorphicDowncast<const ComparisonQueueDescriptor*>(&descriptor);

197

return std::make_unique<NeonComparisonWorkload>(*comparisonQueueDescriptor, info);

198

}

199

case LayerType::Concat :

200

{

201

auto concatQueueDescriptor = PolymorphicDowncast<const ConcatQueueDescriptor*>(&descriptor);

202

return std::make_unique<NeonConcatWorkload>(*concatQueueDescriptor, info);

203

}

204

case LayerType::Constant :

205

{

206

auto constantQueueDescriptor = PolymorphicDowncast<const ConstantQueueDescriptor*>(&descriptor);

207

return std::make_unique<NeonConstantWorkload>(*constantQueueDescriptor, info);

208

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

209

case LayerType::ConvertFp16ToFp32 :

210

{

211

auto convertFp16ToFp32QueueDescriptor

212

= PolymorphicDowncast<const ConvertFp16ToFp32QueueDescriptor*>(&descriptor);

213

return std::make_unique<NeonConvertFp16ToFp32Workload>(*convertFp16ToFp32QueueDescriptor, info);

214

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

215

case LayerType::ConvertFp32ToFp16 :

216

{

217

auto convertFp32ToFp16QueueDescriptor

218

= PolymorphicDowncast<const ConvertFp32ToFp16QueueDescriptor*>(&descriptor);

219

return std::make_unique<NeonConvertFp32ToFp16Workload>(*convertFp32ToFp16QueueDescriptor, info);

220

}

221

case LayerType::Convolution2d :

222

{

223

auto convolution2dQueueDescriptor = PolymorphicDowncast<const Convolution2dQueueDescriptor*>(&descriptor);

224

225

bool isFastMathEnabled = false;

226

if (m_ModelContextPtr)

227

{

228

if (m_ModelContextPtr.get() != nullptr)

229

{

230

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

231

if (modelOptions)

232

{

233

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution2dWorkload>(*convolution2dQueueDescriptor,

238

info,

239

m_MemoryManager->GetIntraLayerManager(),

240

isFastMathEnabled);

241

}

242

case LayerType::Convolution3d :

243

{

244

auto convolution3dQueueDescriptor = PolymorphicDowncast<const Convolution3dQueueDescriptor*>(&descriptor);

245

246

bool isFastMathEnabled = false;

247

if (m_ModelContextPtr)

248

{

249

if (m_ModelContextPtr.get() != nullptr)

250

{

251

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

252

if (modelOptions)

253

{

254

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution3dWorkload>(*convolution3dQueueDescriptor,

259

info,

260

m_MemoryManager->GetIntraLayerManager(),

261

isFastMathEnabled);

262

}

263

case LayerType::Debug :

264

{

265

auto debugQueueDescriptor = PolymorphicDowncast<const DebugQueueDescriptor*>(&descriptor);

266

return MakeWorkloadHelper<NullWorkload, NullWorkload>(*debugQueueDescriptor, info);

267

}

268

case LayerType::DepthToSpace :

269

{

270

auto depthToSpaceQueueDescriptor = PolymorphicDowncast<const DepthToSpaceQueueDescriptor*>(&descriptor);

271

return std::make_unique<NeonDepthToSpaceWorkload>(*depthToSpaceQueueDescriptor, info);

272

}

273

case LayerType::DepthwiseConvolution2d :

274

{

275

auto depthwiseConvolution2dQueueDescriptor

276

= PolymorphicDowncast<const DepthwiseConvolution2dQueueDescriptor*>(&descriptor);

277

return std::make_unique<NeonDepthwiseConvolutionWorkload>(*depthwiseConvolution2dQueueDescriptor, info);

278

}

279

case LayerType::Dequantize :

280

{

281

auto dequantizeQueueDescriptor = PolymorphicDowncast<const DequantizeQueueDescriptor*>(&descriptor);

282

return std::make_unique<NeonDequantizeWorkload>(*dequantizeQueueDescriptor, info);

283

}

284

case LayerType::DetectionPostProcess :

285

{

286

auto detectionPostProcessQueueDescriptor

287

= PolymorphicDowncast<const DetectionPostProcessQueueDescriptor*>(&descriptor);

288

return MakeWorkloadHelper<NullWorkload, NullWorkload>(*detectionPostProcessQueueDescriptor, info);

289

}

290

case LayerType::Division :

291

{

292

auto divisionQueueDescriptor = PolymorphicDowncast<const DivisionQueueDescriptor*>(&descriptor);

293

return std::make_unique<NeonDivisionWorkload>(*divisionQueueDescriptor, info);

294

}

Mike Kelly

3ec3077

2023-03-08 13:47:17 +0000

[diff] [blame]

295

case LayerType::ElementwiseBinary :

296

{

297

auto elementwiseBinaryQueueDescriptor

298

= PolymorphicDowncast<const ElementwiseBinaryQueueDescriptor*>(&descriptor);

299

300

switch (elementwiseBinaryQueueDescriptor->m_Parameters.m_Operation)

301

{

302

case BinaryOperation::Add:

303

{

304

AdditionQueueDescriptor additionQueueDescriptor;

305

additionQueueDescriptor.m_Inputs = descriptor.m_Inputs;

306

additionQueueDescriptor.m_Outputs = descriptor.m_Outputs;

307

return std::make_unique<NeonAdditionWorkload>(additionQueueDescriptor, info);

308

}

309

case BinaryOperation::Div:

310

{

311

DivisionQueueDescriptor divisionQueueDescriptor;

312

divisionQueueDescriptor.m_Inputs = descriptor.m_Inputs;

313

divisionQueueDescriptor.m_Outputs = descriptor.m_Outputs;

314

return std::make_unique<NeonDivisionWorkload>(divisionQueueDescriptor, info);

315

}

316

case BinaryOperation::Maximum:

317

{

318

MaximumQueueDescriptor maximumQueueDescriptor;

319

maximumQueueDescriptor.m_Inputs = descriptor.m_Inputs;

320

maximumQueueDescriptor.m_Outputs = descriptor.m_Outputs;

321

return std::make_unique<NeonMaximumWorkload>(maximumQueueDescriptor, info);

322

}

323

case BinaryOperation::Minimum:

324

{

325

MinimumQueueDescriptor minimumQueueDescriptor;

326

minimumQueueDescriptor.m_Inputs = descriptor.m_Inputs;

327

minimumQueueDescriptor.m_Outputs = descriptor.m_Outputs;

328

return std::make_unique<NeonMinimumWorkload>(minimumQueueDescriptor, info);

329

}

330

case BinaryOperation::Mul:

331

{

332

MultiplicationQueueDescriptor multiplicationQueueDescriptor;

333

multiplicationQueueDescriptor.m_Inputs = descriptor.m_Inputs;

334

multiplicationQueueDescriptor.m_Outputs = descriptor.m_Outputs;

335

return std::make_unique<NeonMultiplicationWorkload>(multiplicationQueueDescriptor, info);

336

}

John Mcloughlin

34c1c38

2023-05-17 15:08:36 +0100

[diff] [blame^]

337

case BinaryOperation::Power:

338

case BinaryOperation::SqDiff:

339

{

340

return std::make_unique<NeonElementwiseBinaryWorkload>(*elementwiseBinaryQueueDescriptor, info);

341

}

Mike Kelly

3ec3077

2023-03-08 13:47:17 +0000

[diff] [blame]

342

case BinaryOperation::Sub:

343

{

344

SubtractionQueueDescriptor subtractionQueueDescriptor;

345

subtractionQueueDescriptor.m_Inputs = descriptor.m_Inputs;

346

subtractionQueueDescriptor.m_Outputs = descriptor.m_Outputs;

347

return std::make_unique<NeonSubtractionWorkload>(subtractionQueueDescriptor, info);

}

default:

return nullptr;

}

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

353

case LayerType::ElementwiseUnary :

354

{

355

auto elementwiseUnaryQueueDescriptor

356

= PolymorphicDowncast<const ElementwiseUnaryQueueDescriptor*>(&descriptor);

357

358

switch(elementwiseUnaryQueueDescriptor->m_Parameters.m_Operation)

359

{

360

case UnaryOperation::Abs:

361

{

362

AbsQueueDescriptor absQueueDescriptor;

363

absQueueDescriptor.m_Inputs = elementwiseUnaryQueueDescriptor->m_Inputs;

364

absQueueDescriptor.m_Outputs = elementwiseUnaryQueueDescriptor->m_Outputs;

365

366

return std::make_unique<NeonAbsWorkload>(absQueueDescriptor, info);

367

}

368

case UnaryOperation::Exp:

369

return std::make_unique<NeonExpWorkload>(*elementwiseUnaryQueueDescriptor, info);

370

case UnaryOperation::LogicalNot:

371

return std::make_unique<NeonLogicalNotWorkload>(*elementwiseUnaryQueueDescriptor, info);

372

case UnaryOperation::Log:

373

return std::make_unique<NeonLogWorkload>(*elementwiseUnaryQueueDescriptor, info);

374

case UnaryOperation::Neg:

375

return std::make_unique<NeonNegWorkload>(*elementwiseUnaryQueueDescriptor, info);

376

case UnaryOperation::Rsqrt:

377

{

378

RsqrtQueueDescriptor rsqrtQueueDescriptor;

379

rsqrtQueueDescriptor.m_Inputs = elementwiseUnaryQueueDescriptor->m_Inputs;

380

rsqrtQueueDescriptor.m_Outputs = elementwiseUnaryQueueDescriptor->m_Outputs;

381

382

return std::make_unique<NeonRsqrtWorkload>(rsqrtQueueDescriptor, info);

383

}

384

case UnaryOperation::Sin:

385

return std::make_unique<NeonSinWorkload>(*elementwiseUnaryQueueDescriptor, info);

Teresa Charlin

0302723

2022-05-09 17:27:08 +0100

[diff] [blame]

386

case UnaryOperation::Sqrt:

387

return std::make_unique<NeonSqrtWorkload>(*elementwiseUnaryQueueDescriptor, info);

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

default:

return nullptr;

}

}

case LayerType::Fill :

393

{

394

auto fillQueueDescriptor = PolymorphicDowncast<const FillQueueDescriptor*>(&descriptor);

395

return std::make_unique<NeonFillWorkload>(*fillQueueDescriptor, info);

396

}

397

case LayerType::Floor :

398

{

399

auto floorQueueDescriptor = PolymorphicDowncast<const FloorQueueDescriptor*>(&descriptor);

400

return MakeWorkloadHelper<NeonFloorFloatWorkload, NullWorkload>(*floorQueueDescriptor, info);

401

}

402

case LayerType::FullyConnected :

403

{

404

auto fullyConnectedQueueDescriptor = PolymorphicDowncast<const FullyConnectedQueueDescriptor*>(&descriptor);

405

return std::make_unique<NeonFullyConnectedWorkload>(*fullyConnectedQueueDescriptor,

406

info,

407

m_MemoryManager->GetIntraLayerManager());

408

}

409

case LayerType::Gather :

410

{

411

auto gatherQueueDescriptor = PolymorphicDowncast<const GatherQueueDescriptor*>(&descriptor);

412

return std::make_unique<NeonGatherWorkload>(*gatherQueueDescriptor, info);

413

}

Teresa Charlin

bd22c7d

2022-04-26 18:14:12 +0100

[diff] [blame]

414

case LayerType::GatherNd :

415

{

416

auto gatherNdQueueDescriptor = PolymorphicDowncast<const GatherNdQueueDescriptor*>(&descriptor);

417

return std::make_unique<NeonGatherNdWorkload>(*gatherNdQueueDescriptor, info);

418

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

419

case LayerType::Input :

420

{

421

auto inputQueueDescriptor = PolymorphicDowncast<const InputQueueDescriptor*>(&descriptor);

422

return std::make_unique<CopyMemGenericWorkload>(*inputQueueDescriptor, info);

423

}

424

case LayerType::InstanceNormalization :

425

{

426

auto instanceNormalizationQueueDescriptor

427

= PolymorphicDowncast<const InstanceNormalizationQueueDescriptor*>(&descriptor);

428

return std::make_unique<NeonInstanceNormalizationWorkload>(*instanceNormalizationQueueDescriptor, info);

429

}

430

case LayerType::L2Normalization :

431

{

432

auto l2NormalizationQueueDescriptor

433

= PolymorphicDowncast<const L2NormalizationQueueDescriptor*>(&descriptor);

434

return MakeWorkloadHelper<NeonL2NormalizationFloatWorkload, NullWorkload>

435

(*l2NormalizationQueueDescriptor, info, m_MemoryManager->GetIntraLayerManager());

436

}

437

case LayerType::LogSoftmax :

438

{

439

auto logSoftmaxQueueDescriptor = PolymorphicDowncast<const LogSoftmaxQueueDescriptor*>(&descriptor);

440

return std::make_unique<NeonLogSoftmaxWorkload>(*logSoftmaxQueueDescriptor,

441

info,

442

m_MemoryManager->GetIntraLayerManager());

443

}

444

case LayerType::LogicalBinary :

445

{

446

auto logicalBinaryQueueDescriptor = PolymorphicDowncast<const LogicalBinaryQueueDescriptor*>(&descriptor);

447

448

switch(logicalBinaryQueueDescriptor->m_Parameters.m_Operation)

449

{

450

case LogicalBinaryOperation::LogicalAnd:

451

return std::make_unique<NeonLogicalAndWorkload>(*logicalBinaryQueueDescriptor, info);

452

case LogicalBinaryOperation::LogicalOr:

453

return std::make_unique<NeonLogicalOrWorkload>(*logicalBinaryQueueDescriptor, info);

default:

return nullptr;

}

}

case LayerType::Lstm :

459

{

460

auto lstmQueueDescriptor = PolymorphicDowncast<const LstmQueueDescriptor*>(&descriptor);

461

return MakeWorkloadHelper<NeonLstmFloatWorkload, NullWorkload>(*lstmQueueDescriptor, info);

462

}

463

case LayerType::Maximum :

464

{

465

auto maximumQueueDescriptor = PolymorphicDowncast<const MaximumQueueDescriptor*>(&descriptor);

466

return std::make_unique<NeonMaximumWorkload>(*maximumQueueDescriptor, info);

467

}

468

case LayerType::Mean :

469

{

470

auto meanQueueDescriptor = PolymorphicDowncast<const MeanQueueDescriptor*>(&descriptor);

471

return std::make_unique<NeonMeanWorkload>(*meanQueueDescriptor, info);

472

}

473

case LayerType::MemCopy :

474

{

475

auto memCopyQueueDescriptor = PolymorphicDowncast<const MemCopyQueueDescriptor*>(&descriptor);

476

if (memCopyQueueDescriptor->m_Inputs.empty() || !memCopyQueueDescriptor->m_Inputs[0])

477

{

478

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemCopy workload");

479

}

480

return MakeWorkloadHelper<CopyMemGenericWorkload, CopyMemGenericWorkload>(*memCopyQueueDescriptor, info);

481

}

482

case LayerType::MemImport :

483

{

484

auto memImportQueueDescriptor = PolymorphicDowncast<const MemImportQueueDescriptor*>(&descriptor);

485

if (memImportQueueDescriptor->m_Inputs.empty() || !memImportQueueDescriptor->m_Inputs[0])

486

{

487

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemImport workload");

488

}

489

return std::make_unique<ImportMemGenericWorkload>(*memImportQueueDescriptor, info);

490

}

491

case LayerType::Minimum :

492

{

493

auto minimumQueueDescriptor = PolymorphicDowncast<const MinimumQueueDescriptor*>(&descriptor);

494

return std::make_unique<NeonMinimumWorkload>(*minimumQueueDescriptor, info);

495

}

496

case LayerType::Multiplication :

497

{

498

auto multiplicationQueueDescriptor = PolymorphicDowncast<const MultiplicationQueueDescriptor*>(&descriptor);

499

return std::make_unique<NeonMultiplicationWorkload>(*multiplicationQueueDescriptor, info);

500

}

501

case LayerType::Normalization :

502

{

503

auto normalizationQueueDescriptor = PolymorphicDowncast<const NormalizationQueueDescriptor*>(&descriptor);

504

return MakeWorkloadHelper<NeonNormalizationFloatWorkload, NullWorkload>

505

(*normalizationQueueDescriptor, info, m_MemoryManager->GetIntraLayerManager());

506

}

507

case LayerType::Output :

508

{

509

auto outputQueueDescriptor = PolymorphicDowncast<const OutputQueueDescriptor*>(&descriptor);

510

return std::make_unique<CopyMemGenericWorkload>(*outputQueueDescriptor, info);

511

}

512

case LayerType::Pad :

513

{

514

auto padQueueDescriptor = PolymorphicDowncast<const PadQueueDescriptor*>(&descriptor);

515

return std::make_unique<NeonPadWorkload>(*padQueueDescriptor, info);

516

}

517

case LayerType::Permute :

518

{

519

auto permuteQueueDescriptor = PolymorphicDowncast<const PermuteQueueDescriptor*>(&descriptor);

520

return std::make_unique<NeonPermuteWorkload>(*permuteQueueDescriptor, info);

521

}

522

case LayerType::Pooling2d :

523

{

524

auto pooling2dQueueDescriptor = PolymorphicDowncast<const Pooling2dQueueDescriptor*>(&descriptor);

525

return std::make_unique<NeonPooling2dWorkload>(*pooling2dQueueDescriptor, info);

526

}

Ryan OShea

19e7942

2022-05-04 00:38:03 +0100

[diff] [blame]

527

case LayerType::Pooling3d :

528

{

529

auto pooling3dQueueDescriptor = PolymorphicDowncast<const Pooling3dQueueDescriptor*>(&descriptor);

530

return std::make_unique<NeonPooling3dWorkload>(*pooling3dQueueDescriptor, info);

531

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

532

case LayerType::PreCompiled :

533

{

534

auto preCompiledQueueDescriptor = PolymorphicDowncast<const PreCompiledQueueDescriptor*>(&descriptor);

535

return MakeWorkloadHelper<NullWorkload, NullWorkload>(*preCompiledQueueDescriptor, info);

536

}

537

case LayerType::Prelu :

538

{

539

auto preluQueueDescriptor = PolymorphicDowncast<const PreluQueueDescriptor*>(&descriptor);

540

return std::make_unique<NeonPreluWorkload>(*preluQueueDescriptor, info);

541

}

542

case LayerType::QLstm :

543

{

544

auto qLstmQueueDescriptor = PolymorphicDowncast<const QLstmQueueDescriptor*>(&descriptor);

545

return std::make_unique<NeonQLstmWorkload>(*qLstmQueueDescriptor, info);

546

}

547

case LayerType::Quantize :

548

{

549

auto quantizeQueueDescriptor = PolymorphicDowncast<const QuantizeQueueDescriptor*>(&descriptor);

550

return std::make_unique<NeonQuantizeWorkload>(*quantizeQueueDescriptor, info);

551

}

552

case LayerType::QuantizedLstm :

553

{

554

auto quantizedLstmQueueDescriptor = PolymorphicDowncast<const QuantizedLstmQueueDescriptor*>(&descriptor);

555

return std::make_unique<NeonQuantizedLstmWorkload>(*quantizedLstmQueueDescriptor, info);

556

}

557

case LayerType::Rank :

558

{

559

auto rankQueueDescriptor = PolymorphicDowncast<const RankQueueDescriptor*>(&descriptor);

560

return std::make_unique<NeonRankWorkload>(*rankQueueDescriptor, info);

561

}

562

case LayerType::Reduce :

563

{

564

auto reduceQueueDescriptor = PolymorphicDowncast<const ReduceQueueDescriptor*>(&descriptor);

565

return std::make_unique<NeonReduceWorkload>(*reduceQueueDescriptor, info);

566

}

567

case LayerType::Reshape :

568

{

569

auto reshapeQueueDescriptor = PolymorphicDowncast<const ReshapeQueueDescriptor*>(&descriptor);

570

return std::make_unique<NeonReshapeWorkload>(*reshapeQueueDescriptor, info);

571

}

572

case LayerType::Resize :

573

{

574

auto resizeQueueDescriptor = PolymorphicDowncast<const ResizeQueueDescriptor*>(&descriptor);

575

return std::make_unique<NeonResizeWorkload>(*resizeQueueDescriptor, info);

576

}

577

case LayerType::Slice :

578

{

579

auto sliceQueueDescriptor = PolymorphicDowncast<const SliceQueueDescriptor*>(&descriptor);

580

return std::make_unique<NeonSliceWorkload>(*sliceQueueDescriptor, info);

581

}

582

case LayerType::Softmax :

583

{

584

auto softmaxQueueDescriptor = PolymorphicDowncast<const SoftmaxQueueDescriptor*>(&descriptor);

585

return std::make_unique<NeonSoftmaxWorkload>(*softmaxQueueDescriptor,

586

info,

587

m_MemoryManager->GetIntraLayerManager());

588

}

589

case LayerType::SpaceToBatchNd :

590

{

591

auto spaceToBatchNdQueueDescriptor

592

= PolymorphicDowncast<const SpaceToBatchNdQueueDescriptor*>(&descriptor);

593

return std::make_unique<NeonSpaceToBatchNdWorkload>(*spaceToBatchNdQueueDescriptor, info);

594

}

595

case LayerType::SpaceToDepth :

596

{

597

auto spaceToDepthQueueDescriptor = PolymorphicDowncast<const SpaceToDepthQueueDescriptor*>(&descriptor);

598

return std::make_unique<NeonSpaceToDepthWorkload>(*spaceToDepthQueueDescriptor, info);

599

}

600

case LayerType::Splitter :

601

{

602

auto splitterQueueDescriptor = PolymorphicDowncast<const SplitterQueueDescriptor*>(&descriptor);

603

return std::make_unique<NeonSplitterWorkload>(*splitterQueueDescriptor, info);

604

}

605

case LayerType::Stack :

606

{

607

auto stackQueueDescriptor = PolymorphicDowncast<const StackQueueDescriptor*>(&descriptor);

608

return std::make_unique<NeonStackWorkload>(*stackQueueDescriptor, info);

609

}

610

case LayerType::StridedSlice :

611

{

612

auto stridedSliceQueueDescriptor = PolymorphicDowncast<const StridedSliceQueueDescriptor*>(&descriptor);

613

return std::make_unique<NeonStridedSliceWorkload>(*stridedSliceQueueDescriptor, info);

614

}

615

case LayerType::Subtraction :

616

{

617

auto subtractionQueueDescriptor = PolymorphicDowncast<const SubtractionQueueDescriptor*>(&descriptor);

618

return std::make_unique<NeonSubtractionWorkload>(*subtractionQueueDescriptor, info);

619

}

620

case LayerType::Transpose :

621

{

622

auto transposeQueueDescriptor = PolymorphicDowncast<const TransposeQueueDescriptor*>(&descriptor);

623

return std::make_unique<NeonTransposeWorkload>(*transposeQueueDescriptor, info);

624

}

625

case LayerType::TransposeConvolution2d :

626

{

627

auto transposeConvolution2dQueueDescriptor

628

= PolymorphicDowncast<const TransposeConvolution2dQueueDescriptor*>(&descriptor);

629

return std::make_unique<NeonTransposeConvolution2dWorkload>(*transposeConvolution2dQueueDescriptor,

630

info,

631

m_MemoryManager->GetIntraLayerManager());

632

}

Cathal Corbett

fd5bec4

2022-03-03 15:13:23 +0000

[diff] [blame]

633

case LayerType::UnidirectionalSequenceLstm :

634

{

635

auto desc = PolymorphicDowncast<const UnidirectionalSequenceLstmQueueDescriptor*>(&descriptor);

Mike Kelly

1299496

2022-04-21 11:57:09 +0100

[diff] [blame]

636

637

if ((info.m_InputTensorInfos[0].GetDataType() == armnn::DataType::Float32) &&

638

(info.m_InputTensorInfos[1].GetDataType() == armnn::DataType::Float32) &&

639

(info.m_InputTensorInfos[2].GetDataType() == armnn::DataType::Float32) &&

640

(info.m_OutputTensorInfos[0].GetDataType() == armnn::DataType::Float32) &&

641

(info.m_OutputTensorInfos[1].GetDataType() == armnn::DataType::Float32) &&

642

(info.m_OutputTensorInfos[2].GetDataType() == armnn::DataType::Float32))

643

{

644

return std::make_unique<NeonUnidirectionalSequenceLstmFloatWorkload>(*desc, info);

}

else

{

return std::make_unique<NeonUnidirectionalSequenceLstmWorkload>(*desc, info);

649

}

Cathal Corbett

fd5bec4

2022-03-03 15:13:23 +0000

[diff] [blame]

650

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

default:

return nullptr;

}

}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

656

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateActivation(const ActivationQueueDescriptor& descriptor,

657

const WorkloadInfo& info) const

658

{

Nattapat Chaimanowong

d4b7059

2018-10-12 11:21:49 +0100

[diff] [blame]

659

return std::make_unique<NeonActivationWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

660

}

661

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

662

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateAddition(const AdditionQueueDescriptor& descriptor,

663

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

664

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

665

return std::make_unique<NeonAdditionWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

666

}

667

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

668

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateArgMinMax(const ArgMinMaxQueueDescriptor& descriptor,

669

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

670

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

671

return std::make_unique<NeonArgMinMaxWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

672

}

673

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

674

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateBatchNormalization(

675

const BatchNormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const

676

{

677

return std::make_unique<NeonBatchNormalizationWorkload>(descriptor, info);

678

}

679

680

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateBatchToSpaceNd(const BatchToSpaceNdQueueDescriptor& descriptor,

681

const WorkloadInfo& info) const

682

{

Mike Kelly

5685802

2020-01-27 12:14:47 +0000

[diff] [blame]

683

return std::make_unique<NeonBatchToSpaceNdWorkload>(descriptor, info);

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

684

}

685

Sadik Armagan

48f011e

2021-04-21 10:50:34 +0100

[diff] [blame]

686

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateCast(const CastQueueDescriptor& descriptor,

687

const WorkloadInfo& info) const

688

{

689

return std::make_unique<NeonCastWorkload>(descriptor, info);

690

}

691

Teresa Charlin

e89dd69

2021-09-01 16:30:34 +0100

[diff] [blame]

692

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateChannelShuffle(const ChannelShuffleQueueDescriptor& descriptor,

693

const WorkloadInfo& info) const

694

{

695

return std::make_unique<NeonChannelShuffleWorkload>(descriptor, info);

696

}

697

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

698

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateComparison(const ComparisonQueueDescriptor& descriptor,

699

const WorkloadInfo& info) const

700

{

Teresa Charlin

cedd34f

2020-03-30 11:17:30 +0100

[diff] [blame]

701

return std::make_unique<NeonComparisonWorkload>(descriptor, info);

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

702

}

703

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

704

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateConcat(const ConcatQueueDescriptor& descriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

705

const WorkloadInfo& info) const

706

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

707

return std::make_unique<NeonConcatWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

708

}

709

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

710

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConstant(const ConstantQueueDescriptor& descriptor,

711

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

712

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

713

return std::make_unique<NeonConstantWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

714

}

715

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

716

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertFp16ToFp32(

717

const ConvertFp16ToFp32QueueDescriptor& descriptor,

718

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

719

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

720

return std::make_unique<NeonConvertFp16ToFp32Workload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

721

}

722

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

723

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertFp32ToFp16(

724

const ConvertFp32ToFp16QueueDescriptor& descriptor,

725

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

726

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

727

return std::make_unique<NeonConvertFp32ToFp16Workload>(descriptor, info);

Nikhil Raj

9b46148

2019-07-03 15:58:31 +0100

[diff] [blame]

728

}

729

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

730

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateConvolution2d(

731

const Convolution2dQueueDescriptor& descriptor, const WorkloadInfo& info) const

732

{

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

733

bool isFastMathEnabled = false;

734

if (m_ModelContextPtr)

735

{

736

if (m_ModelContextPtr.get() != nullptr)

737

{

738

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

739

if (modelOptions)

740

{

741

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution2dWorkload>(descriptor,

746

info,

747

m_MemoryManager->GetIntraLayerManager(),

748

isFastMathEnabled);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

749

}

750

Teresa Charlin

ec5f7d1

2021-10-22 17:15:00 +0100

[diff] [blame]

751

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateConvolution3d(

752

const Convolution3dQueueDescriptor& descriptor, const WorkloadInfo& info) const

753

{

754

bool isFastMathEnabled = false;

755

if (m_ModelContextPtr)

756

{

757

if (m_ModelContextPtr.get() != nullptr)

758

{

759

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

760

if (modelOptions)

761

{

762

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution3dWorkload>(descriptor,

767

info,

768

m_MemoryManager->GetIntraLayerManager(),

isFastMathEnabled);

}

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

772

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDebug(const DebugQueueDescriptor& descriptor,

773

const WorkloadInfo& info) const

774

{

775

return MakeWorkloadHelper<NullWorkload, NullWorkload>(descriptor, info);

776

}

777

Aron Virginas-Tar

2f00b74

2019-09-30 13:28:08 +0100

[diff] [blame]

778

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDepthToSpace(const DepthToSpaceQueueDescriptor& descriptor,

779

const WorkloadInfo& info) const

780

{

781

return std::make_unique<NeonDepthToSpaceWorkload>(descriptor, info);

782

}

783

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

784

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDepthwiseConvolution2d(

785

const DepthwiseConvolution2dQueueDescriptor& descriptor, const WorkloadInfo& info) const

786

{

Nattapat Chaimanowong

7714088

2018-10-17 11:12:19 +0100

[diff] [blame]

787

return std::make_unique<NeonDepthwiseConvolutionWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

788

}

789

Narumol Prangnawarat

01961a7

2019-05-30 16:47:12 +0100

[diff] [blame]

790

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDequantize(const DequantizeQueueDescriptor& descriptor,

791

const WorkloadInfo& info) const

792

{

793

return std::make_unique<NeonDequantizeWorkload>(descriptor, info);

794

}

795

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

796

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDetectionPostProcess(

797

const armnn::DetectionPostProcessQueueDescriptor& descriptor, const armnn::WorkloadInfo& info) const

798

{

James Conroy

d9fb6e2

2020-02-21 16:52:44 +0000

[diff] [blame]

799

return MakeWorkloadHelper<NullWorkload, NullWorkload>(descriptor, info);

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

800

}

801

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

802

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateDivision(

803

const DivisionQueueDescriptor& descriptor, const WorkloadInfo& info) const

804

{

Pablo Tello

e61f071

2020-01-23 10:37:17 +0000

[diff] [blame]

805

return std::make_unique<NeonDivisionWorkload>(descriptor, info);

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

806

}

807

Sadik Armagan

ac47210

2020-03-24 09:54:36 +0000

[diff] [blame]

808

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateElementwiseUnary(

809

const ElementwiseUnaryQueueDescriptor& descriptor, const WorkloadInfo& info) const

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

810

{

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

811

switch(descriptor.m_Parameters.m_Operation)

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

812

{

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

813

case UnaryOperation::Abs:

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

814

{

815

AbsQueueDescriptor absQueueDescriptor;

816

absQueueDescriptor.m_Inputs = descriptor.m_Inputs;

817

absQueueDescriptor.m_Outputs = descriptor.m_Outputs;

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

818

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

819

return std::make_unique<NeonAbsWorkload>(absQueueDescriptor, info);

820

}

Teresa Charlin

50de4fa

2021-05-31 18:47:33 +0100

[diff] [blame]

821

case UnaryOperation::Exp:

822

return std::make_unique<NeonExpWorkload>(descriptor, info);

823

case UnaryOperation::LogicalNot:

824

return std::make_unique<NeonLogicalNotWorkload>(descriptor, info);

825

case UnaryOperation::Log:

826

return std::make_unique<NeonLogWorkload>(descriptor, info);

827

case UnaryOperation::Neg:

828

return std::make_unique<NeonNegWorkload>(descriptor, info);

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

829

case UnaryOperation::Rsqrt:

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

830

{

831

RsqrtQueueDescriptor rsqrtQueueDescriptor;

832

rsqrtQueueDescriptor.m_Inputs = descriptor.m_Inputs;

833

rsqrtQueueDescriptor.m_Outputs = descriptor.m_Outputs;

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

834

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

835

return std::make_unique<NeonRsqrtWorkload>(rsqrtQueueDescriptor, info);

836

}

Teresa Charlin

50de4fa

2021-05-31 18:47:33 +0100

[diff] [blame]

837

case UnaryOperation::Sin:

838

return std::make_unique<NeonSinWorkload>(descriptor, info);

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

839

default:

840

return nullptr;

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

841

}

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

842

}

843

Sadik Armagan

a792a05

2020-06-23 16:22:23 +0100

[diff] [blame]

844

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateFill(const FillQueueDescriptor& descriptor,

845

const WorkloadInfo& info) const

846

{

847

return std::make_unique<NeonFillWorkload>(descriptor, info);

848

}

849

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

850

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateFloor(const FloorQueueDescriptor& descriptor,

851

const WorkloadInfo& info) const

852

{

853

return MakeWorkloadHelper<NeonFloorFloatWorkload, NullWorkload>(descriptor, info);

854

}

855

856

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateFullyConnected(

857

const FullyConnectedQueueDescriptor& descriptor, const WorkloadInfo& info) const

858

{

Kevin May

be7e35c

2020-04-29 17:05:05 +0100

[diff] [blame]

859

return std::make_unique<NeonFullyConnectedWorkload>(descriptor, info, m_MemoryManager->GetIntraLayerManager());

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

860

}

861

862

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateGather(const armnn::GatherQueueDescriptor& descriptor,

863

const armnn::WorkloadInfo& info) const

864

{

Teresa Charlin

f540eb8

2020-04-10 19:24:55 +0100

[diff] [blame]

865

return std::make_unique<NeonGatherWorkload>(descriptor, info);

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

866

}

867

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

868

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateInput(const InputQueueDescriptor& descriptor,

869

const WorkloadInfo& info) const

870

{

871

return std::make_unique<CopyMemGenericWorkload>(descriptor, info);

872

}

873

874

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateInstanceNormalization(

875

const InstanceNormalizationQueueDescriptor& descriptor,

876

const WorkloadInfo& info) const

877

{

878

return std::make_unique<NeonInstanceNormalizationWorkload>(descriptor, info);

879

}

880

881

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateL2Normalization(const L2NormalizationQueueDescriptor& descriptor,

882

const WorkloadInfo& info) const

883

{

884

return MakeWorkloadHelper<NeonL2NormalizationFloatWorkload, NullWorkload>(descriptor, info,

885

m_MemoryManager->GetIntraLayerManager());

886

}

887

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

888

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateLogSoftmax(const LogSoftmaxQueueDescriptor& descriptor,

889

const WorkloadInfo& info) const

890

{

891

return std::make_unique<NeonLogSoftmaxWorkload>(descriptor, info, m_MemoryManager->GetIntraLayerManager());

892

}

893

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

894

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateLogicalBinary(const LogicalBinaryQueueDescriptor& descriptor,

895

const WorkloadInfo& info) const

896

{

897

switch(descriptor.m_Parameters.m_Operation)

898

{

899

case LogicalBinaryOperation::LogicalAnd:

900

return std::make_unique<NeonLogicalAndWorkload>(descriptor, info);

901

case LogicalBinaryOperation::LogicalOr:

902

return std::make_unique<NeonLogicalOrWorkload>(descriptor, info);

default:

return nullptr;

}

}

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

908

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateLstm(const LstmQueueDescriptor& descriptor,

909

const WorkloadInfo& info) const

910

{

911

return MakeWorkloadHelper<NeonLstmFloatWorkload, NullWorkload>(descriptor, info);

912

}

913

914

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateMaximum(const MaximumQueueDescriptor& descriptor,

915

const WorkloadInfo& info) const

916

{

917

return std::make_unique<NeonMaximumWorkload>(descriptor, info);

918

}

919

920

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateMean(const MeanQueueDescriptor& descriptor,

921

const WorkloadInfo& info) const

922

{

923

return std::make_unique<NeonMeanWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

924

}

925

926

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMemCopy(const MemCopyQueueDescriptor& descriptor,

927

const WorkloadInfo& info) const

928

{

929

if (descriptor.m_Inputs.empty() || !descriptor.m_Inputs[0])

930

{

931

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemCopy workload");

932

}

933

Aron Virginas-Tar

a8e06ed

2018-10-19 16:46:15 +0100

[diff] [blame]

934

return MakeWorkloadHelper<CopyMemGenericWorkload, CopyMemGenericWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

935

}

936

Derek Lamberti

f674aa0

2019-08-01 15:56:25 +0100

[diff] [blame]

937

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMemImport(const MemImportQueueDescriptor& descriptor,

938

const WorkloadInfo& info) const

939

{

940

if (descriptor.m_Inputs.empty() || !descriptor.m_Inputs[0])

941

{

942

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemImport workload");

943

}

944

945

return std::make_unique<ImportMemGenericWorkload>(descriptor, info);

946

}

947

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

948

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateMinimum(const MinimumQueueDescriptor& descriptor,

949

const WorkloadInfo& info) const

950

{

951

return std::make_unique<NeonMinimumWorkload>(descriptor, info);

952

}

953

954

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMultiplication(

955

const MultiplicationQueueDescriptor& descriptor, const WorkloadInfo& info) const

956

{

957

return std::make_unique<NeonMultiplicationWorkload>(descriptor, info);

958

}

959

960

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateNormalization(

961

const NormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const

962

{

963

return MakeWorkloadHelper<NeonNormalizationFloatWorkload, NullWorkload>(descriptor, info,

964

m_MemoryManager->GetIntraLayerManager());

965

}

966

967

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateOutput(const OutputQueueDescriptor& descriptor,

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

968

const WorkloadInfo& info) const

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

969

{

970

return std::make_unique<CopyMemGenericWorkload>(descriptor, info);

971

}

972

973

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreatePad(const PadQueueDescriptor& descriptor,

974

const WorkloadInfo& info) const

975

{

976

return std::make_unique<NeonPadWorkload>(descriptor, info);

977

}

978

979

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreatePermute(const PermuteQueueDescriptor& descriptor,

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

980

const WorkloadInfo& info) const

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

981

{

982

return std::make_unique<NeonPermuteWorkload>(descriptor, info);

983

}

984

985

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreatePooling2d(const Pooling2dQueueDescriptor& descriptor,

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

986

const WorkloadInfo& info) const

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

987

{

988

return std::make_unique<NeonPooling2dWorkload>(descriptor, info);

989

}

990

991

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreatePreCompiled(const PreCompiledQueueDescriptor& descriptor,

992

const WorkloadInfo& info) const

993

{

994

return MakeWorkloadHelper<NullWorkload, NullWorkload>(descriptor, info);

995

}

996

997

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreatePrelu(const armnn::PreluQueueDescriptor &descriptor,

998

const armnn::WorkloadInfo &info) const

999

{

1000

return std::make_unique<NeonPreluWorkload>(descriptor, info);

1001

}

1002

James Conroy

cc34093

2020-05-12 18:08:52 +0100

[diff] [blame]

1003

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateQLstm(const QLstmQueueDescriptor& descriptor,

1004

const WorkloadInfo& info) const

1005

{

1006

return std::make_unique<NeonQLstmWorkload>(descriptor, info);

1007

}

1008

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1009

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateQuantize(const QuantizeQueueDescriptor& descriptor,

1010

const WorkloadInfo& info) const

1011

{

Kevin May

9077473

2020-03-03 12:10:10 +0000

[diff] [blame]

1012

return std::make_unique<NeonQuantizeWorkload>(descriptor, info);

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1013

}

1014

1015

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateQuantizedLstm(const QuantizedLstmQueueDescriptor& descriptor,

1016

const WorkloadInfo& info) const

1017

{

1018

return std::make_unique<NeonQuantizedLstmWorkload>(descriptor, info);

1019

}

1020

David Monahan

97451b4

2020-12-03 09:48:06 +0000

[diff] [blame]

1021

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateRank(const RankQueueDescriptor& descriptor,

1022

const WorkloadInfo& info) const

1023

{

1024

return std::make_unique<NeonRankWorkload>(descriptor, info);

1025

}

1026

Sadik Armagan

a274748

2021-02-09 10:28:54 +0000

[diff] [blame]

1027

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateReduce(const ReduceQueueDescriptor& descriptor,

1028

const WorkloadInfo& info) const

1029

{

1030

return std::make_unique<NeonReduceWorkload>(descriptor, info);

1031

}

1032

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1033

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateReshape(const ReshapeQueueDescriptor& descriptor,

1034

const WorkloadInfo& info) const

1035

{

1036

return std::make_unique<NeonReshapeWorkload>(descriptor, info);

1037

}

1038

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

1039

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateResize(const ResizeQueueDescriptor& descriptor,

1040

const WorkloadInfo& info) const

1041

{

Ellen Norris-Thompson

37e6868

2019-07-15 14:23:30 +0100

[diff] [blame]

1042

return std::make_unique<NeonResizeWorkload>(descriptor, info);

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

1043

}

1044

josh minor

036f02d

2019-11-15 14:53:22 -0600

[diff] [blame]

1045

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSlice(const SliceQueueDescriptor& descriptor,

1046

const WorkloadInfo& info) const

1047

{

1048

return std::make_unique<NeonSliceWorkload>(descriptor, info);

1049

}

1050

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1051

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSoftmax(const SoftmaxQueueDescriptor& descriptor,

1052

const WorkloadInfo& info) const

Sadik Armagan

581742d

2019-08-12 14:11:37 +0100

[diff] [blame]

1053

{

Sadik Armagan

be88a57

2020-04-30 11:39:37 +0100

[diff] [blame]

1054

return std::make_unique<NeonSoftmaxWorkload>(descriptor, info, m_MemoryManager->GetIntraLayerManager());

Sadik Armagan

581742d

2019-08-12 14:11:37 +0100

[diff] [blame]

1055

}

1056

Mike Kelly

0be3a88

2020-01-24 11:27:50 +0000

[diff] [blame]

1057

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSpaceToBatchNd(const SpaceToBatchNdQueueDescriptor& descriptor,

1058

const WorkloadInfo& info) const

1059

{

1060

return std::make_unique<NeonSpaceToBatchNdWorkload>(descriptor, info);

1061

}

1062

1063

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSpaceToDepth(const SpaceToDepthQueueDescriptor& descriptor,

1064

const WorkloadInfo& info) const

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

1065

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1066

return std::make_unique<NeonSpaceToDepthWorkload>(descriptor, info);

1067

}

1068

1069

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSplitter(const SplitterQueueDescriptor& descriptor,

1070

const WorkloadInfo& info) const

1071

{

1072

return std::make_unique<NeonSplitterWorkload>(descriptor, info);

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

1073

}

1074

Matthew Jackson

87f65ea

2019-08-01 10:01:34 +0100

[diff] [blame]

1075

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateStack(const StackQueueDescriptor& descriptor,

1076

const WorkloadInfo& info) const

1077

{

1078

return std::make_unique<NeonStackWorkload>(descriptor, info);

1079

}

1080

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1081

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateStridedSlice(const StridedSliceQueueDescriptor& descriptor,

1082

const WorkloadInfo& info) const

James Conroy

d47a064

2019-09-17 14:22:06 +0100

[diff] [blame]

1083

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1084

return std::make_unique<NeonStridedSliceWorkload>(descriptor, info);

1085

}

1086

1087

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateSubtraction(

1088

const SubtractionQueueDescriptor& descriptor, const WorkloadInfo& info) const

1089

{

1090

return std::make_unique<NeonSubtractionWorkload>(descriptor, info);

1091

}

1092

Mike Kelly

c9ea45a

2020-02-28 18:11:58 +0000

[diff] [blame]

1093

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateTranspose(const TransposeQueueDescriptor& descriptor,

1094

const WorkloadInfo& info) const

1095

{

1096

return std::make_unique<NeonTransposeWorkload>(descriptor, info);

1097

}

1098

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1099

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateTransposeConvolution2d(

1100

const TransposeConvolution2dQueueDescriptor &descriptor,

1101

const WorkloadInfo &info) const

1102

{

1103

return std::make_unique<NeonTransposeConvolution2dWorkload>(descriptor, info,

1104

m_MemoryManager->GetIntraLayerManager());

James Conroy

d47a064

2019-09-17 14:22:06 +0100

[diff] [blame]

1105

}

1106

Aron Virginas-Tar