Blame - src/backends/neon/NeonWorkloadFactory.cpp - ml/armnn

2020-07-02 11:49:26 +0100

[diff] [blame]

2

David Beck

ecb56cd

2018-09-05 12:52:57 +0100

[diff] [blame]

3

// SPDX-License-Identifier: MIT

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

5

David Beck

79141b9

2018-10-23 16:09:36 +0100

[diff] [blame]

6

#include "NeonBackendId.hpp"

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

7

#include "NeonBackendModelContext.hpp"

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

8

#include "NeonTensorHandle.hpp"

9

#include "NeonWorkloadFactory.hpp"

10

David Beck

0dbe0ee

2018-09-24 15:59:27 +0100

[diff] [blame]

11

#include <Layer.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

12

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

13

#include <armnn/Utils.hpp>

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

14

#include <armnn/utility/IgnoreUnused.hpp>

Matthew Sloyan

171214c

2020-09-09 09:07:37 +0100

[diff] [blame]

15

#include <armnn/utility/NumericCast.hpp>

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

16

#include <armnn/utility/PolymorphicDowncast.hpp>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

17

Aron Virginas-Tar

c9cc804

2018-11-01 16:15:57 +0000

[diff] [blame]

18

#include <backendsCommon/MakeWorkloadHelper.hpp>

Colm Donelan

0c47974

2021-12-10 12:43:54 +0000

[diff] [blame]

19

#include <armnn/backends/MemCopyWorkload.hpp>

Derek Lamberti

f674aa0

2019-08-01 15:56:25 +0100

[diff] [blame]

20

#include <backendsCommon/MemImportWorkload.hpp>

Colm Donelan

0c47974

2021-12-10 12:43:54 +0000

[diff] [blame]

21

#include <armnn/backends/TensorHandle.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

22

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

23

#include <neon/workloads/NeonWorkloadUtils.hpp>

24

#include <neon/workloads/NeonWorkloads.hpp>

25

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

namespace armnn

{

David Beck

2018-10-23 16:09:36 +0100

[diff] [blame]

29

namespace

30

{

31

static const BackendId s_Id{NeonBackendId()};

32

}

33

David Beck

29c75de

2018-10-23 13:35:58 +0100

[diff] [blame]

34

bool NeonWorkloadFactory::IsLayerSupported(const Layer& layer,

35

Optional<DataType> dataType,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

36

std::string& outReasonIfUnsupported)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

37

{

David Beck

79141b9

2018-10-23 16:09:36 +0100

[diff] [blame]

38

return IWorkloadFactory::IsLayerSupported(s_Id, layer, dataType, outReasonIfUnsupported);

39

}

40

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

41

bool NeonWorkloadFactory::IsLayerSupported(const IConnectableLayer& layer,

42

Optional<DataType> dataType,

43

std::string& outReasonIfUnsupported,

44

const ModelOptions& modelOptions)

45

{

46

return IWorkloadFactory::IsLayerSupported(s_Id, layer, dataType, outReasonIfUnsupported, modelOptions);

47

}

48

David Beck

79141b9

2018-10-23 16:09:36 +0100

[diff] [blame]

49

const BackendId& NeonWorkloadFactory::GetBackendId() const

50

{

51

return s_Id;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

52

}

53

Matthew Sloyan

0a7dc6b

2021-02-10 16:50:53 +0000

[diff] [blame]

54

void NeonWorkloadFactory::SetNumberOfThreads()

55

{

56

if (m_ModelContextPtr)

57

{

58

const unsigned int MIN_THREADS = 1;

59

const unsigned int MAX_THREADS = 64;

60

61

// Set the number of threads to be used if the user has set NumberOfThreads param

62

// Only set if within limit or valid input

63

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

64

auto numberOfThreads = modelOptions->GetNumberOfThreads();

65

66

if (numberOfThreads != 0 && numberOfThreads >= MIN_THREADS && numberOfThreads <= MAX_THREADS)

67

{

68

arm_compute::Scheduler::get().set_num_threads(numberOfThreads);

}

}

}

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

73

NeonWorkloadFactory::NeonWorkloadFactory(const std::shared_ptr<NeonMemoryManager>& memoryManager)

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

74

: m_MemoryManager(memoryManager), m_ModelContextPtr(IBackendInternal::IBackendSpecificModelContextPtr{})

75

{

Matthew Sloyan

0a7dc6b

2021-02-10 16:50:53 +0000

[diff] [blame]

76

SetNumberOfThreads();

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

77

}

78

79

NeonWorkloadFactory::NeonWorkloadFactory(const std::shared_ptr<NeonMemoryManager>& memoryManager,

80

const IBackendInternal::IBackendSpecificModelContextPtr& modelContextPtr)

81

: m_MemoryManager(memoryManager), m_ModelContextPtr(modelContextPtr)

surmeh01

3537c2c

2018-05-18 16:31:43 +0100

[diff] [blame]

82

{

Matthew Sloyan

0a7dc6b

2021-02-10 16:50:53 +0000

[diff] [blame]

83

SetNumberOfThreads();

surmeh01

3537c2c

2018-05-18 16:31:43 +0100

[diff] [blame]

84

}

85

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

86

std::unique_ptr<ITensorHandle> NeonWorkloadFactory::CreateSubTensorHandle(ITensorHandle& parent,

87

TensorShape const& subTensorShape,

88

unsigned int const* subTensorOrigin) const

89

{

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

90

const arm_compute::TensorShape shape = armcomputetensorutils::BuildArmComputeTensorShape(subTensorShape);

91

92

arm_compute::Coordinates coords;

93

coords.set_num_dimensions(subTensorShape.GetNumDimensions());

94

for (unsigned int i = 0; i < subTensorShape.GetNumDimensions(); i++)

95

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

96

// Arm compute indexes tensor coords in reverse order.

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

97

unsigned int revertedIndex = subTensorShape.GetNumDimensions() - i - 1;

Matthew Sloyan

171214c

2020-09-09 09:07:37 +0100

[diff] [blame]

98

coords.set(i, armnn::numeric_cast<int>(subTensorOrigin[revertedIndex]));

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

99

}

100

Derek Lamberti

0790dce

2019-04-15 18:37:35 +0100

[diff] [blame]

101

const arm_compute::TensorShape parentShape = armcomputetensorutils::BuildArmComputeTensorShape(parent.GetShape());

102

if (!::arm_compute::error_on_invalid_subtensor(__func__, __FILE__, __LINE__, parentShape, coords, shape))

{

return nullptr;

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

107

return std::make_unique<NeonSubTensorHandle>(

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

108

PolymorphicDowncast<IAclTensorHandle*>(&parent), shape, coords);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

109

}

110

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

111

std::unique_ptr<ITensorHandle> NeonWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,

112

const bool IsMemoryManaged) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

113

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

114

auto tensorHandle = std::make_unique<NeonTensorHandle>(tensorInfo);

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

115

if (IsMemoryManaged)

116

{

117

tensorHandle->SetMemoryGroup(m_MemoryManager->GetInterLayerMemoryGroup());

118

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

119

return tensorHandle;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

120

}

121

Francis Murtagh

351d13d

2018-09-24 15:01:18 +0100

[diff] [blame]

122

std::unique_ptr<ITensorHandle> NeonWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

123

DataLayout dataLayout,

124

const bool IsMemoryManaged) const

Francis Murtagh

351d13d

2018-09-24 15:01:18 +0100

[diff] [blame]

125

{

126

auto tensorHandle = std::make_unique<NeonTensorHandle>(tensorInfo, dataLayout);

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

127

if (IsMemoryManaged)

128

{

129

tensorHandle->SetMemoryGroup(m_MemoryManager->GetInterLayerMemoryGroup());

130

}

Francis Murtagh

351d13d

2018-09-24 15:01:18 +0100

[diff] [blame]

return tensorHandle;

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

134

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateWorkload(LayerType type,

135

const QueueDescriptor& descriptor,

136

const WorkloadInfo& info) const

{

switch(type)

{

case LayerType::Activation :

141

{

142

auto activationQueueDescriptor = PolymorphicDowncast<const ActivationQueueDescriptor*>(&descriptor);

143

return std::make_unique<NeonActivationWorkload>(*activationQueueDescriptor, info);

144

}

145

case LayerType::Addition :

146

{

147

auto additionQueueDescriptor = PolymorphicDowncast<const AdditionQueueDescriptor*>(&descriptor);

148

return std::make_unique<NeonAdditionWorkload>(*additionQueueDescriptor, info);

149

}

150

case LayerType::ArgMinMax :

151

{

152

auto argMinMaxQueueDescriptor = PolymorphicDowncast<const ArgMinMaxQueueDescriptor*>(&descriptor);

153

return std::make_unique<NeonArgMinMaxWorkload>(*argMinMaxQueueDescriptor, info);

154

}

155

case LayerType::BatchNormalization :

156

{

157

auto batchNormalizationQueueDescriptor

158

= PolymorphicDowncast<const BatchNormalizationQueueDescriptor*>(&descriptor);

159

return std::make_unique<NeonBatchNormalizationWorkload>(*batchNormalizationQueueDescriptor, info);

160

}

161

case LayerType::BatchToSpaceNd :

162

{

163

auto batchToSpaceNdQueueDescriptor

164

= PolymorphicDowncast<const BatchToSpaceNdQueueDescriptor*>(&descriptor);

165

return std::make_unique<NeonBatchToSpaceNdWorkload>(*batchToSpaceNdQueueDescriptor, info);

166

}

167

case LayerType::Cast :

168

{

169

auto castQueueDescriptor = PolymorphicDowncast<const CastQueueDescriptor*>(&descriptor);

170

return std::make_unique<NeonCastWorkload>(*castQueueDescriptor, info);

171

}

172

case LayerType::ChannelShuffle :

173

{

174

auto channelShuffleQueueDescriptor = PolymorphicDowncast<const ChannelShuffleQueueDescriptor*>(&descriptor);

175

return std::make_unique<NeonChannelShuffleWorkload>(*channelShuffleQueueDescriptor, info);

176

}

177

case LayerType::Comparison :

178

{

179

auto comparisonQueueDescriptor = PolymorphicDowncast<const ComparisonQueueDescriptor*>(&descriptor);

180

return std::make_unique<NeonComparisonWorkload>(*comparisonQueueDescriptor, info);

181

}

182

case LayerType::Concat :

183

{

184

auto concatQueueDescriptor = PolymorphicDowncast<const ConcatQueueDescriptor*>(&descriptor);

185

return std::make_unique<NeonConcatWorkload>(*concatQueueDescriptor, info);

186

}

187

case LayerType::Constant :

188

{

189

auto constantQueueDescriptor = PolymorphicDowncast<const ConstantQueueDescriptor*>(&descriptor);

190

return std::make_unique<NeonConstantWorkload>(*constantQueueDescriptor, info);

191

}

192

case LayerType::ConvertBf16ToFp32 :

193

{

194

auto convertBf16ToFp32QueueDescriptor

195

= PolymorphicDowncast<const ConvertBf16ToFp32QueueDescriptor*>(&descriptor);

196

return std::make_unique<NeonConvertBf16ToFp32Workload>(*convertBf16ToFp32QueueDescriptor, info);

197

}

198

case LayerType::ConvertFp16ToFp32 :

199

{

200

auto convertFp16ToFp32QueueDescriptor

201

= PolymorphicDowncast<const ConvertFp16ToFp32QueueDescriptor*>(&descriptor);

202

return std::make_unique<NeonConvertFp16ToFp32Workload>(*convertFp16ToFp32QueueDescriptor, info);

203

}

204

case LayerType::ConvertFp32ToBf16 :

205

{

206

auto convertFp32ToBf16QueueDescriptor

207

= PolymorphicDowncast<const ConvertFp32ToBf16QueueDescriptor*>(&descriptor);

208

return std::make_unique<NeonConvertFp32ToBf16Workload>(*convertFp32ToBf16QueueDescriptor, info);

209

}

210

case LayerType::ConvertFp32ToFp16 :

211

{

212

auto convertFp32ToFp16QueueDescriptor

213

= PolymorphicDowncast<const ConvertFp32ToFp16QueueDescriptor*>(&descriptor);

214

return std::make_unique<NeonConvertFp32ToFp16Workload>(*convertFp32ToFp16QueueDescriptor, info);

215

}

216

case LayerType::Convolution2d :

217

{

218

auto convolution2dQueueDescriptor = PolymorphicDowncast<const Convolution2dQueueDescriptor*>(&descriptor);

219

220

bool isFastMathEnabled = false;

221

if (m_ModelContextPtr)

222

{

223

if (m_ModelContextPtr.get() != nullptr)

224

{

225

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

226

if (modelOptions)

227

{

228

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution2dWorkload>(*convolution2dQueueDescriptor,

233

info,

234

m_MemoryManager->GetIntraLayerManager(),

235

isFastMathEnabled);

236

}

237

case LayerType::Convolution3d :

238

{

239

auto convolution3dQueueDescriptor = PolymorphicDowncast<const Convolution3dQueueDescriptor*>(&descriptor);

240

241

bool isFastMathEnabled = false;

242

if (m_ModelContextPtr)

243

{

244

if (m_ModelContextPtr.get() != nullptr)

245

{

246

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

247

if (modelOptions)

248

{

249

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution3dWorkload>(*convolution3dQueueDescriptor,

254

info,

255

m_MemoryManager->GetIntraLayerManager(),

256

isFastMathEnabled);

257

}

258

case LayerType::Debug :

259

{

260

auto debugQueueDescriptor = PolymorphicDowncast<const DebugQueueDescriptor*>(&descriptor);

261

return MakeWorkloadHelper<NullWorkload, NullWorkload>(*debugQueueDescriptor, info);

262

}

263

case LayerType::DepthToSpace :

264

{

265

auto depthToSpaceQueueDescriptor = PolymorphicDowncast<const DepthToSpaceQueueDescriptor*>(&descriptor);

266

return std::make_unique<NeonDepthToSpaceWorkload>(*depthToSpaceQueueDescriptor, info);

267

}

268

case LayerType::DepthwiseConvolution2d :

269

{

270

auto depthwiseConvolution2dQueueDescriptor

271

= PolymorphicDowncast<const DepthwiseConvolution2dQueueDescriptor*>(&descriptor);

272

return std::make_unique<NeonDepthwiseConvolutionWorkload>(*depthwiseConvolution2dQueueDescriptor, info);

273

}

274

case LayerType::Dequantize :

275

{

276

auto dequantizeQueueDescriptor = PolymorphicDowncast<const DequantizeQueueDescriptor*>(&descriptor);

277

return std::make_unique<NeonDequantizeWorkload>(*dequantizeQueueDescriptor, info);

278

}

279

case LayerType::DetectionPostProcess :

280

{

281

auto detectionPostProcessQueueDescriptor

282

= PolymorphicDowncast<const DetectionPostProcessQueueDescriptor*>(&descriptor);

283

return MakeWorkloadHelper<NullWorkload, NullWorkload>(*detectionPostProcessQueueDescriptor, info);

284

}

285

case LayerType::Division :

286

{

287

auto divisionQueueDescriptor = PolymorphicDowncast<const DivisionQueueDescriptor*>(&descriptor);

288

return std::make_unique<NeonDivisionWorkload>(*divisionQueueDescriptor, info);

289

}

290

case LayerType::ElementwiseUnary :

291

{

292

auto elementwiseUnaryQueueDescriptor

293

= PolymorphicDowncast<const ElementwiseUnaryQueueDescriptor*>(&descriptor);

294

295

switch(elementwiseUnaryQueueDescriptor->m_Parameters.m_Operation)

296

{

297

case UnaryOperation::Abs:

298

{

299

AbsQueueDescriptor absQueueDescriptor;

300

absQueueDescriptor.m_Inputs = elementwiseUnaryQueueDescriptor->m_Inputs;

301

absQueueDescriptor.m_Outputs = elementwiseUnaryQueueDescriptor->m_Outputs;

302

303

return std::make_unique<NeonAbsWorkload>(absQueueDescriptor, info);

304

}

305

case UnaryOperation::Exp:

306

return std::make_unique<NeonExpWorkload>(*elementwiseUnaryQueueDescriptor, info);

307

case UnaryOperation::LogicalNot:

308

return std::make_unique<NeonLogicalNotWorkload>(*elementwiseUnaryQueueDescriptor, info);

309

case UnaryOperation::Log:

310

return std::make_unique<NeonLogWorkload>(*elementwiseUnaryQueueDescriptor, info);

311

case UnaryOperation::Neg:

312

return std::make_unique<NeonNegWorkload>(*elementwiseUnaryQueueDescriptor, info);

313

case UnaryOperation::Rsqrt:

314

{

315

RsqrtQueueDescriptor rsqrtQueueDescriptor;

316

rsqrtQueueDescriptor.m_Inputs = elementwiseUnaryQueueDescriptor->m_Inputs;

317

rsqrtQueueDescriptor.m_Outputs = elementwiseUnaryQueueDescriptor->m_Outputs;

318

319

return std::make_unique<NeonRsqrtWorkload>(rsqrtQueueDescriptor, info);

320

}

321

case UnaryOperation::Sin:

322

return std::make_unique<NeonSinWorkload>(*elementwiseUnaryQueueDescriptor, info);

default:

return nullptr;

}

}

case LayerType::Fill :

328

{

329

auto fillQueueDescriptor = PolymorphicDowncast<const FillQueueDescriptor*>(&descriptor);

330

return std::make_unique<NeonFillWorkload>(*fillQueueDescriptor, info);

331

}

332

case LayerType::Floor :

333

{

334

auto floorQueueDescriptor = PolymorphicDowncast<const FloorQueueDescriptor*>(&descriptor);

335

return MakeWorkloadHelper<NeonFloorFloatWorkload, NullWorkload>(*floorQueueDescriptor, info);

336

}

337

case LayerType::FullyConnected :

338

{

339

auto fullyConnectedQueueDescriptor = PolymorphicDowncast<const FullyConnectedQueueDescriptor*>(&descriptor);

340

return std::make_unique<NeonFullyConnectedWorkload>(*fullyConnectedQueueDescriptor,

341

info,

342

m_MemoryManager->GetIntraLayerManager());

343

}

344

case LayerType::Gather :

345

{

346

auto gatherQueueDescriptor = PolymorphicDowncast<const GatherQueueDescriptor*>(&descriptor);

347

return std::make_unique<NeonGatherWorkload>(*gatherQueueDescriptor, info);

348

}

349

case LayerType::Input :

350

{

351

auto inputQueueDescriptor = PolymorphicDowncast<const InputQueueDescriptor*>(&descriptor);

352

return std::make_unique<CopyMemGenericWorkload>(*inputQueueDescriptor, info);

353

}

354

case LayerType::InstanceNormalization :

355

{

356

auto instanceNormalizationQueueDescriptor

357

= PolymorphicDowncast<const InstanceNormalizationQueueDescriptor*>(&descriptor);

358

return std::make_unique<NeonInstanceNormalizationWorkload>(*instanceNormalizationQueueDescriptor, info);

359

}

360

case LayerType::L2Normalization :

361

{

362

auto l2NormalizationQueueDescriptor

363

= PolymorphicDowncast<const L2NormalizationQueueDescriptor*>(&descriptor);

364

return MakeWorkloadHelper<NeonL2NormalizationFloatWorkload, NullWorkload>

365

(*l2NormalizationQueueDescriptor, info, m_MemoryManager->GetIntraLayerManager());

366

}

367

case LayerType::LogSoftmax :

368

{

369

auto logSoftmaxQueueDescriptor = PolymorphicDowncast<const LogSoftmaxQueueDescriptor*>(&descriptor);

370

return std::make_unique<NeonLogSoftmaxWorkload>(*logSoftmaxQueueDescriptor,

371

info,

372

m_MemoryManager->GetIntraLayerManager());

373

}

374

case LayerType::LogicalBinary :

375

{

376

auto logicalBinaryQueueDescriptor = PolymorphicDowncast<const LogicalBinaryQueueDescriptor*>(&descriptor);

377

378

switch(logicalBinaryQueueDescriptor->m_Parameters.m_Operation)

379

{

380

case LogicalBinaryOperation::LogicalAnd:

381

return std::make_unique<NeonLogicalAndWorkload>(*logicalBinaryQueueDescriptor, info);

382

case LogicalBinaryOperation::LogicalOr:

383

return std::make_unique<NeonLogicalOrWorkload>(*logicalBinaryQueueDescriptor, info);

default:

return nullptr;

}

}

case LayerType::Lstm :

389

{

390

auto lstmQueueDescriptor = PolymorphicDowncast<const LstmQueueDescriptor*>(&descriptor);

391

return MakeWorkloadHelper<NeonLstmFloatWorkload, NullWorkload>(*lstmQueueDescriptor, info);

392

}

393

case LayerType::Maximum :

394

{

395

auto maximumQueueDescriptor = PolymorphicDowncast<const MaximumQueueDescriptor*>(&descriptor);

396

return std::make_unique<NeonMaximumWorkload>(*maximumQueueDescriptor, info);

397

}

398

case LayerType::Mean :

399

{

400

auto meanQueueDescriptor = PolymorphicDowncast<const MeanQueueDescriptor*>(&descriptor);

401

return std::make_unique<NeonMeanWorkload>(*meanQueueDescriptor, info);

402

}

403

case LayerType::MemCopy :

404

{

405

auto memCopyQueueDescriptor = PolymorphicDowncast<const MemCopyQueueDescriptor*>(&descriptor);

406

if (memCopyQueueDescriptor->m_Inputs.empty() || !memCopyQueueDescriptor->m_Inputs[0])

407

{

408

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemCopy workload");

409

}

410

return MakeWorkloadHelper<CopyMemGenericWorkload, CopyMemGenericWorkload>(*memCopyQueueDescriptor, info);

411

}

412

case LayerType::MemImport :

413

{

414

auto memImportQueueDescriptor = PolymorphicDowncast<const MemImportQueueDescriptor*>(&descriptor);

415

if (memImportQueueDescriptor->m_Inputs.empty() || !memImportQueueDescriptor->m_Inputs[0])

416

{

417

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemImport workload");

418

}

419

return std::make_unique<ImportMemGenericWorkload>(*memImportQueueDescriptor, info);

420

}

421

case LayerType::Minimum :

422

{

423

auto minimumQueueDescriptor = PolymorphicDowncast<const MinimumQueueDescriptor*>(&descriptor);

424

return std::make_unique<NeonMinimumWorkload>(*minimumQueueDescriptor, info);

425

}

426

case LayerType::Multiplication :

427

{

428

auto multiplicationQueueDescriptor = PolymorphicDowncast<const MultiplicationQueueDescriptor*>(&descriptor);

429

return std::make_unique<NeonMultiplicationWorkload>(*multiplicationQueueDescriptor, info);

430

}

431

case LayerType::Normalization :

432

{

433

auto normalizationQueueDescriptor = PolymorphicDowncast<const NormalizationQueueDescriptor*>(&descriptor);

434

return MakeWorkloadHelper<NeonNormalizationFloatWorkload, NullWorkload>

435

(*normalizationQueueDescriptor, info, m_MemoryManager->GetIntraLayerManager());

436

}

437

case LayerType::Output :

438

{

439

auto outputQueueDescriptor = PolymorphicDowncast<const OutputQueueDescriptor*>(&descriptor);

440

return std::make_unique<CopyMemGenericWorkload>(*outputQueueDescriptor, info);

441

}

442

case LayerType::Pad :

443

{

444

auto padQueueDescriptor = PolymorphicDowncast<const PadQueueDescriptor*>(&descriptor);

445

return std::make_unique<NeonPadWorkload>(*padQueueDescriptor, info);

446

}

447

case LayerType::Permute :

448

{

449

auto permuteQueueDescriptor = PolymorphicDowncast<const PermuteQueueDescriptor*>(&descriptor);

450

return std::make_unique<NeonPermuteWorkload>(*permuteQueueDescriptor, info);

451

}

452

case LayerType::Pooling2d :

453

{

454

auto pooling2dQueueDescriptor = PolymorphicDowncast<const Pooling2dQueueDescriptor*>(&descriptor);

455

return std::make_unique<NeonPooling2dWorkload>(*pooling2dQueueDescriptor, info);

456

}

457

case LayerType::PreCompiled :

458

{

459

auto preCompiledQueueDescriptor = PolymorphicDowncast<const PreCompiledQueueDescriptor*>(&descriptor);

460

return MakeWorkloadHelper<NullWorkload, NullWorkload>(*preCompiledQueueDescriptor, info);

461

}

462

case LayerType::Prelu :

463

{

464

auto preluQueueDescriptor = PolymorphicDowncast<const PreluQueueDescriptor*>(&descriptor);

465

return std::make_unique<NeonPreluWorkload>(*preluQueueDescriptor, info);

466

}

467

case LayerType::QLstm :

468

{

469

auto qLstmQueueDescriptor = PolymorphicDowncast<const QLstmQueueDescriptor*>(&descriptor);

470

return std::make_unique<NeonQLstmWorkload>(*qLstmQueueDescriptor, info);

471

}

472

case LayerType::Quantize :

473

{

474

auto quantizeQueueDescriptor = PolymorphicDowncast<const QuantizeQueueDescriptor*>(&descriptor);

475

return std::make_unique<NeonQuantizeWorkload>(*quantizeQueueDescriptor, info);

476

}

477

case LayerType::QuantizedLstm :

478

{

479

auto quantizedLstmQueueDescriptor = PolymorphicDowncast<const QuantizedLstmQueueDescriptor*>(&descriptor);

480

return std::make_unique<NeonQuantizedLstmWorkload>(*quantizedLstmQueueDescriptor, info);

481

}

482

case LayerType::Rank :

483

{

484

auto rankQueueDescriptor = PolymorphicDowncast<const RankQueueDescriptor*>(&descriptor);

485

return std::make_unique<NeonRankWorkload>(*rankQueueDescriptor, info);

486

}

487

case LayerType::Reduce :

488

{

489

auto reduceQueueDescriptor = PolymorphicDowncast<const ReduceQueueDescriptor*>(&descriptor);

490

return std::make_unique<NeonReduceWorkload>(*reduceQueueDescriptor, info);

491

}

492

case LayerType::Reshape :

493

{

494

auto reshapeQueueDescriptor = PolymorphicDowncast<const ReshapeQueueDescriptor*>(&descriptor);

495

return std::make_unique<NeonReshapeWorkload>(*reshapeQueueDescriptor, info);

496

}

497

case LayerType::Resize :

498

{

499

auto resizeQueueDescriptor = PolymorphicDowncast<const ResizeQueueDescriptor*>(&descriptor);

500

return std::make_unique<NeonResizeWorkload>(*resizeQueueDescriptor, info);

501

}

502

case LayerType::Slice :

503

{

504

auto sliceQueueDescriptor = PolymorphicDowncast<const SliceQueueDescriptor*>(&descriptor);

505

return std::make_unique<NeonSliceWorkload>(*sliceQueueDescriptor, info);

506

}

507

case LayerType::Softmax :

508

{

509

auto softmaxQueueDescriptor = PolymorphicDowncast<const SoftmaxQueueDescriptor*>(&descriptor);

510

return std::make_unique<NeonSoftmaxWorkload>(*softmaxQueueDescriptor,

511

info,

512

m_MemoryManager->GetIntraLayerManager());

513

}

514

case LayerType::SpaceToBatchNd :

515

{

516

auto spaceToBatchNdQueueDescriptor

517

= PolymorphicDowncast<const SpaceToBatchNdQueueDescriptor*>(&descriptor);

518

return std::make_unique<NeonSpaceToBatchNdWorkload>(*spaceToBatchNdQueueDescriptor, info);

519

}

520

case LayerType::SpaceToDepth :

521

{

522

auto spaceToDepthQueueDescriptor = PolymorphicDowncast<const SpaceToDepthQueueDescriptor*>(&descriptor);

523

return std::make_unique<NeonSpaceToDepthWorkload>(*spaceToDepthQueueDescriptor, info);

524

}

525

case LayerType::Splitter :

526

{

527

auto splitterQueueDescriptor = PolymorphicDowncast<const SplitterQueueDescriptor*>(&descriptor);

528

return std::make_unique<NeonSplitterWorkload>(*splitterQueueDescriptor, info);

529

}

530

case LayerType::Stack :

531

{

532

auto stackQueueDescriptor = PolymorphicDowncast<const StackQueueDescriptor*>(&descriptor);

533

return std::make_unique<NeonStackWorkload>(*stackQueueDescriptor, info);

534

}

535

case LayerType::StridedSlice :

536

{

537

auto stridedSliceQueueDescriptor = PolymorphicDowncast<const StridedSliceQueueDescriptor*>(&descriptor);

538

return std::make_unique<NeonStridedSliceWorkload>(*stridedSliceQueueDescriptor, info);

539

}

540

case LayerType::Subtraction :

541

{

542

auto subtractionQueueDescriptor = PolymorphicDowncast<const SubtractionQueueDescriptor*>(&descriptor);

543

return std::make_unique<NeonSubtractionWorkload>(*subtractionQueueDescriptor, info);

544

}

545

case LayerType::Transpose :

546

{

547

auto transposeQueueDescriptor = PolymorphicDowncast<const TransposeQueueDescriptor*>(&descriptor);

548

return std::make_unique<NeonTransposeWorkload>(*transposeQueueDescriptor, info);

549

}

550

case LayerType::TransposeConvolution2d :

551

{

552

auto transposeConvolution2dQueueDescriptor

553

= PolymorphicDowncast<const TransposeConvolution2dQueueDescriptor*>(&descriptor);

554

return std::make_unique<NeonTransposeConvolution2dWorkload>(*transposeConvolution2dQueueDescriptor,

555

info,

556

m_MemoryManager->GetIntraLayerManager());

557

}

Cathal Corbett

fd5bec4

2022-03-03 15:13:23 +0000

[diff] [blame^]

558

case LayerType::UnidirectionalSequenceLstm :

559

{

560

auto desc = PolymorphicDowncast<const UnidirectionalSequenceLstmQueueDescriptor*>(&descriptor);

561

return MakeWorkloadHelper<NeonUnidirectionalSequenceLstmFloatWorkload, NullWorkload>(*desc, info);

562

}

Teresa Charlin

611c7fb

2022-01-07 09:47:29 +0000

[diff] [blame]

default:

return nullptr;

}

}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

568

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateActivation(const ActivationQueueDescriptor& descriptor,

569

const WorkloadInfo& info) const

570

{

Nattapat Chaimanowong

d4b7059

2018-10-12 11:21:49 +0100

[diff] [blame]

571

return std::make_unique<NeonActivationWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

572

}

573

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

574

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateAddition(const AdditionQueueDescriptor& descriptor,

575

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

576

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

577

return std::make_unique<NeonAdditionWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

578

}

579

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

580

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateArgMinMax(const ArgMinMaxQueueDescriptor& descriptor,

581

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

582

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

583

return std::make_unique<NeonArgMinMaxWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

584

}

585

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

586

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateBatchNormalization(

587

const BatchNormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const

588

{

589

return std::make_unique<NeonBatchNormalizationWorkload>(descriptor, info);

590

}

591

592

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateBatchToSpaceNd(const BatchToSpaceNdQueueDescriptor& descriptor,

593

const WorkloadInfo& info) const

594

{

Mike Kelly

5685802

2020-01-27 12:14:47 +0000

[diff] [blame]

595

return std::make_unique<NeonBatchToSpaceNdWorkload>(descriptor, info);

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

596

}

597

Sadik Armagan

48f011e

2021-04-21 10:50:34 +0100

[diff] [blame]

598

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateCast(const CastQueueDescriptor& descriptor,

599

const WorkloadInfo& info) const

600

{

601

return std::make_unique<NeonCastWorkload>(descriptor, info);

602

}

603

Teresa Charlin

e89dd69

2021-09-01 16:30:34 +0100

[diff] [blame]

604

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateChannelShuffle(const ChannelShuffleQueueDescriptor& descriptor,

605

const WorkloadInfo& info) const

606

{

607

return std::make_unique<NeonChannelShuffleWorkload>(descriptor, info);

608

}

609

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

610

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateComparison(const ComparisonQueueDescriptor& descriptor,

611

const WorkloadInfo& info) const

612

{

Teresa Charlin

cedd34f

2020-03-30 11:17:30 +0100

[diff] [blame]

613

return std::make_unique<NeonComparisonWorkload>(descriptor, info);

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

614

}

615

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

616

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateConcat(const ConcatQueueDescriptor& descriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

617

const WorkloadInfo& info) const

618

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

619

return std::make_unique<NeonConcatWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

620

}

621

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

622

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConstant(const ConstantQueueDescriptor& descriptor,

623

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

624

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

625

return std::make_unique<NeonConstantWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

626

}

627

Narumol Prangnawarat

250d392

2020-03-30 16:11:04 +0100

[diff] [blame]

628

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertBf16ToFp32(

629

const ConvertBf16ToFp32QueueDescriptor& descriptor,

630

const WorkloadInfo& info) const

631

{

632

return std::make_unique<NeonConvertBf16ToFp32Workload>(descriptor, info);

633

}

634

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

635

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertFp16ToFp32(

636

const ConvertFp16ToFp32QueueDescriptor& descriptor,

637

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

638

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

639

return std::make_unique<NeonConvertFp16ToFp32Workload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

640

}

641

Narumol Prangnawarat

250d392

2020-03-30 16:11:04 +0100

[diff] [blame]

642

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertFp32ToBf16(

643

const ConvertFp32ToBf16QueueDescriptor& descriptor,

644

const WorkloadInfo& info) const

645

{

646

return std::make_unique<NeonConvertFp32ToBf16Workload>(descriptor, info);

647

}

648

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

649

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertFp32ToFp16(

650

const ConvertFp32ToFp16QueueDescriptor& descriptor,

651

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

652

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

653

return std::make_unique<NeonConvertFp32ToFp16Workload>(descriptor, info);

Nikhil Raj

9b46148

2019-07-03 15:58:31 +0100

[diff] [blame]

654

}

655

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

656

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateConvolution2d(

657

const Convolution2dQueueDescriptor& descriptor, const WorkloadInfo& info) const

658

{

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

659

bool isFastMathEnabled = false;

660

if (m_ModelContextPtr)

661

{

662

if (m_ModelContextPtr.get() != nullptr)

663

{

664

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

665

if (modelOptions)

666

{

667

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution2dWorkload>(descriptor,

672

info,

673

m_MemoryManager->GetIntraLayerManager(),

674

isFastMathEnabled);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

675

}

676

Teresa Charlin

ec5f7d1

2021-10-22 17:15:00 +0100

[diff] [blame]

677

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateConvolution3d(

678

const Convolution3dQueueDescriptor& descriptor, const WorkloadInfo& info) const

679

{

680

bool isFastMathEnabled = false;

681

if (m_ModelContextPtr)

682

{

683

if (m_ModelContextPtr.get() != nullptr)

684

{

685

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

686

if (modelOptions)

687

{

688

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution3dWorkload>(descriptor,

693

info,

694

m_MemoryManager->GetIntraLayerManager(),

isFastMathEnabled);

}

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

698

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDebug(const DebugQueueDescriptor& descriptor,

699

const WorkloadInfo& info) const

700

{

701

return MakeWorkloadHelper<NullWorkload, NullWorkload>(descriptor, info);

702

}

703

Aron Virginas-Tar

2f00b74

2019-09-30 13:28:08 +0100

[diff] [blame]

704

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDepthToSpace(const DepthToSpaceQueueDescriptor& descriptor,

705

const WorkloadInfo& info) const

706

{

707

return std::make_unique<NeonDepthToSpaceWorkload>(descriptor, info);

708

}

709

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

710

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDepthwiseConvolution2d(

711

const DepthwiseConvolution2dQueueDescriptor& descriptor, const WorkloadInfo& info) const

712

{

Nattapat Chaimanowong

7714088

2018-10-17 11:12:19 +0100

[diff] [blame]

713

return std::make_unique<NeonDepthwiseConvolutionWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

714

}

715

Narumol Prangnawarat

01961a7

2019-05-30 16:47:12 +0100

[diff] [blame]

716

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDequantize(const DequantizeQueueDescriptor& descriptor,

717

const WorkloadInfo& info) const

718

{

719

return std::make_unique<NeonDequantizeWorkload>(descriptor, info);

720

}

721

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

722

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDetectionPostProcess(

723

const armnn::DetectionPostProcessQueueDescriptor& descriptor, const armnn::WorkloadInfo& info) const

724

{

James Conroy

d9fb6e2

2020-02-21 16:52:44 +0000

[diff] [blame]

725

return MakeWorkloadHelper<NullWorkload, NullWorkload>(descriptor, info);

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

726

}

727

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

728

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateDivision(

729

const DivisionQueueDescriptor& descriptor, const WorkloadInfo& info) const

730

{

Pablo Tello

e61f071

2020-01-23 10:37:17 +0000

[diff] [blame]

731

return std::make_unique<NeonDivisionWorkload>(descriptor, info);

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

732

}

733

Sadik Armagan

ac47210

2020-03-24 09:54:36 +0000

[diff] [blame]

734

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateElementwiseUnary(

735

const ElementwiseUnaryQueueDescriptor& descriptor, const WorkloadInfo& info) const

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

736

{

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

737

switch(descriptor.m_Parameters.m_Operation)

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

738

{

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

739

case UnaryOperation::Abs:

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

740

{

741

AbsQueueDescriptor absQueueDescriptor;

742

absQueueDescriptor.m_Inputs = descriptor.m_Inputs;

743

absQueueDescriptor.m_Outputs = descriptor.m_Outputs;

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

744

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

745

return std::make_unique<NeonAbsWorkload>(absQueueDescriptor, info);

746

}

Teresa Charlin

50de4fa

2021-05-31 18:47:33 +0100

[diff] [blame]

747

case UnaryOperation::Exp:

748

return std::make_unique<NeonExpWorkload>(descriptor, info);

749

case UnaryOperation::LogicalNot:

750

return std::make_unique<NeonLogicalNotWorkload>(descriptor, info);

751

case UnaryOperation::Log:

752

return std::make_unique<NeonLogWorkload>(descriptor, info);

753

case UnaryOperation::Neg:

754

return std::make_unique<NeonNegWorkload>(descriptor, info);

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

755

case UnaryOperation::Rsqrt:

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

756

{

757

RsqrtQueueDescriptor rsqrtQueueDescriptor;

758

rsqrtQueueDescriptor.m_Inputs = descriptor.m_Inputs;

759

rsqrtQueueDescriptor.m_Outputs = descriptor.m_Outputs;

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

760

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

761

return std::make_unique<NeonRsqrtWorkload>(rsqrtQueueDescriptor, info);

762

}

Teresa Charlin

50de4fa

2021-05-31 18:47:33 +0100

[diff] [blame]

763

case UnaryOperation::Sin:

764

return std::make_unique<NeonSinWorkload>(descriptor, info);

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

765

default:

766

return nullptr;

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

767

}

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

768

}

769

Sadik Armagan

a792a05

2020-06-23 16:22:23 +0100

[diff] [blame]

770

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateFill(const FillQueueDescriptor& descriptor,

771

const WorkloadInfo& info) const

772

{

773

return std::make_unique<NeonFillWorkload>(descriptor, info);

774

}

775

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

776

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateFloor(const FloorQueueDescriptor& descriptor,

777

const WorkloadInfo& info) const

778

{

779

return MakeWorkloadHelper<NeonFloorFloatWorkload, NullWorkload>(descriptor, info);

780

}

781

782

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateFullyConnected(

783

const FullyConnectedQueueDescriptor& descriptor, const WorkloadInfo& info) const

784

{

Kevin May

be7e35c

2020-04-29 17:05:05 +0100

[diff] [blame]

785

return std::make_unique<NeonFullyConnectedWorkload>(descriptor, info, m_MemoryManager->GetIntraLayerManager());

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

786

}

787

788

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateGather(const armnn::GatherQueueDescriptor& descriptor,

789

const armnn::WorkloadInfo& info) const

790

{

Teresa Charlin

f540eb8

2020-04-10 19:24:55 +0100

[diff] [blame]

791

return std::make_unique<NeonGatherWorkload>(descriptor, info);

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

792

}

793

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

794

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateInput(const InputQueueDescriptor& descriptor,

795

const WorkloadInfo& info) const

796

{

797

return std::make_unique<CopyMemGenericWorkload>(descriptor, info);

798

}

799

800

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateInstanceNormalization(

801

const InstanceNormalizationQueueDescriptor& descriptor,

802

const WorkloadInfo& info) const

803

{

804

return std::make_unique<NeonInstanceNormalizationWorkload>(descriptor, info);

805

}

806

807

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateL2Normalization(const L2NormalizationQueueDescriptor& descriptor,

808

const WorkloadInfo& info) const

809

{

810

return MakeWorkloadHelper<NeonL2NormalizationFloatWorkload, NullWorkload>(descriptor, info,

811

m_MemoryManager->GetIntraLayerManager());

812

}

813

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

814

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateLogSoftmax(const LogSoftmaxQueueDescriptor& descriptor,

815

const WorkloadInfo& info) const

816

{

817

return std::make_unique<NeonLogSoftmaxWorkload>(descriptor, info, m_MemoryManager->GetIntraLayerManager());

818

}

819

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

820

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateLogicalBinary(const LogicalBinaryQueueDescriptor& descriptor,

821

const WorkloadInfo& info) const

822

{

823

switch(descriptor.m_Parameters.m_Operation)

824

{

825

case LogicalBinaryOperation::LogicalAnd:

826

return std::make_unique<NeonLogicalAndWorkload>(descriptor, info);

827

case LogicalBinaryOperation::LogicalOr:

828

return std::make_unique<NeonLogicalOrWorkload>(descriptor, info);

default:

return nullptr;

}

}

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

834

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateLstm(const LstmQueueDescriptor& descriptor,

835

const WorkloadInfo& info) const

836

{

837

return MakeWorkloadHelper<NeonLstmFloatWorkload, NullWorkload>(descriptor, info);

838

}

839

840

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateMaximum(const MaximumQueueDescriptor& descriptor,

841

const WorkloadInfo& info) const

842

{

843

return std::make_unique<NeonMaximumWorkload>(descriptor, info);

844

}

845

846

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateMean(const MeanQueueDescriptor& descriptor,

847

const WorkloadInfo& info) const

848

{

849

return std::make_unique<NeonMeanWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

850

}

851

852

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMemCopy(const MemCopyQueueDescriptor& descriptor,

853

const WorkloadInfo& info) const

854

{

855

if (descriptor.m_Inputs.empty() || !descriptor.m_Inputs[0])

856

{

857

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemCopy workload");

858

}

859

Aron Virginas-Tar

a8e06ed

2018-10-19 16:46:15 +0100

[diff] [blame]

860

return MakeWorkloadHelper<CopyMemGenericWorkload, CopyMemGenericWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

861

}

862

Derek Lamberti

f674aa0

2019-08-01 15:56:25 +0100

[diff] [blame]

863

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMemImport(const MemImportQueueDescriptor& descriptor,

864

const WorkloadInfo& info) const

865

{

866

if (descriptor.m_Inputs.empty() || !descriptor.m_Inputs[0])

867

{

868

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemImport workload");

869

}

870

871

return std::make_unique<ImportMemGenericWorkload>(descriptor, info);

872

}

873

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

874

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateMinimum(const MinimumQueueDescriptor& descriptor,

875

const WorkloadInfo& info) const

876

{

877

return std::make_unique<NeonMinimumWorkload>(descriptor, info);

878

}

879

880

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMultiplication(

881

const MultiplicationQueueDescriptor& descriptor, const WorkloadInfo& info) const

882

{

883

return std::make_unique<NeonMultiplicationWorkload>(descriptor, info);

884

}

885

886

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateNormalization(

887

const NormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const

888

{

889

return MakeWorkloadHelper<NeonNormalizationFloatWorkload, NullWorkload>(descriptor, info,

890

m_MemoryManager->GetIntraLayerManager());

891

}

892

893

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateOutput(const OutputQueueDescriptor& descriptor,

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

894

const WorkloadInfo& info) const

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

895

{

896

return std::make_unique<CopyMemGenericWorkload>(descriptor, info);

897

}

898

899

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreatePad(const PadQueueDescriptor& descriptor,

900

const WorkloadInfo& info) const

901

{

902

return std::make_unique<NeonPadWorkload>(descriptor, info);

903

}

904

905

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreatePermute(const PermuteQueueDescriptor& descriptor,

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

906

const WorkloadInfo& info) const

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

907

{

908

return std::make_unique<NeonPermuteWorkload>(descriptor, info);

909

}

910

911

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreatePooling2d(const Pooling2dQueueDescriptor& descriptor,

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

912

const WorkloadInfo& info) const

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

913

{

914

return std::make_unique<NeonPooling2dWorkload>(descriptor, info);

915

}

916

917

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreatePreCompiled(const PreCompiledQueueDescriptor& descriptor,

918

const WorkloadInfo& info) const

919

{

920

return MakeWorkloadHelper<NullWorkload, NullWorkload>(descriptor, info);

921

}

922

923

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreatePrelu(const armnn::PreluQueueDescriptor &descriptor,

924

const armnn::WorkloadInfo &info) const

925

{

926

return std::make_unique<NeonPreluWorkload>(descriptor, info);

927

}

928

James Conroy

cc34093

2020-05-12 18:08:52 +0100

[diff] [blame]

929

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateQLstm(const QLstmQueueDescriptor& descriptor,

930

const WorkloadInfo& info) const

931

{

932

return std::make_unique<NeonQLstmWorkload>(descriptor, info);

933

}

934

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

935

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateQuantize(const QuantizeQueueDescriptor& descriptor,

936

const WorkloadInfo& info) const

937

{

Kevin May

9077473

2020-03-03 12:10:10 +0000

[diff] [blame]

938

return std::make_unique<NeonQuantizeWorkload>(descriptor, info);

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

939

}

940

941

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateQuantizedLstm(const QuantizedLstmQueueDescriptor& descriptor,

942

const WorkloadInfo& info) const

943

{

944

return std::make_unique<NeonQuantizedLstmWorkload>(descriptor, info);

945

}

946

David Monahan

97451b4

2020-12-03 09:48:06 +0000

[diff] [blame]

947

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateRank(const RankQueueDescriptor& descriptor,

948

const WorkloadInfo& info) const

949

{

950

return std::make_unique<NeonRankWorkload>(descriptor, info);

951

}

952

Sadik Armagan

a274748

2021-02-09 10:28:54 +0000

[diff] [blame]

953

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateReduce(const ReduceQueueDescriptor& descriptor,

954

const WorkloadInfo& info) const

955

{

956

return std::make_unique<NeonReduceWorkload>(descriptor, info);

957

}

958

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

959

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateReshape(const ReshapeQueueDescriptor& descriptor,

960

const WorkloadInfo& info) const

961

{

962

return std::make_unique<NeonReshapeWorkload>(descriptor, info);

963

}

964

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

965

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateResize(const ResizeQueueDescriptor& descriptor,

966

const WorkloadInfo& info) const

967

{

Ellen Norris-Thompson

37e6868

2019-07-15 14:23:30 +0100

[diff] [blame]

968

return std::make_unique<NeonResizeWorkload>(descriptor, info);

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

969

}

970

josh minor

036f02d

2019-11-15 14:53:22 -0600

[diff] [blame]

971

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSlice(const SliceQueueDescriptor& descriptor,

972

const WorkloadInfo& info) const

973

{

974

return std::make_unique<NeonSliceWorkload>(descriptor, info);

975

}

976

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

977

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSoftmax(const SoftmaxQueueDescriptor& descriptor,

978

const WorkloadInfo& info) const

Sadik Armagan

581742d

2019-08-12 14:11:37 +0100

[diff] [blame]

979

{

Sadik Armagan

be88a57

2020-04-30 11:39:37 +0100

[diff] [blame]

980

return std::make_unique<NeonSoftmaxWorkload>(descriptor, info, m_MemoryManager->GetIntraLayerManager());

Sadik Armagan

581742d

2019-08-12 14:11:37 +0100

[diff] [blame]

981

}

982

Mike Kelly

0be3a88

2020-01-24 11:27:50 +0000

[diff] [blame]

983

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSpaceToBatchNd(const SpaceToBatchNdQueueDescriptor& descriptor,

984

const WorkloadInfo& info) const

985

{

986

return std::make_unique<NeonSpaceToBatchNdWorkload>(descriptor, info);

987

}

988

989

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSpaceToDepth(const SpaceToDepthQueueDescriptor& descriptor,

990

const WorkloadInfo& info) const

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

991

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

992

return std::make_unique<NeonSpaceToDepthWorkload>(descriptor, info);

993

}

994

995

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSplitter(const SplitterQueueDescriptor& descriptor,

996

const WorkloadInfo& info) const

997

{

998

return std::make_unique<NeonSplitterWorkload>(descriptor, info);

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

999

}

1000

Matthew Jackson

87f65ea

2019-08-01 10:01:34 +0100

[diff] [blame]

1001

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateStack(const StackQueueDescriptor& descriptor,

1002

const WorkloadInfo& info) const

1003

{

1004

return std::make_unique<NeonStackWorkload>(descriptor, info);

1005

}

1006

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1007

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateStridedSlice(const StridedSliceQueueDescriptor& descriptor,

1008

const WorkloadInfo& info) const

James Conroy

d47a064

2019-09-17 14:22:06 +0100

[diff] [blame]

1009

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1010

return std::make_unique<NeonStridedSliceWorkload>(descriptor, info);

1011

}

1012

1013

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateSubtraction(

1014

const SubtractionQueueDescriptor& descriptor, const WorkloadInfo& info) const

1015

{

1016

return std::make_unique<NeonSubtractionWorkload>(descriptor, info);

1017

}

1018

Mike Kelly

c9ea45a

2020-02-28 18:11:58 +0000

[diff] [blame]

1019

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateTranspose(const TransposeQueueDescriptor& descriptor,

1020

const WorkloadInfo& info) const

1021

{

1022

return std::make_unique<NeonTransposeWorkload>(descriptor, info);

1023

}

1024

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1025

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateTransposeConvolution2d(

1026

const TransposeConvolution2dQueueDescriptor &descriptor,

1027

const WorkloadInfo &info) const

1028

{

1029

return std::make_unique<NeonTransposeConvolution2dWorkload>(descriptor, info,

1030

m_MemoryManager->GetIntraLayerManager());

James Conroy

d47a064

2019-09-17 14:22:06 +0100

[diff] [blame]

1031

}

1032

Aron Virginas-Tar