Blame - src/backends/neon/NeonWorkloadFactory.cpp - ml/armnn

2020-07-02 11:49:26 +0100

[diff] [blame]

2

David Beck

ecb56cd

2018-09-05 12:52:57 +0100

[diff] [blame]

3

// SPDX-License-Identifier: MIT

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

5

David Beck

79141b9

2018-10-23 16:09:36 +0100

[diff] [blame]

6

#include "NeonBackendId.hpp"

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

7

#include "NeonBackendModelContext.hpp"

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

8

#include "NeonTensorHandle.hpp"

9

#include "NeonWorkloadFactory.hpp"

10

David Beck

0dbe0ee

2018-09-24 15:59:27 +0100

[diff] [blame]

11

#include <Layer.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

12

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

13

#include <armnn/Utils.hpp>

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

14

#include <armnn/utility/IgnoreUnused.hpp>

Matthew Sloyan

171214c

2020-09-09 09:07:37 +0100

[diff] [blame]

15

#include <armnn/utility/NumericCast.hpp>

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

16

#include <armnn/utility/PolymorphicDowncast.hpp>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

17

Aron Virginas-Tar

c9cc804

2018-11-01 16:15:57 +0000

[diff] [blame]

18

#include <backendsCommon/MakeWorkloadHelper.hpp>

Colm Donelan

0c47974

2021-12-10 12:43:54 +0000

[diff] [blame]

19

#include <armnn/backends/MemCopyWorkload.hpp>

Derek Lamberti

f674aa0

2019-08-01 15:56:25 +0100

[diff] [blame]

20

#include <backendsCommon/MemImportWorkload.hpp>

Colm Donelan

0c47974

2021-12-10 12:43:54 +0000

[diff] [blame]

21

#include <armnn/backends/TensorHandle.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

22

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

23

#include <neon/workloads/NeonWorkloadUtils.hpp>

24

#include <neon/workloads/NeonWorkloads.hpp>

25

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

namespace armnn

{

David Beck

2018-10-23 16:09:36 +0100

[diff] [blame]

29

namespace

30

{

31

static const BackendId s_Id{NeonBackendId()};

32

}

33

David Beck

29c75de

2018-10-23 13:35:58 +0100

[diff] [blame]

34

bool NeonWorkloadFactory::IsLayerSupported(const Layer& layer,

35

Optional<DataType> dataType,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

36

std::string& outReasonIfUnsupported)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

37

{

David Beck

79141b9

2018-10-23 16:09:36 +0100

[diff] [blame]

38

return IWorkloadFactory::IsLayerSupported(s_Id, layer, dataType, outReasonIfUnsupported);

39

}

40

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

41

bool NeonWorkloadFactory::IsLayerSupported(const IConnectableLayer& layer,

42

Optional<DataType> dataType,

43

std::string& outReasonIfUnsupported,

44

const ModelOptions& modelOptions)

45

{

46

return IWorkloadFactory::IsLayerSupported(s_Id, layer, dataType, outReasonIfUnsupported, modelOptions);

47

}

48

David Beck

79141b9

2018-10-23 16:09:36 +0100

[diff] [blame]

49

const BackendId& NeonWorkloadFactory::GetBackendId() const

50

{

51

return s_Id;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

52

}

53

Matthew Sloyan

0a7dc6b

2021-02-10 16:50:53 +0000

[diff] [blame]

54

void NeonWorkloadFactory::SetNumberOfThreads()

55

{

56

if (m_ModelContextPtr)

57

{

58

const unsigned int MIN_THREADS = 1;

59

const unsigned int MAX_THREADS = 64;

60

61

// Set the number of threads to be used if the user has set NumberOfThreads param

62

// Only set if within limit or valid input

63

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

64

auto numberOfThreads = modelOptions->GetNumberOfThreads();

65

66

if (numberOfThreads != 0 && numberOfThreads >= MIN_THREADS && numberOfThreads <= MAX_THREADS)

67

{

68

arm_compute::Scheduler::get().set_num_threads(numberOfThreads);

}

}

}

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

73

NeonWorkloadFactory::NeonWorkloadFactory(const std::shared_ptr<NeonMemoryManager>& memoryManager)

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

74

: m_MemoryManager(memoryManager), m_ModelContextPtr(IBackendInternal::IBackendSpecificModelContextPtr{})

75

{

Matthew Sloyan

0a7dc6b

2021-02-10 16:50:53 +0000

[diff] [blame]

76

SetNumberOfThreads();

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

77

}

78

79

NeonWorkloadFactory::NeonWorkloadFactory(const std::shared_ptr<NeonMemoryManager>& memoryManager,

80

const IBackendInternal::IBackendSpecificModelContextPtr& modelContextPtr)

81

: m_MemoryManager(memoryManager), m_ModelContextPtr(modelContextPtr)

surmeh01

3537c2c

2018-05-18 16:31:43 +0100

[diff] [blame]

82

{

Matthew Sloyan

0a7dc6b

2021-02-10 16:50:53 +0000

[diff] [blame]

83

SetNumberOfThreads();

surmeh01

3537c2c

2018-05-18 16:31:43 +0100

[diff] [blame]

84

}

85

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

86

std::unique_ptr<ITensorHandle> NeonWorkloadFactory::CreateSubTensorHandle(ITensorHandle& parent,

87

TensorShape const& subTensorShape,

88

unsigned int const* subTensorOrigin) const

89

{

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

90

const arm_compute::TensorShape shape = armcomputetensorutils::BuildArmComputeTensorShape(subTensorShape);

91

92

arm_compute::Coordinates coords;

93

coords.set_num_dimensions(subTensorShape.GetNumDimensions());

94

for (unsigned int i = 0; i < subTensorShape.GetNumDimensions(); i++)

95

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

96

// Arm compute indexes tensor coords in reverse order.

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

97

unsigned int revertedIndex = subTensorShape.GetNumDimensions() - i - 1;

Matthew Sloyan

171214c

2020-09-09 09:07:37 +0100

[diff] [blame]

98

coords.set(i, armnn::numeric_cast<int>(subTensorOrigin[revertedIndex]));

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

99

}

100

Derek Lamberti

0790dce

2019-04-15 18:37:35 +0100

[diff] [blame]

101

const arm_compute::TensorShape parentShape = armcomputetensorutils::BuildArmComputeTensorShape(parent.GetShape());

102

if (!::arm_compute::error_on_invalid_subtensor(__func__, __FILE__, __LINE__, parentShape, coords, shape))

{

return nullptr;

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

107

return std::make_unique<NeonSubTensorHandle>(

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

108

PolymorphicDowncast<IAclTensorHandle*>(&parent), shape, coords);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

109

}

110

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

111

std::unique_ptr<ITensorHandle> NeonWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,

112

const bool IsMemoryManaged) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

113

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

114

auto tensorHandle = std::make_unique<NeonTensorHandle>(tensorInfo);

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

115

if (IsMemoryManaged)

116

{

117

tensorHandle->SetMemoryGroup(m_MemoryManager->GetInterLayerMemoryGroup());

118

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

119

return tensorHandle;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

120

}

121

Francis Murtagh

351d13d

2018-09-24 15:01:18 +0100

[diff] [blame]

122

std::unique_ptr<ITensorHandle> NeonWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

123

DataLayout dataLayout,

124

const bool IsMemoryManaged) const

Francis Murtagh

351d13d

2018-09-24 15:01:18 +0100

[diff] [blame]

125

{

126

auto tensorHandle = std::make_unique<NeonTensorHandle>(tensorInfo, dataLayout);

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

127

if (IsMemoryManaged)

128

{

129

tensorHandle->SetMemoryGroup(m_MemoryManager->GetInterLayerMemoryGroup());

130

}

Francis Murtagh

351d13d

2018-09-24 15:01:18 +0100

[diff] [blame]

return tensorHandle;

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

134

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateWorkload(LayerType type,

135

const QueueDescriptor& descriptor,

136

const WorkloadInfo& info) const

{

switch(type)

{

case LayerType::Activation :

141

{

142

auto activationQueueDescriptor = PolymorphicDowncast<const ActivationQueueDescriptor*>(&descriptor);

143

return std::make_unique<NeonActivationWorkload>(*activationQueueDescriptor, info);

144

}

145

case LayerType::Addition :

146

{

147

auto additionQueueDescriptor = PolymorphicDowncast<const AdditionQueueDescriptor*>(&descriptor);

148

return std::make_unique<NeonAdditionWorkload>(*additionQueueDescriptor, info);

149

}

150

case LayerType::ArgMinMax :

151

{

152

auto argMinMaxQueueDescriptor = PolymorphicDowncast<const ArgMinMaxQueueDescriptor*>(&descriptor);

153

return std::make_unique<NeonArgMinMaxWorkload>(*argMinMaxQueueDescriptor, info);

154

}

155

case LayerType::BatchNormalization :

156

{

157

auto batchNormalizationQueueDescriptor

158

= PolymorphicDowncast<const BatchNormalizationQueueDescriptor*>(&descriptor);

159

return std::make_unique<NeonBatchNormalizationWorkload>(*batchNormalizationQueueDescriptor, info);

160

}

161

case LayerType::BatchToSpaceNd :

162

{

163

auto batchToSpaceNdQueueDescriptor

164

= PolymorphicDowncast<const BatchToSpaceNdQueueDescriptor*>(&descriptor);

165

return std::make_unique<NeonBatchToSpaceNdWorkload>(*batchToSpaceNdQueueDescriptor, info);

166

}

167

case LayerType::Cast :

168

{

169

auto castQueueDescriptor = PolymorphicDowncast<const CastQueueDescriptor*>(&descriptor);

170

return std::make_unique<NeonCastWorkload>(*castQueueDescriptor, info);

171

}

172

case LayerType::ChannelShuffle :

173

{

174

auto channelShuffleQueueDescriptor = PolymorphicDowncast<const ChannelShuffleQueueDescriptor*>(&descriptor);

175

return std::make_unique<NeonChannelShuffleWorkload>(*channelShuffleQueueDescriptor, info);

176

}

177

case LayerType::Comparison :

178

{

179

auto comparisonQueueDescriptor = PolymorphicDowncast<const ComparisonQueueDescriptor*>(&descriptor);

180

return std::make_unique<NeonComparisonWorkload>(*comparisonQueueDescriptor, info);

181

}

182

case LayerType::Concat :

183

{

184

auto concatQueueDescriptor = PolymorphicDowncast<const ConcatQueueDescriptor*>(&descriptor);

185

return std::make_unique<NeonConcatWorkload>(*concatQueueDescriptor, info);

186

}

187

case LayerType::Constant :

188

{

189

auto constantQueueDescriptor = PolymorphicDowncast<const ConstantQueueDescriptor*>(&descriptor);

190

return std::make_unique<NeonConstantWorkload>(*constantQueueDescriptor, info);

191

}

192

case LayerType::ConvertBf16ToFp32 :

193

{

194

auto convertBf16ToFp32QueueDescriptor

195

= PolymorphicDowncast<const ConvertBf16ToFp32QueueDescriptor*>(&descriptor);

196

return std::make_unique<NeonConvertBf16ToFp32Workload>(*convertBf16ToFp32QueueDescriptor, info);

197

}

198

case LayerType::ConvertFp16ToFp32 :

199

{

200

auto convertFp16ToFp32QueueDescriptor

201

= PolymorphicDowncast<const ConvertFp16ToFp32QueueDescriptor*>(&descriptor);

202

return std::make_unique<NeonConvertFp16ToFp32Workload>(*convertFp16ToFp32QueueDescriptor, info);

203

}

204

case LayerType::ConvertFp32ToBf16 :

205

{

206

auto convertFp32ToBf16QueueDescriptor

207

= PolymorphicDowncast<const ConvertFp32ToBf16QueueDescriptor*>(&descriptor);

208

return std::make_unique<NeonConvertFp32ToBf16Workload>(*convertFp32ToBf16QueueDescriptor, info);

209

}

210

case LayerType::ConvertFp32ToFp16 :

211

{

212

auto convertFp32ToFp16QueueDescriptor

213

= PolymorphicDowncast<const ConvertFp32ToFp16QueueDescriptor*>(&descriptor);

214

return std::make_unique<NeonConvertFp32ToFp16Workload>(*convertFp32ToFp16QueueDescriptor, info);

215

}

216

case LayerType::Convolution2d :

217

{

218

auto convolution2dQueueDescriptor = PolymorphicDowncast<const Convolution2dQueueDescriptor*>(&descriptor);

219

220

bool isFastMathEnabled = false;

221

if (m_ModelContextPtr)

222

{

223

if (m_ModelContextPtr.get() != nullptr)

224

{

225

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

226

if (modelOptions)

227

{

228

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution2dWorkload>(*convolution2dQueueDescriptor,

233

info,

234

m_MemoryManager->GetIntraLayerManager(),

235

isFastMathEnabled);

236

}

237

case LayerType::Convolution3d :

238

{

239

auto convolution3dQueueDescriptor = PolymorphicDowncast<const Convolution3dQueueDescriptor*>(&descriptor);

240

241

bool isFastMathEnabled = false;

242

if (m_ModelContextPtr)

243

{

244

if (m_ModelContextPtr.get() != nullptr)

245

{

246

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

247

if (modelOptions)

248

{

249

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution3dWorkload>(*convolution3dQueueDescriptor,

254

info,

255

m_MemoryManager->GetIntraLayerManager(),

256

isFastMathEnabled);

257

}

258

case LayerType::Debug :

259

{

260

auto debugQueueDescriptor = PolymorphicDowncast<const DebugQueueDescriptor*>(&descriptor);

261

return MakeWorkloadHelper<NullWorkload, NullWorkload>(*debugQueueDescriptor, info);

262

}

263

case LayerType::DepthToSpace :

264

{

265

auto depthToSpaceQueueDescriptor = PolymorphicDowncast<const DepthToSpaceQueueDescriptor*>(&descriptor);

266

return std::make_unique<NeonDepthToSpaceWorkload>(*depthToSpaceQueueDescriptor, info);

267

}

268

case LayerType::DepthwiseConvolution2d :

269

{

270

auto depthwiseConvolution2dQueueDescriptor

271

= PolymorphicDowncast<const DepthwiseConvolution2dQueueDescriptor*>(&descriptor);

272

return std::make_unique<NeonDepthwiseConvolutionWorkload>(*depthwiseConvolution2dQueueDescriptor, info);

273

}

274

case LayerType::Dequantize :

275

{

276

auto dequantizeQueueDescriptor = PolymorphicDowncast<const DequantizeQueueDescriptor*>(&descriptor);

277

return std::make_unique<NeonDequantizeWorkload>(*dequantizeQueueDescriptor, info);

278

}

279

case LayerType::DetectionPostProcess :

280

{

281

auto detectionPostProcessQueueDescriptor

282

= PolymorphicDowncast<const DetectionPostProcessQueueDescriptor*>(&descriptor);

283

return MakeWorkloadHelper<NullWorkload, NullWorkload>(*detectionPostProcessQueueDescriptor, info);

284

}

285

case LayerType::Division :

286

{

287

auto divisionQueueDescriptor = PolymorphicDowncast<const DivisionQueueDescriptor*>(&descriptor);

288

return std::make_unique<NeonDivisionWorkload>(*divisionQueueDescriptor, info);

289

}

290

case LayerType::ElementwiseUnary :

291

{

292

auto elementwiseUnaryQueueDescriptor

293

= PolymorphicDowncast<const ElementwiseUnaryQueueDescriptor*>(&descriptor);

294

295

switch(elementwiseUnaryQueueDescriptor->m_Parameters.m_Operation)

296

{

297

case UnaryOperation::Abs:

298

{

299

AbsQueueDescriptor absQueueDescriptor;

300

absQueueDescriptor.m_Inputs = elementwiseUnaryQueueDescriptor->m_Inputs;

301

absQueueDescriptor.m_Outputs = elementwiseUnaryQueueDescriptor->m_Outputs;

302

303

return std::make_unique<NeonAbsWorkload>(absQueueDescriptor, info);

304

}

305

case UnaryOperation::Exp:

306

return std::make_unique<NeonExpWorkload>(*elementwiseUnaryQueueDescriptor, info);

307

case UnaryOperation::LogicalNot:

308

return std::make_unique<NeonLogicalNotWorkload>(*elementwiseUnaryQueueDescriptor, info);

309

case UnaryOperation::Log:

310

return std::make_unique<NeonLogWorkload>(*elementwiseUnaryQueueDescriptor, info);

311

case UnaryOperation::Neg:

312

return std::make_unique<NeonNegWorkload>(*elementwiseUnaryQueueDescriptor, info);

313

case UnaryOperation::Rsqrt:

314

{

315

RsqrtQueueDescriptor rsqrtQueueDescriptor;

316

rsqrtQueueDescriptor.m_Inputs = elementwiseUnaryQueueDescriptor->m_Inputs;

317

rsqrtQueueDescriptor.m_Outputs = elementwiseUnaryQueueDescriptor->m_Outputs;

318

319

return std::make_unique<NeonRsqrtWorkload>(rsqrtQueueDescriptor, info);

320

}

321

case UnaryOperation::Sin:

322

return std::make_unique<NeonSinWorkload>(*elementwiseUnaryQueueDescriptor, info);

Teresa Charlin

0302723

2022-05-09 17:27:08 +0100

[diff] [blame^]

323

case UnaryOperation::Sqrt:

324

return std::make_unique<NeonSqrtWorkload>(*elementwiseUnaryQueueDescriptor, info);

Teresa Charlin

611c7fb

2022-01-07 09:47:29 +0000

[diff] [blame]

default:

return nullptr;

}

}

case LayerType::Fill :

330

{

331

auto fillQueueDescriptor = PolymorphicDowncast<const FillQueueDescriptor*>(&descriptor);

332

return std::make_unique<NeonFillWorkload>(*fillQueueDescriptor, info);

333

}

334

case LayerType::Floor :

335

{

336

auto floorQueueDescriptor = PolymorphicDowncast<const FloorQueueDescriptor*>(&descriptor);

337

return MakeWorkloadHelper<NeonFloorFloatWorkload, NullWorkload>(*floorQueueDescriptor, info);

338

}

339

case LayerType::FullyConnected :

340

{

341

auto fullyConnectedQueueDescriptor = PolymorphicDowncast<const FullyConnectedQueueDescriptor*>(&descriptor);

342

return std::make_unique<NeonFullyConnectedWorkload>(*fullyConnectedQueueDescriptor,

343

info,

344

m_MemoryManager->GetIntraLayerManager());

345

}

346

case LayerType::Gather :

347

{

348

auto gatherQueueDescriptor = PolymorphicDowncast<const GatherQueueDescriptor*>(&descriptor);

349

return std::make_unique<NeonGatherWorkload>(*gatherQueueDescriptor, info);

350

}

Teresa Charlin

bd22c7d

2022-04-26 18:14:12 +0100

[diff] [blame]

351

case LayerType::GatherNd :

352

{

353

auto gatherNdQueueDescriptor = PolymorphicDowncast<const GatherNdQueueDescriptor*>(&descriptor);

354

return std::make_unique<NeonGatherNdWorkload>(*gatherNdQueueDescriptor, info);

355

}

Teresa Charlin

611c7fb

2022-01-07 09:47:29 +0000

[diff] [blame]

356

case LayerType::Input :

357

{

358

auto inputQueueDescriptor = PolymorphicDowncast<const InputQueueDescriptor*>(&descriptor);

359

return std::make_unique<CopyMemGenericWorkload>(*inputQueueDescriptor, info);

360

}

361

case LayerType::InstanceNormalization :

362

{

363

auto instanceNormalizationQueueDescriptor

364

= PolymorphicDowncast<const InstanceNormalizationQueueDescriptor*>(&descriptor);

365

return std::make_unique<NeonInstanceNormalizationWorkload>(*instanceNormalizationQueueDescriptor, info);

366

}

367

case LayerType::L2Normalization :

368

{

369

auto l2NormalizationQueueDescriptor

370

= PolymorphicDowncast<const L2NormalizationQueueDescriptor*>(&descriptor);

371

return MakeWorkloadHelper<NeonL2NormalizationFloatWorkload, NullWorkload>

372

(*l2NormalizationQueueDescriptor, info, m_MemoryManager->GetIntraLayerManager());

373

}

374

case LayerType::LogSoftmax :

375

{

376

auto logSoftmaxQueueDescriptor = PolymorphicDowncast<const LogSoftmaxQueueDescriptor*>(&descriptor);

377

return std::make_unique<NeonLogSoftmaxWorkload>(*logSoftmaxQueueDescriptor,

378

info,

379

m_MemoryManager->GetIntraLayerManager());

380

}

381

case LayerType::LogicalBinary :

382

{

383

auto logicalBinaryQueueDescriptor = PolymorphicDowncast<const LogicalBinaryQueueDescriptor*>(&descriptor);

384

385

switch(logicalBinaryQueueDescriptor->m_Parameters.m_Operation)

386

{

387

case LogicalBinaryOperation::LogicalAnd:

388

return std::make_unique<NeonLogicalAndWorkload>(*logicalBinaryQueueDescriptor, info);

389

case LogicalBinaryOperation::LogicalOr:

390

return std::make_unique<NeonLogicalOrWorkload>(*logicalBinaryQueueDescriptor, info);

default:

return nullptr;

}

}

case LayerType::Lstm :

396

{

397

auto lstmQueueDescriptor = PolymorphicDowncast<const LstmQueueDescriptor*>(&descriptor);

398

return MakeWorkloadHelper<NeonLstmFloatWorkload, NullWorkload>(*lstmQueueDescriptor, info);

399

}

400

case LayerType::Maximum :

401

{

402

auto maximumQueueDescriptor = PolymorphicDowncast<const MaximumQueueDescriptor*>(&descriptor);

403

return std::make_unique<NeonMaximumWorkload>(*maximumQueueDescriptor, info);

404

}

405

case LayerType::Mean :

406

{

407

auto meanQueueDescriptor = PolymorphicDowncast<const MeanQueueDescriptor*>(&descriptor);

408

return std::make_unique<NeonMeanWorkload>(*meanQueueDescriptor, info);

409

}

410

case LayerType::MemCopy :

411

{

412

auto memCopyQueueDescriptor = PolymorphicDowncast<const MemCopyQueueDescriptor*>(&descriptor);

413

if (memCopyQueueDescriptor->m_Inputs.empty() || !memCopyQueueDescriptor->m_Inputs[0])

414

{

415

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemCopy workload");

416

}

417

return MakeWorkloadHelper<CopyMemGenericWorkload, CopyMemGenericWorkload>(*memCopyQueueDescriptor, info);

418

}

419

case LayerType::MemImport :

420

{

421

auto memImportQueueDescriptor = PolymorphicDowncast<const MemImportQueueDescriptor*>(&descriptor);

422

if (memImportQueueDescriptor->m_Inputs.empty() || !memImportQueueDescriptor->m_Inputs[0])

423

{

424

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemImport workload");

425

}

426

return std::make_unique<ImportMemGenericWorkload>(*memImportQueueDescriptor, info);

427

}

428

case LayerType::Minimum :

429

{

430

auto minimumQueueDescriptor = PolymorphicDowncast<const MinimumQueueDescriptor*>(&descriptor);

431

return std::make_unique<NeonMinimumWorkload>(*minimumQueueDescriptor, info);

432

}

433

case LayerType::Multiplication :

434

{

435

auto multiplicationQueueDescriptor = PolymorphicDowncast<const MultiplicationQueueDescriptor*>(&descriptor);

436

return std::make_unique<NeonMultiplicationWorkload>(*multiplicationQueueDescriptor, info);

437

}

438

case LayerType::Normalization :

439

{

440

auto normalizationQueueDescriptor = PolymorphicDowncast<const NormalizationQueueDescriptor*>(&descriptor);

441

return MakeWorkloadHelper<NeonNormalizationFloatWorkload, NullWorkload>

442

(*normalizationQueueDescriptor, info, m_MemoryManager->GetIntraLayerManager());

443

}

444

case LayerType::Output :

445

{

446

auto outputQueueDescriptor = PolymorphicDowncast<const OutputQueueDescriptor*>(&descriptor);

447

return std::make_unique<CopyMemGenericWorkload>(*outputQueueDescriptor, info);

448

}

449

case LayerType::Pad :

450

{

451

auto padQueueDescriptor = PolymorphicDowncast<const PadQueueDescriptor*>(&descriptor);

452

return std::make_unique<NeonPadWorkload>(*padQueueDescriptor, info);

453

}

454

case LayerType::Permute :

455

{

456

auto permuteQueueDescriptor = PolymorphicDowncast<const PermuteQueueDescriptor*>(&descriptor);

457

return std::make_unique<NeonPermuteWorkload>(*permuteQueueDescriptor, info);

458

}

459

case LayerType::Pooling2d :

460

{

461

auto pooling2dQueueDescriptor = PolymorphicDowncast<const Pooling2dQueueDescriptor*>(&descriptor);

462

return std::make_unique<NeonPooling2dWorkload>(*pooling2dQueueDescriptor, info);

463

}

464

case LayerType::PreCompiled :

465

{

466

auto preCompiledQueueDescriptor = PolymorphicDowncast<const PreCompiledQueueDescriptor*>(&descriptor);

467

return MakeWorkloadHelper<NullWorkload, NullWorkload>(*preCompiledQueueDescriptor, info);

468

}

469

case LayerType::Prelu :

470

{

471

auto preluQueueDescriptor = PolymorphicDowncast<const PreluQueueDescriptor*>(&descriptor);

472

return std::make_unique<NeonPreluWorkload>(*preluQueueDescriptor, info);

473

}

474

case LayerType::QLstm :

475

{

476

auto qLstmQueueDescriptor = PolymorphicDowncast<const QLstmQueueDescriptor*>(&descriptor);

477

return std::make_unique<NeonQLstmWorkload>(*qLstmQueueDescriptor, info);

478

}

479

case LayerType::Quantize :

480

{

481

auto quantizeQueueDescriptor = PolymorphicDowncast<const QuantizeQueueDescriptor*>(&descriptor);

482

return std::make_unique<NeonQuantizeWorkload>(*quantizeQueueDescriptor, info);

483

}

484

case LayerType::QuantizedLstm :

485

{

486

auto quantizedLstmQueueDescriptor = PolymorphicDowncast<const QuantizedLstmQueueDescriptor*>(&descriptor);

487

return std::make_unique<NeonQuantizedLstmWorkload>(*quantizedLstmQueueDescriptor, info);

488

}

489

case LayerType::Rank :

490

{

491

auto rankQueueDescriptor = PolymorphicDowncast<const RankQueueDescriptor*>(&descriptor);

492

return std::make_unique<NeonRankWorkload>(*rankQueueDescriptor, info);

493

}

494

case LayerType::Reduce :

495

{

496

auto reduceQueueDescriptor = PolymorphicDowncast<const ReduceQueueDescriptor*>(&descriptor);

497

return std::make_unique<NeonReduceWorkload>(*reduceQueueDescriptor, info);

498

}

499

case LayerType::Reshape :

500

{

501

auto reshapeQueueDescriptor = PolymorphicDowncast<const ReshapeQueueDescriptor*>(&descriptor);

502

return std::make_unique<NeonReshapeWorkload>(*reshapeQueueDescriptor, info);

503

}

504

case LayerType::Resize :

505

{

506

auto resizeQueueDescriptor = PolymorphicDowncast<const ResizeQueueDescriptor*>(&descriptor);

507

return std::make_unique<NeonResizeWorkload>(*resizeQueueDescriptor, info);

508

}

509

case LayerType::Slice :

510

{

511

auto sliceQueueDescriptor = PolymorphicDowncast<const SliceQueueDescriptor*>(&descriptor);

512

return std::make_unique<NeonSliceWorkload>(*sliceQueueDescriptor, info);

513

}

514

case LayerType::Softmax :

515

{

516

auto softmaxQueueDescriptor = PolymorphicDowncast<const SoftmaxQueueDescriptor*>(&descriptor);

517

return std::make_unique<NeonSoftmaxWorkload>(*softmaxQueueDescriptor,

518

info,

519

m_MemoryManager->GetIntraLayerManager());

520

}

521

case LayerType::SpaceToBatchNd :

522

{

523

auto spaceToBatchNdQueueDescriptor

524

= PolymorphicDowncast<const SpaceToBatchNdQueueDescriptor*>(&descriptor);

525

return std::make_unique<NeonSpaceToBatchNdWorkload>(*spaceToBatchNdQueueDescriptor, info);

526

}

527

case LayerType::SpaceToDepth :

528

{

529

auto spaceToDepthQueueDescriptor = PolymorphicDowncast<const SpaceToDepthQueueDescriptor*>(&descriptor);

530

return std::make_unique<NeonSpaceToDepthWorkload>(*spaceToDepthQueueDescriptor, info);

531

}

532

case LayerType::Splitter :

533

{

534

auto splitterQueueDescriptor = PolymorphicDowncast<const SplitterQueueDescriptor*>(&descriptor);

535

return std::make_unique<NeonSplitterWorkload>(*splitterQueueDescriptor, info);

536

}

537

case LayerType::Stack :

538

{

539

auto stackQueueDescriptor = PolymorphicDowncast<const StackQueueDescriptor*>(&descriptor);

540

return std::make_unique<NeonStackWorkload>(*stackQueueDescriptor, info);

541

}

542

case LayerType::StridedSlice :

543

{

544

auto stridedSliceQueueDescriptor = PolymorphicDowncast<const StridedSliceQueueDescriptor*>(&descriptor);

545

return std::make_unique<NeonStridedSliceWorkload>(*stridedSliceQueueDescriptor, info);

546

}

547

case LayerType::Subtraction :

548

{

549

auto subtractionQueueDescriptor = PolymorphicDowncast<const SubtractionQueueDescriptor*>(&descriptor);

550

return std::make_unique<NeonSubtractionWorkload>(*subtractionQueueDescriptor, info);

551

}

552

case LayerType::Transpose :

553

{

554

auto transposeQueueDescriptor = PolymorphicDowncast<const TransposeQueueDescriptor*>(&descriptor);

555

return std::make_unique<NeonTransposeWorkload>(*transposeQueueDescriptor, info);

556

}

557

case LayerType::TransposeConvolution2d :

558

{

559

auto transposeConvolution2dQueueDescriptor

560

= PolymorphicDowncast<const TransposeConvolution2dQueueDescriptor*>(&descriptor);

561

return std::make_unique<NeonTransposeConvolution2dWorkload>(*transposeConvolution2dQueueDescriptor,

562

info,

563

m_MemoryManager->GetIntraLayerManager());

564

}

Cathal Corbett

fd5bec4

2022-03-03 15:13:23 +0000

[diff] [blame]

565

case LayerType::UnidirectionalSequenceLstm :

566

{

567

auto desc = PolymorphicDowncast<const UnidirectionalSequenceLstmQueueDescriptor*>(&descriptor);

Mike Kelly

1299496

2022-04-21 11:57:09 +0100

[diff] [blame]

568

569

if ((info.m_InputTensorInfos[0].GetDataType() == armnn::DataType::Float32) &&

570

(info.m_InputTensorInfos[1].GetDataType() == armnn::DataType::Float32) &&

571

(info.m_InputTensorInfos[2].GetDataType() == armnn::DataType::Float32) &&

572

(info.m_OutputTensorInfos[0].GetDataType() == armnn::DataType::Float32) &&

573

(info.m_OutputTensorInfos[1].GetDataType() == armnn::DataType::Float32) &&

574

(info.m_OutputTensorInfos[2].GetDataType() == armnn::DataType::Float32))

575

{

576

return std::make_unique<NeonUnidirectionalSequenceLstmFloatWorkload>(*desc, info);

}

else

{

return std::make_unique<NeonUnidirectionalSequenceLstmWorkload>(*desc, info);

581

}

Cathal Corbett

fd5bec4

2022-03-03 15:13:23 +0000

[diff] [blame]

582

}

Teresa Charlin

611c7fb

2022-01-07 09:47:29 +0000

[diff] [blame]

default:

return nullptr;

}

}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

588

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateActivation(const ActivationQueueDescriptor& descriptor,

589

const WorkloadInfo& info) const

590

{

Nattapat Chaimanowong

d4b7059

2018-10-12 11:21:49 +0100

[diff] [blame]

591

return std::make_unique<NeonActivationWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

592

}

593

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

594

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateAddition(const AdditionQueueDescriptor& descriptor,

595

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

596

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

597

return std::make_unique<NeonAdditionWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

598

}

599

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

600

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateArgMinMax(const ArgMinMaxQueueDescriptor& descriptor,

601

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

602

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

603

return std::make_unique<NeonArgMinMaxWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

604

}

605

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

606

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateBatchNormalization(

607

const BatchNormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const

608

{

609

return std::make_unique<NeonBatchNormalizationWorkload>(descriptor, info);

610

}

611

612

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateBatchToSpaceNd(const BatchToSpaceNdQueueDescriptor& descriptor,

613

const WorkloadInfo& info) const

614

{

Mike Kelly

5685802

2020-01-27 12:14:47 +0000

[diff] [blame]

615

return std::make_unique<NeonBatchToSpaceNdWorkload>(descriptor, info);

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

616

}

617

Sadik Armagan

48f011e

2021-04-21 10:50:34 +0100

[diff] [blame]

618

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateCast(const CastQueueDescriptor& descriptor,

619

const WorkloadInfo& info) const

620

{

621

return std::make_unique<NeonCastWorkload>(descriptor, info);

622

}

623

Teresa Charlin

e89dd69

2021-09-01 16:30:34 +0100

[diff] [blame]

624

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateChannelShuffle(const ChannelShuffleQueueDescriptor& descriptor,

625

const WorkloadInfo& info) const

626

{

627

return std::make_unique<NeonChannelShuffleWorkload>(descriptor, info);

628

}

629

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

630

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateComparison(const ComparisonQueueDescriptor& descriptor,

631

const WorkloadInfo& info) const

632

{

Teresa Charlin

cedd34f

2020-03-30 11:17:30 +0100

[diff] [blame]

633

return std::make_unique<NeonComparisonWorkload>(descriptor, info);

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

634

}

635

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

636

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateConcat(const ConcatQueueDescriptor& descriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

637

const WorkloadInfo& info) const

638

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

639

return std::make_unique<NeonConcatWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

640

}

641

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

642

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConstant(const ConstantQueueDescriptor& descriptor,

643

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

644

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

645

return std::make_unique<NeonConstantWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

646

}

647

Narumol Prangnawarat

250d392

2020-03-30 16:11:04 +0100

[diff] [blame]

648

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertBf16ToFp32(

649

const ConvertBf16ToFp32QueueDescriptor& descriptor,

650

const WorkloadInfo& info) const

651

{

652

return std::make_unique<NeonConvertBf16ToFp32Workload>(descriptor, info);

653

}

654

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

655

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertFp16ToFp32(

656

const ConvertFp16ToFp32QueueDescriptor& descriptor,

657

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

658

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

659

return std::make_unique<NeonConvertFp16ToFp32Workload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

660

}

661

Narumol Prangnawarat

250d392

2020-03-30 16:11:04 +0100

[diff] [blame]

662

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertFp32ToBf16(

663

const ConvertFp32ToBf16QueueDescriptor& descriptor,

664

const WorkloadInfo& info) const

665

{

666

return std::make_unique<NeonConvertFp32ToBf16Workload>(descriptor, info);

667

}

668

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

669

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertFp32ToFp16(

670

const ConvertFp32ToFp16QueueDescriptor& descriptor,

671

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

672

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

673

return std::make_unique<NeonConvertFp32ToFp16Workload>(descriptor, info);

Nikhil Raj

9b46148

2019-07-03 15:58:31 +0100

[diff] [blame]

674

}

675

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

676

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateConvolution2d(

677

const Convolution2dQueueDescriptor& descriptor, const WorkloadInfo& info) const

678

{

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

679

bool isFastMathEnabled = false;

680

if (m_ModelContextPtr)

681

{

682

if (m_ModelContextPtr.get() != nullptr)

683

{

684

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

685

if (modelOptions)

686

{

687

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution2dWorkload>(descriptor,

692

info,

693

m_MemoryManager->GetIntraLayerManager(),

694

isFastMathEnabled);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

695

}

696

Teresa Charlin

ec5f7d1

2021-10-22 17:15:00 +0100

[diff] [blame]

697

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateConvolution3d(

698

const Convolution3dQueueDescriptor& descriptor, const WorkloadInfo& info) const

699

{

700

bool isFastMathEnabled = false;

701

if (m_ModelContextPtr)

702

{

703

if (m_ModelContextPtr.get() != nullptr)

704

{

705

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

706

if (modelOptions)

707

{

708

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution3dWorkload>(descriptor,

713

info,

714

m_MemoryManager->GetIntraLayerManager(),

isFastMathEnabled);

}

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

718

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDebug(const DebugQueueDescriptor& descriptor,

719

const WorkloadInfo& info) const

720

{

721

return MakeWorkloadHelper<NullWorkload, NullWorkload>(descriptor, info);

722

}

723

Aron Virginas-Tar

2f00b74

2019-09-30 13:28:08 +0100

[diff] [blame]

724

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDepthToSpace(const DepthToSpaceQueueDescriptor& descriptor,

725

const WorkloadInfo& info) const

726

{

727

return std::make_unique<NeonDepthToSpaceWorkload>(descriptor, info);

728

}

729

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

730

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDepthwiseConvolution2d(

731

const DepthwiseConvolution2dQueueDescriptor& descriptor, const WorkloadInfo& info) const

732

{

Nattapat Chaimanowong

7714088

2018-10-17 11:12:19 +0100

[diff] [blame]

733

return std::make_unique<NeonDepthwiseConvolutionWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

734

}

735

Narumol Prangnawarat

01961a7

2019-05-30 16:47:12 +0100

[diff] [blame]

736

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDequantize(const DequantizeQueueDescriptor& descriptor,

737

const WorkloadInfo& info) const

738

{

739

return std::make_unique<NeonDequantizeWorkload>(descriptor, info);

740

}

741

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

742

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDetectionPostProcess(

743

const armnn::DetectionPostProcessQueueDescriptor& descriptor, const armnn::WorkloadInfo& info) const

744

{

James Conroy

d9fb6e2

2020-02-21 16:52:44 +0000

[diff] [blame]

745

return MakeWorkloadHelper<NullWorkload, NullWorkload>(descriptor, info);

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

746

}

747

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

748

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateDivision(

749

const DivisionQueueDescriptor& descriptor, const WorkloadInfo& info) const

750

{

Pablo Tello

e61f071

2020-01-23 10:37:17 +0000

[diff] [blame]

751

return std::make_unique<NeonDivisionWorkload>(descriptor, info);

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

752

}

753

Sadik Armagan

ac47210

2020-03-24 09:54:36 +0000

[diff] [blame]

754

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateElementwiseUnary(

755

const ElementwiseUnaryQueueDescriptor& descriptor, const WorkloadInfo& info) const

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

756

{

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

757

switch(descriptor.m_Parameters.m_Operation)

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

758

{

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

759

case UnaryOperation::Abs:

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

760

{

761

AbsQueueDescriptor absQueueDescriptor;

762

absQueueDescriptor.m_Inputs = descriptor.m_Inputs;

763

absQueueDescriptor.m_Outputs = descriptor.m_Outputs;

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

764

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

765

return std::make_unique<NeonAbsWorkload>(absQueueDescriptor, info);

766

}

Teresa Charlin

50de4fa

2021-05-31 18:47:33 +0100

[diff] [blame]

767

case UnaryOperation::Exp:

768

return std::make_unique<NeonExpWorkload>(descriptor, info);

769

case UnaryOperation::LogicalNot:

770

return std::make_unique<NeonLogicalNotWorkload>(descriptor, info);

771

case UnaryOperation::Log:

772

return std::make_unique<NeonLogWorkload>(descriptor, info);

773

case UnaryOperation::Neg:

774

return std::make_unique<NeonNegWorkload>(descriptor, info);

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

775

case UnaryOperation::Rsqrt:

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

776

{

777

RsqrtQueueDescriptor rsqrtQueueDescriptor;

778

rsqrtQueueDescriptor.m_Inputs = descriptor.m_Inputs;

779

rsqrtQueueDescriptor.m_Outputs = descriptor.m_Outputs;

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

780

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

781

return std::make_unique<NeonRsqrtWorkload>(rsqrtQueueDescriptor, info);

782

}

Teresa Charlin

50de4fa

2021-05-31 18:47:33 +0100

[diff] [blame]

783

case UnaryOperation::Sin:

784

return std::make_unique<NeonSinWorkload>(descriptor, info);

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

785

default:

786

return nullptr;

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

787

}

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

788

}

789

Sadik Armagan

a792a05

2020-06-23 16:22:23 +0100

[diff] [blame]

790

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateFill(const FillQueueDescriptor& descriptor,

791

const WorkloadInfo& info) const

792

{

793

return std::make_unique<NeonFillWorkload>(descriptor, info);

794

}

795

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

796

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateFloor(const FloorQueueDescriptor& descriptor,

797

const WorkloadInfo& info) const

798

{

799

return MakeWorkloadHelper<NeonFloorFloatWorkload, NullWorkload>(descriptor, info);

800

}

801

802

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateFullyConnected(

803

const FullyConnectedQueueDescriptor& descriptor, const WorkloadInfo& info) const

804

{

Kevin May

be7e35c

2020-04-29 17:05:05 +0100

[diff] [blame]

805

return std::make_unique<NeonFullyConnectedWorkload>(descriptor, info, m_MemoryManager->GetIntraLayerManager());

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

806

}

807

808

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateGather(const armnn::GatherQueueDescriptor& descriptor,

809

const armnn::WorkloadInfo& info) const

810

{

Teresa Charlin

f540eb8

2020-04-10 19:24:55 +0100

[diff] [blame]

811

return std::make_unique<NeonGatherWorkload>(descriptor, info);

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

812

}

813

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

814

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateInput(const InputQueueDescriptor& descriptor,

815

const WorkloadInfo& info) const

816

{

817

return std::make_unique<CopyMemGenericWorkload>(descriptor, info);

818

}

819

820

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateInstanceNormalization(

821

const InstanceNormalizationQueueDescriptor& descriptor,

822

const WorkloadInfo& info) const

823

{

824

return std::make_unique<NeonInstanceNormalizationWorkload>(descriptor, info);

825

}

826

827

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateL2Normalization(const L2NormalizationQueueDescriptor& descriptor,

828

const WorkloadInfo& info) const

829

{

830

return MakeWorkloadHelper<NeonL2NormalizationFloatWorkload, NullWorkload>(descriptor, info,

831

m_MemoryManager->GetIntraLayerManager());

832

}

833

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

834

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateLogSoftmax(const LogSoftmaxQueueDescriptor& descriptor,

835

const WorkloadInfo& info) const

836

{

837

return std::make_unique<NeonLogSoftmaxWorkload>(descriptor, info, m_MemoryManager->GetIntraLayerManager());

838

}

839

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

840

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateLogicalBinary(const LogicalBinaryQueueDescriptor& descriptor,

841

const WorkloadInfo& info) const

842

{

843

switch(descriptor.m_Parameters.m_Operation)

844

{

845

case LogicalBinaryOperation::LogicalAnd:

846

return std::make_unique<NeonLogicalAndWorkload>(descriptor, info);

847

case LogicalBinaryOperation::LogicalOr:

848

return std::make_unique<NeonLogicalOrWorkload>(descriptor, info);

default:

return nullptr;

}

}

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

854

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateLstm(const LstmQueueDescriptor& descriptor,

855

const WorkloadInfo& info) const

856

{

857

return MakeWorkloadHelper<NeonLstmFloatWorkload, NullWorkload>(descriptor, info);

858

}

859

860

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateMaximum(const MaximumQueueDescriptor& descriptor,

861

const WorkloadInfo& info) const

862

{

863

return std::make_unique<NeonMaximumWorkload>(descriptor, info);

864

}

865

866

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateMean(const MeanQueueDescriptor& descriptor,

867

const WorkloadInfo& info) const

868

{

869

return std::make_unique<NeonMeanWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

870

}

871

872

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMemCopy(const MemCopyQueueDescriptor& descriptor,

873

const WorkloadInfo& info) const

874

{

875

if (descriptor.m_Inputs.empty() || !descriptor.m_Inputs[0])

876

{

877

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemCopy workload");

878

}

879

Aron Virginas-Tar

a8e06ed

2018-10-19 16:46:15 +0100

[diff] [blame]

880

return MakeWorkloadHelper<CopyMemGenericWorkload, CopyMemGenericWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

881

}

882

Derek Lamberti

f674aa0

2019-08-01 15:56:25 +0100

[diff] [blame]

883

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMemImport(const MemImportQueueDescriptor& descriptor,

884

const WorkloadInfo& info) const

885

{

886

if (descriptor.m_Inputs.empty() || !descriptor.m_Inputs[0])

887

{

888

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemImport workload");

889

}

890

891

return std::make_unique<ImportMemGenericWorkload>(descriptor, info);

892

}

893

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

894

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateMinimum(const MinimumQueueDescriptor& descriptor,

895

const WorkloadInfo& info) const

896

{

897

return std::make_unique<NeonMinimumWorkload>(descriptor, info);

898

}

899

900

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMultiplication(

901

const MultiplicationQueueDescriptor& descriptor, const WorkloadInfo& info) const

902

{

903

return std::make_unique<NeonMultiplicationWorkload>(descriptor, info);

904

}

905

906

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateNormalization(

907

const NormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const

908

{

909

return MakeWorkloadHelper<NeonNormalizationFloatWorkload, NullWorkload>(descriptor, info,

910

m_MemoryManager->GetIntraLayerManager());

911

}

912

913

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateOutput(const OutputQueueDescriptor& descriptor,

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

914

const WorkloadInfo& info) const

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

915

{

916

return std::make_unique<CopyMemGenericWorkload>(descriptor, info);

917

}

918

919

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreatePad(const PadQueueDescriptor& descriptor,

920

const WorkloadInfo& info) const

921

{

922

return std::make_unique<NeonPadWorkload>(descriptor, info);

923

}

924

925

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreatePermute(const PermuteQueueDescriptor& descriptor,

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

926

const WorkloadInfo& info) const

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

927

{

928

return std::make_unique<NeonPermuteWorkload>(descriptor, info);

929

}

930

931

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreatePooling2d(const Pooling2dQueueDescriptor& descriptor,

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

932

const WorkloadInfo& info) const

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

933

{

934

return std::make_unique<NeonPooling2dWorkload>(descriptor, info);

935

}

936

937

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreatePreCompiled(const PreCompiledQueueDescriptor& descriptor,

938

const WorkloadInfo& info) const

939

{

940

return MakeWorkloadHelper<NullWorkload, NullWorkload>(descriptor, info);

941

}

942

943

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreatePrelu(const armnn::PreluQueueDescriptor &descriptor,

944

const armnn::WorkloadInfo &info) const

945

{

946

return std::make_unique<NeonPreluWorkload>(descriptor, info);

947

}

948

James Conroy

cc34093

2020-05-12 18:08:52 +0100

[diff] [blame]

949

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateQLstm(const QLstmQueueDescriptor& descriptor,

950

const WorkloadInfo& info) const

951

{

952

return std::make_unique<NeonQLstmWorkload>(descriptor, info);

953

}

954

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

955

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateQuantize(const QuantizeQueueDescriptor& descriptor,

956

const WorkloadInfo& info) const

957

{

Kevin May

9077473

2020-03-03 12:10:10 +0000

[diff] [blame]

958

return std::make_unique<NeonQuantizeWorkload>(descriptor, info);

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

959

}

960

961

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateQuantizedLstm(const QuantizedLstmQueueDescriptor& descriptor,

962

const WorkloadInfo& info) const

963

{

964

return std::make_unique<NeonQuantizedLstmWorkload>(descriptor, info);

965

}

966

David Monahan

97451b4

2020-12-03 09:48:06 +0000

[diff] [blame]

967

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateRank(const RankQueueDescriptor& descriptor,

968

const WorkloadInfo& info) const

969

{

970

return std::make_unique<NeonRankWorkload>(descriptor, info);

971

}

972

Sadik Armagan

a274748

2021-02-09 10:28:54 +0000

[diff] [blame]

973

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateReduce(const ReduceQueueDescriptor& descriptor,

974

const WorkloadInfo& info) const

975

{

976

return std::make_unique<NeonReduceWorkload>(descriptor, info);

977

}

978

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

979

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateReshape(const ReshapeQueueDescriptor& descriptor,

980

const WorkloadInfo& info) const

981

{

982

return std::make_unique<NeonReshapeWorkload>(descriptor, info);

983

}

984

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

985

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateResize(const ResizeQueueDescriptor& descriptor,

986

const WorkloadInfo& info) const

987

{

Ellen Norris-Thompson

37e6868

2019-07-15 14:23:30 +0100

[diff] [blame]

988

return std::make_unique<NeonResizeWorkload>(descriptor, info);

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

989

}

990

josh minor

036f02d

2019-11-15 14:53:22 -0600

[diff] [blame]

991

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSlice(const SliceQueueDescriptor& descriptor,

992

const WorkloadInfo& info) const

993

{

994

return std::make_unique<NeonSliceWorkload>(descriptor, info);

995

}

996

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

997

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSoftmax(const SoftmaxQueueDescriptor& descriptor,

998

const WorkloadInfo& info) const

Sadik Armagan

581742d

2019-08-12 14:11:37 +0100

[diff] [blame]

999

{

Sadik Armagan

be88a57

2020-04-30 11:39:37 +0100

[diff] [blame]

1000

return std::make_unique<NeonSoftmaxWorkload>(descriptor, info, m_MemoryManager->GetIntraLayerManager());

Sadik Armagan

581742d

2019-08-12 14:11:37 +0100

[diff] [blame]

1001

}

1002

Mike Kelly

0be3a88

2020-01-24 11:27:50 +0000

[diff] [blame]

1003

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSpaceToBatchNd(const SpaceToBatchNdQueueDescriptor& descriptor,

1004

const WorkloadInfo& info) const

1005

{

1006

return std::make_unique<NeonSpaceToBatchNdWorkload>(descriptor, info);

1007

}

1008

1009

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSpaceToDepth(const SpaceToDepthQueueDescriptor& descriptor,

1010

const WorkloadInfo& info) const

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

1011

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1012

return std::make_unique<NeonSpaceToDepthWorkload>(descriptor, info);

1013

}

1014

1015

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSplitter(const SplitterQueueDescriptor& descriptor,

1016

const WorkloadInfo& info) const

1017

{

1018

return std::make_unique<NeonSplitterWorkload>(descriptor, info);

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

1019

}

1020

Matthew Jackson

87f65ea

2019-08-01 10:01:34 +0100

[diff] [blame]

1021

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateStack(const StackQueueDescriptor& descriptor,

1022

const WorkloadInfo& info) const

1023

{

1024

return std::make_unique<NeonStackWorkload>(descriptor, info);

1025

}

1026

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1027

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateStridedSlice(const StridedSliceQueueDescriptor& descriptor,

1028

const WorkloadInfo& info) const

James Conroy

d47a064

2019-09-17 14:22:06 +0100

[diff] [blame]

1029

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1030

return std::make_unique<NeonStridedSliceWorkload>(descriptor, info);

1031

}

1032

1033

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateSubtraction(

1034

const SubtractionQueueDescriptor& descriptor, const WorkloadInfo& info) const

1035

{

1036

return std::make_unique<NeonSubtractionWorkload>(descriptor, info);

1037

}

1038

Mike Kelly

c9ea45a

2020-02-28 18:11:58 +0000

[diff] [blame]

1039

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateTranspose(const TransposeQueueDescriptor& descriptor,

1040

const WorkloadInfo& info) const

1041

{

1042

return std::make_unique<NeonTransposeWorkload>(descriptor, info);

1043

}

1044

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1045

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateTransposeConvolution2d(

1046

const TransposeConvolution2dQueueDescriptor &descriptor,

1047

const WorkloadInfo &info) const

1048

{

1049

return std::make_unique<NeonTransposeConvolution2dWorkload>(descriptor, info,

1050

m_MemoryManager->GetIntraLayerManager());

James Conroy

d47a064

2019-09-17 14:22:06 +0100

[diff] [blame]

1051

}

1052

Aron Virginas-Tar