Blame - src/backends/neon/NeonWorkloadFactory.cpp - ml/armnn

2020-07-02 11:49:26 +0100

[diff] [blame]

2

David Beck

ecb56cd

2018-09-05 12:52:57 +0100

[diff] [blame]

3

// SPDX-License-Identifier: MIT

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

5

David Beck

79141b9

2018-10-23 16:09:36 +0100

[diff] [blame]

6

#include "NeonBackendId.hpp"

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

7

#include "NeonBackendModelContext.hpp"

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

8

#include "NeonTensorHandle.hpp"

9

#include "NeonWorkloadFactory.hpp"

10

David Beck

0dbe0ee

2018-09-24 15:59:27 +0100

[diff] [blame]

11

#include <Layer.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

12

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

13

#include <armnn/Utils.hpp>

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

14

#include <armnn/utility/IgnoreUnused.hpp>

Matthew Sloyan

171214c

2020-09-09 09:07:37 +0100

[diff] [blame]

15

#include <armnn/utility/NumericCast.hpp>

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

16

#include <armnn/utility/PolymorphicDowncast.hpp>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

17

Aron Virginas-Tar

c9cc804

2018-11-01 16:15:57 +0000

[diff] [blame]

18

#include <backendsCommon/MakeWorkloadHelper.hpp>

Colm Donelan

0c47974

2021-12-10 12:43:54 +0000

[diff] [blame]

19

#include <armnn/backends/MemCopyWorkload.hpp>

Derek Lamberti

f674aa0

2019-08-01 15:56:25 +0100

[diff] [blame]

20

#include <backendsCommon/MemImportWorkload.hpp>

Colm Donelan

0c47974

2021-12-10 12:43:54 +0000

[diff] [blame]

21

#include <armnn/backends/TensorHandle.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

22

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

23

#include <neon/workloads/NeonWorkloadUtils.hpp>

24

#include <neon/workloads/NeonWorkloads.hpp>

25

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

namespace armnn

{

David Beck

2018-10-23 16:09:36 +0100

[diff] [blame]

29

namespace

30

{

31

static const BackendId s_Id{NeonBackendId()};

32

}

33

David Beck

29c75de

2018-10-23 13:35:58 +0100

[diff] [blame]

34

bool NeonWorkloadFactory::IsLayerSupported(const Layer& layer,

35

Optional<DataType> dataType,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

36

std::string& outReasonIfUnsupported)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

37

{

David Beck

79141b9

2018-10-23 16:09:36 +0100

[diff] [blame]

38

return IWorkloadFactory::IsLayerSupported(s_Id, layer, dataType, outReasonIfUnsupported);

39

}

40

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

41

bool NeonWorkloadFactory::IsLayerSupported(const IConnectableLayer& layer,

42

Optional<DataType> dataType,

43

std::string& outReasonIfUnsupported,

44

const ModelOptions& modelOptions)

45

{

46

return IWorkloadFactory::IsLayerSupported(s_Id, layer, dataType, outReasonIfUnsupported, modelOptions);

47

}

48

David Beck

79141b9

2018-10-23 16:09:36 +0100

[diff] [blame]

49

const BackendId& NeonWorkloadFactory::GetBackendId() const

50

{

51

return s_Id;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

52

}

53

Matthew Sloyan

0a7dc6b

2021-02-10 16:50:53 +0000

[diff] [blame]

54

void NeonWorkloadFactory::SetNumberOfThreads()

55

{

56

if (m_ModelContextPtr)

57

{

58

const unsigned int MIN_THREADS = 1;

59

const unsigned int MAX_THREADS = 64;

60

61

// Set the number of threads to be used if the user has set NumberOfThreads param

62

// Only set if within limit or valid input

63

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

64

auto numberOfThreads = modelOptions->GetNumberOfThreads();

65

66

if (numberOfThreads != 0 && numberOfThreads >= MIN_THREADS && numberOfThreads <= MAX_THREADS)

67

{

68

arm_compute::Scheduler::get().set_num_threads(numberOfThreads);

}

}

}

Aron Virginas-Tar

2018-11-12 18:10:43 +0000

[diff] [blame]

73

NeonWorkloadFactory::NeonWorkloadFactory(const std::shared_ptr<NeonMemoryManager>& memoryManager)

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

74

: m_MemoryManager(memoryManager), m_ModelContextPtr(IBackendInternal::IBackendSpecificModelContextPtr{})

75

{

Matthew Sloyan

0a7dc6b

2021-02-10 16:50:53 +0000

[diff] [blame]

76

SetNumberOfThreads();

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

77

}

78

79

NeonWorkloadFactory::NeonWorkloadFactory(const std::shared_ptr<NeonMemoryManager>& memoryManager,

80

const IBackendInternal::IBackendSpecificModelContextPtr& modelContextPtr)

81

: m_MemoryManager(memoryManager), m_ModelContextPtr(modelContextPtr)

surmeh01

3537c2c

2018-05-18 16:31:43 +0100

[diff] [blame]

82

{

Matthew Sloyan

0a7dc6b

2021-02-10 16:50:53 +0000

[diff] [blame]

83

SetNumberOfThreads();

surmeh01

3537c2c

2018-05-18 16:31:43 +0100

[diff] [blame]

84

}

85

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

86

std::unique_ptr<ITensorHandle> NeonWorkloadFactory::CreateSubTensorHandle(ITensorHandle& parent,

87

TensorShape const& subTensorShape,

88

unsigned int const* subTensorOrigin) const

89

{

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

90

const arm_compute::TensorShape shape = armcomputetensorutils::BuildArmComputeTensorShape(subTensorShape);

91

92

arm_compute::Coordinates coords;

93

coords.set_num_dimensions(subTensorShape.GetNumDimensions());

94

for (unsigned int i = 0; i < subTensorShape.GetNumDimensions(); i++)

95

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

96

// Arm compute indexes tensor coords in reverse order.

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

97

unsigned int revertedIndex = subTensorShape.GetNumDimensions() - i - 1;

Matthew Sloyan

171214c

2020-09-09 09:07:37 +0100

[diff] [blame]

98

coords.set(i, armnn::numeric_cast<int>(subTensorOrigin[revertedIndex]));

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

99

}

100

Derek Lamberti

0790dce

2019-04-15 18:37:35 +0100

[diff] [blame]

101

const arm_compute::TensorShape parentShape = armcomputetensorutils::BuildArmComputeTensorShape(parent.GetShape());

102

if (!::arm_compute::error_on_invalid_subtensor(__func__, __FILE__, __LINE__, parentShape, coords, shape))

{

return nullptr;

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

107

return std::make_unique<NeonSubTensorHandle>(

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

108

PolymorphicDowncast<IAclTensorHandle*>(&parent), shape, coords);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

109

}

110

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

111

std::unique_ptr<ITensorHandle> NeonWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,

112

const bool IsMemoryManaged) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

113

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

114

auto tensorHandle = std::make_unique<NeonTensorHandle>(tensorInfo);

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

115

if (IsMemoryManaged)

116

{

117

tensorHandle->SetMemoryGroup(m_MemoryManager->GetInterLayerMemoryGroup());

118

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

119

return tensorHandle;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

120

}

121

Francis Murtagh

351d13d

2018-09-24 15:01:18 +0100

[diff] [blame]

122

std::unique_ptr<ITensorHandle> NeonWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

123

DataLayout dataLayout,

124

const bool IsMemoryManaged) const

Francis Murtagh

351d13d

2018-09-24 15:01:18 +0100

[diff] [blame]

125

{

126

auto tensorHandle = std::make_unique<NeonTensorHandle>(tensorInfo, dataLayout);

David Monahan

2019-08-20 11:25:29 +0100

[diff] [blame]

127

if (IsMemoryManaged)

128

{

129

tensorHandle->SetMemoryGroup(m_MemoryManager->GetInterLayerMemoryGroup());

130

}

Francis Murtagh

351d13d

2018-09-24 15:01:18 +0100

[diff] [blame]

return tensorHandle;

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

134

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateWorkload(LayerType type,

135

const QueueDescriptor& descriptor,

136

const WorkloadInfo& info) const

{

switch(type)

{

case LayerType::Activation :

141

{

142

auto activationQueueDescriptor = PolymorphicDowncast<const ActivationQueueDescriptor*>(&descriptor);

143

return std::make_unique<NeonActivationWorkload>(*activationQueueDescriptor, info);

144

}

145

case LayerType::Addition :

146

{

147

auto additionQueueDescriptor = PolymorphicDowncast<const AdditionQueueDescriptor*>(&descriptor);

148

return std::make_unique<NeonAdditionWorkload>(*additionQueueDescriptor, info);

149

}

150

case LayerType::ArgMinMax :

151

{

152

auto argMinMaxQueueDescriptor = PolymorphicDowncast<const ArgMinMaxQueueDescriptor*>(&descriptor);

153

return std::make_unique<NeonArgMinMaxWorkload>(*argMinMaxQueueDescriptor, info);

154

}

Teresa Charlin

0f86ecf

2022-10-13 15:47:08 +0100

[diff] [blame]

155

case LayerType::BatchMatMul :

156

{

157

auto batchMatMulQueueDescriptor = PolymorphicDowncast<const BatchMatMulQueueDescriptor*>(&descriptor);

158

return std::make_unique<NeonBatchMatMulWorkload>(*batchMatMulQueueDescriptor, info);

159

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

160

case LayerType::BatchNormalization :

161

{

162

auto batchNormalizationQueueDescriptor

163

= PolymorphicDowncast<const BatchNormalizationQueueDescriptor*>(&descriptor);

164

return std::make_unique<NeonBatchNormalizationWorkload>(*batchNormalizationQueueDescriptor, info);

165

}

166

case LayerType::BatchToSpaceNd :

167

{

168

auto batchToSpaceNdQueueDescriptor

169

= PolymorphicDowncast<const BatchToSpaceNdQueueDescriptor*>(&descriptor);

170

return std::make_unique<NeonBatchToSpaceNdWorkload>(*batchToSpaceNdQueueDescriptor, info);

171

}

172

case LayerType::Cast :

173

{

174

auto castQueueDescriptor = PolymorphicDowncast<const CastQueueDescriptor*>(&descriptor);

175

return std::make_unique<NeonCastWorkload>(*castQueueDescriptor, info);

176

}

177

case LayerType::ChannelShuffle :

178

{

179

auto channelShuffleQueueDescriptor = PolymorphicDowncast<const ChannelShuffleQueueDescriptor*>(&descriptor);

180

return std::make_unique<NeonChannelShuffleWorkload>(*channelShuffleQueueDescriptor, info);

181

}

182

case LayerType::Comparison :

183

{

184

auto comparisonQueueDescriptor = PolymorphicDowncast<const ComparisonQueueDescriptor*>(&descriptor);

185

return std::make_unique<NeonComparisonWorkload>(*comparisonQueueDescriptor, info);

186

}

187

case LayerType::Concat :

188

{

189

auto concatQueueDescriptor = PolymorphicDowncast<const ConcatQueueDescriptor*>(&descriptor);

190

return std::make_unique<NeonConcatWorkload>(*concatQueueDescriptor, info);

191

}

192

case LayerType::Constant :

193

{

194

auto constantQueueDescriptor = PolymorphicDowncast<const ConstantQueueDescriptor*>(&descriptor);

195

return std::make_unique<NeonConstantWorkload>(*constantQueueDescriptor, info);

196

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

197

case LayerType::ConvertFp16ToFp32 :

198

{

199

auto convertFp16ToFp32QueueDescriptor

200

= PolymorphicDowncast<const ConvertFp16ToFp32QueueDescriptor*>(&descriptor);

201

return std::make_unique<NeonConvertFp16ToFp32Workload>(*convertFp16ToFp32QueueDescriptor, info);

202

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

203

case LayerType::ConvertFp32ToFp16 :

204

{

205

auto convertFp32ToFp16QueueDescriptor

206

= PolymorphicDowncast<const ConvertFp32ToFp16QueueDescriptor*>(&descriptor);

207

return std::make_unique<NeonConvertFp32ToFp16Workload>(*convertFp32ToFp16QueueDescriptor, info);

208

}

209

case LayerType::Convolution2d :

210

{

211

auto convolution2dQueueDescriptor = PolymorphicDowncast<const Convolution2dQueueDescriptor*>(&descriptor);

212

213

bool isFastMathEnabled = false;

214

if (m_ModelContextPtr)

215

{

216

if (m_ModelContextPtr.get() != nullptr)

217

{

218

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

219

if (modelOptions)

220

{

221

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution2dWorkload>(*convolution2dQueueDescriptor,

226

info,

227

m_MemoryManager->GetIntraLayerManager(),

228

isFastMathEnabled);

229

}

230

case LayerType::Convolution3d :

231

{

232

auto convolution3dQueueDescriptor = PolymorphicDowncast<const Convolution3dQueueDescriptor*>(&descriptor);

233

234

bool isFastMathEnabled = false;

235

if (m_ModelContextPtr)

236

{

237

if (m_ModelContextPtr.get() != nullptr)

238

{

239

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

240

if (modelOptions)

241

{

242

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution3dWorkload>(*convolution3dQueueDescriptor,

247

info,

248

m_MemoryManager->GetIntraLayerManager(),

249

isFastMathEnabled);

250

}

251

case LayerType::Debug :

252

{

253

auto debugQueueDescriptor = PolymorphicDowncast<const DebugQueueDescriptor*>(&descriptor);

254

return MakeWorkloadHelper<NullWorkload, NullWorkload>(*debugQueueDescriptor, info);

255

}

256

case LayerType::DepthToSpace :

257

{

258

auto depthToSpaceQueueDescriptor = PolymorphicDowncast<const DepthToSpaceQueueDescriptor*>(&descriptor);

259

return std::make_unique<NeonDepthToSpaceWorkload>(*depthToSpaceQueueDescriptor, info);

260

}

261

case LayerType::DepthwiseConvolution2d :

262

{

263

auto depthwiseConvolution2dQueueDescriptor

264

= PolymorphicDowncast<const DepthwiseConvolution2dQueueDescriptor*>(&descriptor);

265

return std::make_unique<NeonDepthwiseConvolutionWorkload>(*depthwiseConvolution2dQueueDescriptor, info);

266

}

267

case LayerType::Dequantize :

268

{

269

auto dequantizeQueueDescriptor = PolymorphicDowncast<const DequantizeQueueDescriptor*>(&descriptor);

270

return std::make_unique<NeonDequantizeWorkload>(*dequantizeQueueDescriptor, info);

271

}

272

case LayerType::DetectionPostProcess :

273

{

274

auto detectionPostProcessQueueDescriptor

275

= PolymorphicDowncast<const DetectionPostProcessQueueDescriptor*>(&descriptor);

276

return MakeWorkloadHelper<NullWorkload, NullWorkload>(*detectionPostProcessQueueDescriptor, info);

277

}

278

case LayerType::Division :

279

{

280

auto divisionQueueDescriptor = PolymorphicDowncast<const DivisionQueueDescriptor*>(&descriptor);

281

return std::make_unique<NeonDivisionWorkload>(*divisionQueueDescriptor, info);

282

}

283

case LayerType::ElementwiseUnary :

284

{

285

auto elementwiseUnaryQueueDescriptor

286

= PolymorphicDowncast<const ElementwiseUnaryQueueDescriptor*>(&descriptor);

287

288

switch(elementwiseUnaryQueueDescriptor->m_Parameters.m_Operation)

289

{

290

case UnaryOperation::Abs:

291

{

292

AbsQueueDescriptor absQueueDescriptor;

293

absQueueDescriptor.m_Inputs = elementwiseUnaryQueueDescriptor->m_Inputs;

294

absQueueDescriptor.m_Outputs = elementwiseUnaryQueueDescriptor->m_Outputs;

295

296

return std::make_unique<NeonAbsWorkload>(absQueueDescriptor, info);

297

}

298

case UnaryOperation::Exp:

299

return std::make_unique<NeonExpWorkload>(*elementwiseUnaryQueueDescriptor, info);

300

case UnaryOperation::LogicalNot:

301

return std::make_unique<NeonLogicalNotWorkload>(*elementwiseUnaryQueueDescriptor, info);

302

case UnaryOperation::Log:

303

return std::make_unique<NeonLogWorkload>(*elementwiseUnaryQueueDescriptor, info);

304

case UnaryOperation::Neg:

305

return std::make_unique<NeonNegWorkload>(*elementwiseUnaryQueueDescriptor, info);

306

case UnaryOperation::Rsqrt:

307

{

308

RsqrtQueueDescriptor rsqrtQueueDescriptor;

309

rsqrtQueueDescriptor.m_Inputs = elementwiseUnaryQueueDescriptor->m_Inputs;

310

rsqrtQueueDescriptor.m_Outputs = elementwiseUnaryQueueDescriptor->m_Outputs;

311

312

return std::make_unique<NeonRsqrtWorkload>(rsqrtQueueDescriptor, info);

313

}

314

case UnaryOperation::Sin:

315

return std::make_unique<NeonSinWorkload>(*elementwiseUnaryQueueDescriptor, info);

Teresa Charlin

0302723

2022-05-09 17:27:08 +0100

[diff] [blame]

316

case UnaryOperation::Sqrt:

317

return std::make_unique<NeonSqrtWorkload>(*elementwiseUnaryQueueDescriptor, info);

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

default:

return nullptr;

}

}

case LayerType::Fill :

323

{

324

auto fillQueueDescriptor = PolymorphicDowncast<const FillQueueDescriptor*>(&descriptor);

325

return std::make_unique<NeonFillWorkload>(*fillQueueDescriptor, info);

326

}

327

case LayerType::Floor :

328

{

329

auto floorQueueDescriptor = PolymorphicDowncast<const FloorQueueDescriptor*>(&descriptor);

330

return MakeWorkloadHelper<NeonFloorFloatWorkload, NullWorkload>(*floorQueueDescriptor, info);

331

}

332

case LayerType::FullyConnected :

333

{

334

auto fullyConnectedQueueDescriptor = PolymorphicDowncast<const FullyConnectedQueueDescriptor*>(&descriptor);

335

return std::make_unique<NeonFullyConnectedWorkload>(*fullyConnectedQueueDescriptor,

336

info,

337

m_MemoryManager->GetIntraLayerManager());

338

}

339

case LayerType::Gather :

340

{

341

auto gatherQueueDescriptor = PolymorphicDowncast<const GatherQueueDescriptor*>(&descriptor);

342

return std::make_unique<NeonGatherWorkload>(*gatherQueueDescriptor, info);

343

}

Teresa Charlin

bd22c7d

2022-04-26 18:14:12 +0100

[diff] [blame]

344

case LayerType::GatherNd :

345

{

346

auto gatherNdQueueDescriptor = PolymorphicDowncast<const GatherNdQueueDescriptor*>(&descriptor);

347

return std::make_unique<NeonGatherNdWorkload>(*gatherNdQueueDescriptor, info);

348

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

349

case LayerType::Input :

350

{

351

auto inputQueueDescriptor = PolymorphicDowncast<const InputQueueDescriptor*>(&descriptor);

352

return std::make_unique<CopyMemGenericWorkload>(*inputQueueDescriptor, info);

353

}

354

case LayerType::InstanceNormalization :

355

{

356

auto instanceNormalizationQueueDescriptor

357

= PolymorphicDowncast<const InstanceNormalizationQueueDescriptor*>(&descriptor);

358

return std::make_unique<NeonInstanceNormalizationWorkload>(*instanceNormalizationQueueDescriptor, info);

359

}

360

case LayerType::L2Normalization :

361

{

362

auto l2NormalizationQueueDescriptor

363

= PolymorphicDowncast<const L2NormalizationQueueDescriptor*>(&descriptor);

364

return MakeWorkloadHelper<NeonL2NormalizationFloatWorkload, NullWorkload>

365

(*l2NormalizationQueueDescriptor, info, m_MemoryManager->GetIntraLayerManager());

366

}

367

case LayerType::LogSoftmax :

368

{

369

auto logSoftmaxQueueDescriptor = PolymorphicDowncast<const LogSoftmaxQueueDescriptor*>(&descriptor);

370

return std::make_unique<NeonLogSoftmaxWorkload>(*logSoftmaxQueueDescriptor,

371

info,

372

m_MemoryManager->GetIntraLayerManager());

373

}

374

case LayerType::LogicalBinary :

375

{

376

auto logicalBinaryQueueDescriptor = PolymorphicDowncast<const LogicalBinaryQueueDescriptor*>(&descriptor);

377

378

switch(logicalBinaryQueueDescriptor->m_Parameters.m_Operation)

379

{

380

case LogicalBinaryOperation::LogicalAnd:

381

return std::make_unique<NeonLogicalAndWorkload>(*logicalBinaryQueueDescriptor, info);

382

case LogicalBinaryOperation::LogicalOr:

383

return std::make_unique<NeonLogicalOrWorkload>(*logicalBinaryQueueDescriptor, info);

default:

return nullptr;

}

}

case LayerType::Lstm :

389

{

390

auto lstmQueueDescriptor = PolymorphicDowncast<const LstmQueueDescriptor*>(&descriptor);

391

return MakeWorkloadHelper<NeonLstmFloatWorkload, NullWorkload>(*lstmQueueDescriptor, info);

392

}

393

case LayerType::Maximum :

394

{

395

auto maximumQueueDescriptor = PolymorphicDowncast<const MaximumQueueDescriptor*>(&descriptor);

396

return std::make_unique<NeonMaximumWorkload>(*maximumQueueDescriptor, info);

397

}

398

case LayerType::Mean :

399

{

400

auto meanQueueDescriptor = PolymorphicDowncast<const MeanQueueDescriptor*>(&descriptor);

401

return std::make_unique<NeonMeanWorkload>(*meanQueueDescriptor, info);

402

}

403

case LayerType::MemCopy :

404

{

405

auto memCopyQueueDescriptor = PolymorphicDowncast<const MemCopyQueueDescriptor*>(&descriptor);

406

if (memCopyQueueDescriptor->m_Inputs.empty() || !memCopyQueueDescriptor->m_Inputs[0])

407

{

408

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemCopy workload");

409

}

410

return MakeWorkloadHelper<CopyMemGenericWorkload, CopyMemGenericWorkload>(*memCopyQueueDescriptor, info);

411

}

412

case LayerType::MemImport :

413

{

414

auto memImportQueueDescriptor = PolymorphicDowncast<const MemImportQueueDescriptor*>(&descriptor);

415

if (memImportQueueDescriptor->m_Inputs.empty() || !memImportQueueDescriptor->m_Inputs[0])

416

{

417

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemImport workload");

418

}

419

return std::make_unique<ImportMemGenericWorkload>(*memImportQueueDescriptor, info);

420

}

421

case LayerType::Minimum :

422

{

423

auto minimumQueueDescriptor = PolymorphicDowncast<const MinimumQueueDescriptor*>(&descriptor);

424

return std::make_unique<NeonMinimumWorkload>(*minimumQueueDescriptor, info);

425

}

426

case LayerType::Multiplication :

427

{

428

auto multiplicationQueueDescriptor = PolymorphicDowncast<const MultiplicationQueueDescriptor*>(&descriptor);

429

return std::make_unique<NeonMultiplicationWorkload>(*multiplicationQueueDescriptor, info);

430

}

431

case LayerType::Normalization :

432

{

433

auto normalizationQueueDescriptor = PolymorphicDowncast<const NormalizationQueueDescriptor*>(&descriptor);

434

return MakeWorkloadHelper<NeonNormalizationFloatWorkload, NullWorkload>

435

(*normalizationQueueDescriptor, info, m_MemoryManager->GetIntraLayerManager());

436

}

437

case LayerType::Output :

438

{

439

auto outputQueueDescriptor = PolymorphicDowncast<const OutputQueueDescriptor*>(&descriptor);

440

return std::make_unique<CopyMemGenericWorkload>(*outputQueueDescriptor, info);

441

}

442

case LayerType::Pad :

443

{

444

auto padQueueDescriptor = PolymorphicDowncast<const PadQueueDescriptor*>(&descriptor);

445

return std::make_unique<NeonPadWorkload>(*padQueueDescriptor, info);

446

}

447

case LayerType::Permute :

448

{

449

auto permuteQueueDescriptor = PolymorphicDowncast<const PermuteQueueDescriptor*>(&descriptor);

450

return std::make_unique<NeonPermuteWorkload>(*permuteQueueDescriptor, info);

451

}

452

case LayerType::Pooling2d :

453

{

454

auto pooling2dQueueDescriptor = PolymorphicDowncast<const Pooling2dQueueDescriptor*>(&descriptor);

455

return std::make_unique<NeonPooling2dWorkload>(*pooling2dQueueDescriptor, info);

456

}

Ryan OShea

19e7942

2022-05-04 00:38:03 +0100

[diff] [blame]

457

case LayerType::Pooling3d :

458

{

459

auto pooling3dQueueDescriptor = PolymorphicDowncast<const Pooling3dQueueDescriptor*>(&descriptor);

460

return std::make_unique<NeonPooling3dWorkload>(*pooling3dQueueDescriptor, info);

461

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

462

case LayerType::PreCompiled :

463

{

464

auto preCompiledQueueDescriptor = PolymorphicDowncast<const PreCompiledQueueDescriptor*>(&descriptor);

465

return MakeWorkloadHelper<NullWorkload, NullWorkload>(*preCompiledQueueDescriptor, info);

466

}

467

case LayerType::Prelu :

468

{

469

auto preluQueueDescriptor = PolymorphicDowncast<const PreluQueueDescriptor*>(&descriptor);

470

return std::make_unique<NeonPreluWorkload>(*preluQueueDescriptor, info);

471

}

472

case LayerType::QLstm :

473

{

474

auto qLstmQueueDescriptor = PolymorphicDowncast<const QLstmQueueDescriptor*>(&descriptor);

475

return std::make_unique<NeonQLstmWorkload>(*qLstmQueueDescriptor, info);

476

}

477

case LayerType::Quantize :

478

{

479

auto quantizeQueueDescriptor = PolymorphicDowncast<const QuantizeQueueDescriptor*>(&descriptor);

480

return std::make_unique<NeonQuantizeWorkload>(*quantizeQueueDescriptor, info);

481

}

482

case LayerType::QuantizedLstm :

483

{

484

auto quantizedLstmQueueDescriptor = PolymorphicDowncast<const QuantizedLstmQueueDescriptor*>(&descriptor);

485

return std::make_unique<NeonQuantizedLstmWorkload>(*quantizedLstmQueueDescriptor, info);

486

}

487

case LayerType::Rank :

488

{

489

auto rankQueueDescriptor = PolymorphicDowncast<const RankQueueDescriptor*>(&descriptor);

490

return std::make_unique<NeonRankWorkload>(*rankQueueDescriptor, info);

491

}

492

case LayerType::Reduce :

493

{

494

auto reduceQueueDescriptor = PolymorphicDowncast<const ReduceQueueDescriptor*>(&descriptor);

495

return std::make_unique<NeonReduceWorkload>(*reduceQueueDescriptor, info);

496

}

497

case LayerType::Reshape :

498

{

499

auto reshapeQueueDescriptor = PolymorphicDowncast<const ReshapeQueueDescriptor*>(&descriptor);

500

return std::make_unique<NeonReshapeWorkload>(*reshapeQueueDescriptor, info);

501

}

502

case LayerType::Resize :

503

{

504

auto resizeQueueDescriptor = PolymorphicDowncast<const ResizeQueueDescriptor*>(&descriptor);

505

return std::make_unique<NeonResizeWorkload>(*resizeQueueDescriptor, info);

506

}

507

case LayerType::Slice :

508

{

509

auto sliceQueueDescriptor = PolymorphicDowncast<const SliceQueueDescriptor*>(&descriptor);

510

return std::make_unique<NeonSliceWorkload>(*sliceQueueDescriptor, info);

511

}

512

case LayerType::Softmax :

513

{

514

auto softmaxQueueDescriptor = PolymorphicDowncast<const SoftmaxQueueDescriptor*>(&descriptor);

515

return std::make_unique<NeonSoftmaxWorkload>(*softmaxQueueDescriptor,

516

info,

517

m_MemoryManager->GetIntraLayerManager());

518

}

519

case LayerType::SpaceToBatchNd :

520

{

521

auto spaceToBatchNdQueueDescriptor

522

= PolymorphicDowncast<const SpaceToBatchNdQueueDescriptor*>(&descriptor);

523

return std::make_unique<NeonSpaceToBatchNdWorkload>(*spaceToBatchNdQueueDescriptor, info);

524

}

525

case LayerType::SpaceToDepth :

526

{

527

auto spaceToDepthQueueDescriptor = PolymorphicDowncast<const SpaceToDepthQueueDescriptor*>(&descriptor);

528

return std::make_unique<NeonSpaceToDepthWorkload>(*spaceToDepthQueueDescriptor, info);

529

}

530

case LayerType::Splitter :

531

{

532

auto splitterQueueDescriptor = PolymorphicDowncast<const SplitterQueueDescriptor*>(&descriptor);

533

return std::make_unique<NeonSplitterWorkload>(*splitterQueueDescriptor, info);

534

}

535

case LayerType::Stack :

536

{

537

auto stackQueueDescriptor = PolymorphicDowncast<const StackQueueDescriptor*>(&descriptor);

538

return std::make_unique<NeonStackWorkload>(*stackQueueDescriptor, info);

539

}

540

case LayerType::StridedSlice :

541

{

542

auto stridedSliceQueueDescriptor = PolymorphicDowncast<const StridedSliceQueueDescriptor*>(&descriptor);

543

return std::make_unique<NeonStridedSliceWorkload>(*stridedSliceQueueDescriptor, info);

544

}

545

case LayerType::Subtraction :

546

{

547

auto subtractionQueueDescriptor = PolymorphicDowncast<const SubtractionQueueDescriptor*>(&descriptor);

548

return std::make_unique<NeonSubtractionWorkload>(*subtractionQueueDescriptor, info);

549

}

550

case LayerType::Transpose :

551

{

552

auto transposeQueueDescriptor = PolymorphicDowncast<const TransposeQueueDescriptor*>(&descriptor);

553

return std::make_unique<NeonTransposeWorkload>(*transposeQueueDescriptor, info);

554

}

555

case LayerType::TransposeConvolution2d :

556

{

557

auto transposeConvolution2dQueueDescriptor

558

= PolymorphicDowncast<const TransposeConvolution2dQueueDescriptor*>(&descriptor);

559

return std::make_unique<NeonTransposeConvolution2dWorkload>(*transposeConvolution2dQueueDescriptor,

560

info,

561

m_MemoryManager->GetIntraLayerManager());

562

}

Cathal Corbett

fd5bec4

2022-03-03 15:13:23 +0000

[diff] [blame]

563

case LayerType::UnidirectionalSequenceLstm :

564

{

565

auto desc = PolymorphicDowncast<const UnidirectionalSequenceLstmQueueDescriptor*>(&descriptor);

Mike Kelly

1299496

2022-04-21 11:57:09 +0100

[diff] [blame]

566

567

if ((info.m_InputTensorInfos[0].GetDataType() == armnn::DataType::Float32) &&

568

(info.m_InputTensorInfos[1].GetDataType() == armnn::DataType::Float32) &&

569

(info.m_InputTensorInfos[2].GetDataType() == armnn::DataType::Float32) &&

570

(info.m_OutputTensorInfos[0].GetDataType() == armnn::DataType::Float32) &&

571

(info.m_OutputTensorInfos[1].GetDataType() == armnn::DataType::Float32) &&

572

(info.m_OutputTensorInfos[2].GetDataType() == armnn::DataType::Float32))

573

{

574

return std::make_unique<NeonUnidirectionalSequenceLstmFloatWorkload>(*desc, info);

}

else

{

return std::make_unique<NeonUnidirectionalSequenceLstmWorkload>(*desc, info);

579

}

Cathal Corbett

fd5bec4

2022-03-03 15:13:23 +0000

[diff] [blame]

580

}

Teresa Charlin

2022-01-07 09:47:29 +0000

[diff] [blame]

default:

return nullptr;

}

}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

586

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateActivation(const ActivationQueueDescriptor& descriptor,

587

const WorkloadInfo& info) const

588

{

Nattapat Chaimanowong

d4b7059

2018-10-12 11:21:49 +0100

[diff] [blame]

589

return std::make_unique<NeonActivationWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

590

}

591

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

592

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateAddition(const AdditionQueueDescriptor& descriptor,

593

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

594

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

595

return std::make_unique<NeonAdditionWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

596

}

597

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

598

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateArgMinMax(const ArgMinMaxQueueDescriptor& descriptor,

599

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

600

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

601

return std::make_unique<NeonArgMinMaxWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

602

}

603

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

604

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateBatchNormalization(

605

const BatchNormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const

606

{

607

return std::make_unique<NeonBatchNormalizationWorkload>(descriptor, info);

608

}

609

610

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateBatchToSpaceNd(const BatchToSpaceNdQueueDescriptor& descriptor,

611

const WorkloadInfo& info) const

612

{

Mike Kelly

5685802

2020-01-27 12:14:47 +0000

[diff] [blame]

613

return std::make_unique<NeonBatchToSpaceNdWorkload>(descriptor, info);

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

614

}

615

Sadik Armagan

48f011e

2021-04-21 10:50:34 +0100

[diff] [blame]

616

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateCast(const CastQueueDescriptor& descriptor,

617

const WorkloadInfo& info) const

618

{

619

return std::make_unique<NeonCastWorkload>(descriptor, info);

620

}

621

Teresa Charlin

e89dd69

2021-09-01 16:30:34 +0100

[diff] [blame]

622

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateChannelShuffle(const ChannelShuffleQueueDescriptor& descriptor,

623

const WorkloadInfo& info) const

624

{

625

return std::make_unique<NeonChannelShuffleWorkload>(descriptor, info);

626

}

627

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

628

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateComparison(const ComparisonQueueDescriptor& descriptor,

629

const WorkloadInfo& info) const

630

{

Teresa Charlin

cedd34f

2020-03-30 11:17:30 +0100

[diff] [blame]

631

return std::make_unique<NeonComparisonWorkload>(descriptor, info);

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

632

}

633

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

634

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateConcat(const ConcatQueueDescriptor& descriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

635

const WorkloadInfo& info) const

636

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

637

return std::make_unique<NeonConcatWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

638

}

639

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

640

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConstant(const ConstantQueueDescriptor& descriptor,

641

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

642

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

643

return std::make_unique<NeonConstantWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

644

}

645

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

646

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertFp16ToFp32(

647

const ConvertFp16ToFp32QueueDescriptor& descriptor,

648

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

649

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

650

return std::make_unique<NeonConvertFp16ToFp32Workload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

651

}

652

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

653

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateConvertFp32ToFp16(

654

const ConvertFp32ToFp16QueueDescriptor& descriptor,

655

const WorkloadInfo& info) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

656

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

657

return std::make_unique<NeonConvertFp32ToFp16Workload>(descriptor, info);

Nikhil Raj

9b46148

2019-07-03 15:58:31 +0100

[diff] [blame]

658

}

659

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

660

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateConvolution2d(

661

const Convolution2dQueueDescriptor& descriptor, const WorkloadInfo& info) const

662

{

Sadik Armagan

2020-09-14 15:44:18 +0100

[diff] [blame]

663

bool isFastMathEnabled = false;

664

if (m_ModelContextPtr)

665

{

666

if (m_ModelContextPtr.get() != nullptr)

667

{

668

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

669

if (modelOptions)

670

{

671

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution2dWorkload>(descriptor,

676

info,

677

m_MemoryManager->GetIntraLayerManager(),

678

isFastMathEnabled);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

679

}

680

Teresa Charlin

ec5f7d1

2021-10-22 17:15:00 +0100

[diff] [blame]

681

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateConvolution3d(

682

const Convolution3dQueueDescriptor& descriptor, const WorkloadInfo& info) const

683

{

684

bool isFastMathEnabled = false;

685

if (m_ModelContextPtr)

686

{

687

if (m_ModelContextPtr.get() != nullptr)

688

{

689

auto modelOptions = dynamic_cast<NeonBackendModelContext*>(m_ModelContextPtr.get());

690

if (modelOptions)

691

{

692

isFastMathEnabled = modelOptions->IsFastMathEnabled();

}

}

}

return std::make_unique<NeonConvolution3dWorkload>(descriptor,

697

info,

698

m_MemoryManager->GetIntraLayerManager(),

isFastMathEnabled);

}

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

702

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDebug(const DebugQueueDescriptor& descriptor,

703

const WorkloadInfo& info) const

704

{

705

return MakeWorkloadHelper<NullWorkload, NullWorkload>(descriptor, info);

706

}

707

Aron Virginas-Tar

2f00b74

2019-09-30 13:28:08 +0100

[diff] [blame]

708

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDepthToSpace(const DepthToSpaceQueueDescriptor& descriptor,

709

const WorkloadInfo& info) const

710

{

711

return std::make_unique<NeonDepthToSpaceWorkload>(descriptor, info);

712

}

713

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

714

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDepthwiseConvolution2d(

715

const DepthwiseConvolution2dQueueDescriptor& descriptor, const WorkloadInfo& info) const

716

{

Nattapat Chaimanowong

7714088

2018-10-17 11:12:19 +0100

[diff] [blame]

717

return std::make_unique<NeonDepthwiseConvolutionWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

718

}

719

Narumol Prangnawarat

01961a7

2019-05-30 16:47:12 +0100

[diff] [blame]

720

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDequantize(const DequantizeQueueDescriptor& descriptor,

721

const WorkloadInfo& info) const

722

{

723

return std::make_unique<NeonDequantizeWorkload>(descriptor, info);

724

}

725

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

726

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateDetectionPostProcess(

727

const armnn::DetectionPostProcessQueueDescriptor& descriptor, const armnn::WorkloadInfo& info) const

728

{

James Conroy

d9fb6e2

2020-02-21 16:52:44 +0000

[diff] [blame]

729

return MakeWorkloadHelper<NullWorkload, NullWorkload>(descriptor, info);

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

730

}

731

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

732

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateDivision(

733

const DivisionQueueDescriptor& descriptor, const WorkloadInfo& info) const

734

{

Pablo Tello

e61f071

2020-01-23 10:37:17 +0000

[diff] [blame]

735

return std::make_unique<NeonDivisionWorkload>(descriptor, info);

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

736

}

737

Sadik Armagan

ac47210

2020-03-24 09:54:36 +0000

[diff] [blame]

738

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateElementwiseUnary(

739

const ElementwiseUnaryQueueDescriptor& descriptor, const WorkloadInfo& info) const

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

740

{

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

741

switch(descriptor.m_Parameters.m_Operation)

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

742

{

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

743

case UnaryOperation::Abs:

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

744

{

745

AbsQueueDescriptor absQueueDescriptor;

746

absQueueDescriptor.m_Inputs = descriptor.m_Inputs;

747

absQueueDescriptor.m_Outputs = descriptor.m_Outputs;

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

748

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

749

return std::make_unique<NeonAbsWorkload>(absQueueDescriptor, info);

750

}

Teresa Charlin

50de4fa

2021-05-31 18:47:33 +0100

[diff] [blame]

751

case UnaryOperation::Exp:

752

return std::make_unique<NeonExpWorkload>(descriptor, info);

753

case UnaryOperation::LogicalNot:

754

return std::make_unique<NeonLogicalNotWorkload>(descriptor, info);

755

case UnaryOperation::Log:

756

return std::make_unique<NeonLogWorkload>(descriptor, info);

757

case UnaryOperation::Neg:

758

return std::make_unique<NeonNegWorkload>(descriptor, info);

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

759

case UnaryOperation::Rsqrt:

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

760

{

761

RsqrtQueueDescriptor rsqrtQueueDescriptor;

762

rsqrtQueueDescriptor.m_Inputs = descriptor.m_Inputs;

763

rsqrtQueueDescriptor.m_Outputs = descriptor.m_Outputs;

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

764

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

765

return std::make_unique<NeonRsqrtWorkload>(rsqrtQueueDescriptor, info);

766

}

Teresa Charlin

50de4fa

2021-05-31 18:47:33 +0100

[diff] [blame]

767

case UnaryOperation::Sin:

768

return std::make_unique<NeonSinWorkload>(descriptor, info);

Derek Lamberti

2020-04-28 13:34:56 +0100

[diff] [blame]

769

default:

770

return nullptr;

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

771

}

josh minor

2020-01-06 16:40:46 -0600

[diff] [blame]

772

}

773

Sadik Armagan

a792a05

2020-06-23 16:22:23 +0100

[diff] [blame]

774

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateFill(const FillQueueDescriptor& descriptor,

775

const WorkloadInfo& info) const

776

{

777

return std::make_unique<NeonFillWorkload>(descriptor, info);

778

}

779

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

780

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateFloor(const FloorQueueDescriptor& descriptor,

781

const WorkloadInfo& info) const

782

{

783

return MakeWorkloadHelper<NeonFloorFloatWorkload, NullWorkload>(descriptor, info);

784

}

785

786

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateFullyConnected(

787

const FullyConnectedQueueDescriptor& descriptor, const WorkloadInfo& info) const

788

{

Kevin May

be7e35c

2020-04-29 17:05:05 +0100

[diff] [blame]

789

return std::make_unique<NeonFullyConnectedWorkload>(descriptor, info, m_MemoryManager->GetIntraLayerManager());

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

790

}

791

792

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateGather(const armnn::GatherQueueDescriptor& descriptor,

793

const armnn::WorkloadInfo& info) const

794

{

Teresa Charlin

f540eb8

2020-04-10 19:24:55 +0100

[diff] [blame]

795

return std::make_unique<NeonGatherWorkload>(descriptor, info);

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

796

}

797

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

798

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateInput(const InputQueueDescriptor& descriptor,

799

const WorkloadInfo& info) const

800

{

801

return std::make_unique<CopyMemGenericWorkload>(descriptor, info);

802

}

803

804

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateInstanceNormalization(

805

const InstanceNormalizationQueueDescriptor& descriptor,

806

const WorkloadInfo& info) const

807

{

808

return std::make_unique<NeonInstanceNormalizationWorkload>(descriptor, info);

809

}

810

811

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateL2Normalization(const L2NormalizationQueueDescriptor& descriptor,

812

const WorkloadInfo& info) const

813

{

814

return MakeWorkloadHelper<NeonL2NormalizationFloatWorkload, NullWorkload>(descriptor, info,

815

m_MemoryManager->GetIntraLayerManager());

816

}

817

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

818

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateLogSoftmax(const LogSoftmaxQueueDescriptor& descriptor,

819

const WorkloadInfo& info) const

820

{

821

return std::make_unique<NeonLogSoftmaxWorkload>(descriptor, info, m_MemoryManager->GetIntraLayerManager());

822

}

823

James Conroy

2020-11-13 10:18:51 +0000

[diff] [blame]

824

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateLogicalBinary(const LogicalBinaryQueueDescriptor& descriptor,

825

const WorkloadInfo& info) const

826

{

827

switch(descriptor.m_Parameters.m_Operation)

828

{

829

case LogicalBinaryOperation::LogicalAnd:

830

return std::make_unique<NeonLogicalAndWorkload>(descriptor, info);

831

case LogicalBinaryOperation::LogicalOr:

832

return std::make_unique<NeonLogicalOrWorkload>(descriptor, info);

default:

return nullptr;

}

}

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

838

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateLstm(const LstmQueueDescriptor& descriptor,

839

const WorkloadInfo& info) const

840

{

841

return MakeWorkloadHelper<NeonLstmFloatWorkload, NullWorkload>(descriptor, info);

842

}

843

844

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateMaximum(const MaximumQueueDescriptor& descriptor,

845

const WorkloadInfo& info) const

846

{

847

return std::make_unique<NeonMaximumWorkload>(descriptor, info);

848

}

849

850

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateMean(const MeanQueueDescriptor& descriptor,

851

const WorkloadInfo& info) const

852

{

853

return std::make_unique<NeonMeanWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

854

}

855

856

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMemCopy(const MemCopyQueueDescriptor& descriptor,

857

const WorkloadInfo& info) const

858

{

859

if (descriptor.m_Inputs.empty() || !descriptor.m_Inputs[0])

860

{

861

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemCopy workload");

862

}

863

Aron Virginas-Tar

a8e06ed

2018-10-19 16:46:15 +0100

[diff] [blame]

864

return MakeWorkloadHelper<CopyMemGenericWorkload, CopyMemGenericWorkload>(descriptor, info);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

865

}

866

Derek Lamberti

f674aa0

2019-08-01 15:56:25 +0100

[diff] [blame]

867

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMemImport(const MemImportQueueDescriptor& descriptor,

868

const WorkloadInfo& info) const

869

{

870

if (descriptor.m_Inputs.empty() || !descriptor.m_Inputs[0])

871

{

872

throw InvalidArgumentException("NeonWorkloadFactory: Invalid null input for MemImport workload");

873

}

874

875

return std::make_unique<ImportMemGenericWorkload>(descriptor, info);

876

}

877

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

878

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateMinimum(const MinimumQueueDescriptor& descriptor,

879

const WorkloadInfo& info) const

880

{

881

return std::make_unique<NeonMinimumWorkload>(descriptor, info);

882

}

883

884

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateMultiplication(

885

const MultiplicationQueueDescriptor& descriptor, const WorkloadInfo& info) const

886

{

887

return std::make_unique<NeonMultiplicationWorkload>(descriptor, info);

888

}

889

890

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateNormalization(

891

const NormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const

892

{

893

return MakeWorkloadHelper<NeonNormalizationFloatWorkload, NullWorkload>(descriptor, info,

894

m_MemoryManager->GetIntraLayerManager());

895

}

896

897

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateOutput(const OutputQueueDescriptor& descriptor,

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

898

const WorkloadInfo& info) const

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

899

{

900

return std::make_unique<CopyMemGenericWorkload>(descriptor, info);

901

}

902

903

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreatePad(const PadQueueDescriptor& descriptor,

904

const WorkloadInfo& info) const

905

{

906

return std::make_unique<NeonPadWorkload>(descriptor, info);

907

}

908

909

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreatePermute(const PermuteQueueDescriptor& descriptor,

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

910

const WorkloadInfo& info) const

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

911

{

912

return std::make_unique<NeonPermuteWorkload>(descriptor, info);

913

}

914

915

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreatePooling2d(const Pooling2dQueueDescriptor& descriptor,

Keith Davis

2020-07-02 11:49:26 +0100

[diff] [blame]

916

const WorkloadInfo& info) const

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

917

{

918

return std::make_unique<NeonPooling2dWorkload>(descriptor, info);

919

}

920

921

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreatePreCompiled(const PreCompiledQueueDescriptor& descriptor,

922

const WorkloadInfo& info) const

923

{

924

return MakeWorkloadHelper<NullWorkload, NullWorkload>(descriptor, info);

925

}

926

927

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreatePrelu(const armnn::PreluQueueDescriptor &descriptor,

928

const armnn::WorkloadInfo &info) const

929

{

930

return std::make_unique<NeonPreluWorkload>(descriptor, info);

931

}

932

James Conroy

cc34093

2020-05-12 18:08:52 +0100

[diff] [blame]

933

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateQLstm(const QLstmQueueDescriptor& descriptor,

934

const WorkloadInfo& info) const

935

{

936

return std::make_unique<NeonQLstmWorkload>(descriptor, info);

937

}

938

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

939

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateQuantize(const QuantizeQueueDescriptor& descriptor,

940

const WorkloadInfo& info) const

941

{

Kevin May

9077473

2020-03-03 12:10:10 +0000

[diff] [blame]

942

return std::make_unique<NeonQuantizeWorkload>(descriptor, info);

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

943

}

944

945

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateQuantizedLstm(const QuantizedLstmQueueDescriptor& descriptor,

946

const WorkloadInfo& info) const

947

{

948

return std::make_unique<NeonQuantizedLstmWorkload>(descriptor, info);

949

}

950

David Monahan

97451b4

2020-12-03 09:48:06 +0000

[diff] [blame]

951

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateRank(const RankQueueDescriptor& descriptor,

952

const WorkloadInfo& info) const

953

{

954

return std::make_unique<NeonRankWorkload>(descriptor, info);

955

}

956

Sadik Armagan

a274748

2021-02-09 10:28:54 +0000

[diff] [blame]

957

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateReduce(const ReduceQueueDescriptor& descriptor,

958

const WorkloadInfo& info) const

959

{

960

return std::make_unique<NeonReduceWorkload>(descriptor, info);

961

}

962

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

963

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateReshape(const ReshapeQueueDescriptor& descriptor,

964

const WorkloadInfo& info) const

965

{

966

return std::make_unique<NeonReshapeWorkload>(descriptor, info);

967

}

968

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

969

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateResize(const ResizeQueueDescriptor& descriptor,

970

const WorkloadInfo& info) const

971

{

Ellen Norris-Thompson

37e6868

2019-07-15 14:23:30 +0100

[diff] [blame]

972

return std::make_unique<NeonResizeWorkload>(descriptor, info);

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

973

}

974

josh minor

036f02d

2019-11-15 14:53:22 -0600

[diff] [blame]

975

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSlice(const SliceQueueDescriptor& descriptor,

976

const WorkloadInfo& info) const

977

{

978

return std::make_unique<NeonSliceWorkload>(descriptor, info);

979

}

980

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

981

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSoftmax(const SoftmaxQueueDescriptor& descriptor,

982

const WorkloadInfo& info) const

Sadik Armagan

581742d

2019-08-12 14:11:37 +0100

[diff] [blame]

983

{

Sadik Armagan

be88a57

2020-04-30 11:39:37 +0100

[diff] [blame]

984

return std::make_unique<NeonSoftmaxWorkload>(descriptor, info, m_MemoryManager->GetIntraLayerManager());

Sadik Armagan

581742d

2019-08-12 14:11:37 +0100

[diff] [blame]

985

}

986

Mike Kelly

0be3a88

2020-01-24 11:27:50 +0000

[diff] [blame]

987

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSpaceToBatchNd(const SpaceToBatchNdQueueDescriptor& descriptor,

988

const WorkloadInfo& info) const

989

{

990

return std::make_unique<NeonSpaceToBatchNdWorkload>(descriptor, info);

991

}

992

993

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSpaceToDepth(const SpaceToDepthQueueDescriptor& descriptor,

994

const WorkloadInfo& info) const

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

995

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

996

return std::make_unique<NeonSpaceToDepthWorkload>(descriptor, info);

997

}

998

999

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateSplitter(const SplitterQueueDescriptor& descriptor,

1000

const WorkloadInfo& info) const

1001

{

1002

return std::make_unique<NeonSplitterWorkload>(descriptor, info);

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

1003

}

1004

Matthew Jackson

87f65ea

2019-08-01 10:01:34 +0100

[diff] [blame]

1005

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateStack(const StackQueueDescriptor& descriptor,

1006

const WorkloadInfo& info) const

1007

{

1008

return std::make_unique<NeonStackWorkload>(descriptor, info);

1009

}

1010

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1011

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateStridedSlice(const StridedSliceQueueDescriptor& descriptor,

1012

const WorkloadInfo& info) const

James Conroy

d47a064

2019-09-17 14:22:06 +0100

[diff] [blame]

1013

{

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1014

return std::make_unique<NeonStridedSliceWorkload>(descriptor, info);

1015

}

1016

1017

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateSubtraction(

1018

const SubtractionQueueDescriptor& descriptor, const WorkloadInfo& info) const

1019

{

1020

return std::make_unique<NeonSubtractionWorkload>(descriptor, info);

1021

}

1022

Mike Kelly

c9ea45a

2020-02-28 18:11:58 +0000

[diff] [blame]

1023

std::unique_ptr<armnn::IWorkload> NeonWorkloadFactory::CreateTranspose(const TransposeQueueDescriptor& descriptor,

1024

const WorkloadInfo& info) const

1025

{

1026

return std::make_unique<NeonTransposeWorkload>(descriptor, info);

1027

}

1028

Sadik Armagan

2019-10-09 14:26:32 +0100

[diff] [blame]

1029

std::unique_ptr<IWorkload> NeonWorkloadFactory::CreateTransposeConvolution2d(

1030

const TransposeConvolution2dQueueDescriptor &descriptor,

1031

const WorkloadInfo &info) const

1032

{

1033

return std::make_unique<NeonTransposeConvolution2dWorkload>(descriptor, info,

1034

m_MemoryManager->GetIntraLayerManager());

James Conroy

d47a064

2019-09-17 14:22:06 +0100

[diff] [blame]

1035

}

1036

Aron Virginas-Tar