Blame - src/armnn/Network.cpp - ml/armnn

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

5

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

6

#include "Network.hpp"

7

#include "Graph.hpp"

8

#include "Layer.hpp"

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

9

#include "DeviceSpec.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

10

#include "Optimizer.hpp"

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

11

#include "SubgraphViewSelector.hpp"

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

12

#include "BackendSettings.hpp"

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

13

#include "optimizations/All.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

14

Colm Donelan

0c47974

2021-12-10 12:43:54 +0000

[diff] [blame]

15

#include <armnn/backends/TensorHandle.hpp>

16

#include <armnn/backends/WorkloadFactory.hpp>

Matteo Martincigh

e5b8eb9

2019-11-28 15:45:42 +0000

[diff] [blame]

17

#include <armnn/backends/IBackendInternal.hpp>

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

18

#include <backendsCommon/TensorHandleFactoryRegistry.hpp>

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

19

20

#include <armnn/Exceptions.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

21

#include <armnn/Utils.hpp>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

22

#include <armnn/TypesUtils.hpp>

Matteo Martincigh

c601aa6

2019-10-29 15:03:22 +0000

[diff] [blame]

23

#include <armnn/BackendRegistry.hpp>

Matthew Bentham

f48afc6

2020-01-15 17:55:08 +0000

[diff] [blame]

24

#include <armnn/Logging.hpp>

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

25

#include <armnn/utility/Assert.hpp>

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

26

#include <armnn/utility/IgnoreUnused.hpp>

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

27

#include <armnn/utility/PolymorphicDowncast.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

28

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

29

#include <ProfilingService.hpp>

30

Nikhil Raj

77fe76b

2021-06-09 14:55:32 +0100

[diff] [blame]

31

#include <common/include/ProfilingGuid.hpp>

32

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

33

#include <fmt/format.h>

34

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

#include <fcntl.h>

#include <algorithm>

#include <fstream>

#include <memory>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

39

#include <vector>

40

#include <algorithm>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

41

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

namespace armnn

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

45

INetwork::INetwork(NetworkOptions networkOptions) : pNetworkImpl(new NetworkImpl(networkOptions)) {}

46

47

INetwork::~INetwork() = default;

48

49

Status INetwork::PrintGraph()

50

{

51

return pNetworkImpl->PrintGraph();

52

}

53

54

IConnectableLayer* INetwork::AddInputLayer(LayerBindingId id, const char* name)

55

{

56

return pNetworkImpl->AddInputLayer(id, name);

}

IConnectableLayer* INetwork::AddArgMinMaxLayer(const ArgMinMaxDescriptor& desc,

61

const char* name)

62

{

63

return pNetworkImpl->AddArgMinMaxLayer(desc, name);

64

}

65

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

66

IConnectableLayer* INetwork::AddCastLayer(const char* name)

67

{

68

return pNetworkImpl->AddCastLayer(name);

69

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

70

71

IConnectableLayer* INetwork::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

72

const char* name)

73

{

74

return pNetworkImpl->AddComparisonLayer(comparisonDescriptor, name);

}

IConnectableLayer* INetwork::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

79

const char* name)

80

{

81

return pNetworkImpl->AddConcatLayer(concatDescriptor, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

86

const ConstTensor& weights,

87

const Optional<ConstTensor>& biases,

88

const char* name)

89

{

90

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

95

const ConstTensor& weights,

96

const char* name)

97

{

98

Optional<ConstTensor> biases;

99

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

104

const ConstTensor& weights,

105

const ConstTensor& biases,

const char* name )

{

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor,

110

weights,

111

armnn::Optional<ConstTensor>(biases),

name);

}

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

116

IConnectableLayer* INetwork::AddConvolution3dLayer(const Convolution3dDescriptor& convolution3dDescriptor,

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

117

const char* name)

118

{

Matthew Sloyan

5d7b0a3

2021-10-18 13:07:49 +0100

[diff] [blame]

119

return pNetworkImpl->AddConvolution3dLayer(convolution3dDescriptor, name);

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

123

IConnectableLayer* INetwork::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

124

const char* name)

125

{

126

return pNetworkImpl->AddDepthToSpaceLayer(depthToSpaceDescriptor, name);

}

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

131

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

132

const ConstTensor& weights,

133

const Optional<ConstTensor>& biases,

134

const char* name)

135

{

136

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

140

IConnectableLayer* INetwork::AddDequantizeLayer(const char* name)

141

{

142

return pNetworkImpl->AddDequantizeLayer(name);

}

IConnectableLayer* INetwork::AddDetectionPostProcessLayer(

147

const DetectionPostProcessDescriptor& descriptor,

148

const ConstTensor& anchors,

149

const char* name)

150

{

151

return pNetworkImpl->AddDetectionPostProcessLayer(descriptor, anchors, name);

}

IConnectableLayer* INetwork::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

156

const char* name)

157

{

158

return pNetworkImpl->AddElementwiseUnaryLayer(elementwiseUnaryDescriptor, name);

}

IConnectableLayer* INetwork::AddFillLayer(const FillDescriptor& fillDescriptor,

163

const char* name)

164

{

165

return pNetworkImpl->AddFillLayer(fillDescriptor, name);

166

}

167

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

168

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

169

const char* name)

170

{

171

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor, name);

172

}

173

174

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

175

const ConstTensor& weights,

176

const Optional<ConstTensor>& biases,

177

const char* name)

178

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

179

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor,

180

armnn::Optional<ConstTensor>(weights),

181

biases,

182

name);

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

183

}

184

185

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

186

const Optional<ConstTensor>& weights,

187

const Optional<ConstTensor>& biases,

188

const char* name)

189

{

190

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor, weights, biases, name);

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

191

}

192

193

IConnectableLayer* INetwork::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

194

const char* name)

195

{

196

return pNetworkImpl->AddPermuteLayer(permuteDescriptor, name);

197

}

198

199

IConnectableLayer* INetwork::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

200

const char* name)

201

{

202

return pNetworkImpl->AddBatchToSpaceNdLayer(batchToSpaceNdDescriptor, name);

203

}

204

205

IConnectableLayer* INetwork::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

206

const char* name)

207

{

208

return pNetworkImpl->AddPooling2dLayer(pooling2dDescriptor, name);

209

}

210

Tamás Nyíri

7b885b3

2021-10-26 14:47:57 +0100

[diff] [blame]

211

IConnectableLayer* INetwork::AddPooling3dLayer(const Pooling3dDescriptor& pooling3dDescriptor,

212

const char* name)

213

{

214

return pNetworkImpl->AddPooling3dLayer(pooling3dDescriptor, name);

215

}

216

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

217

IConnectableLayer* INetwork::AddPrecompiledLayer(const PreCompiledDescriptor& preCompiledDescriptor,

Cathal Corbett

3ea0107

2022-01-06 10:29:43 +0000

[diff] [blame]

218

CompiledBlobPtr compiledBlobPtr,

Cathal Corbett

cbfd718

2021-12-15 17:12:59 +0000

[diff] [blame]

219

const Optional<BackendId>& backend,

220

const char* name)

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

221

{

Cathal Corbett

3ea0107

2022-01-06 10:29:43 +0000

[diff] [blame]

222

return pNetworkImpl->AddPrecompiledLayer(preCompiledDescriptor, std::move(compiledBlobPtr), backend, name);

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

223

}

224

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

225

IConnectableLayer* INetwork::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

226

const char* name)

227

{

228

return pNetworkImpl->AddActivationLayer(activationDescriptor, name);

229

}

230

231

IConnectableLayer* INetwork::AddNormalizationLayer(const NormalizationDescriptor& normalizationDescriptor,

232

const char* name)

233

{

234

return pNetworkImpl->AddNormalizationLayer(normalizationDescriptor, name);

235

}

236

237

IConnectableLayer* INetwork::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

238

{

239

return pNetworkImpl->AddSliceLayer(sliceDescriptor, name);

240

}

241

IConnectableLayer* INetwork::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

242

const char* name)

243

{

244

return pNetworkImpl->AddSoftmaxLayer(softmaxDescriptor, name);

245

}

246

247

IConnectableLayer* INetwork::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

248

const char* name)

249

{

250

return pNetworkImpl->AddSplitterLayer(splitterDescriptor, name);

251

}

252

253

IConnectableLayer* INetwork::AddMergeLayer(const char* name)

254

{

255

return pNetworkImpl->AddMergeLayer(name);

256

}

257

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

258

IConnectableLayer* INetwork::AddAdditionLayer(const char* name)

259

{

260

return pNetworkImpl->AddAdditionLayer(name);

261

}

262

263

IConnectableLayer* INetwork::AddMultiplicationLayer(const char* name)

264

{

265

return pNetworkImpl->AddMultiplicationLayer(name);

266

}

267

268

IConnectableLayer* INetwork::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

269

const ConstTensor& mean,

270

const ConstTensor& variance,

271

const ConstTensor& beta,

272

const ConstTensor& gamma,

273

const char* name)

274

{

275

return pNetworkImpl->AddBatchNormalizationLayer(desc, mean, variance, beta, gamma, name);

276

}

277

278

IConnectableLayer* INetwork::AddRankLayer(const char* name)

279

{

280

return pNetworkImpl->AddRankLayer(name);

281

}

282

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

283

IConnectableLayer* INetwork::AddResizeLayer(const ResizeDescriptor& resizeDescriptor,

284

const char* name)

285

{

286

return pNetworkImpl->AddResizeLayer(resizeDescriptor, name);

287

}

288

289

IConnectableLayer* INetwork::AddReduceLayer(const ReduceDescriptor& reduceDescriptor,

290

const char* name)

291

{

292

return pNetworkImpl->AddReduceLayer(reduceDescriptor, name);

293

}

294

295

IConnectableLayer* INetwork::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

296

const char* name)

297

{

298

return pNetworkImpl->AddInstanceNormalizationLayer(desc, name);

299

}

300

301

IConnectableLayer* INetwork::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

302

const char* name)

303

{

304

return pNetworkImpl->AddL2NormalizationLayer(desc, name);

305

}

306

307

IConnectableLayer* INetwork::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& logSoftmaxDescriptor,

308

const char* name)

309

{

310

return pNetworkImpl->AddLogSoftmaxLayer(logSoftmaxDescriptor, name);

311

}

312

313

IConnectableLayer* INetwork::AddConstantLayer(const ConstTensor& input,

314

const char* name)

315

{

316

return pNetworkImpl->AddConstantLayer(input, name);

317

}

318

319

IConnectableLayer* INetwork::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

320

const char* name)

321

{

322

return pNetworkImpl->AddReshapeLayer(reshapeDescriptor, name);

323

}

324

325

IConnectableLayer* INetwork::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

326

const char* name)

327

{

328

return pNetworkImpl->AddSpaceToBatchNdLayer(spaceToBatchNdDescriptor, name);

329

}

330

331

IConnectableLayer* INetwork::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

332

const char* name)

333

{

334

return pNetworkImpl->AddSpaceToDepthLayer(spaceToDepthDescriptor, name);

335

}

336

337

IConnectableLayer* INetwork::AddFloorLayer(const char* name)

338

{

339

return pNetworkImpl->AddFloorLayer(name);

340

}

341

IConnectableLayer* INetwork::AddOutputLayer(LayerBindingId id, const char* name)

342

{

343

return pNetworkImpl->AddOutputLayer(id, name);

344

}

345

346

IConnectableLayer* INetwork::AddLstmLayer(const LstmDescriptor& descriptor,

347

const LstmInputParams& params,

348

const char* name)

349

{

350

return pNetworkImpl->AddLstmLayer(descriptor, params, name);

351

}

352

353

IConnectableLayer* INetwork::AddDivisionLayer(const char* name)

354

{

355

return pNetworkImpl->AddDivisionLayer(name);

356

}

357

358

IConnectableLayer* INetwork::AddSubtractionLayer(const char* name)

359

{

360

return pNetworkImpl->AddSubtractionLayer(name);

361

}

362

363

IConnectableLayer* INetwork::AddMaximumLayer(const char* name)

364

{

365

return pNetworkImpl->AddMaximumLayer(name);

366

}

367

368

IConnectableLayer* INetwork::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

369

{

370

return pNetworkImpl->AddMeanLayer(meanDescriptor, name);

371

}

372

373

IConnectableLayer* INetwork::AddPadLayer(const PadDescriptor& padDescriptor,

374

const char* name)

375

{

376

return pNetworkImpl->AddPadLayer(padDescriptor, name);

377

}

378

379

IConnectableLayer* INetwork::AddQuantizeLayer(const char* name)

380

{

381

return pNetworkImpl->AddQuantizeLayer(name);

382

}

383

384

IConnectableLayer* INetwork::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

385

const char* name)

386

{

387

return pNetworkImpl->AddStridedSliceLayer(stridedSliceDescriptor, name);

388

}

389

390

IConnectableLayer* INetwork::AddMinimumLayer(const char* name)

391

{

392

return pNetworkImpl->AddMinimumLayer(name);

393

}

394

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

395

IConnectableLayer* INetwork::AddGatherLayer(const GatherDescriptor& descriptor,

396

const char* name)

397

{

398

return pNetworkImpl->AddGatherLayer(descriptor, name);

399

}

400

401

IConnectableLayer* INetwork::AddSwitchLayer(const char* name)

402

{

403

return pNetworkImpl->AddSwitchLayer(name);

404

}

405

406

IConnectableLayer* INetwork::AddPreluLayer(const char* name)

407

{

408

return pNetworkImpl->AddPreluLayer(name);

409

}

410

411

IConnectableLayer* INetwork::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

412

const ConstTensor& weights,

413

const Optional<ConstTensor>& biases,

414

const char* name)

415

{

416

return pNetworkImpl->AddTransposeConvolution2dLayer(descriptor, weights, biases, name);

417

}

418

419

IConnectableLayer* INetwork::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

420

const char* name)

421

{

422

return pNetworkImpl->AddTransposeLayer(transposeDescriptor, name);

423

}

424

Keith Davis

3ae3f97

2021-05-21 16:33:48 +0100

[diff] [blame]

425

IConnectableLayer* INetwork::AddShapeLayer(const char* name)

426

{

427

return pNetworkImpl->AddShapeLayer(name);

428

}

429

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

430

IConnectableLayer* INetwork::AddStackLayer(const StackDescriptor& descriptor,

431

const char* name)

432

{

433

return pNetworkImpl->AddStackLayer(descriptor, name);

434

}

435

436

IConnectableLayer* INetwork::AddStandInLayer(const StandInDescriptor& descriptor,

437

const char* name)

438

{

439

return pNetworkImpl->AddStandInLayer(descriptor, name);

440

}

441

442

IConnectableLayer* INetwork::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

443

const char* name)

444

{

445

return pNetworkImpl->AddQuantizedLstmLayer(params, name);

446

}

447

448

IConnectableLayer* INetwork::AddQLstmLayer(const QLstmDescriptor& descriptor,

449

const LstmInputParams& params,

450

const char* name)

451

{

452

return pNetworkImpl->AddQLstmLayer(descriptor, params, name);

453

}

454

455

IConnectableLayer* INetwork::AddLogicalBinaryLayer(const LogicalBinaryDescriptor& descriptor,

456

const char* name)

457

{

458

return pNetworkImpl->AddLogicalBinaryLayer(descriptor, name);

459

}

460

Narumol Prangnawarat

8ed39ae

2021-07-15 16:16:25 +0100

[diff] [blame]

461

IConnectableLayer* INetwork::AddUnidirectionalSequenceLstmLayer(

462

const UnidirectionalSequenceLstmDescriptor& descriptor,

463

const LstmInputParams& params,

464

const char* name)

465

{

466

return pNetworkImpl->AddUnidirectionalSequenceLstmLayer(descriptor, params, name);

467

}

468

Simon Obute

51f6777

2021-09-03 15:50:13 +0100

[diff] [blame]

469

IConnectableLayer* INetwork::AddChannelShuffleLayer(const ChannelShuffleDescriptor &descriptor,

470

const char* name)

471

{

472

return pNetworkImpl->AddChannelShuffleLayer(descriptor, name);

473

}

474

Jan Eilers

1b2654f

2021-09-24 15:45:46 +0100

[diff] [blame]

475

ARMNN_NO_DEPRECATE_WARN_BEGIN

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

476

void INetwork::Accept(ILayerVisitor& visitor) const

477

{

478

return pNetworkImpl->Accept(visitor);

479

}

Jan Eilers

1b2654f

2021-09-24 15:45:46 +0100

[diff] [blame]

480

ARMNN_NO_DEPRECATE_WARN_END

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

481

482

void INetwork::ExecuteStrategy(IStrategy& strategy) const

483

{

484

return pNetworkImpl->ExecuteStrategy(strategy);

485

}

486

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

487

armnn::INetwork* INetwork::CreateRaw(NetworkOptions networkOptions)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

488

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

489

return new INetwork(networkOptions);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

490

}

491

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

492

armnn::INetworkPtr INetwork::Create(NetworkOptions networkOptions)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

493

{

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

494

return INetworkPtr(CreateRaw(networkOptions), &INetwork::Destroy);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

495

}

496

497

void INetwork::Destroy(INetwork* network)

498

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

499

delete network;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

500

}

501

Mike Kelly

0d677db

2021-06-27 22:39:21 +0100

[diff] [blame]

502

IOptimizedNetwork::IOptimizedNetwork(const IOptimizedNetwork& other, const ModelOptions& modelOptions)

503

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(*other.pOptimizedNetworkImpl.get(), modelOptions)) {}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

504

505

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<Graph> graph)

506

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph))) {}

507

508

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<OptimizedNetworkImpl> impl)

509

: pOptimizedNetworkImpl(std::move(impl)) {}

510

511

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<Graph> graph, const ModelOptions& modelOptions)

512

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph), modelOptions)) {}

513

514

IOptimizedNetwork::~IOptimizedNetwork() = default;

515

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

516

void IOptimizedNetwork::Destroy(IOptimizedNetwork* network)

517

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

518

delete network;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

519

}

520

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

521

Status IOptimizedNetwork::PrintGraph()

522

{

523

return pOptimizedNetworkImpl->PrintGraph();

524

}

525

526

Status IOptimizedNetwork::SerializeToDot(std::ostream& stream) const

527

{

528

return pOptimizedNetworkImpl->SerializeToDot(stream);

529

}

530

Derek Lamberti

e155bbf

2021-10-13 14:32:12 +0100

[diff] [blame]

531

const std::shared_ptr<IProfiler>& IOptimizedNetwork::GetProfiler() const

532

{

533

return pOptimizedNetworkImpl->GetGraph().GetProfiler();

534

}

535

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

536

profiling::ProfilingGuid IOptimizedNetwork::GetGuid() const

537

{

538

return pOptimizedNetworkImpl->GetGuid();

539

}

540

Sadik Armagan

b7851f9

2021-10-06 16:37:02 +0100

[diff] [blame]

541

size_t IOptimizedNetwork::GetNumInputs() const

542

{

543

return pOptimizedNetworkImpl->GetNumInputs();

544

}

545

546

size_t IOptimizedNetwork::GetNumOutputs() const

547

{

548

return pOptimizedNetworkImpl->GetNumOutputs();

549

}

550

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

551

Status OptimizedNetworkImpl::PrintGraph()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

552

{

553

m_Graph->Print();

554

return Status::Success;

555

}

556

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

557

Status OptimizedNetworkImpl::SerializeToDot(std::ostream& stream) const

surmeh01

bceff2f

2018-03-29 16:29:27 +0100

[diff] [blame]

558

{

559

return m_Graph->SerializeToDot(stream);

560

}

561

Sadik Armagan

b7851f9

2021-10-06 16:37:02 +0100

[diff] [blame]

562

size_t OptimizedNetworkImpl::GetNumInputs() const

563

{

564

return m_Graph->GetNumInputs();

565

}

566

567

size_t OptimizedNetworkImpl::GetNumOutputs() const

568

{

569

return m_Graph->GetNumOutputs();

570

}

571

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

572

void ReportError(const std::string& errorMessage,

573

Optional<std::vector<std::string>&> errorMessages)

574

{

575

std::stringstream fullErrorMessage;

576

fullErrorMessage << "ERROR: " << errorMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

577

ARMNN_LOG(warning) << fullErrorMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

578

if (errorMessages)

579

{

580

errorMessages.value().push_back(fullErrorMessage.str());

}

}

void ReportWarning(const std::string& warningMessage,

585

Optional<std::vector<std::string>&> warningMessages)

586

{

587

std::stringstream fullWarningMessage;

588

fullWarningMessage << "WARNING: " << warningMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

589

ARMNN_LOG(warning) << fullWarningMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

590

if (warningMessages)

591

{

592

warningMessages.value().push_back(fullWarningMessage.str());

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

596

OptimizationResult ReturnWithError(OptimizationResult res,

597

const Layer* layer,

598

const BackendSettings& backendSettings,

599

Optional<std::vector<std::string>&> errMessages)

600

{

601

std::stringstream failureMsg;

602

failureMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

603

<< " is not supported on any preferred backend " << backendSettings.m_PreferredBackends;

604

ReportError(failureMsg.str(), errMessages);

res.m_Error = true;

return res;

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

611

bool CheckScaleSetOnQuantizedType(Layer* layer, Optional<std::vector<std::string>&> errMessages)

612

{

613

bool noErrors = true;

614

unsigned int numOutputs = layer->GetNumOutputSlots();

615

for (unsigned int i = 0; i < numOutputs; i++) {

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

616

OutputSlot& outputSlot = layer->GetOutputSlot(i);

617

TensorInfo info = outputSlot.GetTensorInfo();

Derek Lamberti

f90c56d

2020-01-10 17:14:08 +0000

[diff] [blame]

618

if (DataType::QAsymmU8 == info.GetDataType()) {

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

619

if (0.f == info.GetQuantizationScale()) {

620

noErrors = false;

621

std::stringstream ss;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

622

ss << "output " << i << " of layer " << GetLayerTypeAsCString(layer->GetType())

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

623

<< " (" << layer->GetNameStr() << ") is of type"

624

<< " Quantized 8 bit but its scale parameter has not been set";

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

625

ReportError(ss.str(), errMessages);

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

626

}

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

627

// Softmax under QuantisedAsymm8 must always be scale (1.0f/256.0f) and offset 0

628

if ((info.GetQuantizationScale() != (1.0f / 256.0f) ||

629

info.GetQuantizationOffset() != 0) &&

630

layer->GetType() == armnn::LayerType::Softmax)

631

{

632

std::stringstream ss;

633

ss << "Quantization parameters for Softmax layer (Scale: " <<

634

info.GetQuantizationScale() << " and Offset: " << info.GetQuantizationOffset() <<

635

") are incorrect and have been updated to Scale: 0.00390625 and Offset: 0";

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

636

ARMNN_LOG(warning) << ss.str();

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

637

info.SetQuantizationScale((1.0f /256.0f));

638

info.SetQuantizationOffset(0);

639

outputSlot.SetTensorInfo(info);

640

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

}

}

return noErrors;

}

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

646

template <typename LayerT>

647

LayerT* ConvertBf16ToFp32Weight(Layer* l)

648

{

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

649

LayerT* layer = PolymorphicDowncast<LayerT*>(l);

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

650

if ((layer->GetType() == LayerType::Convolution2d || layer->GetType() == LayerType::FullyConnected)

651

&& layer->m_Weight)

652

{

653

const TensorInfo& info = layer->m_Weight->GetTensorInfo();

654

655

if (info.GetDataType() == DataType::BFloat16)

656

{

657

std::vector<float> newValues(info.GetNumElements());

658

659

armnnUtils::FloatingPointConverter::ConvertBFloat16ToFloat32(

Finn Williams

4422cec

2021-03-22 17:51:06 +0000

[diff] [blame]

660

layer->m_Weight->template GetConstTensor<armnn::BFloat16>(), info.GetNumElements(), newValues.data());

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

661

662

TensorInfo newInfo(info.GetShape(), DataType::Float32);

663

ConstTensor newInput(newInfo, newValues);

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

664

layer->m_Weight.reset(new ScopedTensorHandle(newInput));

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

}

}

return layer;

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

670

OptimizationResult AttemptBackendAssignment(BackendSettings& backendSettings,

Graph& graph,

Layer* layer,

BackendId backend,

DataType dataTypeIn,

DataType dataTypeOut,

676

const std::vector<BackendId>& availablePreferredBackends,

677

std::string& reasonIfUnsupported,

678

Optional<std::vector<std::string>&> errMessages)

679

{

680

OptimizationResult result;

681

682

// Helper lambda to compose meaningful error message before returning with error

683

auto ReturnError = [&](const Layer* layer)

684

{

685

return ReturnWithError(result, layer, backendSettings, errMessages);

686

};

687

688

// need to set the compute device on the layer

689

// before we can check if it is supported

690

layer->SetBackendId(backend);

691

if (!IWorkloadFactory::IsLayerSupported(*layer, EmptyOptional(), reasonIfUnsupported))

692

{

693

if (dataTypeIn == DataType::Float16 || dataTypeOut == DataType::Float16)

694

{

695

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

696

&& layer->GetType() != LayerType::ConvertFp32ToFp16

697

&& layer->GetType() != LayerType::ConvertFp16ToFp32)

698

{

Jan Eilers

0c0019c

2021-08-20 16:42:58 +0100

[diff] [blame]

699

auto ConstantLayerFromFp16ToFp32 = [](Layer& layer)

700

{

701

if (layer.GetType() == LayerType::Constant)

702

{

703

ConstantLayer* constantLayer = PolymorphicDowncast<ConstantLayer*>(&layer);

704

705

auto& info = constantLayer->m_LayerOutput->GetTensorInfo();

706

707

if (info.GetDataType() == DataType::Float16)

708

{

709

std::vector<float> newValues(info.GetNumElements());

710

711

armnnUtils::FloatingPointConverter::ConvertFloat16To32(

712

constantLayer->m_LayerOutput->GetConstTensor<Half>(),

713

info.GetNumElements(),

714

newValues.data());

715

716

TensorInfo newInfo(info);

717

newInfo.SetDataType(DataType::Float32);

718

ConstTensor newInput(newInfo, newValues);

719

constantLayer->m_LayerOutput.reset(new ScopedTensorHandle(newInput));

720

721

layer.GetOutputSlot(0).SetTensorInfo(newInfo);

}

}

};

bool checkType = false;

727

728

for (auto inputSlot : layer->GetInputSlots())

729

{

730

auto connectedOutputSlot = inputSlot.GetConnectedOutputSlot();

731

if (connectedOutputSlot->GetOwningLayer().GetType() == LayerType::Constant)

732

{

733

if (connectedOutputSlot->GetNumConnections() == 1)

734

{

735

checkType = true;

736

ConstantLayerFromFp16ToFp32(connectedOutputSlot->GetOwningLayer());

}

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

741

// Insert FP16 -> FP32 conversion layer before current layer

742

std::vector<ConvertFp16ToFp32Layer*> convertFp16ToFp32Layers;

743

if (dataTypeIn == DataType::Float16)

744

{

745

convertFp16ToFp32Layers =

Jan Eilers

0c0019c

2021-08-20 16:42:58 +0100

[diff] [blame]

746

InsertConvertFp16ToFp32LayersBefore(graph, *layer, checkType);

Derek Lamberti

4a9e24b

2020-01-03 16:53:38 +0000

[diff] [blame]

747

}

748

749

// Insert FP32 -> FP16 conversion layer after current layer

750

std::vector<ConvertFp32ToFp16Layer*> convertFp32ToFp16Layers;

751

if (dataTypeOut == DataType::Float16)

752

{

753

convertFp32ToFp16Layers =

754

InsertConvertFp32ToFp16LayersAfter(graph, *layer);

755

}

756

757

// Assign a supported backend to the newly introduced conversion layers

758

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

759

{

760

bool supportedBackendFound = false;

761

std::string reasonIfUnsupported;

762

763

// Try preferred backend first

764

layer->SetBackendId(preferredBackend);

765

if (IWorkloadFactory::IsLayerSupported(*layer,

766

EmptyOptional(),

767

reasonIfUnsupported))

768

{

769

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

774

{

775

// Skip preferred backend (we already determined that it is not supported)

776

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

782

if (IWorkloadFactory::IsLayerSupported(*layer,

783

EmptyOptional(),

784

reasonIfUnsupported))

785

{

786

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

793

};

794

795

for (ConvertFp16ToFp32Layer* convertLayer : convertFp16ToFp32Layers)

796

{

797

if (!AssignFirstSupportedBackend(convertLayer, backend))

798

{

799

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToFp16Layer* convertLayer : convertFp32ToFp16Layers)

804

{

805

if (!AssignFirstSupportedBackend(convertLayer, backend))

806

{

807

return ReturnError(convertLayer);

}

}

return result;

}

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

814

else if (dataTypeIn == DataType::BFloat16 || dataTypeOut == DataType::BFloat16)

815

{

816

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

817

&& layer->GetType() != LayerType::ConvertFp32ToBf16

818

&& layer->GetType() != LayerType::ConvertBf16ToFp32)

819

{

820

// Insert BF16 -> FP32 conversion layer before current layer

821

std::vector<ConvertBf16ToFp32Layer*> convertBf16ToFp32Layers;

822

if (dataTypeIn == DataType::BFloat16)

823

{

824

convertBf16ToFp32Layers =

825

InsertConvertBf16ToFp32LayersBefore(graph, *layer);

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

826

if (layer->GetType() == LayerType::Convolution2d)

827

{

828

ConvertBf16ToFp32Weight<Convolution2dLayer>(layer);

829

}

830

else if (layer->GetType() == LayerType::FullyConnected)

831

{

832

ConvertBf16ToFp32Weight<FullyConnectedLayer>(layer);

833

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

834

}

835

836

// Insert FP32 -> BF16 conversion layer after current layer

837

std::vector<ConvertFp32ToBf16Layer*> convertFp32ToBf16Layers;

838

if (dataTypeOut == DataType::BFloat16)

839

{

840

convertFp32ToBf16Layers =

841

InsertConvertFp32ToBf16LayersAfter(graph, *layer);

842

}

843

844

// Assign a supported backend to the newly introduced conversion layers

845

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

846

{

847

bool supportedBackendFound = false;

848

std::string reasonIfUnsupported;

849

850

// Try preferred backend first

851

layer->SetBackendId(preferredBackend);

852

if (IWorkloadFactory::IsLayerSupported(*layer,

853

EmptyOptional(),

854

reasonIfUnsupported))

855

{

856

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

861

{

862

// Skip preferred backend (we already determined that it is not supported)

863

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

869

if (IWorkloadFactory::IsLayerSupported(*layer,

870

EmptyOptional(),

871

reasonIfUnsupported))

872

{

873

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

880

};

881

882

for (ConvertBf16ToFp32Layer* convertLayer : convertBf16ToFp32Layers)

883

{

884

if (!AssignFirstSupportedBackend(convertLayer, backend))

885

{

886

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToBf16Layer* convertLayer : convertFp32ToBf16Layers)

891

{

892

if (!AssignFirstSupportedBackend(convertLayer, backend))

893

{

894

return ReturnError(convertLayer);

}

}

return result;

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

902

std::stringstream warningMsg;

903

warningMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

904

<< " is not supported on requested backend " << layer->GetBackendId().Get()

905

<< " for input data type " << GetDataTypeName(dataTypeIn)

906

<< " and output data type " << GetDataTypeName(dataTypeOut)

907

<< " (reason: " << reasonIfUnsupported

908

<< "), falling back to the next backend.";

909

ReportWarning(warningMsg.str(), errMessages);

910

911

return OptimizationResult(true, false);

}

else

{

return result;

}

}

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

919

// Refactor to allow passing the IConnectableLayer* rather than Layer Iterator

920

// on Graph and SubgraphView which are different types.

921

void AssignBackendsIConnectable(OptimizedNetworkImpl* optNetObjPtr,

922

IConnectableLayer* it,

923

Optional<std::vector<std::string>&> errMessages,

924

OptimizationResult& result,

925

BackendSettings& backendSettings,

926

std::vector<BackendId>& availablePreferredBackends)

927

{

928

auto ReturnError = [&](const Layer* layer)

929

{

930

return ReturnWithError(result, layer, backendSettings, errMessages);

931

};

932

933

auto layer = PolymorphicDowncast<Layer*>(it);

934

935

if (layer->GetType() == LayerType::Input)

{

return;

}

DataType dataTypeIn = layer->GetNumInputSlots() == 0 ? DataType::Float32 :

941

layer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo().GetDataType();

942

DataType dataTypeOut = layer->GetNumOutputSlots() == 0 ? DataType::Float32 :

943

layer->GetOutputSlot(0).GetTensorInfo().GetDataType();

944

945

std::string reasonIfUnsupported;

946

bool found = false;

947

if (!CheckScaleSetOnQuantizedType(layer, errMessages))

948

{

949

// don't bomb immediately, find all the quantized outputs

950

// which haven't had a scale set and report them all back.

951

result.m_Error = true;

952

}

953

954

// First try assign layer to hint backend

955

if (layer->GetBackendHint().has_value() &&

956

backendSettings.IsBackendSupported(layer->GetBackendHint().value()) &&

957

AttemptBackendAssignment(backendSettings,

958

optNetObjPtr->GetGraph(),

959

layer,

960

layer->GetBackendHint().value(),

961

dataTypeIn,

962

dataTypeOut,

963

availablePreferredBackends,

reasonIfUnsupported,

errMessages).IsOk())

{

found = true;

backendSettings.m_SelectedBackends.insert(layer->GetBackendHint().value());

}

else

{

// Try assign layer to prefered list of backends

973

for (const auto& backend : availablePreferredBackends)

974

{

975

if (layer->GetBackendHint().has_value() &&

976

layer->GetBackendHint().value() == backend)

977

{

978

continue; //Don't re-test the backend hint

979

}

980

981

OptimizationResult res = AttemptBackendAssignment(backendSettings,

982

optNetObjPtr->GetGraph(),

layer,

backend,

dataTypeIn,

dataTypeOut,

availablePreferredBackends,

reasonIfUnsupported,

errMessages);

if (res.IsOk())

{

found = true;

backendSettings.m_SelectedBackends.insert(backend);

995

break;

996

}

997

else if (res.IsError())

998

{

999

result = res; // Cannot continue.

1000

// Note: we don't need to log the error as it would already

1001

// be logged in AttemptBackendAssignment().

}

else

{

ARMNN_ASSERT_MSG(res.IsWarningOnly(), "OptimizationResult in unexpected state.");

}

}

}

// If the layer is unsupported by any devices, log and return a null network.

1011

if (!found)

1012

{

1013

// NOTE: if the layer is not an operation queue type AND we have not got CpuRef as a

1014

// fallback we should set the compute device on the layer to CpuRef (these are not

1015

// available as accelerated operations, or are only available under certain

1016

// conditions, currently they comprise MemCopy, Constant, Permute)

1017

armnn::LayerType layerType = layer->GetType();

1018

if (!backendSettings.IsCpuRefUsed() && (layerType == armnn::LayerType::MemCopy ||

1019

layerType == armnn::LayerType::Constant ||

1020

layerType == armnn::LayerType::Permute))

1021

{

1022

BackendId cpuBackendId(armnn::Compute::CpuRef);

1023

layer->SetBackendId(cpuBackendId);

1024

backendSettings.m_SelectedBackends.insert(cpuBackendId);

}

else

{

result = ReturnError(layer);

}

}

}

Derek Lamberti

4a9e24b

2020-01-03 16:53:38 +0000

[diff] [blame]

1033

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1034

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1035

BackendSettings& backendSettings,

1036

Graph::Iterator& firstLayer,

1037

Graph::Iterator& lastLayer,

1038

Optional<std::vector<std::string>&> errMessages)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1039

{

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1040

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_AssignBackends");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1041

OptimizationResult result;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1042

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1043

auto availablePreferredBackends = backendSettings.GetAvailablePreferredBackends();

1044

if (availablePreferredBackends.empty())

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1045

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1046

std::stringstream failureMsg;

1047

failureMsg << "No preferred backends are available";

1048

ReportError(failureMsg.str(), errMessages);

1049

1050

result.m_Error = true;

return result;

}

for (auto it = firstLayer; it != lastLayer; ++it)

1055

{

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1056

AssignBackendsIConnectable(optNetObjPtr,

*it,

errMessages,

result,

backendSettings,

availablePreferredBackends);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1062

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1063

Finn Williams

b1aad42

2021-10-28 19:07:32 +0100

[diff] [blame]

1064

for (auto it = firstLayer; it != lastLayer; ++it)

1065

{

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1066

auto layer = PolymorphicDowncast<Layer*>(*it);

1067

1068

if(layer->GetType() == LayerType::Input)

1069

{

1070

BackendId connectedBackendId = layer->GetOutputSlot(0).GetConnection(0)->GetOwningLayer().GetBackendId();

1071

layer->SetBackendId(connectedBackendId);

}

}

return result;

}

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

1079

BackendSettings& backendSettings,

1080

SubgraphView::IConnectableLayerIterator& firstLayer,

1081

SubgraphView::IConnectableLayerIterator& lastLayer,

1082

Optional<std::vector<std::string>&> errMessages)

1083

{

1084

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_AssignBackends");

1085

OptimizationResult result;

1086

1087

auto availablePreferredBackends = backendSettings.GetAvailablePreferredBackends();

1088

if (availablePreferredBackends.empty())

1089

{

1090

std::stringstream failureMsg;

1091

failureMsg << "No preferred backends are available";

1092

ReportError(failureMsg.str(), errMessages);

1093

1094

result.m_Error = true;

return result;

}

for (auto it = firstLayer; it != lastLayer; ++it)

1099

{

1100

AssignBackendsIConnectable(optNetObjPtr,

*it,

errMessages,

result,

backendSettings,

availablePreferredBackends);

1106

}

1107

1108

for (auto it = firstLayer; it != lastLayer; ++it)

1109

{

1110

auto layer = PolymorphicDowncast<Layer*>(*it);

Finn Williams

b1aad42

2021-10-28 19:07:32 +0100

[diff] [blame]

1111

1112

if(layer->GetType() == LayerType::Input)

1113

{

1114

BackendId connectedBackendId = layer->GetOutputSlot(0).GetConnection(0)->GetOwningLayer().GetBackendId();

1115

layer->SetBackendId(connectedBackendId);

}

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

return result;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1122

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1123

BackendSettings& backendSettings,

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1124

SubgraphView& subgraph,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1125

Optional<std::vector<std::string>&> errMessages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1126

{

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1127

SubgraphView::IConnectableLayerIterator firstLayer = subgraph.beginIConnectable();

1128

SubgraphView::IConnectableLayerIterator lastLayer = subgraph.endIConnectable();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1129

return AssignBackends(optNetObjPtr,

backendSettings,

firstLayer,

lastLayer,

errMessages);

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1136

BackendsMap CreateSupportedBackends(TensorHandleFactoryRegistry& handleFactoryRegistry,

1137

BackendSettings& backendSettings)

1138

{

1139

BackendsMap backends;

1140

auto const& backendRegistry = BackendRegistryInstance();

1141

for (auto&& selectedBackend : backendSettings.m_SupportedBackends)

1142

{

1143

auto backendFactory = backendRegistry.GetFactory(selectedBackend);

1144

auto backendObjPtr = backendFactory();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1145

ARMNN_ASSERT(backendObjPtr);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1146

1147

backendObjPtr->RegisterTensorHandleFactories(handleFactoryRegistry);

1148

1149

backends[backendObjPtr->GetId()] = std::move(backendObjPtr);

}

return backends;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1155

OptimizationResult ApplyBackendOptimizations(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1156

BackendSettings& backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1157

BackendsMap& backends,

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1158

const ModelOptions& modelOptions,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1159

Optional<std::vector<std::string>&> errMessages)

1160

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1161

ARMNN_ASSERT(optNetObjPtr);

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1162

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_ApplyBackendOptimizations")

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1163

OptimizationResult result;

1164

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1165

// Get the optimized graph

1166

Graph& optGraph = optNetObjPtr->GetGraph();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1167

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1168

// Run backend specific optimizations

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1169

for (auto&& selectedBackend : backendSettings.m_SelectedBackends)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1170

{

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1171

auto backendObjPtr = backends.find(selectedBackend)->second.get();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1172

ARMNN_ASSERT(backendObjPtr);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1173

1174

// Select sub-graphs based on backend

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1175

SubgraphViewSelector::Subgraphs subgraphs =

Rob Hughes

65c3226

2019-07-23 15:33:39 +0100

[diff] [blame]

1176

SubgraphViewSelector::SelectSubgraphs(optGraph,

Matteo Martincigh

602af09

2019-05-01 10:31:27 +0100

[diff] [blame]

1177

// Select layers assigned to the requested backend

1178

[&backendObjPtr](const Layer& layer)

1179

{

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1180

Matteo Martincigh

602af09

2019-05-01 10:31:27 +0100

[diff] [blame]

1181

return layer.GetType() != LayerType::Input &&

1182

layer.GetType() != LayerType::Output &&

1183

layer.GetBackendId() == backendObjPtr->GetId();

1184

});

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1185

if (subgraphs.empty())

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1186

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1187

// No sub-graphs found, try with next selected backend

1188

continue;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1189

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1190

1191

// Try to optimize each sub-graph

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1192

for (auto& subgraph : subgraphs)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1193

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1194

// Try to optimize the current sub-graph

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1195

ARMNN_SCOPED_PROFILING_EVENT(backendObjPtr->GetId(), "Optimizer_OptimizeSubgraph");

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1196

OptimizationViews optimizationViews = backendObjPtr->OptimizeSubgraphView(*subgraph, modelOptions);

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1197

ARMNN_ASSERT(optimizationViews.Validate(*subgraph));

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1198

1199

// Optimization attempted, check the resulting optimized sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1200

for (auto& substitution : optimizationViews.GetSubstitutions())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1201

{

1202

// Sub-graph optimized, substitute the sub-graph with the new optimized one in the main optimized graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1203

SubgraphView& replacementSubgraph = substitution.m_ReplacementSubgraph;

1204

SubgraphView& substitutableSubgraph = substitution.m_SubstitutableSubgraph;

1205

optGraph.SubstituteSubgraph(substitutableSubgraph, replacementSubgraph);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1206

1207

// Assign the current backend to the optimized sub-graph

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1208

const SubgraphView::IConnectableLayers& subgraphLayers = replacementSubgraph.GetIConnectableLayers();

1209

std::for_each(subgraphLayers.begin(), subgraphLayers.end(), [&selectedBackend](IConnectableLayer* l)

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1210

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1211

ARMNN_ASSERT(l);

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1212

PolymorphicDowncast<Layer*>(l)->SetBackendId(selectedBackend);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1213

});

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1214

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1215

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1216

if (!optimizationViews.GetFailedSubgraphs().empty())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1217

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1218

std::stringstream warningMsg;

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1219

warningMsg << "Some sub-graph(s) failed to optimized on " << backendObjPtr->GetId() << " backend.";

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1220

ReportWarning(warningMsg.str(), errMessages);

1221

1222

// Failed to optimize the given sub-graph, re-assign the sub-graph layers to other available backends

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1223

BackendSettings settingsCopy(backendSettings);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1224

if (!backendObjPtr->GetId().IsCpuRef())

1225

{

1226

// Add the current backend to the list of backends to ignore

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1227

settingsCopy.m_IgnoredBackends.insert(backendObjPtr->GetId());

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1228

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1229

1230

int count=0;

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1231

for (auto& failedSubgraph : optimizationViews.GetFailedSubgraphs())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1232

{

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1233

// An error occurred: the optimization was attempted but not performed, try different backends

1234

std::stringstream subgraphMsg;

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1235

subgraphMsg << "Re-assigning backends to " << failedSubgraph.GetIConnectableLayers().size()

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1236

<< " layers inside sub-graph " << count++;

Matteo Martincigh

328d92b

2019-07-04 17:52:55 +0100

[diff] [blame]

1237

ReportWarning(subgraphMsg.str(), errMessages);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1238

1239

OptimizationResult reassignmentResult = AssignBackends(optNetObjPtr,

settingsCopy,

*subgraph,

errMessages);

if (reassignmentResult.m_Error)

1244

{

1245

// Failed to re-assign one of the remaining backends to each layer of the sub-graph

1246

result.m_Error = true;

1247

return result;

1248

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1249

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

}

}

}

return result;

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1257

bool RequiresCopy(ITensorHandleFactory::FactoryId src,

1258

ITensorHandleFactory::FactoryId dst,

1259

TensorHandleFactoryRegistry& registry)

{

if (src != dst)

{

ITensorHandleFactory* srcFactory = registry.GetFactory(src);

1264

ITensorHandleFactory* dstFactory = registry.GetFactory(dst);

1265

Matteo Martincigh

a6539ed

2019-08-27 13:43:32 +0100

[diff] [blame]

1266

if (srcFactory && dstFactory &&

1267

(srcFactory->GetExportFlags() & dstFactory->GetImportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

{

return false;

}

return true;

}

return false;

}

// Find the handle factory for the input layer which results in fewest required copies.

1277

ITensorHandleFactory::FactoryId CalculateSlotOptionForInput(BackendsMap& backends,

1278

OutputSlot& slot,

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1279

TensorHandleFactoryRegistry& registry,

1280

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1281

{

1282

Layer& layer = slot.GetOwningLayer();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1283

ARMNN_ASSERT(layer.GetType() == LayerType::Input);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1284

1285

// Explicitly select the tensorhandle factory for InputLayer because the rules for it are slightly different. It

1286

// doesn't matter which backend it is assigned to because they all use the same implementation, which

1287

// requires Map/Unmap support. This means that, so long as the handle type supports map/unmap semantics, we can

1288

// select a factory with maximum compatibility with the layers connected to the InputLayer.

1289

1290

// First ensure the from backends can support the TensorHandeAPI

1291

auto frmBackend = backends.find(layer.GetBackendId());

1292

if (frmBackend == backends.end() ||

1293

!frmBackend->second->SupportsTensorAllocatorAPI())

1294

{

1295

return ITensorHandleFactory::LegacyFactoryId;

1296

}

1297

1298

// Go through all connections to the output slot and determine the TensorHandleFactory which results in the

1299

// fewest copies.

1300

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

1301

int topScore = 0;

1302

ITensorHandleFactory::FactoryId topChoice = ITensorHandleFactory::LegacyFactoryId;

1303

1304

for (auto&& connection : slot.GetConnections())

1305

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1306

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1307

const Layer& connectedLayer = connection->GetOwningLayer();

1308

1309

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1310

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1311

1312

if (!toBackend->second.get()->SupportsTensorAllocatorAPI())

1313

{

1314

// The destination backend does not support the tensor allocator API, move to the next one

continue;

}

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1319

for (auto&& dst : dstPrefs)

1320

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1321

// Input layers use the mem copy workload or import, so the selected factory must

1322

// support either the map/unmap API or Import API

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1323

ITensorHandleFactory* factory = registry.GetFactory(dst);

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1324

if (importEnabled && factory->GetImportFlags() == 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1325

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1326

continue;

1327

}

1328

else if (!importEnabled && !factory->SupportsMapUnmap())

1329

{

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

continue;

}

auto it = factoryScores.find(dst);

1334

if (it == factoryScores.end())

1335

{

1336

// Add new score to the table

1337

factoryScores[dst] = 0;

1338

if (topChoice == ITensorHandleFactory::LegacyFactoryId)

{

topChoice = dst;

}

}

else

{

// Increase the score

1346

factoryScores[dst]++;

1347

1348

// Track the best option

1349

if (factoryScores[dst] > topScore)

1350

{

1351

topScore = factoryScores[dst];

topChoice = dst;

}

}

}

}

return topChoice;

}

// Find the handle factory for the output layer which results in fewest required copies.

1362

ITensorHandleFactory::FactoryId CalculateSlotOptionForOutput(BackendsMap& backends,

1363

OutputSlot& slot,

1364

TensorHandleFactoryRegistry& registry)

1365

{

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

1366

IgnoreUnused(backends, slot, registry);

Derek Lamberti

94a88d2

2019-12-10 21:12:59 +0000

[diff] [blame]

1367

return ITensorHandleFactory::DeferredFactoryId;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1368

}

1369

1370

// For all handle factories supported on the source backend, we wish to find the one which requires the fewest copies

1371

// when considering all connections.

1372

ITensorHandleFactory::FactoryId CalculateSlotOption(BackendsMap& backends,

1373

OutputSlot& outputSlot,

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1374

TensorHandleFactoryRegistry& registry,

1375

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1376

{

1377

// First ensure the from backends can support the TensorHandeAPI

1378

Layer& layer = outputSlot.GetOwningLayer();

1379

auto frmBackend = backends.find(layer.GetBackendId());

1380

if (frmBackend == backends.end() ||

1381

!frmBackend->second->SupportsTensorAllocatorAPI())

1382

{

1383

return ITensorHandleFactory::LegacyFactoryId;

1384

}

1385

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1386

bool outputConnection = false;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1387

for (auto&& connection : outputSlot.GetConnections())

1388

{

1389

const Layer& connectedLayer = connection->GetOwningLayer();

1390

if (connectedLayer.GetType() == LayerType::Output)

1391

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1392

outputConnection = true;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

IBackendInternal* srcBackend = frmBackend->second.get();

1397

auto srcPrefs = srcBackend->GetHandleFactoryPreferences();

1398

1399

// Initialize the scores

1400

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

1401

for (auto&& pref : srcPrefs)

1402

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1403

if (importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1404

{

1405

ITensorHandleFactory* factory = registry.GetFactory(pref);

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1406

if (outputConnection)

1407

{

1408

// Check if this is fallback case

1409

bool fallbackConnection = false;

1410

for (auto&& inputSlot : layer.GetInputSlots())

1411

{

1412

if (inputSlot.GetConnectedOutputSlot()->GetOwningLayer().GetBackendId() != layer.GetBackendId())

1413

{

1414

fallbackConnection = true;

1415

}

1416

}

1417

if (fallbackConnection)

1418

{

1419

auto factoryCap = factory->GetCapabilities(&layer, &layer, CapabilityClass::FallbackImportDisabled);

1420

// Cannot use factory import if fallback import is not supported.

1421

if (!factoryCap.empty())

{

continue;

}

}

else if (factory->GetExportFlags() == 0)

{

continue;

}

}

if (!outputConnection)

1432

{

1433

auto factoryCap = factory->GetCapabilities(&layer, &layer, CapabilityClass::FallbackImportDisabled);

1434

// Cannot use factory import if fallback import is not supported.

1435

if (!factoryCap.empty())

{

continue;

}

}

}

else

{

// Only consider factories that support map/unmap

1445

ITensorHandleFactory* factory = registry.GetFactory(pref);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1446

if (!factory->SupportsMapUnmap())

1447

{

1448

// The current tensor handle factory does not support the map/unmap strategy, move to the next one

continue;

}

}

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1453

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1454

auto it = factoryScores.find(pref);

1455

if (it == factoryScores.end())

1456

{

1457

// Add new score to the table

1458

factoryScores[pref] = 0;

}

}

// Score each handle factory based on how many times it requires copies on the slot connections

1463

for (auto&& connection : outputSlot.GetConnections())

1464

{

1465

const Layer& connectedLayer = connection->GetOwningLayer();

1466

1467

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1468

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1469

1470

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1471

for (auto&& src : srcPrefs)

1472

{

1473

if (factoryScores.find(src) == factoryScores.end()) // Don't consider excluded factories

{

continue;

}

for (auto&& dst : dstPrefs)

1479

{

1480

if (RequiresCopy(src, dst, registry))

1481

{

1482

// Copy avoided, increase the score

1483

factoryScores[src]++;

break;

}

}

}

}

// Find the lowest score

1491

int minScore = std::numeric_limits<int>::max();

1492

for (auto it : factoryScores)

1493

{

1494

minScore = std::min(minScore, it.second);

1495

}

1496

1497

// Collect factories matching the best(lowest) score

1498

std::vector<ITensorHandleFactory::FactoryId> optimalFactories;

1499

for (auto it : factoryScores)

1500

{

1501

if (it.second == minScore)

1502

{

1503

optimalFactories.push_back(it.first);

}

}

// For all compatible Factories matching the best score, find the preferred one for the current layer.

1508

for (auto&& srcPref : srcPrefs)

1509

{

1510

for (auto&& comp : optimalFactories)

{

if (comp == srcPref)

{

return comp;

}

}

}

return ITensorHandleFactory::LegacyFactoryId;

1520

}

1521

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1522

EdgeStrategy CalculateEdgeStrategy(BackendsMap& backends,

1523

ITensorHandleFactory::FactoryId srcFactoryId,

1524

const Layer& layer,

1525

const Layer& connectedLayer,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1526

TensorHandleFactoryRegistry& registry,

1527

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1528

{

1529

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1530

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1531

1532

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1533

1534

// Legacy API check for backward compatibility

1535

if (srcFactoryId == ITensorHandleFactory::LegacyFactoryId || dstPrefs.empty())

1536

{

1537

if (layer.GetBackendId() != connectedLayer.GetBackendId())

1538

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1539

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1540

}

1541

else

1542

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1543

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// TensorHandleFactory API present, so perform more sophisticated strategies.

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1548

// Dst Output layers don't require copy because they use import or map/unmap

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1549

if (connectedLayer.GetType() == LayerType::Output)

1550

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1551

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1552

}

1553

1554

// Search for direct match in prefs

1555

for (auto&& pref : dstPrefs)

1556

{

1557

if (pref == srcFactoryId)

1558

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1559

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// Search for export/import options

1564

ITensorHandleFactory* srcFactory = registry.GetFactory(srcFactoryId);

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1565

if (srcFactory->GetExportFlags() != 0 && importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1566

{

1567

for (auto&& pref : dstPrefs)

1568

{

1569

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1570

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1571

// Handles cases when a destPref is not listed in TensorHandleFactoryRegistry

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1572

if (!dstFactory) {

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1573

continue;

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1574

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1575

if ((dstFactory->GetImportFlags() & srcFactory->GetExportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1576

{

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1577

auto srcCapability = srcFactory->GetCapabilities(&layer, &layer, CapabilityClass::PaddingRequired);

1578

auto dstCapability = dstFactory->GetCapabilities(&connectedLayer,

1579

&connectedLayer,

1580

CapabilityClass::PaddingRequired);

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1581

auto srcFallback = srcFactory->GetCapabilities(&layer, &layer, CapabilityClass::FallbackImportDisabled);

1582

auto dstFallback = dstFactory->GetCapabilities(&connectedLayer,

1583

&connectedLayer,

1584

CapabilityClass::FallbackImportDisabled);

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1585

// Do not require memory copy if the source and destination do not require padding.

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1586

if (srcCapability.empty() && dstCapability.empty() && srcFallback.empty() && dstFallback.empty())

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1587

{

1588

return EdgeStrategy::ExportToTarget;

1589

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

// Search for copy options via map/unmap

1595

if (srcFactory->SupportsMapUnmap())

1596

{

1597

for (auto&& pref : dstPrefs)

1598

{

1599

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1600

if (dstFactory && dstFactory->SupportsMapUnmap())

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1601

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1602

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1607

return EdgeStrategy::Undefined;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1608

}

1609

1610

// Select the TensorHandleFactories and the corresponding memory strategy

1611

OptimizationResult SelectTensorHandleStrategy(Graph& optGraph,

1612

BackendsMap& backends,

1613

TensorHandleFactoryRegistry& registry,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1614

bool importEnabled,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1615

Optional<std::vector<std::string>&> errMessages)

1616

{

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1617

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_SelectTensorHandleStrategy");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1618

OptimizationResult result;

1619

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1620

optGraph.ForEachLayer([&backends, &registry, &result, &errMessages, importEnabled](Layer* layer)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1621

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1622

ARMNN_ASSERT(layer);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1623

1624

// Lets make sure the backend is in our list of supported backends. Something went wrong during backend

1625

// assignment if this check fails

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1626

ARMNN_ASSERT(backends.find(layer->GetBackendId()) != backends.end());

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1627

1628

// Check each output separately

1629

for (unsigned int slotIdx = 0; slotIdx < layer->GetNumOutputSlots(); slotIdx++)

1630

{

1631

OutputSlot& outputSlot = layer->GetOutputSlot(slotIdx);

1632

1633

ITensorHandleFactory::FactoryId slotOption = ITensorHandleFactory::LegacyFactoryId;

1634

1635

// Calculate the factory to use which results in the fewest copies being made.

1636

switch(layer->GetType())

1637

{

1638

case LayerType::Input:

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1639

slotOption = CalculateSlotOptionForInput(backends, outputSlot, registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1640

break;

1641

case LayerType::Output:

1642

slotOption = CalculateSlotOptionForOutput(backends, outputSlot, registry);

1643

break;

1644

default:

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1645

slotOption = CalculateSlotOption(backends, outputSlot, registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1646

break;

1647

}

1648

outputSlot.SetTensorHandleFactory(slotOption);

1649

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1650

// Now determine the "best" edge strategy for each connection given the slotOption.

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1651

unsigned int connectionIdx = 0;

1652

for (auto&& connection : outputSlot.GetConnections())

1653

{

1654

const Layer& connectedLayer = connection->GetOwningLayer();

1655

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1656

EdgeStrategy strategy = CalculateEdgeStrategy(backends, slotOption, *layer, connectedLayer,

1657

registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1658

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1659

if (strategy == EdgeStrategy::Undefined)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1660

{

1661

result.m_Error = true;

1662

if (errMessages)

1663

{

1664

errMessages.value().emplace_back("Could not find valid strategy required for compatibility"

1665

" between backends.");

}

return;

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1670

outputSlot.SetEdgeStrategy(connectionIdx, strategy);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

connectionIdx++;

}

}

});

return result;

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1680

IOptimizedNetworkPtr Optimize(const INetwork& inNetwork,

1681

const std::vector<BackendId>& backendPreferences,

1682

const IDeviceSpec& deviceSpec,

1683

const OptimizerOptions& options,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1684

Optional<std::vector<std::string>&> messages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1685

{

Jan Eilers

17d34da

2021-12-08 16:15:12 +0000

[diff] [blame]

1686

ARMNN_LOG(debug) << options.ToString();

Jan Eilers

6a71bb5

2021-10-26 17:41:18 +0100

[diff] [blame]

1687

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1688

// Enable profiling

1689

auto profiler = inNetwork.pNetworkImpl->GetGraph().GetProfiler();

1690

ProfilerManager::GetInstance().RegisterProfiler(profiler.get());

1691

profiler->EnableProfiling(options.m_ProfilingEnabled);

1692

1693

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1694

if (backendPreferences.empty())

1695

{

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1696

throw InvalidArgumentException("Invoked Optimize with no backends specified");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1697

}

1698

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1699

if (options.m_ReduceFp32ToFp16 && options.m_ReduceFp32ToBf16)

1700

{

1701

throw InvalidArgumentException("BFloat16 and Float16 optimization cannot be enabled at the same time.");

1702

}

1703

Cathal Corbett

521032f

2021-10-07 11:46:40 +0100

[diff] [blame]

1704

// Ensure TensorInfo is set on all output slots of ConstantLayers in the graph

1705

inNetwork.pNetworkImpl->GetGraph().VerifyConstantLayerSetTensorInfo();

1706

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1707

std::unique_ptr<Graph> graph = std::make_unique<Graph>(inNetwork.pNetworkImpl->GetGraph());

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1708

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1709

auto optNet = IOptimizedNetworkPtr(new IOptimizedNetwork(std::move(graph), options.m_ModelOptions),

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

1710

&IOptimizedNetwork::Destroy);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1711

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1712

IOptimizedNetwork* optNetObjPtr = optNet.get();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1713

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1714

// Get the optimized graph

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1715

Graph& optGraph = optNetObjPtr->pOptimizedNetworkImpl->GetGraph();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1716

Finn Williams

d218d98

2021-08-09 13:00:08 +0100

[diff] [blame]

1717

if(options.m_shapeInferenceMethod == ShapeInferenceMethod::InferAndValidate)

1718

{

1719

// Infer the tensor infos for all output slots. Throws an exception on failure

1720

optGraph.InferTensorInfos();

1721

}

Finn Williams

84e025a

2021-08-05 17:29:32 +0100

[diff] [blame]

1722

Narumol Prangnawarat

16f82f9

2020-09-14 16:12:44 +0100

[diff] [blame]

1723

// Perform AddBroadcastReshapeLayer optimisation

1724

using namespace optimizations;

1725

Optimizer::Pass(optGraph, MakeOptimizations(AddBroadcastReshapeLayer()));

1726

Finn Williams

d218d98

2021-08-09 13:00:08 +0100

[diff] [blame]

1727

if(options.m_shapeInferenceMethod == ShapeInferenceMethod::ValidateOnly)

1728

{

1729

// Validate the tensor infos for all output slots. Throws an exception on failure

1730

optGraph.InferTensorInfos();

1731

}

1732

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1733

// Perform optimisation passes

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1734

Optimizer::Pass(optGraph, MakeOptimizations(SquashEqualPermuteSiblings(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1735

SquashEqualTransposeSiblings(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1736

SquashEqualReshapeSiblings(),

1737

OptimizeInversePermutes(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1738

OptimizeInverseTransposes(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1739

MovePermuteUp(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1740

MoveTransposeUp(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1741

PermuteAsReshape(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1742

TransposeAsReshape(),

Nina Drozd

861985f

2019-04-18 14:48:51 +0100

[diff] [blame]

1743

OptimizeConsecutiveReshapes(),

Matthew Sloyan

33f8987

2021-06-30 10:20:17 +0100

[diff] [blame]

1744

RedirectMembersToConstantInputs(),

Rob Hughes

3a7d3a7

2019-09-24 16:59:56 +0100

[diff] [blame]

1745

FoldPadIntoConvolution2d(),

Teresa Charlin

5786eb7

2021-05-21 16:29:45 +0100

[diff] [blame]

1746

FoldPadIntoDepthwiseConvolution2d(),

Diego Lopez Recas

fe95d72

2021-03-19 12:40:16 +0000

[diff] [blame]

1747

FoldPadIntoPooling2d(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1748

PermuteAndBatchToSpaceAsDepthToSpace(),

Teresa Charlin

06e0300

2020-10-15 13:16:07 +0100

[diff] [blame]

1749

TransposeAndBatchToSpaceAsDepthToSpace(),

Mike Kelly

90231b8

2020-11-05 15:44:56 +0000

[diff] [blame]

1750

FuseBatchNormIntoConvolution2DFloat32(),

1751

FuseBatchNormIntoConvolution2DFloat16(),

1752

FuseBatchNormIntoDepthwiseConvolution2DFloat32(),

1753

FuseBatchNormIntoDepthwiseConvolution2DFloat16()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1754

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1755

// If Fp32 to Fp16 optimization is set convert Fp32 network to Fp16

1756

if (options.m_ReduceFp32ToFp16)

1757

{

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1758

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_ReduceFp32ToFp16");

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1759

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToFp16Converter()));

Derek Lamberti

dd6804b

2019-11-27 09:29:57 +0000

[diff] [blame]

1760

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1761

}

1762

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1763

// If Fp32 to Bf16 optimization is set convert Fp32 network to Bf16

Narumol Prangnawarat

57ef008

2020-03-26 09:20:43 +0000

[diff] [blame]

1764

// Convert input of Convolution2d and FullyConnected from Fp32 to Bf16

1765

// Only Constant weight of Convolution2d and FullyConnected are converted from Fp32 to Bf16

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1766

if (options.m_ReduceFp32ToBf16)

1767

{

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1768

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_ReduceFp32ToBf16");

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1769

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToBf16Converter()));

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1770

}

1771

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1772

// Initialize backend settings

1773

BackendSettings backendSettings(backendPreferences, deviceSpec);

1774

if (backendSettings.GetAvailablePreferredBackends().empty())

1775

{

1776

std::stringstream failureMsg;

1777

failureMsg << "None of the preferred backends " << backendPreferences

1778

<< " are supported. Current platform provides " << backendSettings.m_SupportedBackends;

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1779

ReportError(failureMsg.str(), messages);

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1780

throw InvalidArgumentException(failureMsg.str());

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1781

}

1782

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1783

// Create a map to temporarily hold initialized backend objects

1784

TensorHandleFactoryRegistry tensorHandleFactoryRegistry;

1785

BackendsMap backends = CreateSupportedBackends(tensorHandleFactoryRegistry, backendSettings);

1786

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1787

// Assign an available backend to each layer

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1788

Graph::Iterator firstLayer = optGraph.begin();

1789

Graph::Iterator lastLayer = optGraph.end();

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1790

OptimizationResult assignBackendsResult = AssignBackends(optNetObjPtr->pOptimizedNetworkImpl.get(),

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1791

backendSettings,

1792

firstLayer,

1793

lastLayer,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1794

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1795

if (assignBackendsResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1796

{

1797

// Failed to assign a backend to each layer

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1798

throw InvalidArgumentException("Failed to assign a backend to each layer");

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

1799

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1800

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1801

Optimizer::Pass(optGraph, MakeOptimizations(OptimizeInverseConversionsFp16(),

1802

OptimizeInverseConversionsFp32()));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1803

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1804

// Apply the backend-specific optimizations

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1805

OptimizationResult backendOptimizationResult = ApplyBackendOptimizations(optNetObjPtr->pOptimizedNetworkImpl.get(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1806

backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1807

backends,

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1808

options.m_ModelOptions,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1809

messages);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1810

if (backendOptimizationResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1811

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1812

// Failed to apply the backend-specific optimizations

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1813

throw InvalidArgumentException("Failed to apply the backend-specific optimizations");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1814

}

1815

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1816

// If the debug flag is set, then insert a DebugLayer after each layer

1817

// Doing this after applying the backend optimizations as they might have changed some layers

1818

if (options.m_Debug)

1819

{

1820

Optimizer::Pass(optGraph, MakeOptimizations(InsertDebugLayer()));

1821

}

1822

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1823

// Calculate the compatibility strategies for tensor handles

1824

OptimizationResult strategyResult = SelectTensorHandleStrategy(optGraph,

1825

backends,

1826

tensorHandleFactoryRegistry,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1827

options.m_ImportEnabled,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1828

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1829

if (strategyResult.m_Error)

1830

{

1831

// Failed to apply the backend-specific optimizations

1832

return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);

1833

}

1834

1835

// Based on the tensor handle strategy determined above, insert copy layers where required.

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1836

{

1837

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_AddCompatibilityLayers");

1838

optGraph.AddCompatibilityLayers(backends, tensorHandleFactoryRegistry);

1839

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1840

1841

// Convert constants

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1842

{

1843

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_ConvertConstants");

1844

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

1845

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsHalfToFloat()));

1846

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1847

return optNet;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1848

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1849

bool NetworkImpl::GetShapeInferenceMethod()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1850

{

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

1851

if (m_NetworkOptions.size() > 0 && m_NetworkOptions[0].GetBackendId().Get() == "ShapeInferenceMethod")

1852

{

1853

return m_NetworkOptions[0].GetOption(0).GetValue().AsBool();

1854

}

1855

1856

return false;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1857

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1858

NetworkImpl::NetworkImpl(NetworkOptions networkOptions)

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

1859

: m_NetworkOptions(networkOptions),

1860

m_Graph(std::make_unique<Graph>(GetShapeInferenceMethod()))

1861

{}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1862

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1863

NetworkImpl::~NetworkImpl()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1867

Status NetworkImpl::PrintGraph()

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

1868

{

1869

m_Graph->Print();

1870

return Status::Success;

1871

}

1872

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1873

IConnectableLayer* NetworkImpl::AddInputLayer(LayerBindingId id, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1874

{

1875

return m_Graph->AddLayer<InputLayer>(id, name);

1876

}

1877

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1878

IConnectableLayer* NetworkImpl::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

Éanna Ó Catháin

4e1e136

2018-11-12 11:36:34 +0000

[diff] [blame]

1879

const char* name)

1880

{

1881

return m_Graph->AddLayer<BatchToSpaceNdLayer>(batchToSpaceNdDescriptor, name);

1882

}

1883

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

1884

IConnectableLayer* NetworkImpl::AddCastLayer(const char* name)

1885

{

1886

return m_Graph->AddLayer<CastLayer>(name);

1887

}

Simon Obute

51f6777

2021-09-03 15:50:13 +0100

[diff] [blame]

1888

IConnectableLayer* NetworkImpl::AddChannelShuffleLayer(const ChannelShuffleDescriptor& channelShuffleDescriptor,

1889

const char* name)

1890

{

1891

return m_Graph->AddLayer<ChannelShuffleLayer>(channelShuffleDescriptor, name);

1892

}

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

1893

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1894

IConnectableLayer* NetworkImpl::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

1895

const char* name)

1896

{

1897

return m_Graph->AddLayer<ComparisonLayer>(comparisonDescriptor, name);

1898

}

1899

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1900

IConnectableLayer* NetworkImpl::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

1901

const char* name)

1902

{

1903

return m_Graph->AddLayer<ElementwiseUnaryLayer>(elementwiseUnaryDescriptor, name);

1904

}

1905

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1906

IConnectableLayer* NetworkImpl::AddFillLayer(const FillDescriptor& fillDescriptor,

Ryan OShea

ec6c680

2020-06-05 17:17:06 +0100

[diff] [blame]

1907

const char* name)

1908

{

1909

return m_Graph->AddLayer<FillLayer>(fillDescriptor, name);

1910

}

1911

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1912

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

1913

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1914

{

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1915

return m_Graph->AddLayer<FullyConnectedLayer>(fullyConnectedDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1916

}

1917

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1918

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1919

const Optional<ConstTensor>& weights,

1920

const Optional<ConstTensor>& biases,

1921

const char* name)

1922

{

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1923

ConstantLayer* weightsLayer = nullptr;

1924

ConstantLayer* biasLayer = nullptr;

1925

unsigned int numInputs = fullyConnectedDescriptor.GetNumInputs();

1926

1927

// Add a constant layer for weights

1928

if (weights.has_value())

1929

{

1930

weightsLayer = m_Graph->AddLayer<ConstantLayer>("Weights");

1931

weightsLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(weights.value());

Matthew Sloyan

b20d1d4

2021-08-09 15:33:41 +0100

[diff] [blame]

1932

1933

TensorInfo weightsInfo = weightsLayer->m_LayerOutput->GetTensorInfo();

1934

weightsInfo.SetConstant();

1935

1936

weightsLayer->GetOutputSlot(0).SetTensorInfo(weightsInfo);

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1937

}

1938

else if (fullyConnectedDescriptor.m_ConstantWeights)

1939

{

1940

throw InvalidArgumentException("AddFullyConnectedLayer: Constant weights tensor is empty.");

1941

}

1942

1943

// Add a constant layer for biases

1944

if (biases.has_value() && fullyConnectedDescriptor.m_BiasEnabled)

1945

{

1946

biasLayer = m_Graph->AddLayer<ConstantLayer>("Biases");

1947

biasLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(biases.value());

Matthew Sloyan

b20d1d4

2021-08-09 15:33:41 +0100

[diff] [blame]

1948

1949

TensorInfo biasInfo = biasLayer->m_LayerOutput->GetTensorInfo();

1950

biasInfo.SetConstant();

1951

1952

biasLayer->GetOutputSlot(0).SetTensorInfo(biasInfo);

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

}

if (numInputs < 2)

{

throw InvalidArgumentException("AddFullyConnectedLayer: Requires at least 2 input tensors: Input, Weights");

1958

}

1959

1960

auto layer = m_Graph->AddLayer<FullyConnectedLayer>(fullyConnectedDescriptor, name);

if (weightsLayer)

{

// Connect weights layer

1965

weightsLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(1));

1966

}

1967

1968

if ( fullyConnectedDescriptor.m_BiasEnabled && numInputs == 3 )

{

if (biasLayer)

{

// Connect bias layer

1973

biasLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(2));

1974

}

1975

}

1976

else if ( !fullyConnectedDescriptor.m_BiasEnabled && numInputs == 2 )

1977

{

1978

// Bias is disabled

1979

layer->m_Bias = nullptr;

}

else

{

throw InvalidArgumentException(fmt::format(

1984

"AddFullyConnectedLayer: Value mismatch. When bias is enabled in the "

1985

"descriptor the number of inputs is expected to be 3 otherwise 2. "

1986

"BiasEnabled={}, numInputs={}",

1987

fullyConnectedDescriptor.m_BiasEnabled,

numInputs));

}

return layer;

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1992

}

1993

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1994

IConnectableLayer* NetworkImpl::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1995

const char* name)

1996

{

Jim Flynn

e242f2d

2019-05-22 14:24:13 +0100

[diff] [blame]

1997

return m_Graph->AddLayer<ConcatLayer>(concatDescriptor, name);

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1998

}

1999

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2000

IConnectableLayer* NetworkImpl::AddConvolution2dLayerImpl(const Convolution2dDescriptor& convolution2dDescriptor,

2001

const ConstTensor& weights,

2002

const Optional<ConstTensor>& biases,

2003

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2004

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2005

if (convolution2dDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2006

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2007

throw InvalidArgumentException("AddConvolution2dLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2008

}

2009

2010

const auto layer = m_Graph->AddLayer<Convolution2dLayer>(convolution2dDescriptor, name);

2011

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2012

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2013

2014

if (convolution2dDescriptor.m_BiasEnabled)

2015

{

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2016

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2022

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2023

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2024

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2025

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2026

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2027

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2028

}

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2029

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2030

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2031

const ConstTensor& weights,

2032

const char* name)

2033

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

2034

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2035

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

2036

}

2037

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2038

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2039

const ConstTensor& weights,

2040

const ConstTensor& biases,

2041

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2042

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2043

Optional<ConstTensor> optionalBiases(biases);

2044

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2045

}

2046

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

2047

IConnectableLayer* NetworkImpl::AddConvolution3dLayer(const Convolution3dDescriptor& convolution3dDescriptor,

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

2048

const char* name)

2049

{

Matthew Sloyan

5d7b0a3

2021-10-18 13:07:49 +0100

[diff] [blame]

2050

return m_Graph->AddLayer<Convolution3dLayer>(convolution3dDescriptor, name);

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

2051

}

2052

2053

IConnectableLayer* NetworkImpl::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

2054

const char* name)

2055

{

2056

return m_Graph->AddLayer<DepthToSpaceLayer>(depthToSpaceDescriptor, name);

2057

}

2058

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2059

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayerImpl(

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

2060

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

2061

const ConstTensor& weights,

2062

const Optional<ConstTensor>& biases,

2063

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2064

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2065

if (convolution2dDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2066

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2067

throw InvalidArgumentException("AddDepthwiseConvolution2dLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2068

}

2069

Matteo Martincigh

3d6898c

2019-01-15 16:11:44 +0000

[diff] [blame]

2070

const auto layer = m_Graph->AddLayer<DepthwiseConvolution2dLayer>(convolution2dDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2071

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2072

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2073

2074

if (convolution2dDescriptor.m_BiasEnabled)

2075

{

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2076

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2082

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2083

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

2084

const ConstTensor& weights,

2085

const Optional<ConstTensor>& biases,

2086

const char* name)

2087

{

2088

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

2089

}

2090

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2091

IConnectableLayer* NetworkImpl::AddDetectionPostProcessLayer(const armnn::DetectionPostProcessDescriptor& descriptor,

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

2092

const ConstTensor& anchors, const char* name)

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

2093

{

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

2094

const auto layer = m_Graph->AddLayer<DetectionPostProcessLayer>(descriptor, name);

2095

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2096

layer->m_Anchors = std::make_shared<ScopedTensorHandle>(anchors);

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

2097

2098

return layer;

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

2099

}

2100

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2101

IConnectableLayer* NetworkImpl::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2102

const char* name)

2103

{

2104

return m_Graph->AddLayer<PermuteLayer>(permuteDescriptor, name);

2105

}

2106

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2107

IConnectableLayer* NetworkImpl::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2108

const char* name)

2109

{

2110

return m_Graph->AddLayer<Pooling2dLayer>(pooling2dDescriptor, name);

2111

}

2112

Tamás Nyíri

7b885b3

2021-10-26 14:47:57 +0100

[diff] [blame]

2113

IConnectableLayer* NetworkImpl::AddPooling3dLayer(const Pooling3dDescriptor& pooling3dDescriptor,

2114

const char* name)

2115

{

2116

return m_Graph->AddLayer<Pooling3dLayer>(pooling3dDescriptor, name);

2117

}

2118

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2119

IConnectableLayer* NetworkImpl::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2120

const char* name)

2121

{

2122

return m_Graph->AddLayer<ActivationLayer>(activationDescriptor, name);

2123

}

2124

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2125

IConnectableLayer* NetworkImpl::AddArgMinMaxLayer(const ArgMinMaxDescriptor& argMinMaxDescriptor,

Nikhil Raj

ee391d5

2019-09-05 17:50:44 +0100

[diff] [blame]

2126

const char* name)

2127

{

2128

return m_Graph->AddLayer<ArgMinMaxLayer>(argMinMaxDescriptor, name);

2129

}

2130

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2131

IConnectableLayer* NetworkImpl::AddNormalizationLayer(const NormalizationDescriptor&

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2132

normalizationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2133

const char* name)

2134

{

2135

return m_Graph->AddLayer<NormalizationLayer>(normalizationDescriptor, name);

2136

}

2137

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2138

IConnectableLayer* NetworkImpl::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

Aron Virginas-Tar

636ab40

2019-09-16 14:27:45 +0100

[diff] [blame]

2139

{

2140

return m_Graph->AddLayer<SliceLayer>(sliceDescriptor, name);

2141

}

2142

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2143

IConnectableLayer* NetworkImpl::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2144

const char* name)

2145

{

2146

return m_Graph->AddLayer<SoftmaxLayer>(softmaxDescriptor, name);

2147

}

2148

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2149

IConnectableLayer* NetworkImpl::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2150

const char* name)

2151

{

2152

return m_Graph->AddLayer<SplitterLayer>(splitterDescriptor, name);

2153

}

2154

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2155

IConnectableLayer* NetworkImpl::AddMaximumLayer(const char* name)

Nattapat Chaimanowong

5a4304a

2018-11-28 10:44:37 +0000

[diff] [blame]

2156

{

2157

return m_Graph->AddLayer<MaximumLayer>(name);

2158

}

2159

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2160

IConnectableLayer* NetworkImpl::AddMinimumLayer(const char* name)

Éanna Ó Catháin

20e5880

2018-12-04 10:29:06 +0000

[diff] [blame]

2161

{

2162

return m_Graph->AddLayer<MinimumLayer>(name);

2163

}

2164

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2165

IConnectableLayer* NetworkImpl::AddAdditionLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2166

{

2167

return m_Graph->AddLayer<AdditionLayer>(name);

2168

}

2169

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2170

IConnectableLayer* NetworkImpl::AddMultiplicationLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2171

{

2172

return m_Graph->AddLayer<MultiplicationLayer>(name);

2173

}

2174

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2175

IConnectableLayer* NetworkImpl::AddOutputLayer(LayerBindingId id, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2176

{

2177

return m_Graph->AddLayer<OutputLayer>(id, name);

2178

}

2179

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2180

IConnectableLayer* NetworkImpl::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2181

const ConstTensor& mean,

2182

const ConstTensor& variance,

2183

const ConstTensor& beta,

2184

const ConstTensor& gamma,

2185

const char* name)

2186

{

2187

const auto layer = m_Graph->AddLayer<BatchNormalizationLayer>(desc, name);

2188

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2189

layer->m_Mean = std::make_shared<ScopedTensorHandle>(mean);

2190

layer->m_Variance = std::make_shared<ScopedTensorHandle>(variance);

2191

layer->m_Beta = std::make_shared<ScopedTensorHandle>(beta);

2192

layer->m_Gamma = std::make_shared<ScopedTensorHandle>(gamma);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2197

IConnectableLayer* NetworkImpl::AddRankLayer(const char* name)

Finn Williams

2605b23

2020-06-10 15:53:46 +0100

[diff] [blame]

2198

{

2199

return m_Graph->AddLayer<RankLayer>(name);

2200

}

2201

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2202

IConnectableLayer* NetworkImpl::AddReduceLayer(const ReduceDescriptor& reduceDescriptor,

2203

const char* name)

Sadik Armagan

0c3ea5b

2021-02-03 09:29:30 +0000

[diff] [blame]

2204

{

2205

return m_Graph->AddLayer<ReduceLayer>(reduceDescriptor, name);

2206

}

2207

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2208

IConnectableLayer* NetworkImpl::AddResizeLayer(const ResizeDescriptor& resizeDescriptor, const char* name)

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

2209

{

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

2210

return m_Graph->AddLayer<ResizeLayer>(resizeDescriptor, name);

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

2211

}

2212

Keith Davis

3ae3f97

2021-05-21 16:33:48 +0100

[diff] [blame]

2213

IConnectableLayer* NetworkImpl::AddShapeLayer(const char* name)

2214

{

2215

return m_Graph->AddLayer<ShapeLayer>(name);

2216

}

2217

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2218

IConnectableLayer* NetworkImpl::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

2219

const char* name)

Kevin May

ce5045a

2019-10-02 14:07:47 +0100

[diff] [blame]

2220

{

2221

return m_Graph->AddLayer<InstanceNormalizationLayer>(desc, name);

2222

}

2223

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2224

IConnectableLayer* NetworkImpl::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

2225

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2226

{

Matteo Martincigh

bcd3c85

2018-09-28 14:14:12 +0100

[diff] [blame]

2227

return m_Graph->AddLayer<L2NormalizationLayer>(desc, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2228

}

2229

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2230

IConnectableLayer* NetworkImpl::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& desc,

Aron Virginas-Tar

f982dea

2019-10-11 14:07:53 +0100

[diff] [blame]

2231

const char* name)

2232

{

2233

return m_Graph->AddLayer<LogSoftmaxLayer>(desc, name);

2234

}

2235

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2236

IConnectableLayer* NetworkImpl::AddConstantLayer(const ConstTensor& input, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2237

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2238

auto layer = m_Graph->AddLayer<ConstantLayer>(name);

2239

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2240

layer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(input);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2241

2242

return layer;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2243

}

2244

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2245

IConnectableLayer* NetworkImpl::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2246

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2247

{

2248

return m_Graph->AddLayer<ReshapeLayer>(reshapeDescriptor, name);

2249

}

2250

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2251

IConnectableLayer* NetworkImpl::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

Nattapat Chaimanowong

207ef9a

2018-11-02 10:57:25 +0000

[diff] [blame]

2252

const char* name)

2253

{

2254

return m_Graph->AddLayer<SpaceToBatchNdLayer>(spaceToBatchNdDescriptor, name);

2255

}

2256

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2257

IConnectableLayer* NetworkImpl::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

Aron Virginas-Tar

972af15

2019-06-11 14:14:03 +0100

[diff] [blame]

2258

const char* name)

2259

{

2260

return m_Graph->AddLayer<SpaceToDepthLayer>(spaceToDepthDescriptor, name);

2261

}

2262

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2263

IConnectableLayer* NetworkImpl::AddFloorLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2264

{

2265

return m_Graph->AddLayer<FloorLayer>(name);

2266

}

2267

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2268

IConnectableLayer* NetworkImpl::AddLstmLayer(const LstmDescriptor& descriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2269

const LstmInputParams& params,

2270

const char* name)

2271

{

2272

const auto layer = m_Graph->AddLayer<LstmLayer>(descriptor, name);

2273

2274

//Lstm Basic Parameters

2275

layer->m_BasicParameters.m_InputToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2276

std::make_shared<ScopedTensorHandle>(*(params.m_InputToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2277

layer->m_BasicParameters.m_InputToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2278

std::make_shared<ScopedTensorHandle>(*(params.m_InputToCellWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2279

layer->m_BasicParameters.m_InputToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2280

std::make_shared<ScopedTensorHandle>(*(params.m_InputToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2281

layer->m_BasicParameters.m_RecurrentToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2282

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2283

layer->m_BasicParameters.m_RecurrentToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2284

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToCellWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2285

layer->m_BasicParameters.m_RecurrentToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2286

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2287

layer->m_BasicParameters.m_ForgetGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2288

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2289

layer->m_BasicParameters.m_CellBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2290

std::make_shared<ScopedTensorHandle>(*(params.m_CellBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2291

layer->m_BasicParameters.m_OutputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2292

std::make_shared<ScopedTensorHandle>(*(params.m_OutputGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2293

2294

//Lstm Cifg parameters

2295

if(!descriptor.m_CifgEnabled)

2296

{

2297

if(params.m_InputToInputWeights == nullptr)

2298

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2299

throw InvalidArgumentException("AddLstmLayer: Input To Input Weights cannot be NULL "

2300

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2301

}

2302

if(params.m_RecurrentToInputWeights == nullptr)

2303

{

2304

throw InvalidArgumentException(

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2305

"AddLstmLayer: Recurrent To Input Weights cannot be NULL "

2306

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2307

}

2308

if(params.m_InputGateBias == nullptr)

2309

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2310

throw InvalidArgumentException("AddLstmLayer: Input Gate Bias cannot be NULL "

2311

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2312

}

2313

layer->m_CifgParameters.m_InputToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2314

std::make_shared<ScopedTensorHandle>(*(params.m_InputToInputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2315

layer->m_CifgParameters.m_RecurrentToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2316

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToInputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2317

layer->m_CifgParameters.m_InputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2318

std::make_shared<ScopedTensorHandle>(*(params.m_InputGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2319

}

2320

2321

//Lstm projection parameters

2322

if(descriptor.m_ProjectionEnabled)

2323

{

2324

if(params.m_ProjectionWeights == nullptr)

2325

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2326

throw InvalidArgumentException("AddLstmLayer: Projection Weights cannot be NULL "

2327

"when projection is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2328

}

2329

layer->m_ProjectionParameters.m_ProjectionWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2330

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2331

if(params.m_ProjectionBias != nullptr)

2332

{

2333

layer->m_ProjectionParameters.m_ProjectionBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2334

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

}

}

//Lstm Peephole params

2339

if(descriptor.m_PeepholeEnabled)

2340

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2341

if(!descriptor.m_CifgEnabled)

2342

{

2343

if(params.m_CellToInputWeights == nullptr)

2344

{

2345

throw InvalidArgumentException("AddLstmLayer: Cell To Input Weights cannot be NULL "

2346

"when Peephole is enabled and CIFG disabled.");

2347

}

2348

2349

layer->m_PeepholeParameters.m_CellToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2350

std::make_shared<ScopedTensorHandle>(*(params.m_CellToInputWeights));

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2351

}

2352

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2353

if(params.m_CellToForgetWeights == nullptr)

2354

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2355

throw InvalidArgumentException("AddLstmLayer: Cell To Forget Weights cannot be NULL "

2356

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2357

}

2358

if(params.m_CellToOutputWeights == nullptr)

2359

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2360

throw InvalidArgumentException("AddLstmLayer: Cell To Output Weights cannot be NULL "

2361

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2362

}

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2363

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2364

layer->m_PeepholeParameters.m_CellToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2365

std::make_shared<ScopedTensorHandle>(*(params.m_CellToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2366

layer->m_PeepholeParameters.m_CellToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2367

std::make_shared<ScopedTensorHandle>(*(params.m_CellToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2368

}

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2369

2370

//Lstm Layer Normalization params

2371

if(descriptor.m_LayerNormEnabled)

2372

{

2373

if(!descriptor.m_CifgEnabled)

2374

{

2375

if(params.m_InputLayerNormWeights == nullptr)

2376

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2377

throw InvalidArgumentException("AddLstmLayer: Input layer normalization weights cannot be NULL "

2378

"when layer normalization is enabled and CIFG disabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2379

}

2380

layer->m_LayerNormParameters.m_InputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2381

std::make_shared<ScopedTensorHandle>(*(params.m_InputLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2382

}

2383

2384

if(params.m_ForgetLayerNormWeights == nullptr)

2385

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2386

throw InvalidArgumentException("AddLstmLayer: Forget layer normalization weights cannot be NULL "

2387

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2388

}

2389

if(params.m_CellLayerNormWeights == nullptr)

2390

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2391

throw InvalidArgumentException("AddLstmLayer: Cell layer normalization weights cannot be NULL "

2392

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2393

}

2394

if(params.m_OutputLayerNormWeights == nullptr)

2395

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2396

throw InvalidArgumentException("AddLstmLayer: Output layer normalization weights cannot be NULL "

2397

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2398

}

2399

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2400

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2401

layer->m_LayerNormParameters.m_CellLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2402

std::make_shared<ScopedTensorHandle>(*(params.m_CellLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2403

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2404

std::make_shared<ScopedTensorHandle>(*(params.m_OutputLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2405

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2409

IConnectableLayer* NetworkImpl::AddDivisionLayer(const char* name)

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

2410

{

2411

return m_Graph->AddLayer<DivisionLayer>(name);

2412

}

2413

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2414

IConnectableLayer* NetworkImpl::AddSubtractionLayer(const char* name)

David Beck

1952622

2018-09-12 16:00:08 +0100

[diff] [blame]

2415

{

2416

return m_Graph->AddLayer<SubtractionLayer>(name);

2417

}

2418

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2419

IConnectableLayer* NetworkImpl::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

narpra01

32b9046

2018-09-13 11:07:48 +0100

[diff] [blame]

2420

{

2421

return m_Graph->AddLayer<MeanLayer>(meanDescriptor,name);

2422

}

2423

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2424

IConnectableLayer* NetworkImpl::AddPadLayer(const PadDescriptor& padDescriptor, const char* name)

Mohamed Nour Abouelseoud

5662c20

2018-09-24 13:30:09 +0100

[diff] [blame]

2425

{

2426

return m_Graph->AddLayer<PadLayer>(padDescriptor,name);

2427

}

2428

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2429

IConnectableLayer *NetworkImpl::AddQuantizeLayer(const char *name)

Derek Lamberti

a9cca6a

2019-03-25 15:41:58 +0000

[diff] [blame]

2430

{

2431

return m_Graph->AddLayer<QuantizeLayer>(name);

2432

}

2433

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2434

IConnectableLayer* NetworkImpl::AddDequantizeLayer(const char* name)

Nattapat Chaimanowong

e4294fd

2019-03-28 09:56:53 +0000

[diff] [blame]

2435

{

2436

return m_Graph->AddLayer<DequantizeLayer>(name);

2437

}

2438

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2439

IConnectableLayer* NetworkImpl::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

Conor Kennedy

430b5d8

2018-11-14 15:28:28 +0000

[diff] [blame]

2440

const char* name)

2441

{

2442

return m_Graph->AddLayer<StridedSliceLayer>(stridedSliceDescriptor, name);

2443

}

2444

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2445

IConnectableLayer* NetworkImpl::AddGatherLayer(const GatherDescriptor& gatherDescriptor,

Teresa Charlin

5266473

2020-06-29 16:27:03 +0100

[diff] [blame]

2446

const char* name)

2447

{

2448

return m_Graph->AddLayer<GatherLayer>(gatherDescriptor, name);

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

2449

}

2450

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2451

IConnectableLayer* NetworkImpl::AddMergeLayer(const char* name)

Nattapat Chaimanowong

1f88630

2019-04-05 13:37:19 +0100

[diff] [blame]

2452

{

2453

return m_Graph->AddLayer<MergeLayer>(name);

2454

}

2455

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2456

IConnectableLayer* NetworkImpl::AddSwitchLayer(const char* name)

Sadik Armagan

eff363d

2019-04-05 15:25:46 +0100

[diff] [blame]

2457

{

2458

return m_Graph->AddLayer<SwitchLayer>(name);

2459

}

2460

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2461

IConnectableLayer* NetworkImpl::AddPreluLayer(const char* name)

Matteo Martincigh

0e406ee

2019-06-12 15:42:18 +0100

[diff] [blame]

2462

{

2463

return m_Graph->AddLayer<PreluLayer>(name);

2464

}

2465

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2466

IConnectableLayer* NetworkImpl::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

2467

const ConstTensor& weights,

2468

const Optional<ConstTensor>& biases,

2469

const char* name)

2470

{

2471

if (descriptor.m_BiasEnabled && !biases.has_value())

2472

{

2473

throw InvalidArgumentException("AddTransposeConvolution2dLayer: Biases cannot be empty");

2474

}

2475

2476

const auto layer = m_Graph->AddLayer<TransposeConvolution2dLayer>(descriptor, name);

2477

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2478

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

2479

2480

if (descriptor.m_BiasEnabled)

2481

{

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2482

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2488

IConnectableLayer* NetworkImpl::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

Mike Kelly

c9ea45a

2020-02-28 18:11:58 +0000

[diff] [blame]

2489

const char* name)

2490

{

2491

return m_Graph->AddLayer<TransposeLayer>(transposeDescriptor, name);

2492

}

2493

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2494

IConnectableLayer* NetworkImpl::AddStackLayer(const StackDescriptor& stackDescriptor,

Matthew Jackson

2b8c1da

2019-07-04 14:59:16 +0100

[diff] [blame]

2495

const char* name)

2496

{

2497

return m_Graph->AddLayer<StackLayer>(stackDescriptor, name);

2498

}

2499

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

2500

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2501

IConnectableLayer* NetworkImpl::AddStandInLayer(const StandInDescriptor& desc,

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

2502

const char* name)

2503

{

2504

return m_Graph->AddLayer<StandInLayer>(desc, name);

2505

}

2506

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2507

IConnectableLayer* NetworkImpl::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2508

const char* name)

2509

{

2510

const auto layer = m_Graph->AddLayer<QuantizedLstmLayer>(name);

2511

2512

// InputToX weights

2513

layer->m_QuantizedLstmParameters.m_InputToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2514

std::make_shared<ScopedTensorHandle>(params.GetInputToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2515

layer->m_QuantizedLstmParameters.m_InputToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2516

std::make_shared<ScopedTensorHandle>(params.GetInputToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2517

layer->m_QuantizedLstmParameters.m_InputToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2518

std::make_shared<ScopedTensorHandle>(params.GetInputToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2519

layer->m_QuantizedLstmParameters.m_InputToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2520

std::make_shared<ScopedTensorHandle>(params.GetInputToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2521

2522

// RecurrentToX weights

2523

layer->m_QuantizedLstmParameters.m_RecurrentToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2524

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2525

layer->m_QuantizedLstmParameters.m_RecurrentToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2526

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2527

layer->m_QuantizedLstmParameters.m_RecurrentToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2528

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2529

layer->m_QuantizedLstmParameters.m_RecurrentToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2530

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2531

2532

// Bias

2533

layer->m_QuantizedLstmParameters.m_InputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2534

std::make_shared<ScopedTensorHandle>(params.GetInputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2535

layer->m_QuantizedLstmParameters.m_ForgetGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2536

std::make_shared<ScopedTensorHandle>(params.GetForgetGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2537

layer->m_QuantizedLstmParameters.m_CellBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2538

std::make_shared<ScopedTensorHandle>(params.GetCellBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2539

layer->m_QuantizedLstmParameters.m_OutputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2540

std::make_shared<ScopedTensorHandle>(params.GetOutputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2545

IConnectableLayer* NetworkImpl::AddQLstmLayer(const QLstmDescriptor& descriptor,

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2546

const LstmInputParams& params,

2547

const char* name)

2548

{

2549

const auto layer = m_Graph->AddLayer<QLstmLayer>(descriptor, name);

2550

2551

// QLstm Basic Parameters

2552

layer->m_BasicParameters.m_InputToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2553

std::make_shared<ScopedTensorHandle>(*(params.m_InputToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2554

layer->m_BasicParameters.m_InputToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2555

std::make_shared<ScopedTensorHandle>(*(params.m_InputToCellWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2556

layer->m_BasicParameters.m_InputToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2557

std::make_shared<ScopedTensorHandle>(*(params.m_InputToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2558

layer->m_BasicParameters.m_RecurrentToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2559

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2560

layer->m_BasicParameters.m_RecurrentToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2561

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToCellWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2562

layer->m_BasicParameters.m_RecurrentToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2563

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2564

layer->m_BasicParameters.m_ForgetGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2565

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2566

layer->m_BasicParameters.m_CellBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2567

std::make_shared<ScopedTensorHandle>(*(params.m_CellBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2568

layer->m_BasicParameters.m_OutputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2569

std::make_shared<ScopedTensorHandle>(*(params.m_OutputGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2570

2571

// QLstm Cifg parameters

2572

if(!descriptor.m_CifgEnabled)

2573

{

2574

if(params.m_InputToInputWeights == nullptr)

2575

{

2576

throw InvalidArgumentException("AddQLstmLayer: Input To Input Weights cannot be NULL");

2577

}

2578

2579

if(params.m_RecurrentToInputWeights == nullptr)

2580

{

2581

throw InvalidArgumentException(

2582

"AddQLstmLayer: Recurrent To Input Weights cannot be NULL");

2583

}

2584

2585

if(params.m_InputGateBias == nullptr)

2586

{

2587

throw InvalidArgumentException("AddQLstmLayer: Input Gate Bias cannot be NULL");

2588

}

2589

2590

layer->m_CifgParameters.m_InputToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2591

std::make_shared<ScopedTensorHandle>(*(params.m_InputToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2592

layer->m_CifgParameters.m_RecurrentToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2593

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2594

layer->m_CifgParameters.m_InputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2595

std::make_shared<ScopedTensorHandle>(*(params.m_InputGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2596

}

2597

2598

// QLstm Projection parameters

2599

if(descriptor.m_ProjectionEnabled)

2600

{

2601

if(params.m_ProjectionWeights == nullptr)

2602

{

2603

throw InvalidArgumentException("AddQLstmLayer: Projection Weights cannot be NULL");

2604

}

2605

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2606

layer->m_ProjectionParameters.m_ProjectionWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2607

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionWeights));

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

2608

2609

// Projection bias is optional even if projection is enabled

2610

if(params.m_ProjectionWeights != nullptr)

2611

{

2612

layer->m_ProjectionParameters.m_ProjectionBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2613

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionBias));

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

2614

}

2615

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2616

}

2617

2618

// QLstm Peephole params

2619

if(descriptor.m_PeepholeEnabled)

2620

{

2621

if(params.m_CellToForgetWeights == nullptr)

2622

{

2623

throw InvalidArgumentException("AddQLstmLayer: Cell To Forget Weights cannot be NULL");

2624

}

2625

2626

if(params.m_CellToOutputWeights == nullptr)

2627

{

2628

throw InvalidArgumentException("AddQLstmLayer: Cell To Output Weights cannot be NULL");

2629

}

2630

2631

if(!descriptor.m_CifgEnabled)

2632

{

2633

if(params.m_CellToInputWeights == nullptr)

2634

{

2635

throw InvalidArgumentException("AddQLstmLayer: Cell To Input Weights cannot be NULL");

2636

}

2637

2638

layer->m_PeepholeParameters.m_CellToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2639

std::make_shared<ScopedTensorHandle>(*(params.m_CellToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2640

}

2641

2642

layer->m_PeepholeParameters.m_CellToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2643

std::make_shared<ScopedTensorHandle>(*(params.m_CellToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2644

layer->m_PeepholeParameters.m_CellToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2645

std::make_shared<ScopedTensorHandle>(*(params.m_CellToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2646

}

2647

2648

// QLstm Layer Normalization params

2649

if(descriptor.m_LayerNormEnabled)

2650

{

2651

if(params.m_ForgetLayerNormWeights == nullptr)

2652

{

2653

throw InvalidArgumentException("AddQLstmLayer: Forget layer normalization weights cannot be NULL");

2654

}

2655

2656

if(params.m_CellLayerNormWeights == nullptr)

2657

{

2658

throw InvalidArgumentException("AddQLstmLayer: Cell layer normalization weights cannot be NULL");

2659

}

2660

2661

if(params.m_OutputLayerNormWeights == nullptr)

2662

{

2663

throw InvalidArgumentException("AddQLstmLayer: Output layer normalization weights cannot be NULL");

2664

}

2665

2666

if(!descriptor.m_CifgEnabled)

2667

{

2668

if(params.m_InputLayerNormWeights == nullptr)

2669

{

2670

throw InvalidArgumentException("AddQLstmLayer: Input layer normalization weights cannot be NULL");

2671

}

2672

2673

layer->m_LayerNormParameters.m_InputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2674

std::make_shared<ScopedTensorHandle>(*(params.m_InputLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2675

}

2676

2677

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2678

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2679

layer->m_LayerNormParameters.m_CellLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2680

std::make_shared<ScopedTensorHandle>(*(params.m_CellLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2681

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2682

std::make_shared<ScopedTensorHandle>(*(params.m_OutputLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2687

IConnectableLayer* NetworkImpl::AddLogicalBinaryLayer(const LogicalBinaryDescriptor& logicalBinaryDescriptor,

Narumol Prangnawarat

8ed39ae

2021-07-15 16:16:25 +0100

[diff] [blame]

2688

const char* name)

James Conroy

aba90cd

2020-11-06 16:28:18 +0000

[diff] [blame]

2689

{

2690

return m_Graph->AddLayer<LogicalBinaryLayer>(logicalBinaryDescriptor, name);

2691

}

2692

Narumol Prangnawarat

8ed39ae

2021-07-15 16:16:25 +0100

[diff] [blame]

2693

IConnectableLayer* NetworkImpl::AddUnidirectionalSequenceLstmLayer(

2694

const UnidirectionalSequenceLstmDescriptor& descriptor,

2695

const LstmInputParams& params,

2696

const char* name)

2697

{

2698

const auto layer = m_Graph->AddLayer<UnidirectionalSequenceLstmLayer>(descriptor, name);

2699

2700

//Lstm Basic Parameters

2701

layer->m_BasicParameters.m_InputToForgetWeights =

2702

std::make_shared<ScopedTensorHandle>(*(params.m_InputToForgetWeights));

2703

layer->m_BasicParameters.m_InputToCellWeights =

2704

std::make_shared<ScopedTensorHandle>(*(params.m_InputToCellWeights));

2705

layer->m_BasicParameters.m_InputToOutputWeights =

2706

std::make_shared<ScopedTensorHandle>(*(params.m_InputToOutputWeights));

2707

layer->m_BasicParameters.m_RecurrentToForgetWeights =

2708

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToForgetWeights));

2709

layer->m_BasicParameters.m_RecurrentToCellWeights =

2710

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToCellWeights));

2711

layer->m_BasicParameters.m_RecurrentToOutputWeights =

2712

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToOutputWeights));

2713

layer->m_BasicParameters.m_ForgetGateBias =

2714

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetGateBias));

2715

layer->m_BasicParameters.m_CellBias =

2716

std::make_shared<ScopedTensorHandle>(*(params.m_CellBias));

2717

layer->m_BasicParameters.m_OutputGateBias =

2718

std::make_shared<ScopedTensorHandle>(*(params.m_OutputGateBias));

2719

2720

//Lstm Cifg parameters

2721

if(!descriptor.m_CifgEnabled)

2722

{

2723

if(params.m_InputToInputWeights == nullptr)

2724

{

2725

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Input To Input Weights cannot be NULL "

2726

"when CIFG is disabled.");

2727

}

2728

if(params.m_RecurrentToInputWeights == nullptr)

2729

{

2730

throw InvalidArgumentException(

2731

"AddUnidirectionalSequenceLstmLayer: Recurrent To Input Weights cannot be NULL "

2732

"when CIFG is disabled.");

2733

}

2734

if(params.m_InputGateBias == nullptr)

2735

{

2736

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Input Gate Bias cannot be NULL "

2737

"when CIFG is disabled.");

2738

}

2739

layer->m_CifgParameters.m_InputToInputWeights =

2740

std::make_shared<ScopedTensorHandle>(*(params.m_InputToInputWeights));

2741

layer->m_CifgParameters.m_RecurrentToInputWeights =

2742

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToInputWeights));

2743

layer->m_CifgParameters.m_InputGateBias =

2744

std::make_shared<ScopedTensorHandle>(*(params.m_InputGateBias));

2745

}

2746

2747

//Lstm projection parameters

2748

if(descriptor.m_ProjectionEnabled)

2749

{

2750

if(params.m_ProjectionWeights == nullptr)

2751

{

2752

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Projection Weights cannot be NULL "

2753

"when projection is enabled.");

2754

}

2755

layer->m_ProjectionParameters.m_ProjectionWeights =

2756

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionWeights));

2757

if(params.m_ProjectionBias != nullptr)

2758

{

2759

layer->m_ProjectionParameters.m_ProjectionBias =

2760

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionBias));

}

}

//Lstm Peephole params

2765

if(descriptor.m_PeepholeEnabled)

2766

{

2767

if(!descriptor.m_CifgEnabled)

2768

{

2769

if(params.m_CellToInputWeights == nullptr)

2770

{

2771

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell To Input Weights "

2772

"cannot be NULL when Peephole is enabled and CIFG disabled.");

2773

}

2774

2775

layer->m_PeepholeParameters.m_CellToInputWeights =

2776

std::make_shared<ScopedTensorHandle>(*(params.m_CellToInputWeights));

2777

}

2778

2779

if(params.m_CellToForgetWeights == nullptr)

2780

{

2781

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell To Forget Weights cannot be NULL "

2782

"when Peephole is enabled.");

2783

}

2784

if(params.m_CellToOutputWeights == nullptr)

2785

{

2786

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell To Output Weights cannot be NULL "

2787

"when Peephole is enabled.");

2788

}

2789

2790

layer->m_PeepholeParameters.m_CellToForgetWeights =

2791

std::make_shared<ScopedTensorHandle>(*(params.m_CellToForgetWeights));

2792

layer->m_PeepholeParameters.m_CellToOutputWeights =

2793

std::make_shared<ScopedTensorHandle>(*(params.m_CellToOutputWeights));

2794

}

2795

2796

//Lstm Layer Normalization params

2797

if(descriptor.m_LayerNormEnabled)

2798

{

2799

if(!descriptor.m_CifgEnabled)

2800

{

2801

if(params.m_InputLayerNormWeights == nullptr)

2802

{

2803

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Input layer normalization weights "

2804

"cannot be NULL when layer normalization is enabled and CIFG disabled.");

2805

}

2806

layer->m_LayerNormParameters.m_InputLayerNormWeights =

2807

std::make_shared<ScopedTensorHandle>(*(params.m_InputLayerNormWeights));

2808

}

2809

2810

if(params.m_ForgetLayerNormWeights == nullptr)

2811

{

2812

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Forget layer normalization weights "

2813

"cannot be NULL when layer normalization is enabled.");

2814

}

2815

if(params.m_CellLayerNormWeights == nullptr)

2816

{

2817

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell layer normalization weights "

2818

"cannot be NULL when layer normalization is enabled.");

2819

}

2820

if(params.m_OutputLayerNormWeights == nullptr)

2821

{

2822

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Output layer normalization weights "

2823

"cannot be NULL when layer normalization is enabled.");

2824

}

2825

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

2826

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetLayerNormWeights));

2827

layer->m_LayerNormParameters.m_CellLayerNormWeights =

2828

std::make_shared<ScopedTensorHandle>(*(params.m_CellLayerNormWeights));

2829

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

2830

std::make_shared<ScopedTensorHandle>(*(params.m_OutputLayerNormWeights));

}

return layer;

}

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

2835

IConnectableLayer* NetworkImpl::AddPrecompiledLayer(const PreCompiledDescriptor& preCompiledDescriptor,

Cathal Corbett

3ea0107

2022-01-06 10:29:43 +0000

[diff] [blame]

2836

CompiledBlobPtr compiledBlobPtr,

Cathal Corbett

cbfd718

2021-12-15 17:12:59 +0000

[diff] [blame]

2837

const Optional<BackendId>& backend,

2838

const char* name)

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

2839

{

2840

// Method use is for backend users.

Cathal Corbett

cbfd718

2021-12-15 17:12:59 +0000

[diff] [blame]

2841

PreCompiledLayer* layer;

2842

if (name)

2843

{

2844

layer = m_Graph->AddLayer<PreCompiledLayer>(preCompiledDescriptor, name);

}

else

{

layer = m_Graph->AddLayer<PreCompiledLayer>(preCompiledDescriptor, "pre-compiled");

2849

}

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

2850

2851

// Assign the pre-compiled object to layer

2852

// Pass only one compiled network, Arm NN does not handle multiple

2853

// pre-compiled objects in a single pre-compiled layer currently

2854

layer->SetPreCompiledObject(std::move(compiledBlobPtr));

2855

2856

if (backend.has_value())

2857

{

2858

layer->SetBackendId(backend.value());

2859

}

Francis Murtagh

9d74ba6

2022-01-19 16:31:58 +0000

[diff] [blame^]

2860

else if (layer->GetBackendHint().has_value())

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

2861

{

2862

layer->SetBackendId(layer->GetBackendHint().value());

}

return layer;

}

Jan Eilers

2021-09-24 15:45:46 +0100

[diff] [blame]

2868

ARMNN_NO_DEPRECATE_WARN_BEGIN

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2869

void NetworkImpl::Accept(ILayerVisitor& visitor) const

Mike Kelly

8c1701a

2019-02-11 17:01:27 +0000

[diff] [blame]

2870

{

2871

for (auto layer : GetGraph())

2872

{

2873

layer->Accept(visitor);

2874

};

2875

}

Jan Eilers

1b2654f

2021-09-24 15:45:46 +0100

[diff] [blame]

2876

ARMNN_NO_DEPRECATE_WARN_END

Mike Kelly

8c1701a

2019-02-11 17:01:27 +0000

[diff] [blame]

2877

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2878

void NetworkImpl::ExecuteStrategy(IStrategy& strategy) const

Finn Williams

b454c5c

2021-02-09 15:56:23 +0000

[diff] [blame]

2879

{

2880

for (auto layer : GetGraph())

2881

{

2882

layer->ExecuteStrategy(strategy);

};

}

Mike Kelly

2021-06-27 22:39:21 +0100

[diff] [blame]

2886

OptimizedNetworkImpl::OptimizedNetworkImpl(const OptimizedNetworkImpl& other, const ModelOptions& modelOptions)

2887

: m_Graph(new Graph(*other.m_Graph.get()))

2888

, m_Guid(profiling::ProfilingService::GetNextGuid())

2889

, m_ModelOptions(modelOptions)

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2893

OptimizedNetworkImpl::OptimizedNetworkImpl(std::unique_ptr<Graph> graph)

Sadik Armagan

3184c90

2020-03-18 10:57:30 +0000

[diff] [blame]

2894

: m_Graph(std::move(graph)), m_Guid(profiling::ProfilingService::GetNextGuid())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2898

OptimizedNetworkImpl::OptimizedNetworkImpl(std::unique_ptr<Graph> graph, const ModelOptions& modelOptions)

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

2899

: m_Graph(std::move(graph)), m_Guid(profiling::ProfilingService::GetNextGuid()), m_ModelOptions(modelOptions)

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2903

OptimizedNetworkImpl::~OptimizedNetworkImpl()

telsoa01