Blame - src/armnn/Network.cpp - ml/armnn

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

5

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

6

#include "Network.hpp"

7

#include "Graph.hpp"

8

#include "Layer.hpp"

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

9

#include "DeviceSpec.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

10

#include "Optimizer.hpp"

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

11

#include "SubgraphViewSelector.hpp"

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

12

#include "BackendSettings.hpp"

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

13

#include "optimizations/All.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

14

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

15

#include <backendsCommon/TensorHandle.hpp>

Aron Virginas-Tar

c9cc804

2018-11-01 16:15:57 +0000

[diff] [blame]

16

#include <backendsCommon/WorkloadFactory.hpp>

Matteo Martincigh

e5b8eb9

2019-11-28 15:45:42 +0000

[diff] [blame]

17

#include <armnn/backends/IBackendInternal.hpp>

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

18

#include <backendsCommon/TensorHandleFactoryRegistry.hpp>

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

19

20

#include <armnn/Exceptions.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

21

#include <armnn/Utils.hpp>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

22

#include <armnn/TypesUtils.hpp>

Matteo Martincigh

c601aa6

2019-10-29 15:03:22 +0000

[diff] [blame]

23

#include <armnn/BackendRegistry.hpp>

Matthew Bentham

f48afc6

2020-01-15 17:55:08 +0000

[diff] [blame]

24

#include <armnn/Logging.hpp>

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

25

#include <armnn/utility/Assert.hpp>

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

26

#include <armnn/utility/IgnoreUnused.hpp>

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

27

#include <armnn/utility/PolymorphicDowncast.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

28

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

29

#include <ProfilingService.hpp>

30

Nikhil Raj

77fe76b

2021-06-09 14:55:32 +0100

[diff] [blame]

31

#include <common/include/ProfilingGuid.hpp>

32

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

33

#include <fmt/format.h>

34

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

#include <fcntl.h>

#include <algorithm>

#include <fstream>

#include <memory>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

39

#include <vector>

40

#include <algorithm>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

41

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

namespace armnn

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

45

INetwork::INetwork(NetworkOptions networkOptions) : pNetworkImpl(new NetworkImpl(networkOptions)) {}

46

47

INetwork::~INetwork() = default;

48

49

Status INetwork::PrintGraph()

50

{

51

return pNetworkImpl->PrintGraph();

52

}

53

54

IConnectableLayer* INetwork::AddInputLayer(LayerBindingId id, const char* name)

55

{

56

return pNetworkImpl->AddInputLayer(id, name);

}

IConnectableLayer* INetwork::AddArgMinMaxLayer(const ArgMinMaxDescriptor& desc,

61

const char* name)

62

{

63

return pNetworkImpl->AddArgMinMaxLayer(desc, name);

64

}

65

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

66

IConnectableLayer* INetwork::AddCastLayer(const char* name)

67

{

68

return pNetworkImpl->AddCastLayer(name);

69

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

70

71

IConnectableLayer* INetwork::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

72

const char* name)

73

{

74

return pNetworkImpl->AddComparisonLayer(comparisonDescriptor, name);

}

IConnectableLayer* INetwork::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

79

const char* name)

80

{

81

return pNetworkImpl->AddConcatLayer(concatDescriptor, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

86

const ConstTensor& weights,

87

const Optional<ConstTensor>& biases,

88

const char* name)

89

{

90

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

95

const ConstTensor& weights,

96

const char* name)

97

{

98

Optional<ConstTensor> biases;

99

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

104

const ConstTensor& weights,

105

const ConstTensor& biases,

const char* name )

{

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor,

110

weights,

111

armnn::Optional<ConstTensor>(biases),

name);

}

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame^]

116

IConnectableLayer* INetwork::AddConvolution3dLayer(const Convolution3dDescriptor& convolution3dDescriptor,

117

const ConstTensor& weights,

118

const Optional<ConstTensor>& biases,

119

const char* name)

120

{

121

return pNetworkImpl->AddConvolution3dLayer(convolution3dDescriptor, weights, biases, name);

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

125

IConnectableLayer* INetwork::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

126

const char* name)

127

{

128

return pNetworkImpl->AddDepthToSpaceLayer(depthToSpaceDescriptor, name);

}

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

133

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

134

const ConstTensor& weights,

135

const Optional<ConstTensor>& biases,

136

const char* name)

137

{

138

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

143

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

144

const ConstTensor& weights,

145

const char* name)

146

{

147

Optional<ConstTensor> biases;

148

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

153

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

154

const ConstTensor& weights,

155

const ConstTensor& biases,

156

const char* name)

157

{

158

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, weights,

159

armnn::Optional<ConstTensor>(biases), name);

}

IConnectableLayer* INetwork::AddDequantizeLayer(const char* name)

164

{

165

return pNetworkImpl->AddDequantizeLayer(name);

}

IConnectableLayer* INetwork::AddDetectionPostProcessLayer(

170

const DetectionPostProcessDescriptor& descriptor,

171

const ConstTensor& anchors,

172

const char* name)

173

{

174

return pNetworkImpl->AddDetectionPostProcessLayer(descriptor, anchors, name);

}

IConnectableLayer* INetwork::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

179

const char* name)

180

{

181

return pNetworkImpl->AddElementwiseUnaryLayer(elementwiseUnaryDescriptor, name);

}

IConnectableLayer* INetwork::AddFillLayer(const FillDescriptor& fillDescriptor,

186

const char* name)

187

{

188

return pNetworkImpl->AddFillLayer(fillDescriptor, name);

189

}

190

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

191

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

192

const char* name)

193

{

194

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor, name);

195

}

196

197

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

198

const ConstTensor& weights,

199

const Optional<ConstTensor>& biases,

200

const char* name)

201

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

202

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor,

203

armnn::Optional<ConstTensor>(weights),

204

biases,

205

name);

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

206

}

207

208

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

209

const Optional<ConstTensor>& weights,

210

const Optional<ConstTensor>& biases,

211

const char* name)

212

{

213

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor, weights, biases, name);

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

214

}

215

216

IConnectableLayer* INetwork::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

217

const char* name)

218

{

219

return pNetworkImpl->AddPermuteLayer(permuteDescriptor, name);

220

}

221

222

IConnectableLayer* INetwork::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

223

const char* name)

224

{

225

return pNetworkImpl->AddBatchToSpaceNdLayer(batchToSpaceNdDescriptor, name);

226

}

227

228

IConnectableLayer* INetwork::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

229

const char* name)

230

{

231

return pNetworkImpl->AddPooling2dLayer(pooling2dDescriptor, name);

232

}

233

234

IConnectableLayer* INetwork::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

235

const char* name)

236

{

237

return pNetworkImpl->AddActivationLayer(activationDescriptor, name);

238

}

239

240

IConnectableLayer* INetwork::AddNormalizationLayer(const NormalizationDescriptor& normalizationDescriptor,

241

const char* name)

242

{

243

return pNetworkImpl->AddNormalizationLayer(normalizationDescriptor, name);

244

}

245

246

IConnectableLayer* INetwork::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

247

{

248

return pNetworkImpl->AddSliceLayer(sliceDescriptor, name);

249

}

250

IConnectableLayer* INetwork::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

251

const char* name)

252

{

253

return pNetworkImpl->AddSoftmaxLayer(softmaxDescriptor, name);

254

}

255

256

IConnectableLayer* INetwork::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

257

const char* name)

258

{

259

return pNetworkImpl->AddSplitterLayer(splitterDescriptor, name);

260

}

261

262

IConnectableLayer* INetwork::AddMergeLayer(const char* name)

263

{

264

return pNetworkImpl->AddMergeLayer(name);

265

}

266

267

IConnectableLayer* INetwork::AddMergerLayer(const MergerDescriptor& mergerDescriptor,

268

const char* name)

269

{

270

return pNetworkImpl->AddConcatLayer(mergerDescriptor, name);

271

}

272

273

IConnectableLayer* INetwork::AddAbsLayer(const char* name)

274

{

275

return pNetworkImpl->AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Abs), name);

276

}

277

278

IConnectableLayer* INetwork::AddAdditionLayer(const char* name)

279

{

280

return pNetworkImpl->AddAdditionLayer(name);

281

}

282

283

IConnectableLayer* INetwork::AddMultiplicationLayer(const char* name)

284

{

285

return pNetworkImpl->AddMultiplicationLayer(name);

286

}

287

288

IConnectableLayer* INetwork::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

289

const ConstTensor& mean,

290

const ConstTensor& variance,

291

const ConstTensor& beta,

292

const ConstTensor& gamma,

293

const char* name)

294

{

295

return pNetworkImpl->AddBatchNormalizationLayer(desc, mean, variance, beta, gamma, name);

296

}

297

298

IConnectableLayer* INetwork::AddRankLayer(const char* name)

299

{

300

return pNetworkImpl->AddRankLayer(name);

301

}

302

303

IConnectableLayer* INetwork::AddResizeBilinearLayer(const ResizeBilinearDescriptor& descriptor,

304

const char* name)

305

{

306

ResizeDescriptor resizeDescriptor;

307

resizeDescriptor.m_Method = ResizeMethod::Bilinear;

308

resizeDescriptor.m_DataLayout = descriptor.m_DataLayout;

309

resizeDescriptor.m_TargetWidth = descriptor.m_TargetWidth;

310

resizeDescriptor.m_TargetHeight = descriptor.m_TargetHeight;

311

resizeDescriptor.m_AlignCorners = descriptor.m_AlignCorners;

312

resizeDescriptor.m_HalfPixelCenters = descriptor.m_HalfPixelCenters;

313

314

return pNetworkImpl->AddResizeLayer(resizeDescriptor, name);

315

}

316

317

IConnectableLayer* INetwork::AddResizeLayer(const ResizeDescriptor& resizeDescriptor,

318

const char* name)

319

{

320

return pNetworkImpl->AddResizeLayer(resizeDescriptor, name);

321

}

322

323

IConnectableLayer* INetwork::AddReduceLayer(const ReduceDescriptor& reduceDescriptor,

324

const char* name)

325

{

326

return pNetworkImpl->AddReduceLayer(reduceDescriptor, name);

327

}

328

329

IConnectableLayer* INetwork::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

330

const char* name)

331

{

332

return pNetworkImpl->AddInstanceNormalizationLayer(desc, name);

333

}

334

335

IConnectableLayer* INetwork::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

336

const char* name)

337

{

338

return pNetworkImpl->AddL2NormalizationLayer(desc, name);

339

}

340

341

IConnectableLayer* INetwork::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& logSoftmaxDescriptor,

342

const char* name)

343

{

344

return pNetworkImpl->AddLogSoftmaxLayer(logSoftmaxDescriptor, name);

345

}

346

347

IConnectableLayer* INetwork::AddConstantLayer(const ConstTensor& input,

348

const char* name)

349

{

350

return pNetworkImpl->AddConstantLayer(input, name);

351

}

352

353

IConnectableLayer* INetwork::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

354

const char* name)

355

{

356

return pNetworkImpl->AddReshapeLayer(reshapeDescriptor, name);

357

}

358

359

IConnectableLayer* INetwork::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

360

const char* name)

361

{

362

return pNetworkImpl->AddSpaceToBatchNdLayer(spaceToBatchNdDescriptor, name);

363

}

364

365

IConnectableLayer* INetwork::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

366

const char* name)

367

{

368

return pNetworkImpl->AddSpaceToDepthLayer(spaceToDepthDescriptor, name);

369

}

370

371

IConnectableLayer* INetwork::AddFloorLayer(const char* name)

372

{

373

return pNetworkImpl->AddFloorLayer(name);

374

}

375

IConnectableLayer* INetwork::AddOutputLayer(LayerBindingId id, const char* name)

376

{

377

return pNetworkImpl->AddOutputLayer(id, name);

378

}

379

380

IConnectableLayer* INetwork::AddLstmLayer(const LstmDescriptor& descriptor,

381

const LstmInputParams& params,

382

const char* name)

383

{

384

return pNetworkImpl->AddLstmLayer(descriptor, params, name);

385

}

386

387

IConnectableLayer* INetwork::AddDivisionLayer(const char* name)

388

{

389

return pNetworkImpl->AddDivisionLayer(name);

390

}

391

392

IConnectableLayer* INetwork::AddSubtractionLayer(const char* name)

393

{

394

return pNetworkImpl->AddSubtractionLayer(name);

395

}

396

397

IConnectableLayer* INetwork::AddMaximumLayer(const char* name)

398

{

399

return pNetworkImpl->AddMaximumLayer(name);

400

}

401

402

IConnectableLayer* INetwork::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

403

{

404

return pNetworkImpl->AddMeanLayer(meanDescriptor, name);

405

}

406

407

IConnectableLayer* INetwork::AddPadLayer(const PadDescriptor& padDescriptor,

408

const char* name)

409

{

410

return pNetworkImpl->AddPadLayer(padDescriptor, name);

411

}

412

413

IConnectableLayer* INetwork::AddQuantizeLayer(const char* name)

414

{

415

return pNetworkImpl->AddQuantizeLayer(name);

416

}

417

418

IConnectableLayer* INetwork::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

419

const char* name)

420

{

421

return pNetworkImpl->AddStridedSliceLayer(stridedSliceDescriptor, name);

422

}

423

424

IConnectableLayer* INetwork::AddMinimumLayer(const char* name)

425

{

426

return pNetworkImpl->AddMinimumLayer(name);

427

}

428

429

IConnectableLayer* INetwork::AddGreaterLayer(const char* name)

430

{

431

return pNetworkImpl->AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Greater), name);

432

}

433

434

IConnectableLayer* INetwork::AddEqualLayer(const char* name)

435

{

436

return pNetworkImpl->AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Equal), name);

437

}

438

439

IConnectableLayer* INetwork::AddRsqrtLayer(const char* name)

440

{

441

return pNetworkImpl->AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Rsqrt), name);

442

}

443

444

IConnectableLayer* INetwork::AddGatherLayer(const char* name)

445

{

446

GatherDescriptor gatherDescriptor{};

447

return pNetworkImpl->AddGatherLayer(gatherDescriptor, name);

448

}

449

450

IConnectableLayer* INetwork::AddGatherLayer(const GatherDescriptor& descriptor,

451

const char* name)

452

{

453

return pNetworkImpl->AddGatherLayer(descriptor, name);

454

}

455

456

IConnectableLayer* INetwork::AddSwitchLayer(const char* name)

457

{

458

return pNetworkImpl->AddSwitchLayer(name);

459

}

460

461

IConnectableLayer* INetwork::AddPreluLayer(const char* name)

462

{

463

return pNetworkImpl->AddPreluLayer(name);

464

}

465

466

IConnectableLayer* INetwork::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

467

const ConstTensor& weights,

468

const Optional<ConstTensor>& biases,

469

const char* name)

470

{

471

return pNetworkImpl->AddTransposeConvolution2dLayer(descriptor, weights, biases, name);

472

}

473

474

IConnectableLayer* INetwork::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

475

const char* name)

476

{

477

return pNetworkImpl->AddTransposeLayer(transposeDescriptor, name);

478

}

479

Keith Davis

3ae3f97

2021-05-21 16:33:48 +0100

[diff] [blame]

480

IConnectableLayer* INetwork::AddShapeLayer(const char* name)

481

{

482

return pNetworkImpl->AddShapeLayer(name);

483

}

484

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

485

IConnectableLayer* INetwork::AddStackLayer(const StackDescriptor& descriptor,

486

const char* name)

487

{

488

return pNetworkImpl->AddStackLayer(descriptor, name);

489

}

490

491

IConnectableLayer* INetwork::AddStandInLayer(const StandInDescriptor& descriptor,

492

const char* name)

493

{

494

return pNetworkImpl->AddStandInLayer(descriptor, name);

495

}

496

497

IConnectableLayer* INetwork::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

498

const char* name)

499

{

500

return pNetworkImpl->AddQuantizedLstmLayer(params, name);

501

}

502

503

IConnectableLayer* INetwork::AddQLstmLayer(const QLstmDescriptor& descriptor,

504

const LstmInputParams& params,

505

const char* name)

506

{

507

return pNetworkImpl->AddQLstmLayer(descriptor, params, name);

508

}

509

510

IConnectableLayer* INetwork::AddLogicalBinaryLayer(const LogicalBinaryDescriptor& descriptor,

511

const char* name)

512

{

513

return pNetworkImpl->AddLogicalBinaryLayer(descriptor, name);

514

}

515

Narumol Prangnawarat

8ed39ae

2021-07-15 16:16:25 +0100

[diff] [blame]

516

IConnectableLayer* INetwork::AddUnidirectionalSequenceLstmLayer(

517

const UnidirectionalSequenceLstmDescriptor& descriptor,

518

const LstmInputParams& params,

519

const char* name)

520

{

521

return pNetworkImpl->AddUnidirectionalSequenceLstmLayer(descriptor, params, name);

522

}

523

Simon Obute

51f6777

2021-09-03 15:50:13 +0100

[diff] [blame]

524

IConnectableLayer* INetwork::AddChannelShuffleLayer(const ChannelShuffleDescriptor &descriptor,

525

const char* name)

526

{

527

return pNetworkImpl->AddChannelShuffleLayer(descriptor, name);

528

}

529

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

530

void INetwork::Accept(ILayerVisitor& visitor) const

531

{

532

return pNetworkImpl->Accept(visitor);

533

}

534

535

void INetwork::ExecuteStrategy(IStrategy& strategy) const

536

{

537

return pNetworkImpl->ExecuteStrategy(strategy);

538

}

539

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

540

armnn::INetwork* INetwork::CreateRaw(NetworkOptions networkOptions)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

541

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

542

return new INetwork(networkOptions);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

543

}

544

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

545

armnn::INetworkPtr INetwork::Create(NetworkOptions networkOptions)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

546

{

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

547

return INetworkPtr(CreateRaw(networkOptions), &INetwork::Destroy);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

548

}

549

550

void INetwork::Destroy(INetwork* network)

551

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

552

delete network;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

553

}

554

Mike Kelly

0d677db

2021-06-27 22:39:21 +0100

[diff] [blame]

555

IOptimizedNetwork::IOptimizedNetwork(const IOptimizedNetwork& other, const ModelOptions& modelOptions)

556

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(*other.pOptimizedNetworkImpl.get(), modelOptions)) {}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

557

558

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<Graph> graph)

559

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph))) {}

560

561

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<OptimizedNetworkImpl> impl)

562

: pOptimizedNetworkImpl(std::move(impl)) {}

563

564

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<Graph> graph, const ModelOptions& modelOptions)

565

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph), modelOptions)) {}

566

567

IOptimizedNetwork::~IOptimizedNetwork() = default;

568

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

569

void IOptimizedNetwork::Destroy(IOptimizedNetwork* network)

570

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

571

delete network;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

572

}

573

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

574

Status IOptimizedNetwork::PrintGraph()

575

{

576

return pOptimizedNetworkImpl->PrintGraph();

577

}

578

579

Status IOptimizedNetwork::SerializeToDot(std::ostream& stream) const

580

{

581

return pOptimizedNetworkImpl->SerializeToDot(stream);

582

}

583

584

profiling::ProfilingGuid IOptimizedNetwork::GetGuid() const

585

{

586

return pOptimizedNetworkImpl->GetGuid();

587

}

588

589

Status OptimizedNetworkImpl::PrintGraph()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

590

{

591

m_Graph->Print();

592

return Status::Success;

593

}

594

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

595

Status OptimizedNetworkImpl::SerializeToDot(std::ostream& stream) const

surmeh01

bceff2f

2018-03-29 16:29:27 +0100

[diff] [blame]

596

{

597

return m_Graph->SerializeToDot(stream);

598

}

599

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

600

void ReportError(const std::string& errorMessage,

601

Optional<std::vector<std::string>&> errorMessages)

602

{

603

std::stringstream fullErrorMessage;

604

fullErrorMessage << "ERROR: " << errorMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

605

ARMNN_LOG(warning) << fullErrorMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

606

if (errorMessages)

607

{

608

errorMessages.value().push_back(fullErrorMessage.str());

}

}

void ReportWarning(const std::string& warningMessage,

613

Optional<std::vector<std::string>&> warningMessages)

614

{

615

std::stringstream fullWarningMessage;

616

fullWarningMessage << "WARNING: " << warningMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

617

ARMNN_LOG(warning) << fullWarningMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

618

if (warningMessages)

619

{

620

warningMessages.value().push_back(fullWarningMessage.str());

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

624

OptimizationResult ReturnWithError(OptimizationResult res,

625

const Layer* layer,

626

const BackendSettings& backendSettings,

627

Optional<std::vector<std::string>&> errMessages)

628

{

629

std::stringstream failureMsg;

630

failureMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

631

<< " is not supported on any preferred backend " << backendSettings.m_PreferredBackends;

632

ReportError(failureMsg.str(), errMessages);

res.m_Error = true;

return res;

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

639

bool CheckScaleSetOnQuantizedType(Layer* layer, Optional<std::vector<std::string>&> errMessages)

640

{

641

bool noErrors = true;

642

unsigned int numOutputs = layer->GetNumOutputSlots();

643

for (unsigned int i = 0; i < numOutputs; i++) {

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

644

OutputSlot& outputSlot = layer->GetOutputSlot(i);

645

TensorInfo info = outputSlot.GetTensorInfo();

Derek Lamberti

f90c56d

2020-01-10 17:14:08 +0000

[diff] [blame]

646

if (DataType::QAsymmU8 == info.GetDataType()) {

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

647

if (0.f == info.GetQuantizationScale()) {

648

noErrors = false;

649

std::stringstream ss;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

650

ss << "output " << i << " of layer " << GetLayerTypeAsCString(layer->GetType())

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

651

<< " (" << layer->GetNameStr() << ") is of type"

652

<< " Quantized 8 bit but its scale parameter has not been set";

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

653

ReportError(ss.str(), errMessages);

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

654

}

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

655

// Softmax under QuantisedAsymm8 must always be scale (1.0f/256.0f) and offset 0

656

if ((info.GetQuantizationScale() != (1.0f / 256.0f) ||

657

info.GetQuantizationOffset() != 0) &&

658

layer->GetType() == armnn::LayerType::Softmax)

659

{

660

std::stringstream ss;

661

ss << "Quantization parameters for Softmax layer (Scale: " <<

662

info.GetQuantizationScale() << " and Offset: " << info.GetQuantizationOffset() <<

663

") are incorrect and have been updated to Scale: 0.00390625 and Offset: 0";

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

664

ARMNN_LOG(warning) << ss.str();

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

665

info.SetQuantizationScale((1.0f /256.0f));

666

info.SetQuantizationOffset(0);

667

outputSlot.SetTensorInfo(info);

668

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

}

}

return noErrors;

}

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

674

template <typename LayerT>

675

LayerT* ConvertBf16ToFp32Weight(Layer* l)

676

{

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

677

LayerT* layer = PolymorphicDowncast<LayerT*>(l);

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

678

if ((layer->GetType() == LayerType::Convolution2d || layer->GetType() == LayerType::FullyConnected)

679

&& layer->m_Weight)

680

{

681

const TensorInfo& info = layer->m_Weight->GetTensorInfo();

682

683

if (info.GetDataType() == DataType::BFloat16)

684

{

685

std::vector<float> newValues(info.GetNumElements());

686

687

armnnUtils::FloatingPointConverter::ConvertBFloat16ToFloat32(

Finn Williams

4422cec

2021-03-22 17:51:06 +0000

[diff] [blame]

688

layer->m_Weight->template GetConstTensor<armnn::BFloat16>(), info.GetNumElements(), newValues.data());

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

689

690

TensorInfo newInfo(info.GetShape(), DataType::Float32);

691

ConstTensor newInput(newInfo, newValues);

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

692

layer->m_Weight.reset(new ScopedTensorHandle(newInput));

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

}

}

return layer;

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

698

OptimizationResult AttemptBackendAssignment(BackendSettings& backendSettings,

Graph& graph,

Layer* layer,

BackendId backend,

DataType dataTypeIn,

DataType dataTypeOut,

704

const std::vector<BackendId>& availablePreferredBackends,

705

std::string& reasonIfUnsupported,

706

Optional<std::vector<std::string>&> errMessages)

707

{

708

OptimizationResult result;

709

710

// Helper lambda to compose meaningful error message before returning with error

711

auto ReturnError = [&](const Layer* layer)

712

{

713

return ReturnWithError(result, layer, backendSettings, errMessages);

714

};

715

716

// need to set the compute device on the layer

717

// before we can check if it is supported

718

layer->SetBackendId(backend);

719

if (!IWorkloadFactory::IsLayerSupported(*layer, EmptyOptional(), reasonIfUnsupported))

720

{

721

if (dataTypeIn == DataType::Float16 || dataTypeOut == DataType::Float16)

722

{

723

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

724

&& layer->GetType() != LayerType::ConvertFp32ToFp16

725

&& layer->GetType() != LayerType::ConvertFp16ToFp32)

726

{

Jan Eilers

0c0019c

2021-08-20 16:42:58 +0100

[diff] [blame]

727

auto ConstantLayerFromFp16ToFp32 = [](Layer& layer)

728

{

729

if (layer.GetType() == LayerType::Constant)

730

{

731

ConstantLayer* constantLayer = PolymorphicDowncast<ConstantLayer*>(&layer);

732

733

auto& info = constantLayer->m_LayerOutput->GetTensorInfo();

734

735

if (info.GetDataType() == DataType::Float16)

736

{

737

std::vector<float> newValues(info.GetNumElements());

738

739

armnnUtils::FloatingPointConverter::ConvertFloat16To32(

740

constantLayer->m_LayerOutput->GetConstTensor<Half>(),

741

info.GetNumElements(),

742

newValues.data());

743

744

TensorInfo newInfo(info);

745

newInfo.SetDataType(DataType::Float32);

746

ConstTensor newInput(newInfo, newValues);

747

constantLayer->m_LayerOutput.reset(new ScopedTensorHandle(newInput));

748

749

layer.GetOutputSlot(0).SetTensorInfo(newInfo);

}

}

};

bool checkType = false;

755

756

for (auto inputSlot : layer->GetInputSlots())

757

{

758

auto connectedOutputSlot = inputSlot.GetConnectedOutputSlot();

759

if (connectedOutputSlot->GetOwningLayer().GetType() == LayerType::Constant)

760

{

761

if (connectedOutputSlot->GetNumConnections() == 1)

762

{

763

checkType = true;

764

ConstantLayerFromFp16ToFp32(connectedOutputSlot->GetOwningLayer());

}

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

769

// Insert FP16 -> FP32 conversion layer before current layer

770

std::vector<ConvertFp16ToFp32Layer*> convertFp16ToFp32Layers;

771

if (dataTypeIn == DataType::Float16)

772

{

773

convertFp16ToFp32Layers =

Jan Eilers

0c0019c

2021-08-20 16:42:58 +0100

[diff] [blame]

774

InsertConvertFp16ToFp32LayersBefore(graph, *layer, checkType);

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

775

}

776

777

// Insert FP32 -> FP16 conversion layer after current layer

778

std::vector<ConvertFp32ToFp16Layer*> convertFp32ToFp16Layers;

779

if (dataTypeOut == DataType::Float16)

780

{

781

convertFp32ToFp16Layers =

782

InsertConvertFp32ToFp16LayersAfter(graph, *layer);

783

}

784

785

// Assign a supported backend to the newly introduced conversion layers

786

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

787

{

788

bool supportedBackendFound = false;

789

std::string reasonIfUnsupported;

790

791

// Try preferred backend first

792

layer->SetBackendId(preferredBackend);

793

if (IWorkloadFactory::IsLayerSupported(*layer,

794

EmptyOptional(),

795

reasonIfUnsupported))

796

{

797

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

802

{

803

// Skip preferred backend (we already determined that it is not supported)

804

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

810

if (IWorkloadFactory::IsLayerSupported(*layer,

811

EmptyOptional(),

812

reasonIfUnsupported))

813

{

814

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

821

};

822

823

for (ConvertFp16ToFp32Layer* convertLayer : convertFp16ToFp32Layers)

824

{

825

if (!AssignFirstSupportedBackend(convertLayer, backend))

826

{

827

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToFp16Layer* convertLayer : convertFp32ToFp16Layers)

832

{

833

if (!AssignFirstSupportedBackend(convertLayer, backend))

834

{

835

return ReturnError(convertLayer);

}

}

return result;

}

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

842

else if (dataTypeIn == DataType::BFloat16 || dataTypeOut == DataType::BFloat16)

843

{

844

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

845

&& layer->GetType() != LayerType::ConvertFp32ToBf16

846

&& layer->GetType() != LayerType::ConvertBf16ToFp32)

847

{

848

// Insert BF16 -> FP32 conversion layer before current layer

849

std::vector<ConvertBf16ToFp32Layer*> convertBf16ToFp32Layers;

850

if (dataTypeIn == DataType::BFloat16)

851

{

852

convertBf16ToFp32Layers =

853

InsertConvertBf16ToFp32LayersBefore(graph, *layer);

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

854

if (layer->GetType() == LayerType::Convolution2d)

855

{

856

ConvertBf16ToFp32Weight<Convolution2dLayer>(layer);

857

}

858

else if (layer->GetType() == LayerType::FullyConnected)

859

{

860

ConvertBf16ToFp32Weight<FullyConnectedLayer>(layer);

861

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

862

}

863

864

// Insert FP32 -> BF16 conversion layer after current layer

865

std::vector<ConvertFp32ToBf16Layer*> convertFp32ToBf16Layers;

866

if (dataTypeOut == DataType::BFloat16)

867

{

868

convertFp32ToBf16Layers =

869

InsertConvertFp32ToBf16LayersAfter(graph, *layer);

870

}

871

872

// Assign a supported backend to the newly introduced conversion layers

873

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

874

{

875

bool supportedBackendFound = false;

876

std::string reasonIfUnsupported;

877

878

// Try preferred backend first

879

layer->SetBackendId(preferredBackend);

880

if (IWorkloadFactory::IsLayerSupported(*layer,

881

EmptyOptional(),

882

reasonIfUnsupported))

883

{

884

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

889

{

890

// Skip preferred backend (we already determined that it is not supported)

891

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

897

if (IWorkloadFactory::IsLayerSupported(*layer,

898

EmptyOptional(),

899

reasonIfUnsupported))

900

{

901

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

908

};

909

910

for (ConvertBf16ToFp32Layer* convertLayer : convertBf16ToFp32Layers)

911

{

912

if (!AssignFirstSupportedBackend(convertLayer, backend))

913

{

914

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToBf16Layer* convertLayer : convertFp32ToBf16Layers)

919

{

920

if (!AssignFirstSupportedBackend(convertLayer, backend))

921

{

922

return ReturnError(convertLayer);

}

}

return result;

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

930

std::stringstream warningMsg;

931

warningMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

932

<< " is not supported on requested backend " << layer->GetBackendId().Get()

933

<< " for input data type " << GetDataTypeName(dataTypeIn)

934

<< " and output data type " << GetDataTypeName(dataTypeOut)

935

<< " (reason: " << reasonIfUnsupported

936

<< "), falling back to the next backend.";

937

ReportWarning(warningMsg.str(), errMessages);

938

939

return OptimizationResult(true, false);

}

else

{

return result;

}

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

948

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

949

BackendSettings& backendSettings,

950

Graph::Iterator& firstLayer,

951

Graph::Iterator& lastLayer,

952

Optional<std::vector<std::string>&> errMessages)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

953

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

954

OptimizationResult result;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

955

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

956

// Helper lambda to compose meaningful error message before returning with error

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

957

auto ReturnError = [&](const Layer* layer)

958

{

959

return ReturnWithError(result, layer, backendSettings, errMessages);

960

};

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

961

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

962

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

963

auto availablePreferredBackends = backendSettings.GetAvailablePreferredBackends();

964

if (availablePreferredBackends.empty())

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

965

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

966

std::stringstream failureMsg;

967

failureMsg << "No preferred backends are available";

968

ReportError(failureMsg.str(), errMessages);

969

970

result.m_Error = true;

return result;

}

for (auto it = firstLayer; it != lastLayer; ++it)

975

{

976

auto layer = *it;

Aron Virginas-Tar

87972be

2019-11-13 15:16:28 +0000

[diff] [blame]

977

978

DataType dataTypeIn = layer->GetNumInputSlots() == 0 ? DataType::Float32 :

979

layer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo().GetDataType();

980

DataType dataTypeOut = layer->GetNumOutputSlots() == 0 ? DataType::Float32 :

981

layer->GetOutputSlot(0).GetTensorInfo().GetDataType();

982

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

983

std::string reasonIfUnsupported;

984

bool found = false;

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

985

if (!CheckScaleSetOnQuantizedType(layer, errMessages))

986

{

987

// don't bomb immediately, find all the quantized outputs

988

// which haven't had a scale set and report them all back.

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

989

result.m_Error = true;

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

990

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

991

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

992

// First try assign layer to hint backend

993

if (layer->GetBackendHint().has_value() &&

994

backendSettings.IsBackendSupported(layer->GetBackendHint().value()) &&

995

AttemptBackendAssignment(backendSettings,

996

optNetObjPtr->GetGraph(),

997

layer,

998

layer->GetBackendHint().value(),

999

dataTypeIn,

1000

dataTypeOut,

1001

availablePreferredBackends,

1002

reasonIfUnsupported,

1003

errMessages).IsOk())

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1004

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

1005

found = true;

1006

backendSettings.m_SelectedBackends.insert(layer->GetBackendHint().value());

}

else

{

// Try assign layer to prefered list of backends

1011

for (const auto& backend : availablePreferredBackends)

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1012

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

1013

if (layer->GetBackendHint().has_value() &&

1014

layer->GetBackendHint().value() == backend)

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1015

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

1016

continue; //Don't re-test the backend hint

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1017

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

1018

1019

OptimizationResult res = AttemptBackendAssignment(backendSettings,

1020

optNetObjPtr->GetGraph(),

layer,

backend,

dataTypeIn,

dataTypeOut,

availablePreferredBackends,

reasonIfUnsupported,

errMessages);

if (res.IsOk())

{

found = true;

backendSettings.m_SelectedBackends.insert(backend);

1033

break;

1034

}

1035

else if (res.IsError())

1036

{

1037

return res; // Cannot continue.

1038

// Note: we don't need to log the error as it would already

1039

// be logged in AttemptBackendAssignment().

1040

}

1041

else

1042

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1043

ARMNN_ASSERT_MSG(res.IsWarningOnly(), "OptimizationResult in unexpected state.");

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

1044

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

}

}

// If the layer is unsupported by any devices, log and return a null network.

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1049

if (!found)

1050

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1051

// NOTE: if the layer is not an operation queue type AND we have not got CpuRef as a

1052

// fallback we should set the compute device on the layer to CpuRef (these are not

1053

// available as accelerated operations, or are only available under certain

1054

// conditions, currently they comprise MemCopy, Constant, Permute)

1055

armnn::LayerType layerType = layer->GetType();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1056

if (!backendSettings.IsCpuRefUsed() && (layerType == armnn::LayerType::MemCopy ||

1057

layerType == armnn::LayerType::Constant ||

1058

layerType == armnn::LayerType::Permute))

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1059

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1060

BackendId cpuBackendId(armnn::Compute::CpuRef);

1061

layer->SetBackendId(cpuBackendId);

1062

backendSettings.m_SelectedBackends.insert(cpuBackendId);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1063

}

1064

else

1065

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

1066

return ReturnError(layer);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1067

}

1068

}

1069

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

return result;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1074

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1075

BackendSettings& backendSettings,

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1076

SubgraphView& subgraph,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1077

Optional<std::vector<std::string>&> errMessages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1078

{

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1079

Graph::Iterator firstLayer = subgraph.begin();

1080

Graph::Iterator lastLayer = subgraph.end();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1081

return AssignBackends(optNetObjPtr,

backendSettings,

firstLayer,

lastLayer,

errMessages);

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1088

BackendsMap CreateSupportedBackends(TensorHandleFactoryRegistry& handleFactoryRegistry,

1089

BackendSettings& backendSettings)

1090

{

1091

BackendsMap backends;

1092

auto const& backendRegistry = BackendRegistryInstance();

1093

for (auto&& selectedBackend : backendSettings.m_SupportedBackends)

1094

{

1095

auto backendFactory = backendRegistry.GetFactory(selectedBackend);

1096

auto backendObjPtr = backendFactory();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1097

ARMNN_ASSERT(backendObjPtr);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1098

1099

backendObjPtr->RegisterTensorHandleFactories(handleFactoryRegistry);

1100

1101

backends[backendObjPtr->GetId()] = std::move(backendObjPtr);

}

return backends;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1107

OptimizationResult ApplyBackendOptimizations(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1108

BackendSettings& backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1109

BackendsMap& backends,

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1110

const ModelOptions& modelOptions,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1111

Optional<std::vector<std::string>&> errMessages)

1112

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1113

ARMNN_ASSERT(optNetObjPtr);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1114

1115

OptimizationResult result;

1116

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1117

// Get the optimized graph

1118

Graph& optGraph = optNetObjPtr->GetGraph();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1119

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1120

// Run backend specific optimizations

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1121

for (auto&& selectedBackend : backendSettings.m_SelectedBackends)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1122

{

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1123

auto backendObjPtr = backends.find(selectedBackend)->second.get();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1124

ARMNN_ASSERT(backendObjPtr);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1125

1126

// Select sub-graphs based on backend

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1127

SubgraphViewSelector::Subgraphs subgraphs =

Rob Hughes

65c3226

2019-07-23 15:33:39 +0100

[diff] [blame]

1128

SubgraphViewSelector::SelectSubgraphs(optGraph,

Matteo Martincigh

602af09

2019-05-01 10:31:27 +0100

[diff] [blame]

1129

// Select layers assigned to the requested backend

1130

[&backendObjPtr](const Layer& layer)

1131

{

1132

return layer.GetType() != LayerType::Input &&

1133

layer.GetType() != LayerType::Output &&

1134

layer.GetBackendId() == backendObjPtr->GetId();

1135

});

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1136

if (subgraphs.empty())

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1137

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1138

// No sub-graphs found, try with next selected backend

1139

continue;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1140

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1141

1142

// Try to optimize each sub-graph

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1143

for (auto& subgraph : subgraphs)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1144

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1145

// Try to optimize the current sub-graph

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1146

OptimizationViews optimizationViews = backendObjPtr->OptimizeSubgraphView(*subgraph, modelOptions);

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1147

ARMNN_ASSERT(optimizationViews.Validate(*subgraph));

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1148

1149

// Optimization attempted, check the resulting optimized sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1150

for (auto& substitution : optimizationViews.GetSubstitutions())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1151

{

1152

// Sub-graph optimized, substitute the sub-graph with the new optimized one in the main optimized graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1153

SubgraphView& replacementSubgraph = substitution.m_ReplacementSubgraph;

1154

SubgraphView& substitutableSubgraph = substitution.m_SubstitutableSubgraph;

1155

optGraph.SubstituteSubgraph(substitutableSubgraph, replacementSubgraph);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1156

1157

// Assign the current backend to the optimized sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1158

std::for_each(replacementSubgraph.begin(), replacementSubgraph.end(), [&selectedBackend](Layer* l)

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1159

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1160

ARMNN_ASSERT(l);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1161

l->SetBackendId(selectedBackend);

1162

});

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1163

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1164

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1165

if (!optimizationViews.GetFailedSubgraphs().empty())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1166

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1167

std::stringstream warningMsg;

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1168

warningMsg << "Some sub-graph(s) failed to optimized on " << backendObjPtr->GetId() << " backend.";

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1169

ReportWarning(warningMsg.str(), errMessages);

1170

1171

// Failed to optimize the given sub-graph, re-assign the sub-graph layers to other available backends

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1172

BackendSettings settingsCopy(backendSettings);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1173

if (!backendObjPtr->GetId().IsCpuRef())

1174

{

1175

// Add the current backend to the list of backends to ignore

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1176

settingsCopy.m_IgnoredBackends.insert(backendObjPtr->GetId());

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1177

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1178

1179

int count=0;

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1180

for (auto& failedSubgraph : optimizationViews.GetFailedSubgraphs())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1181

{

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1182

// An error occurred: the optimization was attempted but not performed, try different backends

1183

std::stringstream subgraphMsg;

1184

subgraphMsg << "Re-assigning backends to " << failedSubgraph.GetLayers().size()

1185

<< " layers inside sub-graph " << count++;

Matteo Martincigh

328d92b

2019-07-04 17:52:55 +0100

[diff] [blame]

1186

ReportWarning(subgraphMsg.str(), errMessages);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1187

1188

OptimizationResult reassignmentResult = AssignBackends(optNetObjPtr,

settingsCopy,

*subgraph,

errMessages);

if (reassignmentResult.m_Error)

1193

{

1194

// Failed to re-assign one of the remaining backends to each layer of the sub-graph

1195

result.m_Error = true;

1196

return result;

1197

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1198

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

}

}

}

return result;

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1206

bool RequiresCopy(ITensorHandleFactory::FactoryId src,

1207

ITensorHandleFactory::FactoryId dst,

1208

TensorHandleFactoryRegistry& registry)

{

if (src != dst)

{

ITensorHandleFactory* srcFactory = registry.GetFactory(src);

1213

ITensorHandleFactory* dstFactory = registry.GetFactory(dst);

1214

Matteo Martincigh

a6539ed

2019-08-27 13:43:32 +0100

[diff] [blame]

1215

if (srcFactory && dstFactory &&

1216

(srcFactory->GetExportFlags() & dstFactory->GetImportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

{

return false;

}

return true;

}

return false;

}

// Find the handle factory for the input layer which results in fewest required copies.

1226

ITensorHandleFactory::FactoryId CalculateSlotOptionForInput(BackendsMap& backends,

1227

OutputSlot& slot,

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1228

TensorHandleFactoryRegistry& registry,

1229

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1230

{

1231

Layer& layer = slot.GetOwningLayer();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1232

ARMNN_ASSERT(layer.GetType() == LayerType::Input);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1233

1234

// Explicitly select the tensorhandle factory for InputLayer because the rules for it are slightly different. It

1235

// doesn't matter which backend it is assigned to because they all use the same implementation, which

1236

// requires Map/Unmap support. This means that, so long as the handle type supports map/unmap semantics, we can

1237

// select a factory with maximum compatibility with the layers connected to the InputLayer.

1238

1239

// First ensure the from backends can support the TensorHandeAPI

1240

auto frmBackend = backends.find(layer.GetBackendId());

1241

if (frmBackend == backends.end() ||

1242

!frmBackend->second->SupportsTensorAllocatorAPI())

1243

{

1244

return ITensorHandleFactory::LegacyFactoryId;

1245

}

1246

1247

// Go through all connections to the output slot and determine the TensorHandleFactory which results in the

1248

// fewest copies.

1249

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

1250

int topScore = 0;

1251

ITensorHandleFactory::FactoryId topChoice = ITensorHandleFactory::LegacyFactoryId;

1252

1253

for (auto&& connection : slot.GetConnections())

1254

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1255

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1256

const Layer& connectedLayer = connection->GetOwningLayer();

1257

1258

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1259

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1260

1261

if (!toBackend->second.get()->SupportsTensorAllocatorAPI())

1262

{

1263

// The destination backend does not support the tensor allocator API, move to the next one

continue;

}

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1268

for (auto&& dst : dstPrefs)

1269

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1270

// Input layers use the mem copy workload or import, so the selected factory must

1271

// support either the map/unmap API or Import API

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1272

ITensorHandleFactory* factory = registry.GetFactory(dst);

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1273

if (importEnabled && factory->GetImportFlags() == 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1274

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1275

continue;

1276

}

1277

else if (!importEnabled && !factory->SupportsMapUnmap())

1278

{

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

continue;

}

auto it = factoryScores.find(dst);

1283

if (it == factoryScores.end())

1284

{

1285

// Add new score to the table

1286

factoryScores[dst] = 0;

1287

if (topChoice == ITensorHandleFactory::LegacyFactoryId)

{

topChoice = dst;

}

}

else

{

// Increase the score

1295

factoryScores[dst]++;

1296

1297

// Track the best option

1298

if (factoryScores[dst] > topScore)

1299

{

1300

topScore = factoryScores[dst];

topChoice = dst;

}

}

}

}

return topChoice;

}

// Find the handle factory for the output layer which results in fewest required copies.

1311

ITensorHandleFactory::FactoryId CalculateSlotOptionForOutput(BackendsMap& backends,

1312

OutputSlot& slot,

1313

TensorHandleFactoryRegistry& registry)

1314

{

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

1315

IgnoreUnused(backends, slot, registry);

Derek Lamberti

94a88d2

2019-12-10 21:12:59 +0000

[diff] [blame]

1316

return ITensorHandleFactory::DeferredFactoryId;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1317

}

1318

1319

// For all handle factories supported on the source backend, we wish to find the one which requires the fewest copies

1320

// when considering all connections.

1321

ITensorHandleFactory::FactoryId CalculateSlotOption(BackendsMap& backends,

1322

OutputSlot& outputSlot,

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1323

TensorHandleFactoryRegistry& registry,

1324

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1325

{

1326

// First ensure the from backends can support the TensorHandeAPI

1327

Layer& layer = outputSlot.GetOwningLayer();

1328

auto frmBackend = backends.find(layer.GetBackendId());

1329

if (frmBackend == backends.end() ||

1330

!frmBackend->second->SupportsTensorAllocatorAPI())

1331

{

1332

return ITensorHandleFactory::LegacyFactoryId;

1333

}

1334

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1335

bool outputConnection = false;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1336

for (auto&& connection : outputSlot.GetConnections())

1337

{

1338

const Layer& connectedLayer = connection->GetOwningLayer();

1339

if (connectedLayer.GetType() == LayerType::Output)

1340

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1341

outputConnection = true;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

IBackendInternal* srcBackend = frmBackend->second.get();

1346

auto srcPrefs = srcBackend->GetHandleFactoryPreferences();

1347

1348

// Initialize the scores

1349

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

1350

for (auto&& pref : srcPrefs)

1351

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1352

if (importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1353

{

1354

ITensorHandleFactory* factory = registry.GetFactory(pref);

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1355

if (outputConnection)

1356

{

1357

// Check if this is fallback case

1358

bool fallbackConnection = false;

1359

for (auto&& inputSlot : layer.GetInputSlots())

1360

{

1361

if (inputSlot.GetConnectedOutputSlot()->GetOwningLayer().GetBackendId() != layer.GetBackendId())

1362

{

1363

fallbackConnection = true;

1364

}

1365

}

1366

if (fallbackConnection)

1367

{

1368

auto factoryCap = factory->GetCapabilities(&layer, &layer, CapabilityClass::FallbackImportDisabled);

1369

// Cannot use factory import if fallback import is not supported.

1370

if (!factoryCap.empty())

{

continue;

}

}

else if (factory->GetExportFlags() == 0)

{

continue;

}

}

if (!outputConnection)

1381

{

1382

auto factoryCap = factory->GetCapabilities(&layer, &layer, CapabilityClass::FallbackImportDisabled);

1383

// Cannot use factory import if fallback import is not supported.

1384

if (!factoryCap.empty())

{

continue;

}

}

}

else

{

// Only consider factories that support map/unmap

1394

ITensorHandleFactory* factory = registry.GetFactory(pref);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1395

if (!factory->SupportsMapUnmap())

1396

{

1397

// The current tensor handle factory does not support the map/unmap strategy, move to the next one

continue;

}

}

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1402

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1403

auto it = factoryScores.find(pref);

1404

if (it == factoryScores.end())

1405

{

1406

// Add new score to the table

1407

factoryScores[pref] = 0;

}

}

// Score each handle factory based on how many times it requires copies on the slot connections

1412

for (auto&& connection : outputSlot.GetConnections())

1413

{

1414

const Layer& connectedLayer = connection->GetOwningLayer();

1415

1416

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1417

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1418

1419

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1420

for (auto&& src : srcPrefs)

1421

{

1422

if (factoryScores.find(src) == factoryScores.end()) // Don't consider excluded factories

{

continue;

}

for (auto&& dst : dstPrefs)

1428

{

1429

if (RequiresCopy(src, dst, registry))

1430

{

1431

// Copy avoided, increase the score

1432

factoryScores[src]++;

break;

}

}

}

}

// Find the lowest score

1440

int minScore = std::numeric_limits<int>::max();

1441

for (auto it : factoryScores)

1442

{

1443

minScore = std::min(minScore, it.second);

1444

}

1445

1446

// Collect factories matching the best(lowest) score

1447

std::vector<ITensorHandleFactory::FactoryId> optimalFactories;

1448

for (auto it : factoryScores)

1449

{

1450

if (it.second == minScore)

1451

{

1452

optimalFactories.push_back(it.first);

}

}

// For all compatible Factories matching the best score, find the preferred one for the current layer.

1457

for (auto&& srcPref : srcPrefs)

1458

{

1459

for (auto&& comp : optimalFactories)

{

if (comp == srcPref)

{

return comp;

}

}

}

return ITensorHandleFactory::LegacyFactoryId;

1469

}

1470

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1471

EdgeStrategy CalculateEdgeStrategy(BackendsMap& backends,

1472

ITensorHandleFactory::FactoryId srcFactoryId,

1473

const Layer& layer,

1474

const Layer& connectedLayer,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1475

TensorHandleFactoryRegistry& registry,

1476

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1477

{

1478

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1479

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1480

1481

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1482

1483

// Legacy API check for backward compatibility

1484

if (srcFactoryId == ITensorHandleFactory::LegacyFactoryId || dstPrefs.empty())

1485

{

1486

if (layer.GetBackendId() != connectedLayer.GetBackendId())

1487

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1488

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1489

}

1490

else

1491

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1492

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// TensorHandleFactory API present, so perform more sophisticated strategies.

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1497

// Dst Output layers don't require copy because they use import or map/unmap

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1498

if (connectedLayer.GetType() == LayerType::Output)

1499

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1500

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1501

}

1502

1503

// Search for direct match in prefs

1504

for (auto&& pref : dstPrefs)

1505

{

1506

if (pref == srcFactoryId)

1507

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1508

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// Search for export/import options

1513

ITensorHandleFactory* srcFactory = registry.GetFactory(srcFactoryId);

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1514

if (srcFactory->GetExportFlags() != 0 && importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1515

{

1516

for (auto&& pref : dstPrefs)

1517

{

1518

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1519

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1520

// Handles cases when a destPref is not listed in TensorHandleFactoryRegistry

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1521

if (!dstFactory) {

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1522

continue;

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1523

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1524

if ((dstFactory->GetImportFlags() & srcFactory->GetExportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1525

{

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1526

auto srcCapability = srcFactory->GetCapabilities(&layer, &layer, CapabilityClass::PaddingRequired);

1527

auto dstCapability = dstFactory->GetCapabilities(&connectedLayer,

1528

&connectedLayer,

1529

CapabilityClass::PaddingRequired);

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1530

auto srcFallback = srcFactory->GetCapabilities(&layer, &layer, CapabilityClass::FallbackImportDisabled);

1531

auto dstFallback = dstFactory->GetCapabilities(&connectedLayer,

1532

&connectedLayer,

1533

CapabilityClass::FallbackImportDisabled);

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1534

// Do not require memory copy if the source and destination do not require padding.

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1535

if (srcCapability.empty() && dstCapability.empty() && srcFallback.empty() && dstFallback.empty())

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1536

{

1537

return EdgeStrategy::ExportToTarget;

1538

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

// Search for copy options via map/unmap

1544

if (srcFactory->SupportsMapUnmap())

1545

{

1546

for (auto&& pref : dstPrefs)

1547

{

1548

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1549

if (dstFactory && dstFactory->SupportsMapUnmap())

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1550

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1551

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1556

return EdgeStrategy::Undefined;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1557

}

1558

1559

// Select the TensorHandleFactories and the corresponding memory strategy

1560

OptimizationResult SelectTensorHandleStrategy(Graph& optGraph,

1561

BackendsMap& backends,

1562

TensorHandleFactoryRegistry& registry,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1563

bool importEnabled,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1564

Optional<std::vector<std::string>&> errMessages)

1565

{

1566

OptimizationResult result;

1567

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1568

optGraph.ForEachLayer([&backends, &registry, &result, &errMessages, importEnabled](Layer* layer)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1569

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1570

ARMNN_ASSERT(layer);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1571

1572

// Lets make sure the backend is in our list of supported backends. Something went wrong during backend

1573

// assignment if this check fails

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1574

ARMNN_ASSERT(backends.find(layer->GetBackendId()) != backends.end());

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1575

1576

// Check each output separately

1577

for (unsigned int slotIdx = 0; slotIdx < layer->GetNumOutputSlots(); slotIdx++)

1578

{

1579

OutputSlot& outputSlot = layer->GetOutputSlot(slotIdx);

1580

1581

ITensorHandleFactory::FactoryId slotOption = ITensorHandleFactory::LegacyFactoryId;

1582

1583

// Calculate the factory to use which results in the fewest copies being made.

1584

switch(layer->GetType())

1585

{

1586

case LayerType::Input:

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1587

slotOption = CalculateSlotOptionForInput(backends, outputSlot, registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1588

break;

1589

case LayerType::Output:

1590

slotOption = CalculateSlotOptionForOutput(backends, outputSlot, registry);

1591

break;

1592

default:

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1593

slotOption = CalculateSlotOption(backends, outputSlot, registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1594

break;

1595

}

1596

outputSlot.SetTensorHandleFactory(slotOption);

1597

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1598

// Now determine the "best" edge strategy for each connection given the slotOption.

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1599

unsigned int connectionIdx = 0;

1600

for (auto&& connection : outputSlot.GetConnections())

1601

{

1602

const Layer& connectedLayer = connection->GetOwningLayer();

1603

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1604

EdgeStrategy strategy = CalculateEdgeStrategy(backends, slotOption, *layer, connectedLayer,

1605

registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1606

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1607

if (strategy == EdgeStrategy::Undefined)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1608

{

1609

result.m_Error = true;

1610

if (errMessages)

1611

{

1612

errMessages.value().emplace_back("Could not find valid strategy required for compatibility"

1613

" between backends.");

}

return;

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1618

outputSlot.SetEdgeStrategy(connectionIdx, strategy);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

connectionIdx++;

}

}

});

return result;

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1628

IOptimizedNetworkPtr Optimize(const INetwork& inNetwork,

1629

const std::vector<BackendId>& backendPreferences,

1630

const IDeviceSpec& deviceSpec,

1631

const OptimizerOptions& options,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1632

Optional<std::vector<std::string>&> messages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1633

{

1634

if (backendPreferences.empty())

1635

{

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1636

throw InvalidArgumentException("Invoked Optimize with no backends specified");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1637

}

1638

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1639

if (options.m_ReduceFp32ToFp16 && options.m_ReduceFp32ToBf16)

1640

{

1641

throw InvalidArgumentException("BFloat16 and Float16 optimization cannot be enabled at the same time.");

1642

}

1643

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1644

std::unique_ptr<Graph> graph = std::make_unique<Graph>(inNetwork.pNetworkImpl->GetGraph());

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1645

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1646

auto optNet = IOptimizedNetworkPtr(new IOptimizedNetwork(std::move(graph), options.m_ModelOptions),

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

1647

&IOptimizedNetwork::Destroy);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1648

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1649

IOptimizedNetwork* optNetObjPtr = optNet.get();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1650

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1651

// Get the optimized graph

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1652

Graph& optGraph = optNetObjPtr->pOptimizedNetworkImpl->GetGraph();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1653

Finn Williams

d218d98

2021-08-09 13:00:08 +0100

[diff] [blame]

1654

if(options.m_shapeInferenceMethod == ShapeInferenceMethod::InferAndValidate)

1655

{

1656

// Infer the tensor infos for all output slots. Throws an exception on failure

1657

optGraph.InferTensorInfos();

1658

}

Finn Williams

84e025a

2021-08-05 17:29:32 +0100

[diff] [blame]

1659

Narumol Prangnawarat

16f82f9

2020-09-14 16:12:44 +0100

[diff] [blame]

1660

// Perform AddBroadcastReshapeLayer optimisation

1661

using namespace optimizations;

1662

Optimizer::Pass(optGraph, MakeOptimizations(AddBroadcastReshapeLayer()));

1663

Finn Williams

d218d98

2021-08-09 13:00:08 +0100

[diff] [blame]

1664

if(options.m_shapeInferenceMethod == ShapeInferenceMethod::ValidateOnly)

1665

{

1666

// Validate the tensor infos for all output slots. Throws an exception on failure

1667

optGraph.InferTensorInfos();

1668

}

1669

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1670

// Perform optimisation passes

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1671

Optimizer::Pass(optGraph, MakeOptimizations(SquashEqualPermuteSiblings(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1672

SquashEqualTransposeSiblings(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1673

SquashEqualReshapeSiblings(),

1674

OptimizeInversePermutes(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1675

OptimizeInverseTransposes(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1676

MovePermuteUp(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1677

MoveTransposeUp(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1678

PermuteAsReshape(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1679

TransposeAsReshape(),

Nina Drozd

861985f

2019-04-18 14:48:51 +0100

[diff] [blame]

1680

OptimizeConsecutiveReshapes(),

Matthew Sloyan

33f8987

2021-06-30 10:20:17 +0100

[diff] [blame]

1681

RedirectMembersToConstantInputs(),

Rob Hughes

3a7d3a7

2019-09-24 16:59:56 +0100

[diff] [blame]

1682

FoldPadIntoConvolution2d(),

Teresa Charlin

5786eb7

2021-05-21 16:29:45 +0100

[diff] [blame]

1683

FoldPadIntoDepthwiseConvolution2d(),

Diego Lopez Recas

fe95d72

2021-03-19 12:40:16 +0000

[diff] [blame]

1684

FoldPadIntoPooling2d(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1685

PermuteAndBatchToSpaceAsDepthToSpace(),

Teresa Charlin

06e0300

2020-10-15 13:16:07 +0100

[diff] [blame]

1686

TransposeAndBatchToSpaceAsDepthToSpace(),

Mike Kelly

90231b8

2020-11-05 15:44:56 +0000

[diff] [blame]

1687

FuseBatchNormIntoConvolution2DFloat32(),

1688

FuseBatchNormIntoConvolution2DFloat16(),

1689

FuseBatchNormIntoDepthwiseConvolution2DFloat32(),

1690

FuseBatchNormIntoDepthwiseConvolution2DFloat16()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1691

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1692

// If Fp32 to Fp16 optimization is set convert Fp32 network to Fp16

1693

if (options.m_ReduceFp32ToFp16)

1694

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1695

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToFp16Converter()));

Derek Lamberti

dd6804b

2019-11-27 09:29:57 +0000

[diff] [blame]

1696

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1697

}

1698

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1699

// If Fp32 to Bf16 optimization is set convert Fp32 network to Bf16

Narumol Prangnawarat

57ef008

2020-03-26 09:20:43 +0000

[diff] [blame]

1700

// Convert input of Convolution2d and FullyConnected from Fp32 to Bf16

1701

// Only Constant weight of Convolution2d and FullyConnected are converted from Fp32 to Bf16

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1702

if (options.m_ReduceFp32ToBf16)

1703

{

1704

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToBf16Converter()));

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1705

}

1706

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1707

// Initialize backend settings

1708

BackendSettings backendSettings(backendPreferences, deviceSpec);

1709

if (backendSettings.GetAvailablePreferredBackends().empty())

1710

{

1711

std::stringstream failureMsg;

1712

failureMsg << "None of the preferred backends " << backendPreferences

1713

<< " are supported. Current platform provides " << backendSettings.m_SupportedBackends;

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1714

ReportError(failureMsg.str(), messages);

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1715

throw InvalidArgumentException(failureMsg.str());

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1716

}

1717

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1718

// Create a map to temporarily hold initialized backend objects

1719

TensorHandleFactoryRegistry tensorHandleFactoryRegistry;

1720

BackendsMap backends = CreateSupportedBackends(tensorHandleFactoryRegistry, backendSettings);

1721

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1722

// Assign an available backend to each layer

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1723

Graph::Iterator firstLayer = optGraph.begin();

1724

Graph::Iterator lastLayer = optGraph.end();

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1725

OptimizationResult assignBackendsResult = AssignBackends(optNetObjPtr->pOptimizedNetworkImpl.get(),

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1726

backendSettings,

1727

firstLayer,

1728

lastLayer,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1729

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1730

if (assignBackendsResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1731

{

1732

// Failed to assign a backend to each layer

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1733

throw InvalidArgumentException("Failed to assign a backend to each layer");

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

1734

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1735

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1736

Optimizer::Pass(optGraph, MakeOptimizations(OptimizeInverseConversionsFp16(),

1737

OptimizeInverseConversionsFp32()));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1738

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1739

// Apply the backend-specific optimizations

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1740

OptimizationResult backendOptimizationResult = ApplyBackendOptimizations(optNetObjPtr->pOptimizedNetworkImpl.get(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1741

backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1742

backends,

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1743

options.m_ModelOptions,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1744

messages);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1745

if (backendOptimizationResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1746

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1747

// Failed to apply the backend-specific optimizations

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1748

throw InvalidArgumentException("Failed to apply the backend-specific optimizations");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1749

}

1750

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1751

// If the debug flag is set, then insert a DebugLayer after each layer

1752

// Doing this after applying the backend optimizations as they might have changed some layers

1753

if (options.m_Debug)

1754

{

1755

Optimizer::Pass(optGraph, MakeOptimizations(InsertDebugLayer()));

1756

}

1757

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1758

// Calculate the compatibility strategies for tensor handles

1759

OptimizationResult strategyResult = SelectTensorHandleStrategy(optGraph,

1760

backends,

1761

tensorHandleFactoryRegistry,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1762

options.m_ImportEnabled,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1763

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1764

if (strategyResult.m_Error)

1765

{

1766

// Failed to apply the backend-specific optimizations

1767

return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);

1768

}

1769

1770

// Based on the tensor handle strategy determined above, insert copy layers where required.

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1771

optGraph.AddCompatibilityLayers(backends, tensorHandleFactoryRegistry);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1772

1773

// Convert constants

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1774

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

1775

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsHalfToFloat()));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1776

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1777

// Run backend specific optimizations (deprecated)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1778

for (auto&& chosenBackend : backendSettings.m_SelectedBackends)

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1779

{

1780

auto factoryFun = BackendRegistryInstance().GetFactory(chosenBackend);

1781

auto backendPtr = factoryFun();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1782

ARMNN_ASSERT(backendPtr.get() != nullptr);

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1783

Matteo Martincigh

ed73504

2019-05-22 09:42:43 +0100

[diff] [blame]

1784

ARMNN_NO_DEPRECATE_WARN_BEGIN

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1785

auto backendSpecificOptimizations = backendPtr->GetOptimizations();

Matteo Martincigh

ed73504

2019-05-22 09:42:43 +0100

[diff] [blame]

1786

ARMNN_NO_DEPRECATE_WARN_END

1787

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1788

if (!backendSpecificOptimizations.empty())

1789

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1790

Optimizer::Pass(optNetObjPtr->pOptimizedNetworkImpl->GetGraph(), backendSpecificOptimizations);

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

}

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1794

return optNet;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1795

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1796

bool NetworkImpl::GetShapeInferenceMethod()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1797

{

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

1798

if (m_NetworkOptions.size() > 0 && m_NetworkOptions[0].GetBackendId().Get() == "ShapeInferenceMethod")

1799

{

1800

return m_NetworkOptions[0].GetOption(0).GetValue().AsBool();

1801

}

1802

1803

return false;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1804

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1805

NetworkImpl::NetworkImpl(NetworkOptions networkOptions)

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

1806

: m_NetworkOptions(networkOptions),

1807

m_Graph(std::make_unique<Graph>(GetShapeInferenceMethod()))

1808

{}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1809

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1810

NetworkImpl::~NetworkImpl()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1814

Status NetworkImpl::PrintGraph()

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

1815

{

1816

m_Graph->Print();

1817

return Status::Success;

1818

}

1819

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1820

IConnectableLayer* NetworkImpl::AddInputLayer(LayerBindingId id, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1821

{

1822

return m_Graph->AddLayer<InputLayer>(id, name);

1823

}

1824

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1825

IConnectableLayer* NetworkImpl::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

Éanna Ó Catháin

4e1e136

2018-11-12 11:36:34 +0000

[diff] [blame]

1826

const char* name)

1827

{

1828

return m_Graph->AddLayer<BatchToSpaceNdLayer>(batchToSpaceNdDescriptor, name);

1829

}

1830

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

1831

IConnectableLayer* NetworkImpl::AddCastLayer(const char* name)

1832

{

1833

return m_Graph->AddLayer<CastLayer>(name);

1834

}

Simon Obute

51f6777

2021-09-03 15:50:13 +0100

[diff] [blame]

1835

IConnectableLayer* NetworkImpl::AddChannelShuffleLayer(const ChannelShuffleDescriptor& channelShuffleDescriptor,

1836

const char* name)

1837

{

1838

return m_Graph->AddLayer<ChannelShuffleLayer>(channelShuffleDescriptor, name);

1839

}

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

1840

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1841

IConnectableLayer* NetworkImpl::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

1842

const char* name)

1843

{

1844

return m_Graph->AddLayer<ComparisonLayer>(comparisonDescriptor, name);

1845

}

1846

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1847

IConnectableLayer* NetworkImpl::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

1848

const char* name)

1849

{

1850

return m_Graph->AddLayer<ElementwiseUnaryLayer>(elementwiseUnaryDescriptor, name);

1851

}

1852

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1853

IConnectableLayer* NetworkImpl::AddFillLayer(const FillDescriptor& fillDescriptor,

Ryan OShea

ec6c680

2020-06-05 17:17:06 +0100

[diff] [blame]

1854

const char* name)

1855

{

1856

return m_Graph->AddLayer<FillLayer>(fillDescriptor, name);

1857

}

1858

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1859

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

1860

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1861

{

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1862

return m_Graph->AddLayer<FullyConnectedLayer>(fullyConnectedDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1863

}

1864

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1865

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1866

const Optional<ConstTensor>& weights,

1867

const Optional<ConstTensor>& biases,

1868

const char* name)

1869

{

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1870

ConstantLayer* weightsLayer = nullptr;

1871

ConstantLayer* biasLayer = nullptr;

1872

unsigned int numInputs = fullyConnectedDescriptor.GetNumInputs();

1873

1874

// Add a constant layer for weights

1875

if (weights.has_value())

1876

{

1877

weightsLayer = m_Graph->AddLayer<ConstantLayer>("Weights");

1878

weightsLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(weights.value());

Matthew Sloyan

b20d1d4

2021-08-09 15:33:41 +0100

[diff] [blame]

1879

1880

TensorInfo weightsInfo = weightsLayer->m_LayerOutput->GetTensorInfo();

1881

weightsInfo.SetConstant();

1882

1883

weightsLayer->GetOutputSlot(0).SetTensorInfo(weightsInfo);

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1884

}

1885

else if (fullyConnectedDescriptor.m_ConstantWeights)

1886

{

1887

throw InvalidArgumentException("AddFullyConnectedLayer: Constant weights tensor is empty.");

1888

}

1889

1890

// Add a constant layer for biases

1891

if (biases.has_value() && fullyConnectedDescriptor.m_BiasEnabled)

1892

{

1893

biasLayer = m_Graph->AddLayer<ConstantLayer>("Biases");

1894

biasLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(biases.value());

Matthew Sloyan

b20d1d4

2021-08-09 15:33:41 +0100

[diff] [blame]

1895

1896

TensorInfo biasInfo = biasLayer->m_LayerOutput->GetTensorInfo();

1897

biasInfo.SetConstant();

1898

1899

biasLayer->GetOutputSlot(0).SetTensorInfo(biasInfo);

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

}

if (numInputs < 2)

{

throw InvalidArgumentException("AddFullyConnectedLayer: Requires at least 2 input tensors: Input, Weights");

1905

}

1906

1907

auto layer = m_Graph->AddLayer<FullyConnectedLayer>(fullyConnectedDescriptor, name);

if (weightsLayer)

{

// Connect weights layer

1912

weightsLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(1));

1913

}

1914

1915

if ( fullyConnectedDescriptor.m_BiasEnabled && numInputs == 3 )

{

if (biasLayer)

{

// Connect bias layer

1920

biasLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(2));

1921

}

1922

}

1923

else if ( !fullyConnectedDescriptor.m_BiasEnabled && numInputs == 2 )

1924

{

1925

// Bias is disabled

1926

layer->m_Bias = nullptr;

}

else

{

throw InvalidArgumentException(fmt::format(

1931

"AddFullyConnectedLayer: Value mismatch. When bias is enabled in the "

1932

"descriptor the number of inputs is expected to be 3 otherwise 2. "

1933

"BiasEnabled={}, numInputs={}",

1934

fullyConnectedDescriptor.m_BiasEnabled,

numInputs));

}

return layer;

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1939

}

1940

1941

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1942

const ConstTensor& weights,

1943

const Optional<ConstTensor>& biases,

1944

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1945

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1946

Optional<ConstTensor> optionalWeights(weights);

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1947

return AddFullyConnectedLayer(fullyConnectedDescriptor, optionalWeights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1948

}

1949

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1950

IConnectableLayer* NetworkImpl::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1951

const char* name)

1952

{

Jim Flynn

e242f2d

2019-05-22 14:24:13 +0100

[diff] [blame]

1953

return m_Graph->AddLayer<ConcatLayer>(concatDescriptor, name);

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1954

}

1955

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1956

IConnectableLayer* NetworkImpl::AddConvolution2dLayerImpl(const Convolution2dDescriptor& convolution2dDescriptor,

1957

const ConstTensor& weights,

1958

const Optional<ConstTensor>& biases,

1959

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1960

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1961

if (convolution2dDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1962

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1963

throw InvalidArgumentException("AddConvolution2dLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1964

}

1965

1966

const auto layer = m_Graph->AddLayer<Convolution2dLayer>(convolution2dDescriptor, name);

1967

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

1968

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1969

1970

if (convolution2dDescriptor.m_BiasEnabled)

1971

{

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

1972

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1978

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1979

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1980

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1981

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1982

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1983

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1984

}

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1985

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1986

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1987

const ConstTensor& weights,

1988

const char* name)

1989

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

1990

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1991

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

1992

}

1993

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1994

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1995

const ConstTensor& weights,

1996

const ConstTensor& biases,

1997

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1998

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1999

Optional<ConstTensor> optionalBiases(biases);

2000

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2001

}

2002

Matthew Sloyan

b63a311

2021-09-08 13:05:51 +0100

[diff] [blame^]

2003

IConnectableLayer* NetworkImpl::AddConvolution3dLayer(const Convolution3dDescriptor& convolution3dDescriptor,

2004

const ConstTensor& weights,

2005

const Optional<ConstTensor>& biases,

2006

const char* name)

2007

{

2008

if (convolution3dDescriptor.m_BiasEnabled && !biases.has_value())

2009

{

2010

throw InvalidArgumentException("AddConvolution2dLayer: biases cannot be empty");

2011

}

2012

2013

const auto layer = m_Graph->AddLayer<Convolution3dLayer>(convolution3dDescriptor, name);

2014

2015

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

2016

2017

if (convolution3dDescriptor.m_BiasEnabled)

2018

{

2019

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

}

return layer;

}

IConnectableLayer* NetworkImpl::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

2026

const char* name)

2027

{

2028

return m_Graph->AddLayer<DepthToSpaceLayer>(depthToSpaceDescriptor, name);

2029

}

2030

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2031

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayerImpl(

Matthew Sloyan

b63a311

2021-09-08 13:05:51 +0100

[diff] [blame^]

2032

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

2033

const ConstTensor& weights,

2034

const Optional<ConstTensor>& biases,

2035

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2036

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2037

if (convolution2dDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2038

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2039

throw InvalidArgumentException("AddDepthwiseConvolution2dLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2040

}

2041

Matteo Martincigh

3d6898c

2019-01-15 16:11:44 +0000

[diff] [blame]

2042

const auto layer = m_Graph->AddLayer<DepthwiseConvolution2dLayer>(convolution2dDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2043

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2044

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2045

2046

if (convolution2dDescriptor.m_BiasEnabled)

2047

{

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2048

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2054

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2055

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

2056

const ConstTensor& weights,

2057

const Optional<ConstTensor>& biases,

2058

const char* name)

2059

{

2060

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

2061

}

2062

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2063

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2064

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

2065

const ConstTensor& weights,

2066

const char* name)

2067

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

2068

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2069

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2070

}

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2071

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2072

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2073

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

2074

const ConstTensor& weights,

2075

const ConstTensor& biases,

2076

const char* name)

2077

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2078

Optional<ConstTensor> optionalBiases(biases);

2079

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2080

}

2081

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2082

IConnectableLayer* NetworkImpl::AddDetectionPostProcessLayer(const armnn::DetectionPostProcessDescriptor& descriptor,

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

2083

const ConstTensor& anchors, const char* name)

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

2084

{

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

2085

const auto layer = m_Graph->AddLayer<DetectionPostProcessLayer>(descriptor, name);

2086

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2087

layer->m_Anchors = std::make_shared<ScopedTensorHandle>(anchors);

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

2088

2089

return layer;

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

2090

}

2091

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2092

IConnectableLayer* NetworkImpl::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2093

const char* name)

2094

{

2095

return m_Graph->AddLayer<PermuteLayer>(permuteDescriptor, name);

2096

}

2097

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2098

IConnectableLayer* NetworkImpl::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2099

const char* name)

2100

{

2101

return m_Graph->AddLayer<Pooling2dLayer>(pooling2dDescriptor, name);

2102

}

2103

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2104

IConnectableLayer* NetworkImpl::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2105

const char* name)

2106

{

2107

return m_Graph->AddLayer<ActivationLayer>(activationDescriptor, name);

2108

}

2109

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2110

IConnectableLayer* NetworkImpl::AddArgMinMaxLayer(const ArgMinMaxDescriptor& argMinMaxDescriptor,

Nikhil Raj

ee391d5

2019-09-05 17:50:44 +0100

[diff] [blame]

2111

const char* name)

2112

{

2113

return m_Graph->AddLayer<ArgMinMaxLayer>(argMinMaxDescriptor, name);

2114

}

2115

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2116

IConnectableLayer* NetworkImpl::AddNormalizationLayer(const NormalizationDescriptor&

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2117

normalizationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2118

const char* name)

2119

{

2120

return m_Graph->AddLayer<NormalizationLayer>(normalizationDescriptor, name);

2121

}

2122

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2123

IConnectableLayer* NetworkImpl::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

Aron Virginas-Tar

636ab40

2019-09-16 14:27:45 +0100

[diff] [blame]

2124

{

2125

return m_Graph->AddLayer<SliceLayer>(sliceDescriptor, name);

2126

}

2127

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2128

IConnectableLayer* NetworkImpl::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2129

const char* name)

2130

{

2131

return m_Graph->AddLayer<SoftmaxLayer>(softmaxDescriptor, name);

2132

}

2133

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2134

IConnectableLayer* NetworkImpl::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2135

const char* name)

2136

{

2137

return m_Graph->AddLayer<SplitterLayer>(splitterDescriptor, name);

2138

}

2139

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2140

IConnectableLayer* NetworkImpl::AddMaximumLayer(const char* name)

Nattapat Chaimanowong

5a4304a

2018-11-28 10:44:37 +0000

[diff] [blame]

2141

{

2142

return m_Graph->AddLayer<MaximumLayer>(name);

2143

}

2144

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2145

IConnectableLayer* NetworkImpl::AddMinimumLayer(const char* name)

Éanna Ó Catháin

20e5880

2018-12-04 10:29:06 +0000

[diff] [blame]

2146

{

2147

return m_Graph->AddLayer<MinimumLayer>(name);

2148

}

2149

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2150

IConnectableLayer* NetworkImpl::AddMergerLayer(const MergerDescriptor& mergerDescriptor,

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

2151

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2152

{

Jim Flynn

e242f2d

2019-05-22 14:24:13 +0100

[diff] [blame]

2153

return AddConcatLayer(mergerDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2154

}

2155

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2156

IConnectableLayer* NetworkImpl::AddAbsLayer(const char * name)

Kevin May

868eb14

2019-09-04 17:29:31 +0100

[diff] [blame]

2157

{

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

2158

return AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Abs), name);

Kevin May

868eb14

2019-09-04 17:29:31 +0100

[diff] [blame]

2159

}

2160

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2161

IConnectableLayer* NetworkImpl::AddAdditionLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2162

{

2163

return m_Graph->AddLayer<AdditionLayer>(name);

2164

}

2165

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2166

IConnectableLayer* NetworkImpl::AddMultiplicationLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2167

{

2168

return m_Graph->AddLayer<MultiplicationLayer>(name);

2169

}

2170

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2171

IConnectableLayer* NetworkImpl::AddOutputLayer(LayerBindingId id, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2172

{

2173

return m_Graph->AddLayer<OutputLayer>(id, name);

2174

}

2175

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2176

IConnectableLayer* NetworkImpl::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2177

const ConstTensor& mean,

2178

const ConstTensor& variance,

2179

const ConstTensor& beta,

2180

const ConstTensor& gamma,

2181

const char* name)

2182

{

2183

const auto layer = m_Graph->AddLayer<BatchNormalizationLayer>(desc, name);

2184

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2185

layer->m_Mean = std::make_shared<ScopedTensorHandle>(mean);

2186

layer->m_Variance = std::make_shared<ScopedTensorHandle>(variance);

2187

layer->m_Beta = std::make_shared<ScopedTensorHandle>(beta);

2188

layer->m_Gamma = std::make_shared<ScopedTensorHandle>(gamma);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2193

IConnectableLayer* NetworkImpl::AddRankLayer(const char* name)

Finn Williams

2605b23

2020-06-10 15:53:46 +0100

[diff] [blame]

2194

{

2195

return m_Graph->AddLayer<RankLayer>(name);

2196

}

2197

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2198

IConnectableLayer* NetworkImpl::AddReduceLayer(const ReduceDescriptor& reduceDescriptor,

2199

const char* name)

Sadik Armagan

0c3ea5b

2021-02-03 09:29:30 +0000

[diff] [blame]

2200

{

2201

return m_Graph->AddLayer<ReduceLayer>(reduceDescriptor, name);

2202

}

2203

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2204

IConnectableLayer* NetworkImpl::AddResizeBilinearLayer(const ResizeBilinearDescriptor& descriptor,

2205

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2206

{

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

2207

ResizeDescriptor resizeDescriptor;

David Monahan

4a0c9b9

2020-05-30 09:48:39 +0100

[diff] [blame]

2208

resizeDescriptor.m_Method = ResizeMethod::Bilinear;

2209

resizeDescriptor.m_DataLayout = descriptor.m_DataLayout;

2210

resizeDescriptor.m_TargetWidth = descriptor.m_TargetWidth;

2211

resizeDescriptor.m_TargetHeight = descriptor.m_TargetHeight;

2212

resizeDescriptor.m_AlignCorners = descriptor.m_AlignCorners;

2213

resizeDescriptor.m_HalfPixelCenters = descriptor.m_HalfPixelCenters;

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

2214

2215

return m_Graph->AddLayer<ResizeLayer>(resizeDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2216

}

2217

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2218

IConnectableLayer* NetworkImpl::AddResizeLayer(const ResizeDescriptor& resizeDescriptor, const char* name)

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

2219

{

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

2220

return m_Graph->AddLayer<ResizeLayer>(resizeDescriptor, name);

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

2221

}

2222

Keith Davis

3ae3f97

2021-05-21 16:33:48 +0100

[diff] [blame]

2223

IConnectableLayer* NetworkImpl::AddShapeLayer(const char* name)

2224

{

2225

return m_Graph->AddLayer<ShapeLayer>(name);

2226

}

2227

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2228

IConnectableLayer* NetworkImpl::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

2229

const char* name)

Kevin May

ce5045a

2019-10-02 14:07:47 +0100

[diff] [blame]

2230

{

2231

return m_Graph->AddLayer<InstanceNormalizationLayer>(desc, name);

2232

}

2233

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2234

IConnectableLayer* NetworkImpl::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

2235

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2236

{

Matteo Martincigh

bcd3c85

2018-09-28 14:14:12 +0100

[diff] [blame]

2237

return m_Graph->AddLayer<L2NormalizationLayer>(desc, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2238

}

2239

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2240

IConnectableLayer* NetworkImpl::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& desc,

Aron Virginas-Tar

f982dea

2019-10-11 14:07:53 +0100

[diff] [blame]

2241

const char* name)

2242

{

2243

return m_Graph->AddLayer<LogSoftmaxLayer>(desc, name);

2244

}

2245

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2246

IConnectableLayer* NetworkImpl::AddConstantLayer(const ConstTensor& input, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2247

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2248

auto layer = m_Graph->AddLayer<ConstantLayer>(name);

2249

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2250

layer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(input);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2251

2252

return layer;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2253

}

2254

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2255

IConnectableLayer* NetworkImpl::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2256

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2257

{

2258

return m_Graph->AddLayer<ReshapeLayer>(reshapeDescriptor, name);

2259

}

2260

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2261

IConnectableLayer* NetworkImpl::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

Nattapat Chaimanowong

207ef9a

2018-11-02 10:57:25 +0000

[diff] [blame]

2262

const char* name)

2263

{

2264

return m_Graph->AddLayer<SpaceToBatchNdLayer>(spaceToBatchNdDescriptor, name);

2265

}

2266

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2267

IConnectableLayer* NetworkImpl::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

Aron Virginas-Tar

972af15

2019-06-11 14:14:03 +0100

[diff] [blame]

2268

const char* name)

2269

{

2270

return m_Graph->AddLayer<SpaceToDepthLayer>(spaceToDepthDescriptor, name);

2271

}

2272

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2273

IConnectableLayer* NetworkImpl::AddFloorLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2274

{

2275

return m_Graph->AddLayer<FloorLayer>(name);

2276

}

2277

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2278

IConnectableLayer* NetworkImpl::AddLstmLayer(const LstmDescriptor& descriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2279

const LstmInputParams& params,

2280

const char* name)

2281

{

2282

const auto layer = m_Graph->AddLayer<LstmLayer>(descriptor, name);

2283

2284

//Lstm Basic Parameters

2285

layer->m_BasicParameters.m_InputToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2286

std::make_shared<ScopedTensorHandle>(*(params.m_InputToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2287

layer->m_BasicParameters.m_InputToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2288

std::make_shared<ScopedTensorHandle>(*(params.m_InputToCellWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2289

layer->m_BasicParameters.m_InputToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2290

std::make_shared<ScopedTensorHandle>(*(params.m_InputToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2291

layer->m_BasicParameters.m_RecurrentToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2292

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2293

layer->m_BasicParameters.m_RecurrentToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2294

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToCellWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2295

layer->m_BasicParameters.m_RecurrentToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2296

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2297

layer->m_BasicParameters.m_ForgetGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2298

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2299

layer->m_BasicParameters.m_CellBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2300

std::make_shared<ScopedTensorHandle>(*(params.m_CellBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2301

layer->m_BasicParameters.m_OutputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2302

std::make_shared<ScopedTensorHandle>(*(params.m_OutputGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2303

2304

//Lstm Cifg parameters

2305

if(!descriptor.m_CifgEnabled)

2306

{

2307

if(params.m_InputToInputWeights == nullptr)

2308

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2309

throw InvalidArgumentException("AddLstmLayer: Input To Input Weights cannot be NULL "

2310

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2311

}

2312

if(params.m_RecurrentToInputWeights == nullptr)

2313

{

2314

throw InvalidArgumentException(

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2315

"AddLstmLayer: Recurrent To Input Weights cannot be NULL "

2316

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2317

}

2318

if(params.m_InputGateBias == nullptr)

2319

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2320

throw InvalidArgumentException("AddLstmLayer: Input Gate Bias cannot be NULL "

2321

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2322

}

2323

layer->m_CifgParameters.m_InputToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2324

std::make_shared<ScopedTensorHandle>(*(params.m_InputToInputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2325

layer->m_CifgParameters.m_RecurrentToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2326

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToInputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2327

layer->m_CifgParameters.m_InputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2328

std::make_shared<ScopedTensorHandle>(*(params.m_InputGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2329

}

2330

2331

//Lstm projection parameters

2332

if(descriptor.m_ProjectionEnabled)

2333

{

2334

if(params.m_ProjectionWeights == nullptr)

2335

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2336

throw InvalidArgumentException("AddLstmLayer: Projection Weights cannot be NULL "

2337

"when projection is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2338

}

2339

layer->m_ProjectionParameters.m_ProjectionWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2340

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2341

if(params.m_ProjectionBias != nullptr)

2342

{

2343

layer->m_ProjectionParameters.m_ProjectionBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2344

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

}

}

//Lstm Peephole params

2349

if(descriptor.m_PeepholeEnabled)

2350

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2351

if(!descriptor.m_CifgEnabled)

2352

{

2353

if(params.m_CellToInputWeights == nullptr)

2354

{

2355

throw InvalidArgumentException("AddLstmLayer: Cell To Input Weights cannot be NULL "

2356

"when Peephole is enabled and CIFG disabled.");

2357

}

2358

2359

layer->m_PeepholeParameters.m_CellToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2360

std::make_shared<ScopedTensorHandle>(*(params.m_CellToInputWeights));

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2361

}

2362

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2363

if(params.m_CellToForgetWeights == nullptr)

2364

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2365

throw InvalidArgumentException("AddLstmLayer: Cell To Forget Weights cannot be NULL "

2366

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2367

}

2368

if(params.m_CellToOutputWeights == nullptr)

2369

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2370

throw InvalidArgumentException("AddLstmLayer: Cell To Output Weights cannot be NULL "

2371

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2372

}

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2373

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2374

layer->m_PeepholeParameters.m_CellToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2375

std::make_shared<ScopedTensorHandle>(*(params.m_CellToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2376

layer->m_PeepholeParameters.m_CellToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2377

std::make_shared<ScopedTensorHandle>(*(params.m_CellToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2378

}

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2379

2380

//Lstm Layer Normalization params

2381

if(descriptor.m_LayerNormEnabled)

2382

{

2383

if(!descriptor.m_CifgEnabled)

2384

{

2385

if(params.m_InputLayerNormWeights == nullptr)

2386

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2387

throw InvalidArgumentException("AddLstmLayer: Input layer normalization weights cannot be NULL "

2388

"when layer normalization is enabled and CIFG disabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2389

}

2390

layer->m_LayerNormParameters.m_InputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2391

std::make_shared<ScopedTensorHandle>(*(params.m_InputLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2392

}

2393

2394

if(params.m_ForgetLayerNormWeights == nullptr)

2395

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2396

throw InvalidArgumentException("AddLstmLayer: Forget layer normalization weights cannot be NULL "

2397

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2398

}

2399

if(params.m_CellLayerNormWeights == nullptr)

2400

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2401

throw InvalidArgumentException("AddLstmLayer: Cell layer normalization weights cannot be NULL "

2402

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2403

}

2404

if(params.m_OutputLayerNormWeights == nullptr)

2405

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2406

throw InvalidArgumentException("AddLstmLayer: Output layer normalization weights cannot be NULL "

2407

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2408

}

2409

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2410

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2411

layer->m_LayerNormParameters.m_CellLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2412

std::make_shared<ScopedTensorHandle>(*(params.m_CellLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2413

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2414

std::make_shared<ScopedTensorHandle>(*(params.m_OutputLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2415

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2419

IConnectableLayer* NetworkImpl::AddDivisionLayer(const char* name)

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

2420

{

2421

return m_Graph->AddLayer<DivisionLayer>(name);

2422

}

2423

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2424

IConnectableLayer* NetworkImpl::AddSubtractionLayer(const char* name)

David Beck

1952622

2018-09-12 16:00:08 +0100

[diff] [blame]

2425

{

2426

return m_Graph->AddLayer<SubtractionLayer>(name);

2427

}

2428

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2429

IConnectableLayer* NetworkImpl::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

narpra01

32b9046

2018-09-13 11:07:48 +0100

[diff] [blame]

2430

{

2431

return m_Graph->AddLayer<MeanLayer>(meanDescriptor,name);

2432

}

2433

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2434

IConnectableLayer* NetworkImpl::AddPadLayer(const PadDescriptor& padDescriptor, const char* name)

Mohamed Nour Abouelseoud

5662c20

2018-09-24 13:30:09 +0100

[diff] [blame]

2435

{

2436

return m_Graph->AddLayer<PadLayer>(padDescriptor,name);

2437

}

2438

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2439

IConnectableLayer *NetworkImpl::AddQuantizeLayer(const char *name)

Derek Lamberti

a9cca6a

2019-03-25 15:41:58 +0000

[diff] [blame]

2440

{

2441

return m_Graph->AddLayer<QuantizeLayer>(name);

2442

}

2443

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2444

IConnectableLayer* NetworkImpl::AddDequantizeLayer(const char* name)

Nattapat Chaimanowong

e4294fd

2019-03-28 09:56:53 +0000

[diff] [blame]

2445

{

2446

return m_Graph->AddLayer<DequantizeLayer>(name);

2447

}

2448

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2449

IConnectableLayer* NetworkImpl::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

Conor Kennedy

430b5d8

2018-11-14 15:28:28 +0000

[diff] [blame]

2450

const char* name)

2451

{

2452

return m_Graph->AddLayer<StridedSliceLayer>(stridedSliceDescriptor, name);

2453

}

2454

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2455

IConnectableLayer* NetworkImpl::AddGreaterLayer(const char* name)

Matteo Martincigh

59a950c

2018-12-13 12:48:25 +0000

[diff] [blame]

2456

{

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

2457

return AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Greater), name);

Matteo Martincigh

59a950c

2018-12-13 12:48:25 +0000

[diff] [blame]

2458

}

2459

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2460

IConnectableLayer* NetworkImpl::AddEqualLayer(const char* name)

FrancisMurtagh

2099595

2018-12-17 12:11:36 +0000

[diff] [blame]

2461

{

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

2462

return AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Equal), name);

FrancisMurtagh

2099595

2018-12-17 12:11:36 +0000

[diff] [blame]

2463

}

2464

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2465

IConnectableLayer* NetworkImpl::AddRsqrtLayer(const char * name)

Mohamed Nour Abouelseoud

a1d3c6a

2018-12-27 12:39:16 +0000

[diff] [blame]

2466

{

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

2467

return AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Rsqrt), name);

Mohamed Nour Abouelseoud

a1d3c6a

2018-12-27 12:39:16 +0000

[diff] [blame]

2468

}

2469

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2470

IConnectableLayer* NetworkImpl::AddGatherLayer(const char* name)

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

2471

{

Teresa Charlin

5266473

2020-06-29 16:27:03 +0100

[diff] [blame]

2472

GatherDescriptor gatherDescriptor{};

2473

return AddGatherLayer(gatherDescriptor, name);

2474

}

2475

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2476

IConnectableLayer* NetworkImpl::AddGatherLayer(const GatherDescriptor& gatherDescriptor,

Teresa Charlin

5266473

2020-06-29 16:27:03 +0100

[diff] [blame]

2477

const char* name)

2478

{

2479

return m_Graph->AddLayer<GatherLayer>(gatherDescriptor, name);

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

2480

}

2481

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2482

IConnectableLayer* NetworkImpl::AddMergeLayer(const char* name)

Nattapat Chaimanowong

1f88630

2019-04-05 13:37:19 +0100

[diff] [blame]

2483

{

2484

return m_Graph->AddLayer<MergeLayer>(name);

2485

}

2486

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2487

IConnectableLayer* NetworkImpl::AddSwitchLayer(const char* name)

Sadik Armagan

eff363d

2019-04-05 15:25:46 +0100

[diff] [blame]

2488

{

2489

return m_Graph->AddLayer<SwitchLayer>(name);

2490

}

2491

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2492

IConnectableLayer* NetworkImpl::AddPreluLayer(const char* name)

Matteo Martincigh

0e406ee

2019-06-12 15:42:18 +0100

[diff] [blame]

2493

{

2494

return m_Graph->AddLayer<PreluLayer>(name);

2495

}

2496

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2497

IConnectableLayer* NetworkImpl::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

2498

const ConstTensor& weights,

2499

const Optional<ConstTensor>& biases,

2500

const char* name)

2501

{

2502

if (descriptor.m_BiasEnabled && !biases.has_value())

2503

{

2504

throw InvalidArgumentException("AddTransposeConvolution2dLayer: Biases cannot be empty");

2505

}

2506

2507

const auto layer = m_Graph->AddLayer<TransposeConvolution2dLayer>(descriptor, name);

2508

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2509

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

2510

2511

if (descriptor.m_BiasEnabled)

2512

{

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2513

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2519

IConnectableLayer* NetworkImpl::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

Mike Kelly

c9ea45a

2020-02-28 18:11:58 +0000

[diff] [blame]

2520

const char* name)

2521

{

2522

return m_Graph->AddLayer<TransposeLayer>(transposeDescriptor, name);

2523

}

2524

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2525

IConnectableLayer* NetworkImpl::AddStackLayer(const StackDescriptor& stackDescriptor,

Matthew Jackson

2b8c1da

2019-07-04 14:59:16 +0100

[diff] [blame]

2526

const char* name)

2527

{

2528

return m_Graph->AddLayer<StackLayer>(stackDescriptor, name);

2529

}

2530

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

2531

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2532

IConnectableLayer* NetworkImpl::AddStandInLayer(const StandInDescriptor& desc,

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

2533

const char* name)

2534

{

2535

return m_Graph->AddLayer<StandInLayer>(desc, name);

2536

}

2537

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2538

IConnectableLayer* NetworkImpl::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2539

const char* name)

2540

{

2541

const auto layer = m_Graph->AddLayer<QuantizedLstmLayer>(name);

2542

2543

// InputToX weights

2544

layer->m_QuantizedLstmParameters.m_InputToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2545

std::make_shared<ScopedTensorHandle>(params.GetInputToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2546

layer->m_QuantizedLstmParameters.m_InputToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2547

std::make_shared<ScopedTensorHandle>(params.GetInputToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2548

layer->m_QuantizedLstmParameters.m_InputToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2549

std::make_shared<ScopedTensorHandle>(params.GetInputToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2550

layer->m_QuantizedLstmParameters.m_InputToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2551

std::make_shared<ScopedTensorHandle>(params.GetInputToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2552

2553

// RecurrentToX weights

2554

layer->m_QuantizedLstmParameters.m_RecurrentToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2555

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2556

layer->m_QuantizedLstmParameters.m_RecurrentToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2557

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2558

layer->m_QuantizedLstmParameters.m_RecurrentToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2559

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2560

layer->m_QuantizedLstmParameters.m_RecurrentToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2561

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2562

2563

// Bias

2564

layer->m_QuantizedLstmParameters.m_InputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2565

std::make_shared<ScopedTensorHandle>(params.GetInputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2566

layer->m_QuantizedLstmParameters.m_ForgetGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2567

std::make_shared<ScopedTensorHandle>(params.GetForgetGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2568

layer->m_QuantizedLstmParameters.m_CellBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2569

std::make_shared<ScopedTensorHandle>(params.GetCellBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2570

layer->m_QuantizedLstmParameters.m_OutputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2571

std::make_shared<ScopedTensorHandle>(params.GetOutputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2576

IConnectableLayer* NetworkImpl::AddQLstmLayer(const QLstmDescriptor& descriptor,

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2577

const LstmInputParams& params,

2578

const char* name)

2579

{

2580

const auto layer = m_Graph->AddLayer<QLstmLayer>(descriptor, name);

2581

2582

// QLstm Basic Parameters

2583

layer->m_BasicParameters.m_InputToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2584

std::make_shared<ScopedTensorHandle>(*(params.m_InputToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2585

layer->m_BasicParameters.m_InputToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2586

std::make_shared<ScopedTensorHandle>(*(params.m_InputToCellWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2587

layer->m_BasicParameters.m_InputToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2588

std::make_shared<ScopedTensorHandle>(*(params.m_InputToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2589

layer->m_BasicParameters.m_RecurrentToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2590

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2591

layer->m_BasicParameters.m_RecurrentToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2592

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToCellWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2593

layer->m_BasicParameters.m_RecurrentToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2594

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2595

layer->m_BasicParameters.m_ForgetGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2596

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2597

layer->m_BasicParameters.m_CellBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2598

std::make_shared<ScopedTensorHandle>(*(params.m_CellBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2599

layer->m_BasicParameters.m_OutputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2600

std::make_shared<ScopedTensorHandle>(*(params.m_OutputGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2601

2602

// QLstm Cifg parameters

2603

if(!descriptor.m_CifgEnabled)

2604

{

2605

if(params.m_InputToInputWeights == nullptr)

2606

{

2607

throw InvalidArgumentException("AddQLstmLayer: Input To Input Weights cannot be NULL");

2608

}

2609

2610

if(params.m_RecurrentToInputWeights == nullptr)

2611

{

2612

throw InvalidArgumentException(

2613

"AddQLstmLayer: Recurrent To Input Weights cannot be NULL");

2614

}

2615

2616

if(params.m_InputGateBias == nullptr)

2617

{

2618

throw InvalidArgumentException("AddQLstmLayer: Input Gate Bias cannot be NULL");

2619

}

2620

2621

layer->m_CifgParameters.m_InputToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2622

std::make_shared<ScopedTensorHandle>(*(params.m_InputToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2623

layer->m_CifgParameters.m_RecurrentToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2624

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2625

layer->m_CifgParameters.m_InputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2626

std::make_shared<ScopedTensorHandle>(*(params.m_InputGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2627

}

2628

2629

// QLstm Projection parameters

2630

if(descriptor.m_ProjectionEnabled)

2631

{

2632

if(params.m_ProjectionWeights == nullptr)

2633

{

2634

throw InvalidArgumentException("AddQLstmLayer: Projection Weights cannot be NULL");

2635

}

2636

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2637

layer->m_ProjectionParameters.m_ProjectionWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2638

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionWeights));

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

2639

2640

// Projection bias is optional even if projection is enabled

2641

if(params.m_ProjectionWeights != nullptr)

2642

{

2643

layer->m_ProjectionParameters.m_ProjectionBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2644

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionBias));

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

2645

}

2646

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2647

}

2648

2649

// QLstm Peephole params

2650

if(descriptor.m_PeepholeEnabled)

2651

{

2652

if(params.m_CellToForgetWeights == nullptr)

2653

{

2654

throw InvalidArgumentException("AddQLstmLayer: Cell To Forget Weights cannot be NULL");

2655

}

2656

2657

if(params.m_CellToOutputWeights == nullptr)

2658

{

2659

throw InvalidArgumentException("AddQLstmLayer: Cell To Output Weights cannot be NULL");

2660

}

2661

2662

if(!descriptor.m_CifgEnabled)

2663

{

2664

if(params.m_CellToInputWeights == nullptr)

2665

{

2666

throw InvalidArgumentException("AddQLstmLayer: Cell To Input Weights cannot be NULL");

2667

}

2668

2669

layer->m_PeepholeParameters.m_CellToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2670

std::make_shared<ScopedTensorHandle>(*(params.m_CellToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2671

}

2672

2673

layer->m_PeepholeParameters.m_CellToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2674

std::make_shared<ScopedTensorHandle>(*(params.m_CellToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2675

layer->m_PeepholeParameters.m_CellToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2676

std::make_shared<ScopedTensorHandle>(*(params.m_CellToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2677

}

2678

2679

// QLstm Layer Normalization params

2680

if(descriptor.m_LayerNormEnabled)

2681

{

2682

if(params.m_ForgetLayerNormWeights == nullptr)

2683

{

2684

throw InvalidArgumentException("AddQLstmLayer: Forget layer normalization weights cannot be NULL");

2685

}

2686

2687

if(params.m_CellLayerNormWeights == nullptr)

2688

{

2689

throw InvalidArgumentException("AddQLstmLayer: Cell layer normalization weights cannot be NULL");

2690

}

2691

2692

if(params.m_OutputLayerNormWeights == nullptr)

2693

{

2694

throw InvalidArgumentException("AddQLstmLayer: Output layer normalization weights cannot be NULL");

2695

}

2696

2697

if(!descriptor.m_CifgEnabled)

2698

{

2699

if(params.m_InputLayerNormWeights == nullptr)

2700

{

2701

throw InvalidArgumentException("AddQLstmLayer: Input layer normalization weights cannot be NULL");

2702

}

2703

2704

layer->m_LayerNormParameters.m_InputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2705

std::make_shared<ScopedTensorHandle>(*(params.m_InputLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2706

}

2707

2708

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2709

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2710

layer->m_LayerNormParameters.m_CellLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2711

std::make_shared<ScopedTensorHandle>(*(params.m_CellLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2712

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2713

std::make_shared<ScopedTensorHandle>(*(params.m_OutputLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2718

IConnectableLayer* NetworkImpl::AddLogicalBinaryLayer(const LogicalBinaryDescriptor& logicalBinaryDescriptor,

Narumol Prangnawarat

8ed39ae

2021-07-15 16:16:25 +0100

[diff] [blame]

2719

const char* name)

James Conroy

aba90cd

2020-11-06 16:28:18 +0000

[diff] [blame]

2720

{

2721

return m_Graph->AddLayer<LogicalBinaryLayer>(logicalBinaryDescriptor, name);

2722

}

2723

Narumol Prangnawarat

8ed39ae

2021-07-15 16:16:25 +0100

[diff] [blame]

2724

IConnectableLayer* NetworkImpl::AddUnidirectionalSequenceLstmLayer(

2725

const UnidirectionalSequenceLstmDescriptor& descriptor,

2726

const LstmInputParams& params,

2727

const char* name)

2728

{

2729

const auto layer = m_Graph->AddLayer<UnidirectionalSequenceLstmLayer>(descriptor, name);

2730

2731

//Lstm Basic Parameters

2732

layer->m_BasicParameters.m_InputToForgetWeights =

2733

std::make_shared<ScopedTensorHandle>(*(params.m_InputToForgetWeights));

2734

layer->m_BasicParameters.m_InputToCellWeights =

2735

std::make_shared<ScopedTensorHandle>(*(params.m_InputToCellWeights));

2736

layer->m_BasicParameters.m_InputToOutputWeights =

2737

std::make_shared<ScopedTensorHandle>(*(params.m_InputToOutputWeights));

2738

layer->m_BasicParameters.m_RecurrentToForgetWeights =

2739

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToForgetWeights));

2740

layer->m_BasicParameters.m_RecurrentToCellWeights =

2741

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToCellWeights));

2742

layer->m_BasicParameters.m_RecurrentToOutputWeights =

2743

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToOutputWeights));

2744

layer->m_BasicParameters.m_ForgetGateBias =

2745

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetGateBias));

2746

layer->m_BasicParameters.m_CellBias =

2747

std::make_shared<ScopedTensorHandle>(*(params.m_CellBias));

2748

layer->m_BasicParameters.m_OutputGateBias =

2749

std::make_shared<ScopedTensorHandle>(*(params.m_OutputGateBias));

2750

2751

//Lstm Cifg parameters

2752

if(!descriptor.m_CifgEnabled)

2753

{

2754

if(params.m_InputToInputWeights == nullptr)

2755

{

2756

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Input To Input Weights cannot be NULL "

2757

"when CIFG is disabled.");

2758

}

2759

if(params.m_RecurrentToInputWeights == nullptr)

2760

{

2761

throw InvalidArgumentException(

2762

"AddUnidirectionalSequenceLstmLayer: Recurrent To Input Weights cannot be NULL "

2763

"when CIFG is disabled.");

2764

}

2765

if(params.m_InputGateBias == nullptr)

2766

{

2767

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Input Gate Bias cannot be NULL "

2768

"when CIFG is disabled.");

2769

}

2770

layer->m_CifgParameters.m_InputToInputWeights =

2771

std::make_shared<ScopedTensorHandle>(*(params.m_InputToInputWeights));

2772

layer->m_CifgParameters.m_RecurrentToInputWeights =

2773

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToInputWeights));

2774

layer->m_CifgParameters.m_InputGateBias =

2775

std::make_shared<ScopedTensorHandle>(*(params.m_InputGateBias));

2776

}

2777

2778

//Lstm projection parameters

2779

if(descriptor.m_ProjectionEnabled)

2780

{

2781

if(params.m_ProjectionWeights == nullptr)

2782

{

2783

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Projection Weights cannot be NULL "

2784

"when projection is enabled.");

2785

}

2786

layer->m_ProjectionParameters.m_ProjectionWeights =

2787

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionWeights));

2788

if(params.m_ProjectionBias != nullptr)

2789

{

2790

layer->m_ProjectionParameters.m_ProjectionBias =

2791

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionBias));

}

}

//Lstm Peephole params

2796

if(descriptor.m_PeepholeEnabled)

2797

{

2798

if(!descriptor.m_CifgEnabled)

2799

{

2800

if(params.m_CellToInputWeights == nullptr)

2801

{

2802

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell To Input Weights "

2803

"cannot be NULL when Peephole is enabled and CIFG disabled.");

2804

}

2805

2806

layer->m_PeepholeParameters.m_CellToInputWeights =

2807

std::make_shared<ScopedTensorHandle>(*(params.m_CellToInputWeights));

2808

}

2809

2810

if(params.m_CellToForgetWeights == nullptr)

2811

{

2812

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell To Forget Weights cannot be NULL "

2813

"when Peephole is enabled.");

2814

}

2815

if(params.m_CellToOutputWeights == nullptr)

2816

{

2817

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell To Output Weights cannot be NULL "

2818

"when Peephole is enabled.");

2819

}

2820

2821

layer->m_PeepholeParameters.m_CellToForgetWeights =

2822

std::make_shared<ScopedTensorHandle>(*(params.m_CellToForgetWeights));

2823

layer->m_PeepholeParameters.m_CellToOutputWeights =

2824

std::make_shared<ScopedTensorHandle>(*(params.m_CellToOutputWeights));

2825

}

2826

2827

//Lstm Layer Normalization params

2828

if(descriptor.m_LayerNormEnabled)

2829

{

2830

if(!descriptor.m_CifgEnabled)

2831

{

2832

if(params.m_InputLayerNormWeights == nullptr)

2833

{

2834

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Input layer normalization weights "

2835

"cannot be NULL when layer normalization is enabled and CIFG disabled.");

2836

}

2837

layer->m_LayerNormParameters.m_InputLayerNormWeights =

2838

std::make_shared<ScopedTensorHandle>(*(params.m_InputLayerNormWeights));

2839

}

2840

2841

if(params.m_ForgetLayerNormWeights == nullptr)

2842

{

2843

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Forget layer normalization weights "

2844

"cannot be NULL when layer normalization is enabled.");

2845

}

2846

if(params.m_CellLayerNormWeights == nullptr)

2847

{

2848

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell layer normalization weights "

2849

"cannot be NULL when layer normalization is enabled.");

2850

}

2851

if(params.m_OutputLayerNormWeights == nullptr)

2852

{

2853

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Output layer normalization weights "

2854

"cannot be NULL when layer normalization is enabled.");

2855

}

2856

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

2857

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetLayerNormWeights));

2858

layer->m_LayerNormParameters.m_CellLayerNormWeights =

2859

std::make_shared<ScopedTensorHandle>(*(params.m_CellLayerNormWeights));

2860

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

2861

std::make_shared<ScopedTensorHandle>(*(params.m_OutputLayerNormWeights));

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2866

void NetworkImpl::Accept(ILayerVisitor& visitor) const

Mike Kelly

8c1701a

2019-02-11 17:01:27 +0000

[diff] [blame]

2867

{

2868

for (auto layer : GetGraph())

2869

{

2870

layer->Accept(visitor);

};

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2874

void NetworkImpl::ExecuteStrategy(IStrategy& strategy) const

Finn Williams

b454c5c

2021-02-09 15:56:23 +0000

[diff] [blame]

2875

{

2876

for (auto layer : GetGraph())

2877

{

2878

layer->ExecuteStrategy(strategy);

};

}

Mike Kelly

2021-06-27 22:39:21 +0100

[diff] [blame]

2882

OptimizedNetworkImpl::OptimizedNetworkImpl(const OptimizedNetworkImpl& other, const ModelOptions& modelOptions)

2883

: m_Graph(new Graph(*other.m_Graph.get()))

2884

, m_Guid(profiling::ProfilingService::GetNextGuid())

2885

, m_ModelOptions(modelOptions)

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2889

OptimizedNetworkImpl::OptimizedNetworkImpl(std::unique_ptr<Graph> graph)

Sadik Armagan

3184c90

2020-03-18 10:57:30 +0000

[diff] [blame]

2890

: m_Graph(std::move(graph)), m_Guid(profiling::ProfilingService::GetNextGuid())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2894

OptimizedNetworkImpl::OptimizedNetworkImpl(std::unique_ptr<Graph> graph, const ModelOptions& modelOptions)

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

2895

: m_Graph(std::move(graph)), m_Guid(profiling::ProfilingService::GetNextGuid()), m_ModelOptions(modelOptions)

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2899

OptimizedNetworkImpl::~OptimizedNetworkImpl()

telsoa01