Blame - src/armnn/Network.cpp - ml/armnn

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

5

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

6

#include "Network.hpp"

7

#include "Graph.hpp"

8

#include "Layer.hpp"

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

9

#include "DeviceSpec.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

10

#include "Optimizer.hpp"

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

11

#include "SubgraphViewSelector.hpp"

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

12

#include "BackendSettings.hpp"

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

13

#include "optimizations/All.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

14

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

15

#include <backendsCommon/TensorHandle.hpp>

Aron Virginas-Tar

c9cc804

2018-11-01 16:15:57 +0000

[diff] [blame]

16

#include <backendsCommon/WorkloadFactory.hpp>

Matteo Martincigh

e5b8eb9

2019-11-28 15:45:42 +0000

[diff] [blame]

17

#include <armnn/backends/IBackendInternal.hpp>

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

18

#include <backendsCommon/TensorHandleFactoryRegistry.hpp>

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

19

20

#include <armnn/Exceptions.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

21

#include <armnn/Utils.hpp>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

22

#include <armnn/TypesUtils.hpp>

Matteo Martincigh

c601aa6

2019-10-29 15:03:22 +0000

[diff] [blame]

23

#include <armnn/BackendRegistry.hpp>

Matthew Bentham

f48afc6

2020-01-15 17:55:08 +0000

[diff] [blame]

24

#include <armnn/Logging.hpp>

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

25

#include <armnn/utility/Assert.hpp>

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

26

#include <armnn/utility/IgnoreUnused.hpp>

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

27

#include <armnn/utility/PolymorphicDowncast.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

28

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

29

#include <ProfilingService.hpp>

30

Nikhil Raj

77fe76b

2021-06-09 14:55:32 +0100

[diff] [blame]

31

#include <common/include/ProfilingGuid.hpp>

32

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

33

#include <fmt/format.h>

34

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

#include <fcntl.h>

#include <algorithm>

#include <fstream>

#include <memory>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

39

#include <vector>

40

#include <algorithm>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

41

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

namespace armnn

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

45

INetwork::INetwork(NetworkOptions networkOptions) : pNetworkImpl(new NetworkImpl(networkOptions)) {}

46

47

INetwork::~INetwork() = default;

48

49

Status INetwork::PrintGraph()

50

{

51

return pNetworkImpl->PrintGraph();

52

}

53

54

IConnectableLayer* INetwork::AddInputLayer(LayerBindingId id, const char* name)

55

{

56

return pNetworkImpl->AddInputLayer(id, name);

}

IConnectableLayer* INetwork::AddArgMinMaxLayer(const ArgMinMaxDescriptor& desc,

61

const char* name)

62

{

63

return pNetworkImpl->AddArgMinMaxLayer(desc, name);

64

}

65

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

66

IConnectableLayer* INetwork::AddCastLayer(const char* name)

67

{

68

return pNetworkImpl->AddCastLayer(name);

69

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

70

71

IConnectableLayer* INetwork::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

72

const char* name)

73

{

74

return pNetworkImpl->AddComparisonLayer(comparisonDescriptor, name);

}

IConnectableLayer* INetwork::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

79

const char* name)

80

{

81

return pNetworkImpl->AddConcatLayer(concatDescriptor, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

86

const ConstTensor& weights,

87

const Optional<ConstTensor>& biases,

88

const char* name)

89

{

90

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

95

const ConstTensor& weights,

96

const char* name)

97

{

98

Optional<ConstTensor> biases;

99

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

104

const ConstTensor& weights,

105

const ConstTensor& biases,

const char* name )

{

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor,

110

weights,

111

armnn::Optional<ConstTensor>(biases),

name);

}

IConnectableLayer* INetwork::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

117

const char* name)

118

{

119

return pNetworkImpl->AddDepthToSpaceLayer(depthToSpaceDescriptor, name);

}

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

124

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

125

const ConstTensor& weights,

126

const Optional<ConstTensor>& biases,

127

const char* name)

128

{

129

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

134

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

135

const ConstTensor& weights,

136

const char* name)

137

{

138

Optional<ConstTensor> biases;

139

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

144

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

145

const ConstTensor& weights,

146

const ConstTensor& biases,

147

const char* name)

148

{

149

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, weights,

150

armnn::Optional<ConstTensor>(biases), name);

}

IConnectableLayer* INetwork::AddDequantizeLayer(const char* name)

155

{

156

return pNetworkImpl->AddDequantizeLayer(name);

}

IConnectableLayer* INetwork::AddDetectionPostProcessLayer(

161

const DetectionPostProcessDescriptor& descriptor,

162

const ConstTensor& anchors,

163

const char* name)

164

{

165

return pNetworkImpl->AddDetectionPostProcessLayer(descriptor, anchors, name);

}

IConnectableLayer* INetwork::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

170

const char* name)

171

{

172

return pNetworkImpl->AddElementwiseUnaryLayer(elementwiseUnaryDescriptor, name);

}

IConnectableLayer* INetwork::AddFillLayer(const FillDescriptor& fillDescriptor,

177

const char* name)

178

{

179

return pNetworkImpl->AddFillLayer(fillDescriptor, name);

180

}

181

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

182

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

183

const char* name)

184

{

185

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor, name);

186

}

187

188

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

189

const ConstTensor& weights,

190

const Optional<ConstTensor>& biases,

191

const char* name)

192

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

193

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor,

194

armnn::Optional<ConstTensor>(weights),

195

biases,

196

name);

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

197

}

198

199

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

200

const Optional<ConstTensor>& weights,

201

const Optional<ConstTensor>& biases,

202

const char* name)

203

{

204

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor, weights, biases, name);

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

205

}

206

207

IConnectableLayer* INetwork::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

208

const char* name)

209

{

210

return pNetworkImpl->AddPermuteLayer(permuteDescriptor, name);

211

}

212

213

IConnectableLayer* INetwork::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

214

const char* name)

215

{

216

return pNetworkImpl->AddBatchToSpaceNdLayer(batchToSpaceNdDescriptor, name);

217

}

218

219

IConnectableLayer* INetwork::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

220

const char* name)

221

{

222

return pNetworkImpl->AddPooling2dLayer(pooling2dDescriptor, name);

223

}

224

225

IConnectableLayer* INetwork::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

226

const char* name)

227

{

228

return pNetworkImpl->AddActivationLayer(activationDescriptor, name);

229

}

230

231

IConnectableLayer* INetwork::AddNormalizationLayer(const NormalizationDescriptor& normalizationDescriptor,

232

const char* name)

233

{

234

return pNetworkImpl->AddNormalizationLayer(normalizationDescriptor, name);

235

}

236

237

IConnectableLayer* INetwork::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

238

{

239

return pNetworkImpl->AddSliceLayer(sliceDescriptor, name);

240

}

241

IConnectableLayer* INetwork::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

242

const char* name)

243

{

244

return pNetworkImpl->AddSoftmaxLayer(softmaxDescriptor, name);

245

}

246

247

IConnectableLayer* INetwork::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

248

const char* name)

249

{

250

return pNetworkImpl->AddSplitterLayer(splitterDescriptor, name);

251

}

252

253

IConnectableLayer* INetwork::AddMergeLayer(const char* name)

254

{

255

return pNetworkImpl->AddMergeLayer(name);

256

}

257

258

IConnectableLayer* INetwork::AddMergerLayer(const MergerDescriptor& mergerDescriptor,

259

const char* name)

260

{

261

return pNetworkImpl->AddConcatLayer(mergerDescriptor, name);

262

}

263

264

IConnectableLayer* INetwork::AddAbsLayer(const char* name)

265

{

266

return pNetworkImpl->AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Abs), name);

267

}

268

269

IConnectableLayer* INetwork::AddAdditionLayer(const char* name)

270

{

271

return pNetworkImpl->AddAdditionLayer(name);

272

}

273

274

IConnectableLayer* INetwork::AddMultiplicationLayer(const char* name)

275

{

276

return pNetworkImpl->AddMultiplicationLayer(name);

277

}

278

279

IConnectableLayer* INetwork::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

280

const ConstTensor& mean,

281

const ConstTensor& variance,

282

const ConstTensor& beta,

283

const ConstTensor& gamma,

284

const char* name)

285

{

286

return pNetworkImpl->AddBatchNormalizationLayer(desc, mean, variance, beta, gamma, name);

287

}

288

289

IConnectableLayer* INetwork::AddRankLayer(const char* name)

290

{

291

return pNetworkImpl->AddRankLayer(name);

292

}

293

294

IConnectableLayer* INetwork::AddResizeBilinearLayer(const ResizeBilinearDescriptor& descriptor,

295

const char* name)

296

{

297

ResizeDescriptor resizeDescriptor;

298

resizeDescriptor.m_Method = ResizeMethod::Bilinear;

299

resizeDescriptor.m_DataLayout = descriptor.m_DataLayout;

300

resizeDescriptor.m_TargetWidth = descriptor.m_TargetWidth;

301

resizeDescriptor.m_TargetHeight = descriptor.m_TargetHeight;

302

resizeDescriptor.m_AlignCorners = descriptor.m_AlignCorners;

303

resizeDescriptor.m_HalfPixelCenters = descriptor.m_HalfPixelCenters;

304

305

return pNetworkImpl->AddResizeLayer(resizeDescriptor, name);

306

}

307

308

IConnectableLayer* INetwork::AddResizeLayer(const ResizeDescriptor& resizeDescriptor,

309

const char* name)

310

{

311

return pNetworkImpl->AddResizeLayer(resizeDescriptor, name);

312

}

313

314

IConnectableLayer* INetwork::AddReduceLayer(const ReduceDescriptor& reduceDescriptor,

315

const char* name)

316

{

317

return pNetworkImpl->AddReduceLayer(reduceDescriptor, name);

318

}

319

320

IConnectableLayer* INetwork::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

321

const char* name)

322

{

323

return pNetworkImpl->AddInstanceNormalizationLayer(desc, name);

324

}

325

326

IConnectableLayer* INetwork::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

327

const char* name)

328

{

329

return pNetworkImpl->AddL2NormalizationLayer(desc, name);

330

}

331

332

IConnectableLayer* INetwork::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& logSoftmaxDescriptor,

333

const char* name)

334

{

335

return pNetworkImpl->AddLogSoftmaxLayer(logSoftmaxDescriptor, name);

336

}

337

338

IConnectableLayer* INetwork::AddConstantLayer(const ConstTensor& input,

339

const char* name)

340

{

341

return pNetworkImpl->AddConstantLayer(input, name);

342

}

343

344

IConnectableLayer* INetwork::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

345

const char* name)

346

{

347

return pNetworkImpl->AddReshapeLayer(reshapeDescriptor, name);

348

}

349

350

IConnectableLayer* INetwork::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

351

const char* name)

352

{

353

return pNetworkImpl->AddSpaceToBatchNdLayer(spaceToBatchNdDescriptor, name);

354

}

355

356

IConnectableLayer* INetwork::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

357

const char* name)

358

{

359

return pNetworkImpl->AddSpaceToDepthLayer(spaceToDepthDescriptor, name);

360

}

361

362

IConnectableLayer* INetwork::AddFloorLayer(const char* name)

363

{

364

return pNetworkImpl->AddFloorLayer(name);

365

}

366

IConnectableLayer* INetwork::AddOutputLayer(LayerBindingId id, const char* name)

367

{

368

return pNetworkImpl->AddOutputLayer(id, name);

369

}

370

371

IConnectableLayer* INetwork::AddLstmLayer(const LstmDescriptor& descriptor,

372

const LstmInputParams& params,

373

const char* name)

374

{

375

return pNetworkImpl->AddLstmLayer(descriptor, params, name);

376

}

377

378

IConnectableLayer* INetwork::AddDivisionLayer(const char* name)

379

{

380

return pNetworkImpl->AddDivisionLayer(name);

381

}

382

383

IConnectableLayer* INetwork::AddSubtractionLayer(const char* name)

384

{

385

return pNetworkImpl->AddSubtractionLayer(name);

386

}

387

388

IConnectableLayer* INetwork::AddMaximumLayer(const char* name)

389

{

390

return pNetworkImpl->AddMaximumLayer(name);

391

}

392

393

IConnectableLayer* INetwork::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

394

{

395

return pNetworkImpl->AddMeanLayer(meanDescriptor, name);

396

}

397

398

IConnectableLayer* INetwork::AddPadLayer(const PadDescriptor& padDescriptor,

399

const char* name)

400

{

401

return pNetworkImpl->AddPadLayer(padDescriptor, name);

402

}

403

404

IConnectableLayer* INetwork::AddQuantizeLayer(const char* name)

405

{

406

return pNetworkImpl->AddQuantizeLayer(name);

407

}

408

409

IConnectableLayer* INetwork::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

410

const char* name)

411

{

412

return pNetworkImpl->AddStridedSliceLayer(stridedSliceDescriptor, name);

413

}

414

415

IConnectableLayer* INetwork::AddMinimumLayer(const char* name)

416

{

417

return pNetworkImpl->AddMinimumLayer(name);

418

}

419

420

IConnectableLayer* INetwork::AddGreaterLayer(const char* name)

421

{

422

return pNetworkImpl->AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Greater), name);

423

}

424

425

IConnectableLayer* INetwork::AddEqualLayer(const char* name)

426

{

427

return pNetworkImpl->AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Equal), name);

428

}

429

430

IConnectableLayer* INetwork::AddRsqrtLayer(const char* name)

431

{

432

return pNetworkImpl->AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Rsqrt), name);

433

}

434

435

IConnectableLayer* INetwork::AddGatherLayer(const char* name)

436

{

437

GatherDescriptor gatherDescriptor{};

438

return pNetworkImpl->AddGatherLayer(gatherDescriptor, name);

439

}

440

441

IConnectableLayer* INetwork::AddGatherLayer(const GatherDescriptor& descriptor,

442

const char* name)

443

{

444

return pNetworkImpl->AddGatherLayer(descriptor, name);

445

}

446

447

IConnectableLayer* INetwork::AddSwitchLayer(const char* name)

448

{

449

return pNetworkImpl->AddSwitchLayer(name);

450

}

451

452

IConnectableLayer* INetwork::AddPreluLayer(const char* name)

453

{

454

return pNetworkImpl->AddPreluLayer(name);

455

}

456

457

IConnectableLayer* INetwork::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

458

const ConstTensor& weights,

459

const Optional<ConstTensor>& biases,

460

const char* name)

461

{

462

return pNetworkImpl->AddTransposeConvolution2dLayer(descriptor, weights, biases, name);

463

}

464

465

IConnectableLayer* INetwork::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

466

const char* name)

467

{

468

return pNetworkImpl->AddTransposeLayer(transposeDescriptor, name);

469

}

470

Keith Davis

3ae3f97

2021-05-21 16:33:48 +0100

[diff] [blame]

471

IConnectableLayer* INetwork::AddShapeLayer(const char* name)

472

{

473

return pNetworkImpl->AddShapeLayer(name);

474

}

475

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

476

IConnectableLayer* INetwork::AddStackLayer(const StackDescriptor& descriptor,

477

const char* name)

478

{

479

return pNetworkImpl->AddStackLayer(descriptor, name);

480

}

481

482

IConnectableLayer* INetwork::AddStandInLayer(const StandInDescriptor& descriptor,

483

const char* name)

484

{

485

return pNetworkImpl->AddStandInLayer(descriptor, name);

486

}

487

488

IConnectableLayer* INetwork::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

489

const char* name)

490

{

491

return pNetworkImpl->AddQuantizedLstmLayer(params, name);

492

}

493

494

IConnectableLayer* INetwork::AddQLstmLayer(const QLstmDescriptor& descriptor,

495

const LstmInputParams& params,

496

const char* name)

497

{

498

return pNetworkImpl->AddQLstmLayer(descriptor, params, name);

499

}

500

501

IConnectableLayer* INetwork::AddLogicalBinaryLayer(const LogicalBinaryDescriptor& descriptor,

502

const char* name)

503

{

504

return pNetworkImpl->AddLogicalBinaryLayer(descriptor, name);

505

}

506

Narumol Prangnawarat

8ed39ae

2021-07-15 16:16:25 +0100

[diff] [blame]

507

IConnectableLayer* INetwork::AddUnidirectionalSequenceLstmLayer(

508

const UnidirectionalSequenceLstmDescriptor& descriptor,

509

const LstmInputParams& params,

510

const char* name)

511

{

512

return pNetworkImpl->AddUnidirectionalSequenceLstmLayer(descriptor, params, name);

513

}

514

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

515

void INetwork::Accept(ILayerVisitor& visitor) const

516

{

517

return pNetworkImpl->Accept(visitor);

518

}

519

520

void INetwork::ExecuteStrategy(IStrategy& strategy) const

521

{

522

return pNetworkImpl->ExecuteStrategy(strategy);

523

}

524

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

525

armnn::INetwork* INetwork::CreateRaw(NetworkOptions networkOptions)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

526

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

527

return new INetwork(networkOptions);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

528

}

529

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

530

armnn::INetworkPtr INetwork::Create(NetworkOptions networkOptions)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

531

{

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

532

return INetworkPtr(CreateRaw(networkOptions), &INetwork::Destroy);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

533

}

534

535

void INetwork::Destroy(INetwork* network)

536

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

537

delete network;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

538

}

539

Mike Kelly

0d677db

2021-06-27 22:39:21 +0100

[diff] [blame]

540

IOptimizedNetwork::IOptimizedNetwork(const IOptimizedNetwork& other, const ModelOptions& modelOptions)

541

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(*other.pOptimizedNetworkImpl.get(), modelOptions)) {}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

542

543

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<Graph> graph)

544

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph))) {}

545

546

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<OptimizedNetworkImpl> impl)

547

: pOptimizedNetworkImpl(std::move(impl)) {}

548

549

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<Graph> graph, const ModelOptions& modelOptions)

550

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph), modelOptions)) {}

551

552

IOptimizedNetwork::~IOptimizedNetwork() = default;

553

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

554

void IOptimizedNetwork::Destroy(IOptimizedNetwork* network)

555

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

556

delete network;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

557

}

558

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

559

Status IOptimizedNetwork::PrintGraph()

560

{

561

return pOptimizedNetworkImpl->PrintGraph();

562

}

563

564

Status IOptimizedNetwork::SerializeToDot(std::ostream& stream) const

565

{

566

return pOptimizedNetworkImpl->SerializeToDot(stream);

567

}

568

569

profiling::ProfilingGuid IOptimizedNetwork::GetGuid() const

570

{

571

return pOptimizedNetworkImpl->GetGuid();

572

}

573

574

Status OptimizedNetworkImpl::PrintGraph()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

575

{

576

m_Graph->Print();

577

return Status::Success;

578

}

579

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

580

Status OptimizedNetworkImpl::SerializeToDot(std::ostream& stream) const

surmeh01

bceff2f

2018-03-29 16:29:27 +0100

[diff] [blame]

581

{

582

return m_Graph->SerializeToDot(stream);

583

}

584

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

585

void ReportError(const std::string& errorMessage,

586

Optional<std::vector<std::string>&> errorMessages)

587

{

588

std::stringstream fullErrorMessage;

589

fullErrorMessage << "ERROR: " << errorMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

590

ARMNN_LOG(warning) << fullErrorMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

591

if (errorMessages)

592

{

593

errorMessages.value().push_back(fullErrorMessage.str());

}

}

void ReportWarning(const std::string& warningMessage,

598

Optional<std::vector<std::string>&> warningMessages)

599

{

600

std::stringstream fullWarningMessage;

601

fullWarningMessage << "WARNING: " << warningMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

602

ARMNN_LOG(warning) << fullWarningMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

603

if (warningMessages)

604

{

605

warningMessages.value().push_back(fullWarningMessage.str());

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

609

OptimizationResult ReturnWithError(OptimizationResult res,

610

const Layer* layer,

611

const BackendSettings& backendSettings,

612

Optional<std::vector<std::string>&> errMessages)

613

{

614

std::stringstream failureMsg;

615

failureMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

616

<< " is not supported on any preferred backend " << backendSettings.m_PreferredBackends;

617

ReportError(failureMsg.str(), errMessages);

res.m_Error = true;

return res;

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

624

bool CheckScaleSetOnQuantizedType(Layer* layer, Optional<std::vector<std::string>&> errMessages)

625

{

626

bool noErrors = true;

627

unsigned int numOutputs = layer->GetNumOutputSlots();

628

for (unsigned int i = 0; i < numOutputs; i++) {

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

629

OutputSlot& outputSlot = layer->GetOutputSlot(i);

630

TensorInfo info = outputSlot.GetTensorInfo();

Derek Lamberti

f90c56d

2020-01-10 17:14:08 +0000

[diff] [blame]

631

if (DataType::QAsymmU8 == info.GetDataType()) {

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

632

if (0.f == info.GetQuantizationScale()) {

633

noErrors = false;

634

std::stringstream ss;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

635

ss << "output " << i << " of layer " << GetLayerTypeAsCString(layer->GetType())

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

636

<< " (" << layer->GetNameStr() << ") is of type"

637

<< " Quantized 8 bit but its scale parameter has not been set";

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

638

ReportError(ss.str(), errMessages);

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

639

}

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

640

// Softmax under QuantisedAsymm8 must always be scale (1.0f/256.0f) and offset 0

641

if ((info.GetQuantizationScale() != (1.0f / 256.0f) ||

642

info.GetQuantizationOffset() != 0) &&

643

layer->GetType() == armnn::LayerType::Softmax)

644

{

645

std::stringstream ss;

646

ss << "Quantization parameters for Softmax layer (Scale: " <<

647

info.GetQuantizationScale() << " and Offset: " << info.GetQuantizationOffset() <<

648

") are incorrect and have been updated to Scale: 0.00390625 and Offset: 0";

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

649

ARMNN_LOG(warning) << ss.str();

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

650

info.SetQuantizationScale((1.0f /256.0f));

651

info.SetQuantizationOffset(0);

652

outputSlot.SetTensorInfo(info);

653

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

}

}

return noErrors;

}

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

659

template <typename LayerT>

660

LayerT* ConvertBf16ToFp32Weight(Layer* l)

661

{

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

662

LayerT* layer = PolymorphicDowncast<LayerT*>(l);

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

663

if ((layer->GetType() == LayerType::Convolution2d || layer->GetType() == LayerType::FullyConnected)

664

&& layer->m_Weight)

665

{

666

const TensorInfo& info = layer->m_Weight->GetTensorInfo();

667

668

if (info.GetDataType() == DataType::BFloat16)

669

{

670

std::vector<float> newValues(info.GetNumElements());

671

672

armnnUtils::FloatingPointConverter::ConvertBFloat16ToFloat32(

Finn Williams

4422cec

2021-03-22 17:51:06 +0000

[diff] [blame]

673

layer->m_Weight->template GetConstTensor<armnn::BFloat16>(), info.GetNumElements(), newValues.data());

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

674

675

TensorInfo newInfo(info.GetShape(), DataType::Float32);

676

ConstTensor newInput(newInfo, newValues);

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

677

layer->m_Weight.reset(new ScopedTensorHandle(newInput));

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

}

}

return layer;

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

683

OptimizationResult AttemptBackendAssignment(BackendSettings& backendSettings,

Graph& graph,

Layer* layer,

BackendId backend,

DataType dataTypeIn,

DataType dataTypeOut,

689

const std::vector<BackendId>& availablePreferredBackends,

690

std::string& reasonIfUnsupported,

691

Optional<std::vector<std::string>&> errMessages)

692

{

693

OptimizationResult result;

694

695

// Helper lambda to compose meaningful error message before returning with error

696

auto ReturnError = [&](const Layer* layer)

697

{

698

return ReturnWithError(result, layer, backendSettings, errMessages);

699

};

700

701

// need to set the compute device on the layer

702

// before we can check if it is supported

703

layer->SetBackendId(backend);

704

if (!IWorkloadFactory::IsLayerSupported(*layer, EmptyOptional(), reasonIfUnsupported))

705

{

706

if (dataTypeIn == DataType::Float16 || dataTypeOut == DataType::Float16)

707

{

708

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

709

&& layer->GetType() != LayerType::ConvertFp32ToFp16

710

&& layer->GetType() != LayerType::ConvertFp16ToFp32)

711

{

712

// Insert FP16 -> FP32 conversion layer before current layer

713

std::vector<ConvertFp16ToFp32Layer*> convertFp16ToFp32Layers;

714

if (dataTypeIn == DataType::Float16)

715

{

716

convertFp16ToFp32Layers =

717

InsertConvertFp16ToFp32LayersBefore(graph, *layer);

718

}

719

720

// Insert FP32 -> FP16 conversion layer after current layer

721

std::vector<ConvertFp32ToFp16Layer*> convertFp32ToFp16Layers;

722

if (dataTypeOut == DataType::Float16)

723

{

724

convertFp32ToFp16Layers =

725

InsertConvertFp32ToFp16LayersAfter(graph, *layer);

726

}

727

728

// Assign a supported backend to the newly introduced conversion layers

729

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

730

{

731

bool supportedBackendFound = false;

732

std::string reasonIfUnsupported;

733

734

// Try preferred backend first

735

layer->SetBackendId(preferredBackend);

736

if (IWorkloadFactory::IsLayerSupported(*layer,

737

EmptyOptional(),

738

reasonIfUnsupported))

739

{

740

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

745

{

746

// Skip preferred backend (we already determined that it is not supported)

747

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

753

if (IWorkloadFactory::IsLayerSupported(*layer,

754

EmptyOptional(),

755

reasonIfUnsupported))

756

{

757

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

764

};

765

766

for (ConvertFp16ToFp32Layer* convertLayer : convertFp16ToFp32Layers)

767

{

768

if (!AssignFirstSupportedBackend(convertLayer, backend))

769

{

770

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToFp16Layer* convertLayer : convertFp32ToFp16Layers)

775

{

776

if (!AssignFirstSupportedBackend(convertLayer, backend))

777

{

778

return ReturnError(convertLayer);

}

}

return result;

}

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

785

else if (dataTypeIn == DataType::BFloat16 || dataTypeOut == DataType::BFloat16)

786

{

787

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

788

&& layer->GetType() != LayerType::ConvertFp32ToBf16

789

&& layer->GetType() != LayerType::ConvertBf16ToFp32)

790

{

791

// Insert BF16 -> FP32 conversion layer before current layer

792

std::vector<ConvertBf16ToFp32Layer*> convertBf16ToFp32Layers;

793

if (dataTypeIn == DataType::BFloat16)

794

{

795

convertBf16ToFp32Layers =

796

InsertConvertBf16ToFp32LayersBefore(graph, *layer);

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

797

if (layer->GetType() == LayerType::Convolution2d)

798

{

799

ConvertBf16ToFp32Weight<Convolution2dLayer>(layer);

800

}

801

else if (layer->GetType() == LayerType::FullyConnected)

802

{

803

ConvertBf16ToFp32Weight<FullyConnectedLayer>(layer);

804

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

805

}

806

807

// Insert FP32 -> BF16 conversion layer after current layer

808

std::vector<ConvertFp32ToBf16Layer*> convertFp32ToBf16Layers;

809

if (dataTypeOut == DataType::BFloat16)

810

{

811

convertFp32ToBf16Layers =

812

InsertConvertFp32ToBf16LayersAfter(graph, *layer);

813

}

814

815

// Assign a supported backend to the newly introduced conversion layers

816

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

817

{

818

bool supportedBackendFound = false;

819

std::string reasonIfUnsupported;

820

821

// Try preferred backend first

822

layer->SetBackendId(preferredBackend);

823

if (IWorkloadFactory::IsLayerSupported(*layer,

824

EmptyOptional(),

825

reasonIfUnsupported))

826

{

827

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

832

{

833

// Skip preferred backend (we already determined that it is not supported)

834

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

840

if (IWorkloadFactory::IsLayerSupported(*layer,

841

EmptyOptional(),

842

reasonIfUnsupported))

843

{

844

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

851

};

852

853

for (ConvertBf16ToFp32Layer* convertLayer : convertBf16ToFp32Layers)

854

{

855

if (!AssignFirstSupportedBackend(convertLayer, backend))

856

{

857

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToBf16Layer* convertLayer : convertFp32ToBf16Layers)

862

{

863

if (!AssignFirstSupportedBackend(convertLayer, backend))

864

{

865

return ReturnError(convertLayer);

}

}

return result;

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

873

std::stringstream warningMsg;

874

warningMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

875

<< " is not supported on requested backend " << layer->GetBackendId().Get()

876

<< " for input data type " << GetDataTypeName(dataTypeIn)

877

<< " and output data type " << GetDataTypeName(dataTypeOut)

878

<< " (reason: " << reasonIfUnsupported

879

<< "), falling back to the next backend.";

880

ReportWarning(warningMsg.str(), errMessages);

881

882

return OptimizationResult(true, false);

}

else

{

return result;

}

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

891

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

892

BackendSettings& backendSettings,

893

Graph::Iterator& firstLayer,

894

Graph::Iterator& lastLayer,

895

Optional<std::vector<std::string>&> errMessages)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

896

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

897

OptimizationResult result;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

898

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

899

// Helper lambda to compose meaningful error message before returning with error

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

900

auto ReturnError = [&](const Layer* layer)

901

{

902

return ReturnWithError(result, layer, backendSettings, errMessages);

903

};

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

904

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

905

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

906

auto availablePreferredBackends = backendSettings.GetAvailablePreferredBackends();

907

if (availablePreferredBackends.empty())

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

908

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

909

std::stringstream failureMsg;

910

failureMsg << "No preferred backends are available";

911

ReportError(failureMsg.str(), errMessages);

912

913

result.m_Error = true;

return result;

}

for (auto it = firstLayer; it != lastLayer; ++it)

918

{

919

auto layer = *it;

Aron Virginas-Tar

87972be

2019-11-13 15:16:28 +0000

[diff] [blame]

920

921

DataType dataTypeIn = layer->GetNumInputSlots() == 0 ? DataType::Float32 :

922

layer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo().GetDataType();

923

DataType dataTypeOut = layer->GetNumOutputSlots() == 0 ? DataType::Float32 :

924

layer->GetOutputSlot(0).GetTensorInfo().GetDataType();

925

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

926

std::string reasonIfUnsupported;

927

bool found = false;

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

928

if (!CheckScaleSetOnQuantizedType(layer, errMessages))

929

{

930

// don't bomb immediately, find all the quantized outputs

931

// which haven't had a scale set and report them all back.

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

932

result.m_Error = true;

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

933

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

934

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

935

// First try assign layer to hint backend

936

if (layer->GetBackendHint().has_value() &&

937

backendSettings.IsBackendSupported(layer->GetBackendHint().value()) &&

938

AttemptBackendAssignment(backendSettings,

939

optNetObjPtr->GetGraph(),

940

layer,

941

layer->GetBackendHint().value(),

942

dataTypeIn,

943

dataTypeOut,

944

availablePreferredBackends,

945

reasonIfUnsupported,

946

errMessages).IsOk())

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

947

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

948

found = true;

949

backendSettings.m_SelectedBackends.insert(layer->GetBackendHint().value());

}

else

{

// Try assign layer to prefered list of backends

954

for (const auto& backend : availablePreferredBackends)

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

955

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

956

if (layer->GetBackendHint().has_value() &&

957

layer->GetBackendHint().value() == backend)

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

958

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

959

continue; //Don't re-test the backend hint

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

960

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

961

962

OptimizationResult res = AttemptBackendAssignment(backendSettings,

963

optNetObjPtr->GetGraph(),

layer,

backend,

dataTypeIn,

dataTypeOut,

availablePreferredBackends,

reasonIfUnsupported,

errMessages);

if (res.IsOk())

{

found = true;

backendSettings.m_SelectedBackends.insert(backend);

976

break;

977

}

978

else if (res.IsError())

979

{

980

return res; // Cannot continue.

981

// Note: we don't need to log the error as it would already

982

// be logged in AttemptBackendAssignment().

983

}

984

else

985

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

986

ARMNN_ASSERT_MSG(res.IsWarningOnly(), "OptimizationResult in unexpected state.");

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

987

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

}

}

// If the layer is unsupported by any devices, log and return a null network.

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

992

if (!found)

993

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

994

// NOTE: if the layer is not an operation queue type AND we have not got CpuRef as a

995

// fallback we should set the compute device on the layer to CpuRef (these are not

996

// available as accelerated operations, or are only available under certain

997

// conditions, currently they comprise MemCopy, Constant, Permute)

998

armnn::LayerType layerType = layer->GetType();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

999

if (!backendSettings.IsCpuRefUsed() && (layerType == armnn::LayerType::MemCopy ||

1000

layerType == armnn::LayerType::Constant ||

1001

layerType == armnn::LayerType::Permute))

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1002

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1003

BackendId cpuBackendId(armnn::Compute::CpuRef);

1004

layer->SetBackendId(cpuBackendId);

1005

backendSettings.m_SelectedBackends.insert(cpuBackendId);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1006

}

1007

else

1008

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

1009

return ReturnError(layer);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1010

}

1011

}

1012

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

return result;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1017

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1018

BackendSettings& backendSettings,

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1019

SubgraphView& subgraph,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1020

Optional<std::vector<std::string>&> errMessages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1021

{

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1022

Graph::Iterator firstLayer = subgraph.begin();

1023

Graph::Iterator lastLayer = subgraph.end();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1024

return AssignBackends(optNetObjPtr,

backendSettings,

firstLayer,

lastLayer,

errMessages);

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1031

BackendsMap CreateSupportedBackends(TensorHandleFactoryRegistry& handleFactoryRegistry,

1032

BackendSettings& backendSettings)

1033

{

1034

BackendsMap backends;

1035

auto const& backendRegistry = BackendRegistryInstance();

1036

for (auto&& selectedBackend : backendSettings.m_SupportedBackends)

1037

{

1038

auto backendFactory = backendRegistry.GetFactory(selectedBackend);

1039

auto backendObjPtr = backendFactory();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1040

ARMNN_ASSERT(backendObjPtr);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1041

1042

backendObjPtr->RegisterTensorHandleFactories(handleFactoryRegistry);

1043

1044

backends[backendObjPtr->GetId()] = std::move(backendObjPtr);

}

return backends;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1050

OptimizationResult ApplyBackendOptimizations(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1051

BackendSettings& backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1052

BackendsMap& backends,

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1053

const ModelOptions& modelOptions,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1054

Optional<std::vector<std::string>&> errMessages)

1055

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1056

ARMNN_ASSERT(optNetObjPtr);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1057

1058

OptimizationResult result;

1059

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1060

// Get the optimized graph

1061

Graph& optGraph = optNetObjPtr->GetGraph();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1062

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1063

// Run backend specific optimizations

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1064

for (auto&& selectedBackend : backendSettings.m_SelectedBackends)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1065

{

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1066

auto backendObjPtr = backends.find(selectedBackend)->second.get();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1067

ARMNN_ASSERT(backendObjPtr);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1068

1069

// Select sub-graphs based on backend

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1070

SubgraphViewSelector::Subgraphs subgraphs =

Rob Hughes

65c3226

2019-07-23 15:33:39 +0100

[diff] [blame]

1071

SubgraphViewSelector::SelectSubgraphs(optGraph,

Matteo Martincigh

602af09

2019-05-01 10:31:27 +0100

[diff] [blame]

1072

// Select layers assigned to the requested backend

1073

[&backendObjPtr](const Layer& layer)

1074

{

1075

return layer.GetType() != LayerType::Input &&

1076

layer.GetType() != LayerType::Output &&

1077

layer.GetBackendId() == backendObjPtr->GetId();

1078

});

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1079

if (subgraphs.empty())

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1080

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1081

// No sub-graphs found, try with next selected backend

1082

continue;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1083

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1084

1085

// Try to optimize each sub-graph

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1086

for (auto& subgraph : subgraphs)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1087

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1088

// Try to optimize the current sub-graph

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1089

OptimizationViews optimizationViews = backendObjPtr->OptimizeSubgraphView(*subgraph, modelOptions);

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1090

ARMNN_ASSERT(optimizationViews.Validate(*subgraph));

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1091

1092

// Optimization attempted, check the resulting optimized sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1093

for (auto& substitution : optimizationViews.GetSubstitutions())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1094

{

1095

// Sub-graph optimized, substitute the sub-graph with the new optimized one in the main optimized graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1096

SubgraphView& replacementSubgraph = substitution.m_ReplacementSubgraph;

1097

SubgraphView& substitutableSubgraph = substitution.m_SubstitutableSubgraph;

1098

optGraph.SubstituteSubgraph(substitutableSubgraph, replacementSubgraph);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1099

1100

// Assign the current backend to the optimized sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1101

std::for_each(replacementSubgraph.begin(), replacementSubgraph.end(), [&selectedBackend](Layer* l)

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1102

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1103

ARMNN_ASSERT(l);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1104

l->SetBackendId(selectedBackend);

1105

});

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1106

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1107

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1108

if (!optimizationViews.GetFailedSubgraphs().empty())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1109

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1110

std::stringstream warningMsg;

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1111

warningMsg << "Some sub-graph(s) failed to optimized on " << backendObjPtr->GetId() << " backend.";

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1112

ReportWarning(warningMsg.str(), errMessages);

1113

1114

// Failed to optimize the given sub-graph, re-assign the sub-graph layers to other available backends

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1115

BackendSettings settingsCopy(backendSettings);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1116

if (!backendObjPtr->GetId().IsCpuRef())

1117

{

1118

// Add the current backend to the list of backends to ignore

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1119

settingsCopy.m_IgnoredBackends.insert(backendObjPtr->GetId());

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1120

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1121

1122

int count=0;

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1123

for (auto& failedSubgraph : optimizationViews.GetFailedSubgraphs())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1124

{

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1125

// An error occurred: the optimization was attempted but not performed, try different backends

1126

std::stringstream subgraphMsg;

1127

subgraphMsg << "Re-assigning backends to " << failedSubgraph.GetLayers().size()

1128

<< " layers inside sub-graph " << count++;

Matteo Martincigh

328d92b

2019-07-04 17:52:55 +0100

[diff] [blame]

1129

ReportWarning(subgraphMsg.str(), errMessages);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1130

1131

OptimizationResult reassignmentResult = AssignBackends(optNetObjPtr,

settingsCopy,

*subgraph,

errMessages);

if (reassignmentResult.m_Error)

1136

{

1137

// Failed to re-assign one of the remaining backends to each layer of the sub-graph

1138

result.m_Error = true;

1139

return result;

1140

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1141

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

}

}

}

return result;

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1149

bool RequiresCopy(ITensorHandleFactory::FactoryId src,

1150

ITensorHandleFactory::FactoryId dst,

1151

TensorHandleFactoryRegistry& registry)

{

if (src != dst)

{

ITensorHandleFactory* srcFactory = registry.GetFactory(src);

1156

ITensorHandleFactory* dstFactory = registry.GetFactory(dst);

1157

Matteo Martincigh

a6539ed

2019-08-27 13:43:32 +0100

[diff] [blame]

1158

if (srcFactory && dstFactory &&

1159

(srcFactory->GetExportFlags() & dstFactory->GetImportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

{

return false;

}

return true;

}

return false;

}

// Find the handle factory for the input layer which results in fewest required copies.

1169

ITensorHandleFactory::FactoryId CalculateSlotOptionForInput(BackendsMap& backends,

1170

OutputSlot& slot,

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1171

TensorHandleFactoryRegistry& registry,

1172

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1173

{

1174

Layer& layer = slot.GetOwningLayer();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1175

ARMNN_ASSERT(layer.GetType() == LayerType::Input);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1176

1177

// Explicitly select the tensorhandle factory for InputLayer because the rules for it are slightly different. It

1178

// doesn't matter which backend it is assigned to because they all use the same implementation, which

1179

// requires Map/Unmap support. This means that, so long as the handle type supports map/unmap semantics, we can

1180

// select a factory with maximum compatibility with the layers connected to the InputLayer.

1181

1182

// First ensure the from backends can support the TensorHandeAPI

1183

auto frmBackend = backends.find(layer.GetBackendId());

1184

if (frmBackend == backends.end() ||

1185

!frmBackend->second->SupportsTensorAllocatorAPI())

1186

{

1187

return ITensorHandleFactory::LegacyFactoryId;

1188

}

1189

1190

// Go through all connections to the output slot and determine the TensorHandleFactory which results in the

1191

// fewest copies.

1192

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

1193

int topScore = 0;

1194

ITensorHandleFactory::FactoryId topChoice = ITensorHandleFactory::LegacyFactoryId;

1195

1196

for (auto&& connection : slot.GetConnections())

1197

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1198

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1199

const Layer& connectedLayer = connection->GetOwningLayer();

1200

1201

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1202

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1203

1204

if (!toBackend->second.get()->SupportsTensorAllocatorAPI())

1205

{

1206

// The destination backend does not support the tensor allocator API, move to the next one

continue;

}

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1211

for (auto&& dst : dstPrefs)

1212

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1213

// Input layers use the mem copy workload or import, so the selected factory must

1214

// support either the map/unmap API or Import API

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1215

ITensorHandleFactory* factory = registry.GetFactory(dst);

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1216

if (importEnabled && factory->GetImportFlags() == 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1217

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1218

continue;

1219

}

1220

else if (!importEnabled && !factory->SupportsMapUnmap())

1221

{

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

continue;

}

auto it = factoryScores.find(dst);

1226

if (it == factoryScores.end())

1227

{

1228

// Add new score to the table

1229

factoryScores[dst] = 0;

1230

if (topChoice == ITensorHandleFactory::LegacyFactoryId)

{

topChoice = dst;

}

}

else

{

// Increase the score

1238

factoryScores[dst]++;

1239

1240

// Track the best option

1241

if (factoryScores[dst] > topScore)

1242

{

1243

topScore = factoryScores[dst];

topChoice = dst;

}

}

}

}

return topChoice;

}

// Find the handle factory for the output layer which results in fewest required copies.

1254

ITensorHandleFactory::FactoryId CalculateSlotOptionForOutput(BackendsMap& backends,

1255

OutputSlot& slot,

1256

TensorHandleFactoryRegistry& registry)

1257

{

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

1258

IgnoreUnused(backends, slot, registry);

Derek Lamberti

94a88d2

2019-12-10 21:12:59 +0000

[diff] [blame]

1259

return ITensorHandleFactory::DeferredFactoryId;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1260

}

1261

1262

// For all handle factories supported on the source backend, we wish to find the one which requires the fewest copies

1263

// when considering all connections.

1264

ITensorHandleFactory::FactoryId CalculateSlotOption(BackendsMap& backends,

1265

OutputSlot& outputSlot,

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1266

TensorHandleFactoryRegistry& registry,

1267

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1268

{

1269

// First ensure the from backends can support the TensorHandeAPI

1270

Layer& layer = outputSlot.GetOwningLayer();

1271

auto frmBackend = backends.find(layer.GetBackendId());

1272

if (frmBackend == backends.end() ||

1273

!frmBackend->second->SupportsTensorAllocatorAPI())

1274

{

1275

return ITensorHandleFactory::LegacyFactoryId;

1276

}

1277

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1278

bool outputConnection = false;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1279

for (auto&& connection : outputSlot.GetConnections())

1280

{

1281

const Layer& connectedLayer = connection->GetOwningLayer();

1282

if (connectedLayer.GetType() == LayerType::Output)

1283

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1284

outputConnection = true;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

IBackendInternal* srcBackend = frmBackend->second.get();

1289

auto srcPrefs = srcBackend->GetHandleFactoryPreferences();

1290

1291

// Initialize the scores

1292

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

1293

for (auto&& pref : srcPrefs)

1294

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1295

if (importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1296

{

1297

ITensorHandleFactory* factory = registry.GetFactory(pref);

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1298

if (outputConnection)

1299

{

1300

// Check if this is fallback case

1301

bool fallbackConnection = false;

1302

for (auto&& inputSlot : layer.GetInputSlots())

1303

{

1304

if (inputSlot.GetConnectedOutputSlot()->GetOwningLayer().GetBackendId() != layer.GetBackendId())

1305

{

1306

fallbackConnection = true;

1307

}

1308

}

1309

if (fallbackConnection)

1310

{

1311

auto factoryCap = factory->GetCapabilities(&layer, &layer, CapabilityClass::FallbackImportDisabled);

1312

// Cannot use factory import if fallback import is not supported.

1313

if (!factoryCap.empty())

{

continue;

}

}

else if (factory->GetExportFlags() == 0)

{

continue;

}

}

if (!outputConnection)

1324

{

1325

auto factoryCap = factory->GetCapabilities(&layer, &layer, CapabilityClass::FallbackImportDisabled);

1326

// Cannot use factory import if fallback import is not supported.

1327

if (!factoryCap.empty())

{

continue;

}

}

}

else

{

// Only consider factories that support map/unmap

1337

ITensorHandleFactory* factory = registry.GetFactory(pref);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1338

if (!factory->SupportsMapUnmap())

1339

{

1340

// The current tensor handle factory does not support the map/unmap strategy, move to the next one

continue;

}

}

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1345

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1346

auto it = factoryScores.find(pref);

1347

if (it == factoryScores.end())

1348

{

1349

// Add new score to the table

1350

factoryScores[pref] = 0;

}

}

// Score each handle factory based on how many times it requires copies on the slot connections

1355

for (auto&& connection : outputSlot.GetConnections())

1356

{

1357

const Layer& connectedLayer = connection->GetOwningLayer();

1358

1359

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1360

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1361

1362

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1363

for (auto&& src : srcPrefs)

1364

{

1365

if (factoryScores.find(src) == factoryScores.end()) // Don't consider excluded factories

{

continue;

}

for (auto&& dst : dstPrefs)

1371

{

1372

if (RequiresCopy(src, dst, registry))

1373

{

1374

// Copy avoided, increase the score

1375

factoryScores[src]++;

break;

}

}

}

}

// Find the lowest score

1383

int minScore = std::numeric_limits<int>::max();

1384

for (auto it : factoryScores)

1385

{

1386

minScore = std::min(minScore, it.second);

1387

}

1388

1389

// Collect factories matching the best(lowest) score

1390

std::vector<ITensorHandleFactory::FactoryId> optimalFactories;

1391

for (auto it : factoryScores)

1392

{

1393

if (it.second == minScore)

1394

{

1395

optimalFactories.push_back(it.first);

}

}

// For all compatible Factories matching the best score, find the preferred one for the current layer.

1400

for (auto&& srcPref : srcPrefs)

1401

{

1402

for (auto&& comp : optimalFactories)

{

if (comp == srcPref)

{

return comp;

}

}

}

return ITensorHandleFactory::LegacyFactoryId;

1412

}

1413

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1414

EdgeStrategy CalculateEdgeStrategy(BackendsMap& backends,

1415

ITensorHandleFactory::FactoryId srcFactoryId,

1416

const Layer& layer,

1417

const Layer& connectedLayer,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1418

TensorHandleFactoryRegistry& registry,

1419

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1420

{

1421

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1422

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1423

1424

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1425

1426

// Legacy API check for backward compatibility

1427

if (srcFactoryId == ITensorHandleFactory::LegacyFactoryId || dstPrefs.empty())

1428

{

1429

if (layer.GetBackendId() != connectedLayer.GetBackendId())

1430

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1431

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1432

}

1433

else

1434

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1435

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// TensorHandleFactory API present, so perform more sophisticated strategies.

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1440

// Dst Output layers don't require copy because they use import or map/unmap

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1441

if (connectedLayer.GetType() == LayerType::Output)

1442

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1443

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1444

}

1445

1446

// Search for direct match in prefs

1447

for (auto&& pref : dstPrefs)

1448

{

1449

if (pref == srcFactoryId)

1450

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1451

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// Search for export/import options

1456

ITensorHandleFactory* srcFactory = registry.GetFactory(srcFactoryId);

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1457

if (srcFactory->GetExportFlags() != 0 && importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1458

{

1459

for (auto&& pref : dstPrefs)

1460

{

1461

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1462

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1463

// Handles cases when a destPref is not listed in TensorHandleFactoryRegistry

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1464

if (!dstFactory) {

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1465

continue;

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1466

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1467

if ((dstFactory->GetImportFlags() & srcFactory->GetExportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1468

{

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1469

auto srcCapability = srcFactory->GetCapabilities(&layer, &layer, CapabilityClass::PaddingRequired);

1470

auto dstCapability = dstFactory->GetCapabilities(&connectedLayer,

1471

&connectedLayer,

1472

CapabilityClass::PaddingRequired);

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1473

auto srcFallback = srcFactory->GetCapabilities(&layer, &layer, CapabilityClass::FallbackImportDisabled);

1474

auto dstFallback = dstFactory->GetCapabilities(&connectedLayer,

1475

&connectedLayer,

1476

CapabilityClass::FallbackImportDisabled);

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1477

// Do not require memory copy if the source and destination do not require padding.

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1478

if (srcCapability.empty() && dstCapability.empty() && srcFallback.empty() && dstFallback.empty())

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1479

{

1480

return EdgeStrategy::ExportToTarget;

1481

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

// Search for copy options via map/unmap

1487

if (srcFactory->SupportsMapUnmap())

1488

{

1489

for (auto&& pref : dstPrefs)

1490

{

1491

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1492

if (dstFactory && dstFactory->SupportsMapUnmap())

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1493

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1494

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1499

return EdgeStrategy::Undefined;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1500

}

1501

1502

// Select the TensorHandleFactories and the corresponding memory strategy

1503

OptimizationResult SelectTensorHandleStrategy(Graph& optGraph,

1504

BackendsMap& backends,

1505

TensorHandleFactoryRegistry& registry,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1506

bool importEnabled,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1507

Optional<std::vector<std::string>&> errMessages)

1508

{

1509

OptimizationResult result;

1510

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1511

optGraph.ForEachLayer([&backends, &registry, &result, &errMessages, importEnabled](Layer* layer)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1512

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1513

ARMNN_ASSERT(layer);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1514

1515

// Lets make sure the backend is in our list of supported backends. Something went wrong during backend

1516

// assignment if this check fails

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1517

ARMNN_ASSERT(backends.find(layer->GetBackendId()) != backends.end());

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1518

1519

// Check each output separately

1520

for (unsigned int slotIdx = 0; slotIdx < layer->GetNumOutputSlots(); slotIdx++)

1521

{

1522

OutputSlot& outputSlot = layer->GetOutputSlot(slotIdx);

1523

1524

ITensorHandleFactory::FactoryId slotOption = ITensorHandleFactory::LegacyFactoryId;

1525

1526

// Calculate the factory to use which results in the fewest copies being made.

1527

switch(layer->GetType())

1528

{

1529

case LayerType::Input:

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1530

slotOption = CalculateSlotOptionForInput(backends, outputSlot, registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1531

break;

1532

case LayerType::Output:

1533

slotOption = CalculateSlotOptionForOutput(backends, outputSlot, registry);

1534

break;

1535

default:

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1536

slotOption = CalculateSlotOption(backends, outputSlot, registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1537

break;

1538

}

1539

outputSlot.SetTensorHandleFactory(slotOption);

1540

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1541

// Now determine the "best" edge strategy for each connection given the slotOption.

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1542

unsigned int connectionIdx = 0;

1543

for (auto&& connection : outputSlot.GetConnections())

1544

{

1545

const Layer& connectedLayer = connection->GetOwningLayer();

1546

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1547

EdgeStrategy strategy = CalculateEdgeStrategy(backends, slotOption, *layer, connectedLayer,

1548

registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1549

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1550

if (strategy == EdgeStrategy::Undefined)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1551

{

1552

result.m_Error = true;

1553

if (errMessages)

1554

{

1555

errMessages.value().emplace_back("Could not find valid strategy required for compatibility"

1556

" between backends.");

}

return;

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1561

outputSlot.SetEdgeStrategy(connectionIdx, strategy);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

connectionIdx++;

}

}

});

return result;

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1571

IOptimizedNetworkPtr Optimize(const INetwork& inNetwork,

1572

const std::vector<BackendId>& backendPreferences,

1573

const IDeviceSpec& deviceSpec,

1574

const OptimizerOptions& options,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1575

Optional<std::vector<std::string>&> messages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1576

{

1577

if (backendPreferences.empty())

1578

{

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1579

throw InvalidArgumentException("Invoked Optimize with no backends specified");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1580

}

1581

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1582

if (options.m_ReduceFp32ToFp16 && options.m_ReduceFp32ToBf16)

1583

{

1584

throw InvalidArgumentException("BFloat16 and Float16 optimization cannot be enabled at the same time.");

1585

}

1586

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1587

std::unique_ptr<Graph> graph = std::make_unique<Graph>(inNetwork.pNetworkImpl->GetGraph());

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1588

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1589

auto optNet = IOptimizedNetworkPtr(new IOptimizedNetwork(std::move(graph), options.m_ModelOptions),

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

1590

&IOptimizedNetwork::Destroy);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1591

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1592

IOptimizedNetwork* optNetObjPtr = optNet.get();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1593

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1594

// Get the optimized graph

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1595

Graph& optGraph = optNetObjPtr->pOptimizedNetworkImpl->GetGraph();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1596

Finn Williams

d218d98

2021-08-09 13:00:08 +0100

[diff] [blame^]

1597

if(options.m_shapeInferenceMethod == ShapeInferenceMethod::InferAndValidate)

1598

{

1599

// Infer the tensor infos for all output slots. Throws an exception on failure

1600

optGraph.InferTensorInfos();

1601

}

Finn Williams

84e025a

2021-08-05 17:29:32 +0100

[diff] [blame]

1602

Narumol Prangnawarat

16f82f9

2020-09-14 16:12:44 +0100

[diff] [blame]

1603

// Perform AddBroadcastReshapeLayer optimisation

1604

using namespace optimizations;

1605

Optimizer::Pass(optGraph, MakeOptimizations(AddBroadcastReshapeLayer()));

1606

Finn Williams

d218d98

2021-08-09 13:00:08 +0100

[diff] [blame^]

1607

if(options.m_shapeInferenceMethod == ShapeInferenceMethod::ValidateOnly)

1608

{

1609

// Validate the tensor infos for all output slots. Throws an exception on failure

1610

optGraph.InferTensorInfos();

1611

}

1612

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1613

// Perform optimisation passes

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1614

Optimizer::Pass(optGraph, MakeOptimizations(SquashEqualPermuteSiblings(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1615

SquashEqualTransposeSiblings(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1616

SquashEqualReshapeSiblings(),

1617

OptimizeInversePermutes(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1618

OptimizeInverseTransposes(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1619

MovePermuteUp(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1620

MoveTransposeUp(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1621

PermuteAsReshape(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1622

TransposeAsReshape(),

Nina Drozd

861985f

2019-04-18 14:48:51 +0100

[diff] [blame]

1623

OptimizeConsecutiveReshapes(),

Matthew Sloyan

33f8987

2021-06-30 10:20:17 +0100

[diff] [blame]

1624

RedirectMembersToConstantInputs(),

Rob Hughes

3a7d3a7

2019-09-24 16:59:56 +0100

[diff] [blame]

1625

FoldPadIntoConvolution2d(),

Teresa Charlin

5786eb7

2021-05-21 16:29:45 +0100

[diff] [blame]

1626

FoldPadIntoDepthwiseConvolution2d(),

Diego Lopez Recas

fe95d72

2021-03-19 12:40:16 +0000

[diff] [blame]

1627

FoldPadIntoPooling2d(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1628

PermuteAndBatchToSpaceAsDepthToSpace(),

Teresa Charlin

06e0300

2020-10-15 13:16:07 +0100

[diff] [blame]

1629

TransposeAndBatchToSpaceAsDepthToSpace(),

Mike Kelly

90231b8

2020-11-05 15:44:56 +0000

[diff] [blame]

1630

FuseBatchNormIntoConvolution2DFloat32(),

1631

FuseBatchNormIntoConvolution2DFloat16(),

1632

FuseBatchNormIntoDepthwiseConvolution2DFloat32(),

1633

FuseBatchNormIntoDepthwiseConvolution2DFloat16()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1634

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1635

// If Fp32 to Fp16 optimization is set convert Fp32 network to Fp16

1636

if (options.m_ReduceFp32ToFp16)

1637

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1638

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToFp16Converter()));

Derek Lamberti

dd6804b

2019-11-27 09:29:57 +0000

[diff] [blame]

1639

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1640

}

1641

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1642

// If Fp32 to Bf16 optimization is set convert Fp32 network to Bf16

Narumol Prangnawarat

57ef008

2020-03-26 09:20:43 +0000

[diff] [blame]

1643

// Convert input of Convolution2d and FullyConnected from Fp32 to Bf16

1644

// Only Constant weight of Convolution2d and FullyConnected are converted from Fp32 to Bf16

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1645

if (options.m_ReduceFp32ToBf16)

1646

{

1647

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToBf16Converter()));

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1648

}

1649

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1650

// Initialize backend settings

1651

BackendSettings backendSettings(backendPreferences, deviceSpec);

1652

if (backendSettings.GetAvailablePreferredBackends().empty())

1653

{

1654

std::stringstream failureMsg;

1655

failureMsg << "None of the preferred backends " << backendPreferences

1656

<< " are supported. Current platform provides " << backendSettings.m_SupportedBackends;

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1657

ReportError(failureMsg.str(), messages);

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1658

throw InvalidArgumentException(failureMsg.str());

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1659

}

1660

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1661

// Create a map to temporarily hold initialized backend objects

1662

TensorHandleFactoryRegistry tensorHandleFactoryRegistry;

1663

BackendsMap backends = CreateSupportedBackends(tensorHandleFactoryRegistry, backendSettings);

1664

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1665

// Assign an available backend to each layer

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1666

Graph::Iterator firstLayer = optGraph.begin();

1667

Graph::Iterator lastLayer = optGraph.end();

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1668

OptimizationResult assignBackendsResult = AssignBackends(optNetObjPtr->pOptimizedNetworkImpl.get(),

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1669

backendSettings,

1670

firstLayer,

1671

lastLayer,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1672

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1673

if (assignBackendsResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1674

{

1675

// Failed to assign a backend to each layer

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1676

throw InvalidArgumentException("Failed to assign a backend to each layer");

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

1677

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1678

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1679

Optimizer::Pass(optGraph, MakeOptimizations(OptimizeInverseConversionsFp16(),

1680

OptimizeInverseConversionsFp32()));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1681

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1682

// Apply the backend-specific optimizations

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1683

OptimizationResult backendOptimizationResult = ApplyBackendOptimizations(optNetObjPtr->pOptimizedNetworkImpl.get(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1684

backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1685

backends,

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1686

options.m_ModelOptions,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1687

messages);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1688

if (backendOptimizationResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1689

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1690

// Failed to apply the backend-specific optimizations

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1691

throw InvalidArgumentException("Failed to apply the backend-specific optimizations");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1692

}

1693

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1694

// If the debug flag is set, then insert a DebugLayer after each layer

1695

// Doing this after applying the backend optimizations as they might have changed some layers

1696

if (options.m_Debug)

1697

{

1698

Optimizer::Pass(optGraph, MakeOptimizations(InsertDebugLayer()));

1699

}

1700

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1701

// Calculate the compatibility strategies for tensor handles

1702

OptimizationResult strategyResult = SelectTensorHandleStrategy(optGraph,

1703

backends,

1704

tensorHandleFactoryRegistry,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1705

options.m_ImportEnabled,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1706

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1707

if (strategyResult.m_Error)

1708

{

1709

// Failed to apply the backend-specific optimizations

1710

return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);

1711

}

1712

1713

// Based on the tensor handle strategy determined above, insert copy layers where required.

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1714

optGraph.AddCompatibilityLayers(backends, tensorHandleFactoryRegistry);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1715

1716

// Convert constants

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1717

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

1718

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsHalfToFloat()));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1719

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1720

// Run backend specific optimizations (deprecated)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1721

for (auto&& chosenBackend : backendSettings.m_SelectedBackends)

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1722

{

1723

auto factoryFun = BackendRegistryInstance().GetFactory(chosenBackend);

1724

auto backendPtr = factoryFun();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1725

ARMNN_ASSERT(backendPtr.get() != nullptr);

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1726

Matteo Martincigh

ed73504

2019-05-22 09:42:43 +0100

[diff] [blame]

1727

ARMNN_NO_DEPRECATE_WARN_BEGIN

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1728

auto backendSpecificOptimizations = backendPtr->GetOptimizations();

Matteo Martincigh

ed73504

2019-05-22 09:42:43 +0100

[diff] [blame]

1729

ARMNN_NO_DEPRECATE_WARN_END

1730

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1731

if (!backendSpecificOptimizations.empty())

1732

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1733

Optimizer::Pass(optNetObjPtr->pOptimizedNetworkImpl->GetGraph(), backendSpecificOptimizations);

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

}

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1737

return optNet;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1738

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1739

bool NetworkImpl::GetShapeInferenceMethod()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1740

{

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

1741

if (m_NetworkOptions.size() > 0 && m_NetworkOptions[0].GetBackendId().Get() == "ShapeInferenceMethod")

1742

{

1743

return m_NetworkOptions[0].GetOption(0).GetValue().AsBool();

1744

}

1745

1746

return false;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1747

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1748

NetworkImpl::NetworkImpl(NetworkOptions networkOptions)

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

1749

: m_NetworkOptions(networkOptions),

1750

m_Graph(std::make_unique<Graph>(GetShapeInferenceMethod()))

1751

{}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1752

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1753

NetworkImpl::~NetworkImpl()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1757

Status NetworkImpl::PrintGraph()

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

1758

{

1759

m_Graph->Print();

1760

return Status::Success;

1761

}

1762

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1763

IConnectableLayer* NetworkImpl::AddInputLayer(LayerBindingId id, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1764

{

1765

return m_Graph->AddLayer<InputLayer>(id, name);

1766

}

1767

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1768

IConnectableLayer* NetworkImpl::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

Éanna Ó Catháin

4e1e136

2018-11-12 11:36:34 +0000

[diff] [blame]

1769

const char* name)

1770

{

1771

return m_Graph->AddLayer<BatchToSpaceNdLayer>(batchToSpaceNdDescriptor, name);

1772

}

1773

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

1774

IConnectableLayer* NetworkImpl::AddCastLayer(const char* name)

1775

{

1776

return m_Graph->AddLayer<CastLayer>(name);

1777

}

1778

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1779

IConnectableLayer* NetworkImpl::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

1780

const char* name)

1781

{

1782

return m_Graph->AddLayer<ComparisonLayer>(comparisonDescriptor, name);

1783

}

1784

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1785

IConnectableLayer* NetworkImpl::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

1786

const char* name)

1787

{

1788

return m_Graph->AddLayer<ElementwiseUnaryLayer>(elementwiseUnaryDescriptor, name);

1789

}

1790

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1791

IConnectableLayer* NetworkImpl::AddFillLayer(const FillDescriptor& fillDescriptor,

Ryan OShea

ec6c680

2020-06-05 17:17:06 +0100

[diff] [blame]

1792

const char* name)

1793

{

1794

return m_Graph->AddLayer<FillLayer>(fillDescriptor, name);

1795

}

1796

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1797

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

1798

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1799

{

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1800

return m_Graph->AddLayer<FullyConnectedLayer>(fullyConnectedDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1801

}

1802

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1803

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1804

const Optional<ConstTensor>& weights,

1805

const Optional<ConstTensor>& biases,

1806

const char* name)

1807

{

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1808

ConstantLayer* weightsLayer = nullptr;

1809

ConstantLayer* biasLayer = nullptr;

1810

unsigned int numInputs = fullyConnectedDescriptor.GetNumInputs();

1811

1812

// Add a constant layer for weights

1813

if (weights.has_value())

1814

{

1815

weightsLayer = m_Graph->AddLayer<ConstantLayer>("Weights");

1816

weightsLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(weights.value());

Matthew Sloyan

b20d1d4

2021-08-09 15:33:41 +0100

[diff] [blame]

1817

1818

TensorInfo weightsInfo = weightsLayer->m_LayerOutput->GetTensorInfo();

1819

weightsInfo.SetConstant();

1820

1821

weightsLayer->GetOutputSlot(0).SetTensorInfo(weightsInfo);

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1822

}

1823

else if (fullyConnectedDescriptor.m_ConstantWeights)

1824

{

1825

throw InvalidArgumentException("AddFullyConnectedLayer: Constant weights tensor is empty.");

1826

}

1827

1828

// Add a constant layer for biases

1829

if (biases.has_value() && fullyConnectedDescriptor.m_BiasEnabled)

1830

{

1831

biasLayer = m_Graph->AddLayer<ConstantLayer>("Biases");

1832

biasLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(biases.value());

Matthew Sloyan

b20d1d4

2021-08-09 15:33:41 +0100

[diff] [blame]

1833

1834

TensorInfo biasInfo = biasLayer->m_LayerOutput->GetTensorInfo();

1835

biasInfo.SetConstant();

1836

1837

biasLayer->GetOutputSlot(0).SetTensorInfo(biasInfo);

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

}

if (numInputs < 2)

{

throw InvalidArgumentException("AddFullyConnectedLayer: Requires at least 2 input tensors: Input, Weights");

1843

}

1844

1845

auto layer = m_Graph->AddLayer<FullyConnectedLayer>(fullyConnectedDescriptor, name);

if (weightsLayer)

{

// Connect weights layer

1850

weightsLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(1));

1851

}

1852

1853

if ( fullyConnectedDescriptor.m_BiasEnabled && numInputs == 3 )

{

if (biasLayer)

{

// Connect bias layer

1858

biasLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(2));

1859

}

1860

}

1861

else if ( !fullyConnectedDescriptor.m_BiasEnabled && numInputs == 2 )

1862

{

1863

// Bias is disabled

1864

layer->m_Bias = nullptr;

}

else

{

throw InvalidArgumentException(fmt::format(

1869

"AddFullyConnectedLayer: Value mismatch. When bias is enabled in the "

1870

"descriptor the number of inputs is expected to be 3 otherwise 2. "

1871

"BiasEnabled={}, numInputs={}",

1872

fullyConnectedDescriptor.m_BiasEnabled,

numInputs));

}

return layer;

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1877

}

1878

1879

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1880

const ConstTensor& weights,

1881

const Optional<ConstTensor>& biases,

1882

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1883

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1884

Optional<ConstTensor> optionalWeights(weights);

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1885

return AddFullyConnectedLayer(fullyConnectedDescriptor, optionalWeights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1886

}

1887

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1888

IConnectableLayer* NetworkImpl::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1889

const char* name)

1890

{

Jim Flynn

e242f2d

2019-05-22 14:24:13 +0100

[diff] [blame]

1891

return m_Graph->AddLayer<ConcatLayer>(concatDescriptor, name);

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1892

}

1893

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1894

IConnectableLayer* NetworkImpl::AddConvolution2dLayerImpl(const Convolution2dDescriptor& convolution2dDescriptor,

1895

const ConstTensor& weights,

1896

const Optional<ConstTensor>& biases,

1897

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1898

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1899

if (convolution2dDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1900

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1901

throw InvalidArgumentException("AddConvolution2dLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1902

}

1903

1904

const auto layer = m_Graph->AddLayer<Convolution2dLayer>(convolution2dDescriptor, name);

1905

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

1906

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1907

1908

if (convolution2dDescriptor.m_BiasEnabled)

1909

{

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

1910

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1916

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1917

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1918

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1919

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1920

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1921

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1922

}

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1923

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1924

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1925

const ConstTensor& weights,

1926

const char* name)

1927

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

1928

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1929

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

1930

}

1931

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1932

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1933

const ConstTensor& weights,

1934

const ConstTensor& biases,

1935

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1936

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1937

Optional<ConstTensor> optionalBiases(biases);

1938

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1939

}

1940

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1941

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayerImpl(

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1942

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1943

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1944

const Optional<ConstTensor>& biases,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1945

const char* name)

1946

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1947

if (convolution2dDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1948

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1949

throw InvalidArgumentException("AddDepthwiseConvolution2dLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1950

}

1951

Matteo Martincigh

3d6898c

2019-01-15 16:11:44 +0000

[diff] [blame]

1952

const auto layer = m_Graph->AddLayer<DepthwiseConvolution2dLayer>(convolution2dDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1953

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

1954

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1955

1956

if (convolution2dDescriptor.m_BiasEnabled)

1957

{

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

1958

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1964

IConnectableLayer* NetworkImpl::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

Aron Virginas-Tar

dd6247f

2019-09-19 14:31:17 +0100

[diff] [blame]

1965

const char* name)

1966

{

1967

return m_Graph->AddLayer<DepthToSpaceLayer>(depthToSpaceDescriptor, name);

1968

}

1969

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1970

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1971

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1972

const ConstTensor& weights,

1973

const Optional<ConstTensor>& biases,

1974

const char* name)

1975

{

1976

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

1977

}

1978

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1979

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1980

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1981

const ConstTensor& weights,

1982

const char* name)

1983

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

1984

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1985

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1986

}

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1987

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1988

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1989

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1990

const ConstTensor& weights,

1991

const ConstTensor& biases,

1992

const char* name)

1993

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1994

Optional<ConstTensor> optionalBiases(biases);

1995

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1996

}

1997

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1998

IConnectableLayer* NetworkImpl::AddDetectionPostProcessLayer(const armnn::DetectionPostProcessDescriptor& descriptor,

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

1999

const ConstTensor& anchors, const char* name)

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

2000

{

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

2001

const auto layer = m_Graph->AddLayer<DetectionPostProcessLayer>(descriptor, name);

2002

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2003

layer->m_Anchors = std::make_shared<ScopedTensorHandle>(anchors);

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

2004

2005

return layer;

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

2006

}

2007

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2008

IConnectableLayer* NetworkImpl::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2009

const char* name)

2010

{

2011

return m_Graph->AddLayer<PermuteLayer>(permuteDescriptor, name);

2012

}

2013

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2014

IConnectableLayer* NetworkImpl::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2015

const char* name)

2016

{

2017

return m_Graph->AddLayer<Pooling2dLayer>(pooling2dDescriptor, name);

2018

}

2019

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2020

IConnectableLayer* NetworkImpl::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2021

const char* name)

2022

{

2023

return m_Graph->AddLayer<ActivationLayer>(activationDescriptor, name);

2024

}

2025

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2026

IConnectableLayer* NetworkImpl::AddArgMinMaxLayer(const ArgMinMaxDescriptor& argMinMaxDescriptor,

Nikhil Raj

ee391d5

2019-09-05 17:50:44 +0100

[diff] [blame]

2027

const char* name)

2028

{

2029

return m_Graph->AddLayer<ArgMinMaxLayer>(argMinMaxDescriptor, name);

2030

}

2031

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2032

IConnectableLayer* NetworkImpl::AddNormalizationLayer(const NormalizationDescriptor&

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2033

normalizationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2034

const char* name)

2035

{

2036

return m_Graph->AddLayer<NormalizationLayer>(normalizationDescriptor, name);

2037

}

2038

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2039

IConnectableLayer* NetworkImpl::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

Aron Virginas-Tar

636ab40

2019-09-16 14:27:45 +0100

[diff] [blame]

2040

{

2041

return m_Graph->AddLayer<SliceLayer>(sliceDescriptor, name);

2042

}

2043

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2044

IConnectableLayer* NetworkImpl::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2045

const char* name)

2046

{

2047

return m_Graph->AddLayer<SoftmaxLayer>(softmaxDescriptor, name);

2048

}

2049

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2050

IConnectableLayer* NetworkImpl::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2051

const char* name)

2052

{

2053

return m_Graph->AddLayer<SplitterLayer>(splitterDescriptor, name);

2054

}

2055

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2056

IConnectableLayer* NetworkImpl::AddMaximumLayer(const char* name)

Nattapat Chaimanowong

5a4304a

2018-11-28 10:44:37 +0000

[diff] [blame]

2057

{

2058

return m_Graph->AddLayer<MaximumLayer>(name);

2059

}

2060

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2061

IConnectableLayer* NetworkImpl::AddMinimumLayer(const char* name)

Éanna Ó Catháin

20e5880

2018-12-04 10:29:06 +0000

[diff] [blame]

2062

{

2063

return m_Graph->AddLayer<MinimumLayer>(name);

2064

}

2065

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2066

IConnectableLayer* NetworkImpl::AddMergerLayer(const MergerDescriptor& mergerDescriptor,

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

2067

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2068

{

Jim Flynn

e242f2d

2019-05-22 14:24:13 +0100

[diff] [blame]

2069

return AddConcatLayer(mergerDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2070

}

2071

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2072

IConnectableLayer* NetworkImpl::AddAbsLayer(const char * name)

Kevin May

868eb14

2019-09-04 17:29:31 +0100

[diff] [blame]

2073

{

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

2074

return AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Abs), name);

Kevin May

868eb14

2019-09-04 17:29:31 +0100

[diff] [blame]

2075

}

2076

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2077

IConnectableLayer* NetworkImpl::AddAdditionLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2078

{

2079

return m_Graph->AddLayer<AdditionLayer>(name);

2080

}

2081

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2082

IConnectableLayer* NetworkImpl::AddMultiplicationLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2083

{

2084

return m_Graph->AddLayer<MultiplicationLayer>(name);

2085

}

2086

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2087

IConnectableLayer* NetworkImpl::AddOutputLayer(LayerBindingId id, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2088

{

2089

return m_Graph->AddLayer<OutputLayer>(id, name);

2090

}

2091

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2092

IConnectableLayer* NetworkImpl::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2093

const ConstTensor& mean,

2094

const ConstTensor& variance,

2095

const ConstTensor& beta,

2096

const ConstTensor& gamma,

2097

const char* name)

2098

{

2099

const auto layer = m_Graph->AddLayer<BatchNormalizationLayer>(desc, name);

2100

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2101

layer->m_Mean = std::make_shared<ScopedTensorHandle>(mean);

2102

layer->m_Variance = std::make_shared<ScopedTensorHandle>(variance);

2103

layer->m_Beta = std::make_shared<ScopedTensorHandle>(beta);

2104

layer->m_Gamma = std::make_shared<ScopedTensorHandle>(gamma);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2109

IConnectableLayer* NetworkImpl::AddRankLayer(const char* name)

Finn Williams

2605b23

2020-06-10 15:53:46 +0100

[diff] [blame]

2110

{

2111

return m_Graph->AddLayer<RankLayer>(name);

2112

}

2113

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2114

IConnectableLayer* NetworkImpl::AddReduceLayer(const ReduceDescriptor& reduceDescriptor,

2115

const char* name)

Sadik Armagan

0c3ea5b

2021-02-03 09:29:30 +0000

[diff] [blame]

2116

{

2117

return m_Graph->AddLayer<ReduceLayer>(reduceDescriptor, name);

2118

}

2119

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2120

IConnectableLayer* NetworkImpl::AddResizeBilinearLayer(const ResizeBilinearDescriptor& descriptor,

2121

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2122

{

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

2123

ResizeDescriptor resizeDescriptor;

David Monahan

4a0c9b9

2020-05-30 09:48:39 +0100

[diff] [blame]

2124

resizeDescriptor.m_Method = ResizeMethod::Bilinear;

2125

resizeDescriptor.m_DataLayout = descriptor.m_DataLayout;

2126

resizeDescriptor.m_TargetWidth = descriptor.m_TargetWidth;

2127

resizeDescriptor.m_TargetHeight = descriptor.m_TargetHeight;

2128

resizeDescriptor.m_AlignCorners = descriptor.m_AlignCorners;

2129

resizeDescriptor.m_HalfPixelCenters = descriptor.m_HalfPixelCenters;

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

2130

2131

return m_Graph->AddLayer<ResizeLayer>(resizeDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2132

}

2133

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2134

IConnectableLayer* NetworkImpl::AddResizeLayer(const ResizeDescriptor& resizeDescriptor, const char* name)

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

2135

{

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

2136

return m_Graph->AddLayer<ResizeLayer>(resizeDescriptor, name);

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

2137

}

2138

Keith Davis

3ae3f97

2021-05-21 16:33:48 +0100

[diff] [blame]

2139

IConnectableLayer* NetworkImpl::AddShapeLayer(const char* name)

2140

{

2141

return m_Graph->AddLayer<ShapeLayer>(name);

2142

}

2143

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2144

IConnectableLayer* NetworkImpl::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

2145

const char* name)

Kevin May

ce5045a

2019-10-02 14:07:47 +0100

[diff] [blame]

2146

{

2147

return m_Graph->AddLayer<InstanceNormalizationLayer>(desc, name);

2148

}

2149

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2150

IConnectableLayer* NetworkImpl::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

2151

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2152

{

Matteo Martincigh

bcd3c85

2018-09-28 14:14:12 +0100

[diff] [blame]

2153

return m_Graph->AddLayer<L2NormalizationLayer>(desc, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2154

}

2155

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2156

IConnectableLayer* NetworkImpl::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& desc,

Aron Virginas-Tar

f982dea

2019-10-11 14:07:53 +0100

[diff] [blame]

2157

const char* name)

2158

{

2159

return m_Graph->AddLayer<LogSoftmaxLayer>(desc, name);

2160

}

2161

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2162

IConnectableLayer* NetworkImpl::AddConstantLayer(const ConstTensor& input, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2163

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2164

auto layer = m_Graph->AddLayer<ConstantLayer>(name);

2165

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2166

layer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(input);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2167

2168

return layer;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2169

}

2170

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2171

IConnectableLayer* NetworkImpl::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2172

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2173

{

2174

return m_Graph->AddLayer<ReshapeLayer>(reshapeDescriptor, name);

2175

}

2176

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2177

IConnectableLayer* NetworkImpl::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

Nattapat Chaimanowong

207ef9a

2018-11-02 10:57:25 +0000

[diff] [blame]

2178

const char* name)

2179

{

2180

return m_Graph->AddLayer<SpaceToBatchNdLayer>(spaceToBatchNdDescriptor, name);

2181

}

2182

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2183

IConnectableLayer* NetworkImpl::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

Aron Virginas-Tar

972af15

2019-06-11 14:14:03 +0100

[diff] [blame]

2184

const char* name)

2185

{

2186

return m_Graph->AddLayer<SpaceToDepthLayer>(spaceToDepthDescriptor, name);

2187

}

2188

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2189

IConnectableLayer* NetworkImpl::AddFloorLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2190

{

2191

return m_Graph->AddLayer<FloorLayer>(name);

2192

}

2193

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2194

IConnectableLayer* NetworkImpl::AddLstmLayer(const LstmDescriptor& descriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2195

const LstmInputParams& params,

2196

const char* name)

2197

{

2198

const auto layer = m_Graph->AddLayer<LstmLayer>(descriptor, name);

2199

2200

//Lstm Basic Parameters

2201

layer->m_BasicParameters.m_InputToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2202

std::make_shared<ScopedTensorHandle>(*(params.m_InputToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2203

layer->m_BasicParameters.m_InputToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2204

std::make_shared<ScopedTensorHandle>(*(params.m_InputToCellWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2205

layer->m_BasicParameters.m_InputToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2206

std::make_shared<ScopedTensorHandle>(*(params.m_InputToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2207

layer->m_BasicParameters.m_RecurrentToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2208

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2209

layer->m_BasicParameters.m_RecurrentToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2210

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToCellWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2211

layer->m_BasicParameters.m_RecurrentToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2212

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2213

layer->m_BasicParameters.m_ForgetGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2214

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2215

layer->m_BasicParameters.m_CellBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2216

std::make_shared<ScopedTensorHandle>(*(params.m_CellBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2217

layer->m_BasicParameters.m_OutputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2218

std::make_shared<ScopedTensorHandle>(*(params.m_OutputGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2219

2220

//Lstm Cifg parameters

2221

if(!descriptor.m_CifgEnabled)

2222

{

2223

if(params.m_InputToInputWeights == nullptr)

2224

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2225

throw InvalidArgumentException("AddLstmLayer: Input To Input Weights cannot be NULL "

2226

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2227

}

2228

if(params.m_RecurrentToInputWeights == nullptr)

2229

{

2230

throw InvalidArgumentException(

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2231

"AddLstmLayer: Recurrent To Input Weights cannot be NULL "

2232

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2233

}

2234

if(params.m_InputGateBias == nullptr)

2235

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2236

throw InvalidArgumentException("AddLstmLayer: Input Gate Bias cannot be NULL "

2237

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2238

}

2239

layer->m_CifgParameters.m_InputToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2240

std::make_shared<ScopedTensorHandle>(*(params.m_InputToInputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2241

layer->m_CifgParameters.m_RecurrentToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2242

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToInputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2243

layer->m_CifgParameters.m_InputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2244

std::make_shared<ScopedTensorHandle>(*(params.m_InputGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2245

}

2246

2247

//Lstm projection parameters

2248

if(descriptor.m_ProjectionEnabled)

2249

{

2250

if(params.m_ProjectionWeights == nullptr)

2251

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2252

throw InvalidArgumentException("AddLstmLayer: Projection Weights cannot be NULL "

2253

"when projection is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2254

}

2255

layer->m_ProjectionParameters.m_ProjectionWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2256

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2257

if(params.m_ProjectionBias != nullptr)

2258

{

2259

layer->m_ProjectionParameters.m_ProjectionBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2260

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

}

}

//Lstm Peephole params

2265

if(descriptor.m_PeepholeEnabled)

2266

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2267

if(!descriptor.m_CifgEnabled)

2268

{

2269

if(params.m_CellToInputWeights == nullptr)

2270

{

2271

throw InvalidArgumentException("AddLstmLayer: Cell To Input Weights cannot be NULL "

2272

"when Peephole is enabled and CIFG disabled.");

2273

}

2274

2275

layer->m_PeepholeParameters.m_CellToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2276

std::make_shared<ScopedTensorHandle>(*(params.m_CellToInputWeights));

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2277

}

2278

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2279

if(params.m_CellToForgetWeights == nullptr)

2280

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2281

throw InvalidArgumentException("AddLstmLayer: Cell To Forget Weights cannot be NULL "

2282

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2283

}

2284

if(params.m_CellToOutputWeights == nullptr)

2285

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2286

throw InvalidArgumentException("AddLstmLayer: Cell To Output Weights cannot be NULL "

2287

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2288

}

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2289

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2290

layer->m_PeepholeParameters.m_CellToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2291

std::make_shared<ScopedTensorHandle>(*(params.m_CellToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2292

layer->m_PeepholeParameters.m_CellToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2293

std::make_shared<ScopedTensorHandle>(*(params.m_CellToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2294

}

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2295

2296

//Lstm Layer Normalization params

2297

if(descriptor.m_LayerNormEnabled)

2298

{

2299

if(!descriptor.m_CifgEnabled)

2300

{

2301

if(params.m_InputLayerNormWeights == nullptr)

2302

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2303

throw InvalidArgumentException("AddLstmLayer: Input layer normalization weights cannot be NULL "

2304

"when layer normalization is enabled and CIFG disabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2305

}

2306

layer->m_LayerNormParameters.m_InputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2307

std::make_shared<ScopedTensorHandle>(*(params.m_InputLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2308

}

2309

2310

if(params.m_ForgetLayerNormWeights == nullptr)

2311

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2312

throw InvalidArgumentException("AddLstmLayer: Forget layer normalization weights cannot be NULL "

2313

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2314

}

2315

if(params.m_CellLayerNormWeights == nullptr)

2316

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2317

throw InvalidArgumentException("AddLstmLayer: Cell layer normalization weights cannot be NULL "

2318

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2319

}

2320

if(params.m_OutputLayerNormWeights == nullptr)

2321

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2322

throw InvalidArgumentException("AddLstmLayer: Output layer normalization weights cannot be NULL "

2323

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2324

}

2325

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2326

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2327

layer->m_LayerNormParameters.m_CellLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2328

std::make_shared<ScopedTensorHandle>(*(params.m_CellLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2329

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2330

std::make_shared<ScopedTensorHandle>(*(params.m_OutputLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2331

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2335

IConnectableLayer* NetworkImpl::AddDivisionLayer(const char* name)

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

2336

{

2337

return m_Graph->AddLayer<DivisionLayer>(name);

2338

}

2339

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2340

IConnectableLayer* NetworkImpl::AddSubtractionLayer(const char* name)

David Beck

1952622

2018-09-12 16:00:08 +0100

[diff] [blame]

2341

{

2342

return m_Graph->AddLayer<SubtractionLayer>(name);

2343

}

2344

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2345

IConnectableLayer* NetworkImpl::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

narpra01

32b9046

2018-09-13 11:07:48 +0100

[diff] [blame]

2346

{

2347

return m_Graph->AddLayer<MeanLayer>(meanDescriptor,name);

2348

}

2349

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2350

IConnectableLayer* NetworkImpl::AddPadLayer(const PadDescriptor& padDescriptor, const char* name)

Mohamed Nour Abouelseoud

5662c20

2018-09-24 13:30:09 +0100

[diff] [blame]

2351

{

2352

return m_Graph->AddLayer<PadLayer>(padDescriptor,name);

2353

}

2354

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2355

IConnectableLayer *NetworkImpl::AddQuantizeLayer(const char *name)

Derek Lamberti

a9cca6a

2019-03-25 15:41:58 +0000

[diff] [blame]

2356

{

2357

return m_Graph->AddLayer<QuantizeLayer>(name);

2358

}

2359

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2360

IConnectableLayer* NetworkImpl::AddDequantizeLayer(const char* name)

Nattapat Chaimanowong

e4294fd

2019-03-28 09:56:53 +0000

[diff] [blame]

2361

{

2362

return m_Graph->AddLayer<DequantizeLayer>(name);

2363

}

2364

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2365

IConnectableLayer* NetworkImpl::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

Conor Kennedy

430b5d8

2018-11-14 15:28:28 +0000

[diff] [blame]

2366

const char* name)

2367

{

2368

return m_Graph->AddLayer<StridedSliceLayer>(stridedSliceDescriptor, name);

2369

}

2370

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2371

IConnectableLayer* NetworkImpl::AddGreaterLayer(const char* name)

Matteo Martincigh

59a950c

2018-12-13 12:48:25 +0000

[diff] [blame]

2372

{

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

2373

return AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Greater), name);

Matteo Martincigh

59a950c

2018-12-13 12:48:25 +0000

[diff] [blame]

2374

}

2375

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2376

IConnectableLayer* NetworkImpl::AddEqualLayer(const char* name)

FrancisMurtagh

2099595

2018-12-17 12:11:36 +0000

[diff] [blame]

2377

{

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

2378

return AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Equal), name);

FrancisMurtagh

2099595

2018-12-17 12:11:36 +0000

[diff] [blame]

2379

}

2380

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2381

IConnectableLayer* NetworkImpl::AddRsqrtLayer(const char * name)

Mohamed Nour Abouelseoud

a1d3c6a

2018-12-27 12:39:16 +0000

[diff] [blame]

2382

{

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

2383

return AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Rsqrt), name);

Mohamed Nour Abouelseoud

a1d3c6a

2018-12-27 12:39:16 +0000

[diff] [blame]

2384

}

2385

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2386

IConnectableLayer* NetworkImpl::AddGatherLayer(const char* name)

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

2387

{

Teresa Charlin

5266473

2020-06-29 16:27:03 +0100

[diff] [blame]

2388

GatherDescriptor gatherDescriptor{};

2389

return AddGatherLayer(gatherDescriptor, name);

2390

}

2391

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2392

IConnectableLayer* NetworkImpl::AddGatherLayer(const GatherDescriptor& gatherDescriptor,

Teresa Charlin

5266473

2020-06-29 16:27:03 +0100

[diff] [blame]

2393

const char* name)

2394

{

2395

return m_Graph->AddLayer<GatherLayer>(gatherDescriptor, name);

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

2396

}

2397

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2398

IConnectableLayer* NetworkImpl::AddMergeLayer(const char* name)

Nattapat Chaimanowong

1f88630

2019-04-05 13:37:19 +0100

[diff] [blame]

2399

{

2400

return m_Graph->AddLayer<MergeLayer>(name);

2401

}

2402

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2403

IConnectableLayer* NetworkImpl::AddSwitchLayer(const char* name)

Sadik Armagan

eff363d

2019-04-05 15:25:46 +0100

[diff] [blame]

2404

{

2405

return m_Graph->AddLayer<SwitchLayer>(name);

2406

}

2407

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2408

IConnectableLayer* NetworkImpl::AddPreluLayer(const char* name)

Matteo Martincigh

0e406ee

2019-06-12 15:42:18 +0100

[diff] [blame]

2409

{

2410

return m_Graph->AddLayer<PreluLayer>(name);

2411

}

2412

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2413

IConnectableLayer* NetworkImpl::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

2414

const ConstTensor& weights,

2415

const Optional<ConstTensor>& biases,

2416

const char* name)

2417

{

2418

if (descriptor.m_BiasEnabled && !biases.has_value())

2419

{

2420

throw InvalidArgumentException("AddTransposeConvolution2dLayer: Biases cannot be empty");

2421

}

2422

2423

const auto layer = m_Graph->AddLayer<TransposeConvolution2dLayer>(descriptor, name);

2424

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2425

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

2426

2427

if (descriptor.m_BiasEnabled)

2428

{

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2429

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2435

IConnectableLayer* NetworkImpl::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

Mike Kelly

c9ea45a

2020-02-28 18:11:58 +0000

[diff] [blame]

2436

const char* name)

2437

{

2438

return m_Graph->AddLayer<TransposeLayer>(transposeDescriptor, name);

2439

}

2440

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2441

IConnectableLayer* NetworkImpl::AddStackLayer(const StackDescriptor& stackDescriptor,

Matthew Jackson

2b8c1da

2019-07-04 14:59:16 +0100

[diff] [blame]

2442

const char* name)

2443

{

2444

return m_Graph->AddLayer<StackLayer>(stackDescriptor, name);

2445

}

2446

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

2447

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2448

IConnectableLayer* NetworkImpl::AddStandInLayer(const StandInDescriptor& desc,

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

2449

const char* name)

2450

{

2451

return m_Graph->AddLayer<StandInLayer>(desc, name);

2452

}

2453

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2454

IConnectableLayer* NetworkImpl::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2455

const char* name)

2456

{

2457

const auto layer = m_Graph->AddLayer<QuantizedLstmLayer>(name);

2458

2459

// InputToX weights

2460

layer->m_QuantizedLstmParameters.m_InputToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2461

std::make_shared<ScopedTensorHandle>(params.GetInputToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2462

layer->m_QuantizedLstmParameters.m_InputToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2463

std::make_shared<ScopedTensorHandle>(params.GetInputToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2464

layer->m_QuantizedLstmParameters.m_InputToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2465

std::make_shared<ScopedTensorHandle>(params.GetInputToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2466

layer->m_QuantizedLstmParameters.m_InputToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2467

std::make_shared<ScopedTensorHandle>(params.GetInputToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2468

2469

// RecurrentToX weights

2470

layer->m_QuantizedLstmParameters.m_RecurrentToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2471

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2472

layer->m_QuantizedLstmParameters.m_RecurrentToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2473

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2474

layer->m_QuantizedLstmParameters.m_RecurrentToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2475

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2476

layer->m_QuantizedLstmParameters.m_RecurrentToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2477

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2478

2479

// Bias

2480

layer->m_QuantizedLstmParameters.m_InputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2481

std::make_shared<ScopedTensorHandle>(params.GetInputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2482

layer->m_QuantizedLstmParameters.m_ForgetGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2483

std::make_shared<ScopedTensorHandle>(params.GetForgetGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2484

layer->m_QuantizedLstmParameters.m_CellBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2485

std::make_shared<ScopedTensorHandle>(params.GetCellBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2486

layer->m_QuantizedLstmParameters.m_OutputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2487

std::make_shared<ScopedTensorHandle>(params.GetOutputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2492

IConnectableLayer* NetworkImpl::AddQLstmLayer(const QLstmDescriptor& descriptor,

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2493

const LstmInputParams& params,

2494

const char* name)

2495

{

2496

const auto layer = m_Graph->AddLayer<QLstmLayer>(descriptor, name);

2497

2498

// QLstm Basic Parameters

2499

layer->m_BasicParameters.m_InputToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2500

std::make_shared<ScopedTensorHandle>(*(params.m_InputToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2501

layer->m_BasicParameters.m_InputToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2502

std::make_shared<ScopedTensorHandle>(*(params.m_InputToCellWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2503

layer->m_BasicParameters.m_InputToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2504

std::make_shared<ScopedTensorHandle>(*(params.m_InputToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2505

layer->m_BasicParameters.m_RecurrentToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2506

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2507

layer->m_BasicParameters.m_RecurrentToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2508

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToCellWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2509

layer->m_BasicParameters.m_RecurrentToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2510

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2511

layer->m_BasicParameters.m_ForgetGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2512

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2513

layer->m_BasicParameters.m_CellBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2514

std::make_shared<ScopedTensorHandle>(*(params.m_CellBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2515

layer->m_BasicParameters.m_OutputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2516

std::make_shared<ScopedTensorHandle>(*(params.m_OutputGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2517

2518

// QLstm Cifg parameters

2519

if(!descriptor.m_CifgEnabled)

2520

{

2521

if(params.m_InputToInputWeights == nullptr)

2522

{

2523

throw InvalidArgumentException("AddQLstmLayer: Input To Input Weights cannot be NULL");

2524

}

2525

2526

if(params.m_RecurrentToInputWeights == nullptr)

2527

{

2528

throw InvalidArgumentException(

2529

"AddQLstmLayer: Recurrent To Input Weights cannot be NULL");

2530

}

2531

2532

if(params.m_InputGateBias == nullptr)

2533

{

2534

throw InvalidArgumentException("AddQLstmLayer: Input Gate Bias cannot be NULL");

2535

}

2536

2537

layer->m_CifgParameters.m_InputToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2538

std::make_shared<ScopedTensorHandle>(*(params.m_InputToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2539

layer->m_CifgParameters.m_RecurrentToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2540

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2541

layer->m_CifgParameters.m_InputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2542

std::make_shared<ScopedTensorHandle>(*(params.m_InputGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2543

}

2544

2545

// QLstm Projection parameters

2546

if(descriptor.m_ProjectionEnabled)

2547

{

2548

if(params.m_ProjectionWeights == nullptr)

2549

{

2550

throw InvalidArgumentException("AddQLstmLayer: Projection Weights cannot be NULL");

2551

}

2552

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2553

layer->m_ProjectionParameters.m_ProjectionWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2554

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionWeights));

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

2555

2556

// Projection bias is optional even if projection is enabled

2557

if(params.m_ProjectionWeights != nullptr)

2558

{

2559

layer->m_ProjectionParameters.m_ProjectionBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2560

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionBias));

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

2561

}

2562

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2563

}

2564

2565

// QLstm Peephole params

2566

if(descriptor.m_PeepholeEnabled)

2567

{

2568

if(params.m_CellToForgetWeights == nullptr)

2569

{

2570

throw InvalidArgumentException("AddQLstmLayer: Cell To Forget Weights cannot be NULL");

2571

}

2572

2573

if(params.m_CellToOutputWeights == nullptr)

2574

{

2575

throw InvalidArgumentException("AddQLstmLayer: Cell To Output Weights cannot be NULL");

2576

}

2577

2578

if(!descriptor.m_CifgEnabled)

2579

{

2580

if(params.m_CellToInputWeights == nullptr)

2581

{

2582

throw InvalidArgumentException("AddQLstmLayer: Cell To Input Weights cannot be NULL");

2583

}

2584

2585

layer->m_PeepholeParameters.m_CellToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2586

std::make_shared<ScopedTensorHandle>(*(params.m_CellToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2587

}

2588

2589

layer->m_PeepholeParameters.m_CellToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2590

std::make_shared<ScopedTensorHandle>(*(params.m_CellToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2591

layer->m_PeepholeParameters.m_CellToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2592

std::make_shared<ScopedTensorHandle>(*(params.m_CellToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2593

}

2594

2595

// QLstm Layer Normalization params

2596

if(descriptor.m_LayerNormEnabled)

2597

{

2598

if(params.m_ForgetLayerNormWeights == nullptr)

2599

{

2600

throw InvalidArgumentException("AddQLstmLayer: Forget layer normalization weights cannot be NULL");

2601

}

2602

2603

if(params.m_CellLayerNormWeights == nullptr)

2604

{

2605

throw InvalidArgumentException("AddQLstmLayer: Cell layer normalization weights cannot be NULL");

2606

}

2607

2608

if(params.m_OutputLayerNormWeights == nullptr)

2609

{

2610

throw InvalidArgumentException("AddQLstmLayer: Output layer normalization weights cannot be NULL");

2611

}

2612

2613

if(!descriptor.m_CifgEnabled)

2614

{

2615

if(params.m_InputLayerNormWeights == nullptr)

2616

{

2617

throw InvalidArgumentException("AddQLstmLayer: Input layer normalization weights cannot be NULL");

2618

}

2619

2620

layer->m_LayerNormParameters.m_InputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2621

std::make_shared<ScopedTensorHandle>(*(params.m_InputLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2622

}

2623

2624

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2625

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2626

layer->m_LayerNormParameters.m_CellLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2627

std::make_shared<ScopedTensorHandle>(*(params.m_CellLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2628

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2629

std::make_shared<ScopedTensorHandle>(*(params.m_OutputLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2634

IConnectableLayer* NetworkImpl::AddLogicalBinaryLayer(const LogicalBinaryDescriptor& logicalBinaryDescriptor,

Narumol Prangnawarat

8ed39ae

2021-07-15 16:16:25 +0100

[diff] [blame]

2635

const char* name)

James Conroy

aba90cd

2020-11-06 16:28:18 +0000

[diff] [blame]

2636

{

2637

return m_Graph->AddLayer<LogicalBinaryLayer>(logicalBinaryDescriptor, name);

2638

}

2639

Narumol Prangnawarat

8ed39ae

2021-07-15 16:16:25 +0100

[diff] [blame]

2640

IConnectableLayer* NetworkImpl::AddUnidirectionalSequenceLstmLayer(

2641

const UnidirectionalSequenceLstmDescriptor& descriptor,

2642

const LstmInputParams& params,

2643

const char* name)

2644

{

2645

const auto layer = m_Graph->AddLayer<UnidirectionalSequenceLstmLayer>(descriptor, name);

2646

2647

//Lstm Basic Parameters

2648

layer->m_BasicParameters.m_InputToForgetWeights =

2649

std::make_shared<ScopedTensorHandle>(*(params.m_InputToForgetWeights));

2650

layer->m_BasicParameters.m_InputToCellWeights =

2651

std::make_shared<ScopedTensorHandle>(*(params.m_InputToCellWeights));

2652

layer->m_BasicParameters.m_InputToOutputWeights =

2653

std::make_shared<ScopedTensorHandle>(*(params.m_InputToOutputWeights));

2654

layer->m_BasicParameters.m_RecurrentToForgetWeights =

2655

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToForgetWeights));

2656

layer->m_BasicParameters.m_RecurrentToCellWeights =

2657

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToCellWeights));

2658

layer->m_BasicParameters.m_RecurrentToOutputWeights =

2659

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToOutputWeights));

2660

layer->m_BasicParameters.m_ForgetGateBias =

2661

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetGateBias));

2662

layer->m_BasicParameters.m_CellBias =

2663

std::make_shared<ScopedTensorHandle>(*(params.m_CellBias));

2664

layer->m_BasicParameters.m_OutputGateBias =

2665

std::make_shared<ScopedTensorHandle>(*(params.m_OutputGateBias));

2666

2667

//Lstm Cifg parameters

2668

if(!descriptor.m_CifgEnabled)

2669

{

2670

if(params.m_InputToInputWeights == nullptr)

2671

{

2672

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Input To Input Weights cannot be NULL "

2673

"when CIFG is disabled.");

2674

}

2675

if(params.m_RecurrentToInputWeights == nullptr)

2676

{

2677

throw InvalidArgumentException(

2678

"AddUnidirectionalSequenceLstmLayer: Recurrent To Input Weights cannot be NULL "

2679

"when CIFG is disabled.");

2680

}

2681

if(params.m_InputGateBias == nullptr)

2682

{

2683

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Input Gate Bias cannot be NULL "

2684

"when CIFG is disabled.");

2685

}

2686

layer->m_CifgParameters.m_InputToInputWeights =

2687

std::make_shared<ScopedTensorHandle>(*(params.m_InputToInputWeights));

2688

layer->m_CifgParameters.m_RecurrentToInputWeights =

2689

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToInputWeights));

2690

layer->m_CifgParameters.m_InputGateBias =

2691

std::make_shared<ScopedTensorHandle>(*(params.m_InputGateBias));

2692

}

2693

2694

//Lstm projection parameters

2695

if(descriptor.m_ProjectionEnabled)

2696

{

2697

if(params.m_ProjectionWeights == nullptr)

2698

{

2699

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Projection Weights cannot be NULL "

2700

"when projection is enabled.");

2701

}

2702

layer->m_ProjectionParameters.m_ProjectionWeights =

2703

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionWeights));

2704

if(params.m_ProjectionBias != nullptr)

2705

{

2706

layer->m_ProjectionParameters.m_ProjectionBias =

2707

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionBias));

}

}

//Lstm Peephole params

2712

if(descriptor.m_PeepholeEnabled)

2713

{

2714

if(!descriptor.m_CifgEnabled)

2715

{

2716

if(params.m_CellToInputWeights == nullptr)

2717

{

2718

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell To Input Weights "

2719

"cannot be NULL when Peephole is enabled and CIFG disabled.");

2720

}

2721

2722

layer->m_PeepholeParameters.m_CellToInputWeights =

2723

std::make_shared<ScopedTensorHandle>(*(params.m_CellToInputWeights));

2724

}

2725

2726

if(params.m_CellToForgetWeights == nullptr)

2727

{

2728

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell To Forget Weights cannot be NULL "

2729

"when Peephole is enabled.");

2730

}

2731

if(params.m_CellToOutputWeights == nullptr)

2732

{

2733

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell To Output Weights cannot be NULL "

2734

"when Peephole is enabled.");

2735

}

2736

2737

layer->m_PeepholeParameters.m_CellToForgetWeights =

2738

std::make_shared<ScopedTensorHandle>(*(params.m_CellToForgetWeights));

2739

layer->m_PeepholeParameters.m_CellToOutputWeights =

2740

std::make_shared<ScopedTensorHandle>(*(params.m_CellToOutputWeights));

2741

}

2742

2743

//Lstm Layer Normalization params

2744

if(descriptor.m_LayerNormEnabled)

2745

{

2746

if(!descriptor.m_CifgEnabled)

2747

{

2748

if(params.m_InputLayerNormWeights == nullptr)

2749

{

2750

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Input layer normalization weights "

2751

"cannot be NULL when layer normalization is enabled and CIFG disabled.");

2752

}

2753

layer->m_LayerNormParameters.m_InputLayerNormWeights =

2754

std::make_shared<ScopedTensorHandle>(*(params.m_InputLayerNormWeights));

2755

}

2756

2757

if(params.m_ForgetLayerNormWeights == nullptr)

2758

{

2759

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Forget layer normalization weights "

2760

"cannot be NULL when layer normalization is enabled.");

2761

}

2762

if(params.m_CellLayerNormWeights == nullptr)

2763

{

2764

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell layer normalization weights "

2765

"cannot be NULL when layer normalization is enabled.");

2766

}

2767

if(params.m_OutputLayerNormWeights == nullptr)

2768

{

2769

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Output layer normalization weights "

2770

"cannot be NULL when layer normalization is enabled.");

2771

}

2772

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

2773

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetLayerNormWeights));

2774

layer->m_LayerNormParameters.m_CellLayerNormWeights =

2775

std::make_shared<ScopedTensorHandle>(*(params.m_CellLayerNormWeights));

2776

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

2777

std::make_shared<ScopedTensorHandle>(*(params.m_OutputLayerNormWeights));

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2782

void NetworkImpl::Accept(ILayerVisitor& visitor) const

Mike Kelly

8c1701a

2019-02-11 17:01:27 +0000

[diff] [blame]

2783

{

2784

for (auto layer : GetGraph())

2785

{

2786

layer->Accept(visitor);

};

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2790

void NetworkImpl::ExecuteStrategy(IStrategy& strategy) const

Finn Williams

b454c5c

2021-02-09 15:56:23 +0000

[diff] [blame]

2791

{

2792

for (auto layer : GetGraph())

2793

{

2794

layer->ExecuteStrategy(strategy);

};

}

Mike Kelly

2021-06-27 22:39:21 +0100

[diff] [blame]

2798

OptimizedNetworkImpl::OptimizedNetworkImpl(const OptimizedNetworkImpl& other, const ModelOptions& modelOptions)

2799

: m_Graph(new Graph(*other.m_Graph.get()))

2800

, m_Guid(profiling::ProfilingService::GetNextGuid())

2801

, m_ModelOptions(modelOptions)

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2805

OptimizedNetworkImpl::OptimizedNetworkImpl(std::unique_ptr<Graph> graph)

Sadik Armagan

3184c90

2020-03-18 10:57:30 +0000

[diff] [blame]

2806

: m_Graph(std::move(graph)), m_Guid(profiling::ProfilingService::GetNextGuid())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2810

OptimizedNetworkImpl::OptimizedNetworkImpl(std::unique_ptr<Graph> graph, const ModelOptions& modelOptions)

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

2811

: m_Graph(std::move(graph)), m_Guid(profiling::ProfilingService::GetNextGuid()), m_ModelOptions(modelOptions)

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2815

OptimizedNetworkImpl::~OptimizedNetworkImpl()

telsoa01