Blame - src/armnn/Network.cpp - ml/armnn

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

5

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

6

#include "Network.hpp"

7

#include "Graph.hpp"

8

#include "Layer.hpp"

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

9

#include "DeviceSpec.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

10

#include "Optimizer.hpp"

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

11

#include "SubgraphViewSelector.hpp"

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

12

#include "BackendSettings.hpp"

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

13

#include "optimizations/All.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

14

Aron Virginas-Tar

c9cc804

2018-11-01 16:15:57 +0000

[diff] [blame]

15

#include <backendsCommon/CpuTensorHandle.hpp>

16

#include <backendsCommon/WorkloadFactory.hpp>

Matteo Martincigh

e5b8eb9

2019-11-28 15:45:42 +0000

[diff] [blame]

17

#include <armnn/backends/IBackendInternal.hpp>

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

18

#include <backendsCommon/TensorHandleFactoryRegistry.hpp>

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

19

20

#include <armnn/Exceptions.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

21

#include <armnn/Utils.hpp>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

22

#include <armnn/TypesUtils.hpp>

Matteo Martincigh

c601aa6

2019-10-29 15:03:22 +0000

[diff] [blame]

23

#include <armnn/BackendRegistry.hpp>

Matthew Bentham

f48afc6

2020-01-15 17:55:08 +0000

[diff] [blame]

24

#include <armnn/Logging.hpp>

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

25

#include <armnn/utility/Assert.hpp>

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

26

#include <armnn/utility/IgnoreUnused.hpp>

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

27

#include <armnn/utility/PolymorphicDowncast.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

28

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

29

#include <ProfilingService.hpp>

30

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

#include <fcntl.h>

#include <algorithm>

#include <fstream>

#include <memory>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

35

#include <vector>

36

#include <algorithm>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

37

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

namespace armnn

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

41

INetwork::INetwork(NetworkOptions networkOptions) : pNetworkImpl(new NetworkImpl(networkOptions)) {}

42

43

INetwork::~INetwork() = default;

44

45

Status INetwork::PrintGraph()

46

{

47

return pNetworkImpl->PrintGraph();

48

}

49

50

IConnectableLayer* INetwork::AddInputLayer(LayerBindingId id, const char* name)

51

{

52

return pNetworkImpl->AddInputLayer(id, name);

}

IConnectableLayer* INetwork::AddArgMinMaxLayer(const ArgMinMaxDescriptor& desc,

57

const char* name)

58

{

59

return pNetworkImpl->AddArgMinMaxLayer(desc, name);

60

}

61

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

62

IConnectableLayer* INetwork::AddCastLayer(const char* name)

63

{

64

return pNetworkImpl->AddCastLayer(name);

65

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

66

67

IConnectableLayer* INetwork::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

68

const char* name)

69

{

70

return pNetworkImpl->AddComparisonLayer(comparisonDescriptor, name);

}

IConnectableLayer* INetwork::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

75

const char* name)

76

{

77

return pNetworkImpl->AddConcatLayer(concatDescriptor, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

82

const ConstTensor& weights,

83

const Optional<ConstTensor>& biases,

84

const char* name)

85

{

86

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

91

const ConstTensor& weights,

92

const char* name)

93

{

94

Optional<ConstTensor> biases;

95

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

100

const ConstTensor& weights,

101

const ConstTensor& biases,

const char* name )

{

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor,

106

weights,

107

armnn::Optional<ConstTensor>(biases),

name);

}

IConnectableLayer* INetwork::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

113

const char* name)

114

{

115

return pNetworkImpl->AddDepthToSpaceLayer(depthToSpaceDescriptor, name);

}

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

120

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

121

const ConstTensor& weights,

122

const Optional<ConstTensor>& biases,

123

const char* name)

124

{

125

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

130

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

131

const ConstTensor& weights,

132

const char* name)

133

{

134

Optional<ConstTensor> biases;

135

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

140

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

141

const ConstTensor& weights,

142

const ConstTensor& biases,

143

const char* name)

144

{

145

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, weights,

146

armnn::Optional<ConstTensor>(biases), name);

}

IConnectableLayer* INetwork::AddDequantizeLayer(const char* name)

151

{

152

return pNetworkImpl->AddDequantizeLayer(name);

}

IConnectableLayer* INetwork::AddDetectionPostProcessLayer(

157

const DetectionPostProcessDescriptor& descriptor,

158

const ConstTensor& anchors,

159

const char* name)

160

{

161

return pNetworkImpl->AddDetectionPostProcessLayer(descriptor, anchors, name);

}

IConnectableLayer* INetwork::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

166

const char* name)

167

{

168

return pNetworkImpl->AddElementwiseUnaryLayer(elementwiseUnaryDescriptor, name);

}

IConnectableLayer* INetwork::AddFillLayer(const FillDescriptor& fillDescriptor,

173

const char* name)

174

{

175

return pNetworkImpl->AddFillLayer(fillDescriptor, name);

176

}

177

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

178

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

179

const ConstTensor& weights,

180

const Optional<ConstTensor>& biases,

181

const char* name)

182

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

183

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor,

184

armnn::Optional<ConstTensor>(weights),

185

biases,

186

name);

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

187

}

188

189

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

190

const ConstTensor& weights,

191

const char* name)

192

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

193

armnn::Optional<ConstTensor> biases;

194

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor,

195

armnn::Optional<ConstTensor>(weights),

196

biases,

197

name);

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

198

}

199

200

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

201

const ConstTensor& weights,

202

const ConstTensor& biases,

203

const char* name)

204

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

205

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor,

206

armnn::Optional<ConstTensor>(weights),

207

armnn::Optional<ConstTensor>(biases),

name);

}

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

212

const Optional<ConstTensor>& weights,

213

const Optional<ConstTensor>& biases,

214

const char* name)

215

{

216

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor, weights, biases, name);

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

217

}

218

219

IConnectableLayer* INetwork::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

220

const char* name)

221

{

222

return pNetworkImpl->AddPermuteLayer(permuteDescriptor, name);

223

}

224

225

IConnectableLayer* INetwork::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

226

const char* name)

227

{

228

return pNetworkImpl->AddBatchToSpaceNdLayer(batchToSpaceNdDescriptor, name);

229

}

230

231

IConnectableLayer* INetwork::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

232

const char* name)

233

{

234

return pNetworkImpl->AddPooling2dLayer(pooling2dDescriptor, name);

235

}

236

237

IConnectableLayer* INetwork::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

238

const char* name)

239

{

240

return pNetworkImpl->AddActivationLayer(activationDescriptor, name);

241

}

242

243

IConnectableLayer* INetwork::AddNormalizationLayer(const NormalizationDescriptor& normalizationDescriptor,

244

const char* name)

245

{

246

return pNetworkImpl->AddNormalizationLayer(normalizationDescriptor, name);

247

}

248

249

IConnectableLayer* INetwork::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

250

{

251

return pNetworkImpl->AddSliceLayer(sliceDescriptor, name);

252

}

253

IConnectableLayer* INetwork::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

254

const char* name)

255

{

256

return pNetworkImpl->AddSoftmaxLayer(softmaxDescriptor, name);

257

}

258

259

IConnectableLayer* INetwork::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

260

const char* name)

261

{

262

return pNetworkImpl->AddSplitterLayer(splitterDescriptor, name);

263

}

264

265

IConnectableLayer* INetwork::AddMergeLayer(const char* name)

266

{

267

return pNetworkImpl->AddMergeLayer(name);

268

}

269

270

IConnectableLayer* INetwork::AddMergerLayer(const MergerDescriptor& mergerDescriptor,

271

const char* name)

272

{

273

return pNetworkImpl->AddConcatLayer(mergerDescriptor, name);

274

}

275

276

IConnectableLayer* INetwork::AddAbsLayer(const char* name)

277

{

278

return pNetworkImpl->AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Abs), name);

279

}

280

281

IConnectableLayer* INetwork::AddAdditionLayer(const char* name)

282

{

283

return pNetworkImpl->AddAdditionLayer(name);

284

}

285

286

IConnectableLayer* INetwork::AddMultiplicationLayer(const char* name)

287

{

288

return pNetworkImpl->AddMultiplicationLayer(name);

289

}

290

291

IConnectableLayer* INetwork::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

292

const ConstTensor& mean,

293

const ConstTensor& variance,

294

const ConstTensor& beta,

295

const ConstTensor& gamma,

296

const char* name)

297

{

298

return pNetworkImpl->AddBatchNormalizationLayer(desc, mean, variance, beta, gamma, name);

299

}

300

301

IConnectableLayer* INetwork::AddRankLayer(const char* name)

302

{

303

return pNetworkImpl->AddRankLayer(name);

304

}

305

306

IConnectableLayer* INetwork::AddResizeBilinearLayer(const ResizeBilinearDescriptor& descriptor,

307

const char* name)

308

{

309

ResizeDescriptor resizeDescriptor;

310

resizeDescriptor.m_Method = ResizeMethod::Bilinear;

311

resizeDescriptor.m_DataLayout = descriptor.m_DataLayout;

312

resizeDescriptor.m_TargetWidth = descriptor.m_TargetWidth;

313

resizeDescriptor.m_TargetHeight = descriptor.m_TargetHeight;

314

resizeDescriptor.m_AlignCorners = descriptor.m_AlignCorners;

315

resizeDescriptor.m_HalfPixelCenters = descriptor.m_HalfPixelCenters;

316

317

return pNetworkImpl->AddResizeLayer(resizeDescriptor, name);

318

}

319

320

IConnectableLayer* INetwork::AddResizeLayer(const ResizeDescriptor& resizeDescriptor,

321

const char* name)

322

{

323

return pNetworkImpl->AddResizeLayer(resizeDescriptor, name);

324

}

325

326

IConnectableLayer* INetwork::AddReduceLayer(const ReduceDescriptor& reduceDescriptor,

327

const char* name)

328

{

329

return pNetworkImpl->AddReduceLayer(reduceDescriptor, name);

330

}

331

332

IConnectableLayer* INetwork::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

333

const char* name)

334

{

335

return pNetworkImpl->AddInstanceNormalizationLayer(desc, name);

336

}

337

338

IConnectableLayer* INetwork::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

339

const char* name)

340

{

341

return pNetworkImpl->AddL2NormalizationLayer(desc, name);

342

}

343

344

IConnectableLayer* INetwork::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& logSoftmaxDescriptor,

345

const char* name)

346

{

347

return pNetworkImpl->AddLogSoftmaxLayer(logSoftmaxDescriptor, name);

348

}

349

350

IConnectableLayer* INetwork::AddConstantLayer(const ConstTensor& input,

351

const char* name)

352

{

353

return pNetworkImpl->AddConstantLayer(input, name);

354

}

355

356

IConnectableLayer* INetwork::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

357

const char* name)

358

{

359

return pNetworkImpl->AddReshapeLayer(reshapeDescriptor, name);

360

}

361

362

IConnectableLayer* INetwork::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

363

const char* name)

364

{

365

return pNetworkImpl->AddSpaceToBatchNdLayer(spaceToBatchNdDescriptor, name);

366

}

367

368

IConnectableLayer* INetwork::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

369

const char* name)

370

{

371

return pNetworkImpl->AddSpaceToDepthLayer(spaceToDepthDescriptor, name);

372

}

373

374

IConnectableLayer* INetwork::AddFloorLayer(const char* name)

375

{

376

return pNetworkImpl->AddFloorLayer(name);

377

}

378

IConnectableLayer* INetwork::AddOutputLayer(LayerBindingId id, const char* name)

379

{

380

return pNetworkImpl->AddOutputLayer(id, name);

381

}

382

383

IConnectableLayer* INetwork::AddLstmLayer(const LstmDescriptor& descriptor,

384

const LstmInputParams& params,

385

const char* name)

386

{

387

return pNetworkImpl->AddLstmLayer(descriptor, params, name);

388

}

389

390

IConnectableLayer* INetwork::AddDivisionLayer(const char* name)

391

{

392

return pNetworkImpl->AddDivisionLayer(name);

393

}

394

395

IConnectableLayer* INetwork::AddSubtractionLayer(const char* name)

396

{

397

return pNetworkImpl->AddSubtractionLayer(name);

398

}

399

400

IConnectableLayer* INetwork::AddMaximumLayer(const char* name)

401

{

402

return pNetworkImpl->AddMaximumLayer(name);

403

}

404

405

IConnectableLayer* INetwork::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

406

{

407

return pNetworkImpl->AddMeanLayer(meanDescriptor, name);

408

}

409

410

IConnectableLayer* INetwork::AddPadLayer(const PadDescriptor& padDescriptor,

411

const char* name)

412

{

413

return pNetworkImpl->AddPadLayer(padDescriptor, name);

414

}

415

416

IConnectableLayer* INetwork::AddQuantizeLayer(const char* name)

417

{

418

return pNetworkImpl->AddQuantizeLayer(name);

419

}

420

421

IConnectableLayer* INetwork::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

422

const char* name)

423

{

424

return pNetworkImpl->AddStridedSliceLayer(stridedSliceDescriptor, name);

425

}

426

427

IConnectableLayer* INetwork::AddMinimumLayer(const char* name)

428

{

429

return pNetworkImpl->AddMinimumLayer(name);

430

}

431

432

IConnectableLayer* INetwork::AddGreaterLayer(const char* name)

433

{

434

return pNetworkImpl->AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Greater), name);

435

}

436

437

IConnectableLayer* INetwork::AddEqualLayer(const char* name)

438

{

439

return pNetworkImpl->AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Equal), name);

440

}

441

442

IConnectableLayer* INetwork::AddRsqrtLayer(const char* name)

443

{

444

return pNetworkImpl->AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Rsqrt), name);

445

}

446

447

IConnectableLayer* INetwork::AddGatherLayer(const char* name)

448

{

449

GatherDescriptor gatherDescriptor{};

450

return pNetworkImpl->AddGatherLayer(gatherDescriptor, name);

451

}

452

453

IConnectableLayer* INetwork::AddGatherLayer(const GatherDescriptor& descriptor,

454

const char* name)

455

{

456

return pNetworkImpl->AddGatherLayer(descriptor, name);

457

}

458

459

IConnectableLayer* INetwork::AddSwitchLayer(const char* name)

460

{

461

return pNetworkImpl->AddSwitchLayer(name);

462

}

463

464

IConnectableLayer* INetwork::AddPreluLayer(const char* name)

465

{

466

return pNetworkImpl->AddPreluLayer(name);

467

}

468

469

IConnectableLayer* INetwork::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

470

const ConstTensor& weights,

471

const Optional<ConstTensor>& biases,

472

const char* name)

473

{

474

return pNetworkImpl->AddTransposeConvolution2dLayer(descriptor, weights, biases, name);

475

}

476

477

IConnectableLayer* INetwork::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

478

const char* name)

479

{

480

return pNetworkImpl->AddTransposeLayer(transposeDescriptor, name);

481

}

482

483

IConnectableLayer* INetwork::AddStackLayer(const StackDescriptor& descriptor,

484

const char* name)

485

{

486

return pNetworkImpl->AddStackLayer(descriptor, name);

487

}

488

489

IConnectableLayer* INetwork::AddStandInLayer(const StandInDescriptor& descriptor,

490

const char* name)

491

{

492

return pNetworkImpl->AddStandInLayer(descriptor, name);

493

}

494

495

IConnectableLayer* INetwork::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

496

const char* name)

497

{

498

return pNetworkImpl->AddQuantizedLstmLayer(params, name);

499

}

500

501

IConnectableLayer* INetwork::AddQLstmLayer(const QLstmDescriptor& descriptor,

502

const LstmInputParams& params,

503

const char* name)

504

{

505

return pNetworkImpl->AddQLstmLayer(descriptor, params, name);

506

}

507

508

IConnectableLayer* INetwork::AddLogicalBinaryLayer(const LogicalBinaryDescriptor& descriptor,

509

const char* name)

510

{

511

return pNetworkImpl->AddLogicalBinaryLayer(descriptor, name);

512

}

513

514

void INetwork::Accept(ILayerVisitor& visitor) const

515

{

516

return pNetworkImpl->Accept(visitor);

517

}

518

519

void INetwork::ExecuteStrategy(IStrategy& strategy) const

520

{

521

return pNetworkImpl->ExecuteStrategy(strategy);

522

}

523

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

524

armnn::INetwork* INetwork::CreateRaw(NetworkOptions networkOptions)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

525

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

526

return new INetwork(networkOptions);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

527

}

528

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

529

armnn::INetworkPtr INetwork::Create(NetworkOptions networkOptions)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

530

{

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

531

return INetworkPtr(CreateRaw(networkOptions), &INetwork::Destroy);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

532

}

533

534

void INetwork::Destroy(INetwork* network)

535

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

536

delete network;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

537

}

538

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

539

540

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<Graph> graph)

541

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph))) {}

542

543

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<OptimizedNetworkImpl> impl)

544

: pOptimizedNetworkImpl(std::move(impl)) {}

545

546

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<Graph> graph, const ModelOptions& modelOptions)

547

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph), modelOptions)) {}

548

549

IOptimizedNetwork::~IOptimizedNetwork() = default;

550

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

551

void IOptimizedNetwork::Destroy(IOptimizedNetwork* network)

552

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

553

delete network;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

554

}

555

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

556

Status IOptimizedNetwork::PrintGraph()

557

{

558

return pOptimizedNetworkImpl->PrintGraph();

559

}

560

561

Status IOptimizedNetwork::SerializeToDot(std::ostream& stream) const

562

{

563

return pOptimizedNetworkImpl->SerializeToDot(stream);

564

}

565

566

profiling::ProfilingGuid IOptimizedNetwork::GetGuid() const

567

{

568

return pOptimizedNetworkImpl->GetGuid();

569

}

570

571

Status OptimizedNetworkImpl::PrintGraph()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

572

{

573

m_Graph->Print();

574

return Status::Success;

575

}

576

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

577

Status OptimizedNetworkImpl::SerializeToDot(std::ostream& stream) const

surmeh01

bceff2f

2018-03-29 16:29:27 +0100

[diff] [blame]

578

{

579

return m_Graph->SerializeToDot(stream);

580

}

581

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

582

void ReportError(const std::string& errorMessage,

583

Optional<std::vector<std::string>&> errorMessages)

584

{

585

std::stringstream fullErrorMessage;

586

fullErrorMessage << "ERROR: " << errorMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

587

ARMNN_LOG(warning) << fullErrorMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

588

if (errorMessages)

589

{

590

errorMessages.value().push_back(fullErrorMessage.str());

}

}

void ReportWarning(const std::string& warningMessage,

595

Optional<std::vector<std::string>&> warningMessages)

596

{

597

std::stringstream fullWarningMessage;

598

fullWarningMessage << "WARNING: " << warningMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

599

ARMNN_LOG(warning) << fullWarningMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

600

if (warningMessages)

601

{

602

warningMessages.value().push_back(fullWarningMessage.str());

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

606

OptimizationResult ReturnWithError(OptimizationResult res,

607

const Layer* layer,

608

const BackendSettings& backendSettings,

609

Optional<std::vector<std::string>&> errMessages)

610

{

611

std::stringstream failureMsg;

612

failureMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

613

<< " is not supported on any preferred backend " << backendSettings.m_PreferredBackends;

614

ReportError(failureMsg.str(), errMessages);

res.m_Error = true;

return res;

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

621

bool CheckScaleSetOnQuantizedType(Layer* layer, Optional<std::vector<std::string>&> errMessages)

622

{

623

bool noErrors = true;

624

unsigned int numOutputs = layer->GetNumOutputSlots();

625

for (unsigned int i = 0; i < numOutputs; i++) {

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

626

OutputSlot& outputSlot = layer->GetOutputSlot(i);

627

TensorInfo info = outputSlot.GetTensorInfo();

Derek Lamberti

f90c56d

2020-01-10 17:14:08 +0000

[diff] [blame]

628

if (DataType::QAsymmU8 == info.GetDataType()) {

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

629

if (0.f == info.GetQuantizationScale()) {

630

noErrors = false;

631

std::stringstream ss;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

632

ss << "output " << i << " of layer " << GetLayerTypeAsCString(layer->GetType())

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

633

<< " (" << layer->GetNameStr() << ") is of type"

634

<< " Quantized 8 bit but its scale parameter has not been set";

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

635

ReportError(ss.str(), errMessages);

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

636

}

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

637

// Softmax under QuantisedAsymm8 must always be scale (1.0f/256.0f) and offset 0

638

if ((info.GetQuantizationScale() != (1.0f / 256.0f) ||

639

info.GetQuantizationOffset() != 0) &&

640

layer->GetType() == armnn::LayerType::Softmax)

641

{

642

std::stringstream ss;

643

ss << "Quantization parameters for Softmax layer (Scale: " <<

644

info.GetQuantizationScale() << " and Offset: " << info.GetQuantizationOffset() <<

645

") are incorrect and have been updated to Scale: 0.00390625 and Offset: 0";

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

646

ARMNN_LOG(warning) << ss.str();

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

647

info.SetQuantizationScale((1.0f /256.0f));

648

info.SetQuantizationOffset(0);

649

outputSlot.SetTensorInfo(info);

650

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

}

}

return noErrors;

}

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

656

template <typename LayerT>

657

LayerT* ConvertBf16ToFp32Weight(Layer* l)

658

{

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

659

LayerT* layer = PolymorphicDowncast<LayerT*>(l);

Narumol Prangnawarat

250d392

2020-03-30 16:11:04 +0100

[diff] [blame]

660

if ((layer->GetType() == LayerType::Convolution2d || layer->GetType() == LayerType::FullyConnected)

661

&& layer->m_Weight)

662

{

663

const TensorInfo& info = layer->m_Weight->GetTensorInfo();

664

665

if (info.GetDataType() == DataType::BFloat16)

666

{

667

std::vector<float> newValues(info.GetNumElements());

668

669

armnnUtils::FloatingPointConverter::ConvertBFloat16ToFloat32(

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

670

layer->m_Weight->template GetConstTensor<armnn::BFloat16>(), info.GetNumElements(), newValues.data());

Narumol Prangnawarat

250d392

2020-03-30 16:11:04 +0100

[diff] [blame]

671

672

TensorInfo newInfo(info.GetShape(), DataType::Float32);

673

ConstTensor newInput(newInfo, newValues);

674

layer->m_Weight.reset(new ScopedCpuTensorHandle(newInput));

}

}

return layer;

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

680

OptimizationResult AttemptBackendAssignment(BackendSettings& backendSettings,

Graph& graph,

Layer* layer,

BackendId backend,

DataType dataTypeIn,

DataType dataTypeOut,

686

const std::vector<BackendId>& availablePreferredBackends,

687

std::string& reasonIfUnsupported,

688

Optional<std::vector<std::string>&> errMessages)

689

{

690

OptimizationResult result;

691

692

// Helper lambda to compose meaningful error message before returning with error

693

auto ReturnError = [&](const Layer* layer)

694

{

695

return ReturnWithError(result, layer, backendSettings, errMessages);

696

};

697

698

// need to set the compute device on the layer

699

// before we can check if it is supported

700

layer->SetBackendId(backend);

701

if (!IWorkloadFactory::IsLayerSupported(*layer, EmptyOptional(), reasonIfUnsupported))

702

{

703

if (dataTypeIn == DataType::Float16 || dataTypeOut == DataType::Float16)

704

{

705

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

706

&& layer->GetType() != LayerType::ConvertFp32ToFp16

707

&& layer->GetType() != LayerType::ConvertFp16ToFp32)

708

{

709

// Insert FP16 -> FP32 conversion layer before current layer

710

std::vector<ConvertFp16ToFp32Layer*> convertFp16ToFp32Layers;

711

if (dataTypeIn == DataType::Float16)

712

{

713

convertFp16ToFp32Layers =

714

InsertConvertFp16ToFp32LayersBefore(graph, *layer);

715

}

716

717

// Insert FP32 -> FP16 conversion layer after current layer

718

std::vector<ConvertFp32ToFp16Layer*> convertFp32ToFp16Layers;

719

if (dataTypeOut == DataType::Float16)

720

{

721

convertFp32ToFp16Layers =

722

InsertConvertFp32ToFp16LayersAfter(graph, *layer);

723

}

724

725

// Assign a supported backend to the newly introduced conversion layers

726

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

727

{

728

bool supportedBackendFound = false;

729

std::string reasonIfUnsupported;

730

731

// Try preferred backend first

732

layer->SetBackendId(preferredBackend);

733

if (IWorkloadFactory::IsLayerSupported(*layer,

734

EmptyOptional(),

735

reasonIfUnsupported))

736

{

737

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

742

{

743

// Skip preferred backend (we already determined that it is not supported)

744

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

750

if (IWorkloadFactory::IsLayerSupported(*layer,

751

EmptyOptional(),

752

reasonIfUnsupported))

753

{

754

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

761

};

762

763

for (ConvertFp16ToFp32Layer* convertLayer : convertFp16ToFp32Layers)

764

{

765

if (!AssignFirstSupportedBackend(convertLayer, backend))

766

{

767

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToFp16Layer* convertLayer : convertFp32ToFp16Layers)

772

{

773

if (!AssignFirstSupportedBackend(convertLayer, backend))

774

{

775

return ReturnError(convertLayer);

}

}

return result;

}

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

782

else if (dataTypeIn == DataType::BFloat16 || dataTypeOut == DataType::BFloat16)

783

{

784

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

785

&& layer->GetType() != LayerType::ConvertFp32ToBf16

786

&& layer->GetType() != LayerType::ConvertBf16ToFp32)

787

{

788

// Insert BF16 -> FP32 conversion layer before current layer

789

std::vector<ConvertBf16ToFp32Layer*> convertBf16ToFp32Layers;

790

if (dataTypeIn == DataType::BFloat16)

791

{

792

convertBf16ToFp32Layers =

793

InsertConvertBf16ToFp32LayersBefore(graph, *layer);

Narumol Prangnawarat

250d392

2020-03-30 16:11:04 +0100

[diff] [blame]

794

if (layer->GetType() == LayerType::Convolution2d)

795

{

796

ConvertBf16ToFp32Weight<Convolution2dLayer>(layer);

797

}

798

else if (layer->GetType() == LayerType::FullyConnected)

799

{

800

ConvertBf16ToFp32Weight<FullyConnectedLayer>(layer);

801

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

802

}

803

804

// Insert FP32 -> BF16 conversion layer after current layer

805

std::vector<ConvertFp32ToBf16Layer*> convertFp32ToBf16Layers;

806

if (dataTypeOut == DataType::BFloat16)

807

{

808

convertFp32ToBf16Layers =

809

InsertConvertFp32ToBf16LayersAfter(graph, *layer);

810

}

811

812

// Assign a supported backend to the newly introduced conversion layers

813

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

814

{

815

bool supportedBackendFound = false;

816

std::string reasonIfUnsupported;

817

818

// Try preferred backend first

819

layer->SetBackendId(preferredBackend);

820

if (IWorkloadFactory::IsLayerSupported(*layer,

821

EmptyOptional(),

822

reasonIfUnsupported))

823

{

824

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

829

{

830

// Skip preferred backend (we already determined that it is not supported)

831

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

837

if (IWorkloadFactory::IsLayerSupported(*layer,

838

EmptyOptional(),

839

reasonIfUnsupported))

840

{

841

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

848

};

849

850

for (ConvertBf16ToFp32Layer* convertLayer : convertBf16ToFp32Layers)

851

{

852

if (!AssignFirstSupportedBackend(convertLayer, backend))

853

{

854

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToBf16Layer* convertLayer : convertFp32ToBf16Layers)

859

{

860

if (!AssignFirstSupportedBackend(convertLayer, backend))

861

{

862

return ReturnError(convertLayer);

}

}

return result;

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

870

std::stringstream warningMsg;

871

warningMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

872

<< " is not supported on requested backend " << layer->GetBackendId().Get()

873

<< " for input data type " << GetDataTypeName(dataTypeIn)

874

<< " and output data type " << GetDataTypeName(dataTypeOut)

875

<< " (reason: " << reasonIfUnsupported

876

<< "), falling back to the next backend.";

877

ReportWarning(warningMsg.str(), errMessages);

878

879

return OptimizationResult(true, false);

}

else

{

return result;

}

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

888

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

889

BackendSettings& backendSettings,

890

Graph::Iterator& firstLayer,

891

Graph::Iterator& lastLayer,

892

Optional<std::vector<std::string>&> errMessages)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

893

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

894

OptimizationResult result;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

895

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

896

// Helper lambda to compose meaningful error message before returning with error

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

897

auto ReturnError = [&](const Layer* layer)

898

{

899

return ReturnWithError(result, layer, backendSettings, errMessages);

900

};

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

901

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

902

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

903

auto availablePreferredBackends = backendSettings.GetAvailablePreferredBackends();

904

if (availablePreferredBackends.empty())

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

905

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

906

std::stringstream failureMsg;

907

failureMsg << "No preferred backends are available";

908

ReportError(failureMsg.str(), errMessages);

909

910

result.m_Error = true;

return result;

}

for (auto it = firstLayer; it != lastLayer; ++it)

915

{

916

auto layer = *it;

Aron Virginas-Tar

87972be

2019-11-13 15:16:28 +0000

[diff] [blame]

917

918

DataType dataTypeIn = layer->GetNumInputSlots() == 0 ? DataType::Float32 :

919

layer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo().GetDataType();

920

DataType dataTypeOut = layer->GetNumOutputSlots() == 0 ? DataType::Float32 :

921

layer->GetOutputSlot(0).GetTensorInfo().GetDataType();

922

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

923

std::string reasonIfUnsupported;

924

bool found = false;

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

925

if (!CheckScaleSetOnQuantizedType(layer, errMessages))

926

{

927

// don't bomb immediately, find all the quantized outputs

928

// which haven't had a scale set and report them all back.

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

929

result.m_Error = true;

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

930

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

931

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

932

// First try assign layer to hint backend

933

if (layer->GetBackendHint().has_value() &&

934

backendSettings.IsBackendSupported(layer->GetBackendHint().value()) &&

935

AttemptBackendAssignment(backendSettings,

936

optNetObjPtr->GetGraph(),

937

layer,

938

layer->GetBackendHint().value(),

939

dataTypeIn,

940

dataTypeOut,

941

availablePreferredBackends,

942

reasonIfUnsupported,

943

errMessages).IsOk())

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

944

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

945

found = true;

946

backendSettings.m_SelectedBackends.insert(layer->GetBackendHint().value());

}

else

{

// Try assign layer to prefered list of backends

951

for (const auto& backend : availablePreferredBackends)

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

952

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

953

if (layer->GetBackendHint().has_value() &&

954

layer->GetBackendHint().value() == backend)

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

955

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

956

continue; //Don't re-test the backend hint

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

957

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

958

959

OptimizationResult res = AttemptBackendAssignment(backendSettings,

960

optNetObjPtr->GetGraph(),

layer,

backend,

dataTypeIn,

dataTypeOut,

availablePreferredBackends,

reasonIfUnsupported,

errMessages);

if (res.IsOk())

{

found = true;

backendSettings.m_SelectedBackends.insert(backend);

973

break;

974

}

975

else if (res.IsError())

976

{

977

return res; // Cannot continue.

978

// Note: we don't need to log the error as it would already

979

// be logged in AttemptBackendAssignment().

980

}

981

else

982

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

983

ARMNN_ASSERT_MSG(res.IsWarningOnly(), "OptimizationResult in unexpected state.");

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

984

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

}

}

// If the layer is unsupported by any devices, log and return a null network.

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

989

if (!found)

990

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

991

// NOTE: if the layer is not an operation queue type AND we have not got CpuRef as a

992

// fallback we should set the compute device on the layer to CpuRef (these are not

993

// available as accelerated operations, or are only available under certain

994

// conditions, currently they comprise MemCopy, Constant, Permute)

995

armnn::LayerType layerType = layer->GetType();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

996

if (!backendSettings.IsCpuRefUsed() && (layerType == armnn::LayerType::MemCopy ||

997

layerType == armnn::LayerType::Constant ||

998

layerType == armnn::LayerType::Permute))

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

999

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1000

BackendId cpuBackendId(armnn::Compute::CpuRef);

1001

layer->SetBackendId(cpuBackendId);

1002

backendSettings.m_SelectedBackends.insert(cpuBackendId);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1003

}

1004

else

1005

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

1006

return ReturnError(layer);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1007

}

1008

}

1009

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

return result;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1014

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1015

BackendSettings& backendSettings,

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1016

SubgraphView& subgraph,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1017

Optional<std::vector<std::string>&> errMessages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1018

{

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1019

Graph::Iterator firstLayer = subgraph.begin();

1020

Graph::Iterator lastLayer = subgraph.end();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1021

return AssignBackends(optNetObjPtr,

backendSettings,

firstLayer,

lastLayer,

errMessages);

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1028

BackendsMap CreateSupportedBackends(TensorHandleFactoryRegistry& handleFactoryRegistry,

1029

BackendSettings& backendSettings)

1030

{

1031

BackendsMap backends;

1032

auto const& backendRegistry = BackendRegistryInstance();

1033

for (auto&& selectedBackend : backendSettings.m_SupportedBackends)

1034

{

1035

auto backendFactory = backendRegistry.GetFactory(selectedBackend);

1036

auto backendObjPtr = backendFactory();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1037

ARMNN_ASSERT(backendObjPtr);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1038

1039

backendObjPtr->RegisterTensorHandleFactories(handleFactoryRegistry);

1040

1041

backends[backendObjPtr->GetId()] = std::move(backendObjPtr);

}

return backends;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1047

OptimizationResult ApplyBackendOptimizations(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1048

BackendSettings& backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1049

BackendsMap& backends,

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1050

const ModelOptions& modelOptions,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1051

Optional<std::vector<std::string>&> errMessages)

1052

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1053

ARMNN_ASSERT(optNetObjPtr);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1054

1055

OptimizationResult result;

1056

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1057

// Get the optimized graph

1058

Graph& optGraph = optNetObjPtr->GetGraph();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1059

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1060

// Run backend specific optimizations

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1061

for (auto&& selectedBackend : backendSettings.m_SelectedBackends)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1062

{

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1063

auto backendObjPtr = backends.find(selectedBackend)->second.get();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1064

ARMNN_ASSERT(backendObjPtr);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1065

1066

// Select sub-graphs based on backend

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1067

SubgraphViewSelector::Subgraphs subgraphs =

Rob Hughes

65c3226

2019-07-23 15:33:39 +0100

[diff] [blame]

1068

SubgraphViewSelector::SelectSubgraphs(optGraph,

Matteo Martincigh

602af09

2019-05-01 10:31:27 +0100

[diff] [blame]

1069

// Select layers assigned to the requested backend

1070

[&backendObjPtr](const Layer& layer)

1071

{

1072

return layer.GetType() != LayerType::Input &&

1073

layer.GetType() != LayerType::Output &&

1074

layer.GetBackendId() == backendObjPtr->GetId();

1075

});

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1076

if (subgraphs.empty())

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1077

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1078

// No sub-graphs found, try with next selected backend

1079

continue;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1080

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1081

1082

// Try to optimize each sub-graph

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1083

for (auto& subgraph : subgraphs)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1084

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1085

// Try to optimize the current sub-graph

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1086

OptimizationViews optimizationViews = backendObjPtr->OptimizeSubgraphView(*subgraph, modelOptions);

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1087

ARMNN_ASSERT(optimizationViews.Validate(*subgraph));

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1088

1089

// Optimization attempted, check the resulting optimized sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1090

for (auto& substitution : optimizationViews.GetSubstitutions())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1091

{

1092

// Sub-graph optimized, substitute the sub-graph with the new optimized one in the main optimized graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1093

SubgraphView& replacementSubgraph = substitution.m_ReplacementSubgraph;

1094

SubgraphView& substitutableSubgraph = substitution.m_SubstitutableSubgraph;

1095

optGraph.SubstituteSubgraph(substitutableSubgraph, replacementSubgraph);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1096

1097

// Assign the current backend to the optimized sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1098

std::for_each(replacementSubgraph.begin(), replacementSubgraph.end(), [&selectedBackend](Layer* l)

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1099

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1100

ARMNN_ASSERT(l);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1101

l->SetBackendId(selectedBackend);

1102

});

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1103

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1104

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1105

if (!optimizationViews.GetFailedSubgraphs().empty())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1106

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1107

std::stringstream warningMsg;

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1108

warningMsg << "Some sub-graph(s) failed to optimized on " << backendObjPtr->GetId() << " backend.";

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1109

ReportWarning(warningMsg.str(), errMessages);

1110

1111

// Failed to optimize the given sub-graph, re-assign the sub-graph layers to other available backends

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1112

BackendSettings settingsCopy(backendSettings);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1113

if (!backendObjPtr->GetId().IsCpuRef())

1114

{

1115

// Add the current backend to the list of backends to ignore

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1116

settingsCopy.m_IgnoredBackends.insert(backendObjPtr->GetId());

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1117

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1118

1119

int count=0;

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1120

for (auto& failedSubgraph : optimizationViews.GetFailedSubgraphs())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1121

{

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1122

// An error occurred: the optimization was attempted but not performed, try different backends

1123

std::stringstream subgraphMsg;

1124

subgraphMsg << "Re-assigning backends to " << failedSubgraph.GetLayers().size()

1125

<< " layers inside sub-graph " << count++;

Matteo Martincigh

328d92b

2019-07-04 17:52:55 +0100

[diff] [blame]

1126

ReportWarning(subgraphMsg.str(), errMessages);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1127

1128

OptimizationResult reassignmentResult = AssignBackends(optNetObjPtr,

settingsCopy,

*subgraph,

errMessages);

if (reassignmentResult.m_Error)

1133

{

1134

// Failed to re-assign one of the remaining backends to each layer of the sub-graph

1135

result.m_Error = true;

1136

return result;

1137

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1138

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

}

}

}

return result;

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1146

bool RequiresCopy(ITensorHandleFactory::FactoryId src,

1147

ITensorHandleFactory::FactoryId dst,

1148

TensorHandleFactoryRegistry& registry)

{

if (src != dst)

{

ITensorHandleFactory* srcFactory = registry.GetFactory(src);

1153

ITensorHandleFactory* dstFactory = registry.GetFactory(dst);

1154

Matteo Martincigh

a6539ed

2019-08-27 13:43:32 +0100

[diff] [blame]

1155

if (srcFactory && dstFactory &&

1156

(srcFactory->GetExportFlags() & dstFactory->GetImportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

{

return false;

}

return true;

}

return false;

}

// Find the handle factory for the input layer which results in fewest required copies.

1166

ITensorHandleFactory::FactoryId CalculateSlotOptionForInput(BackendsMap& backends,

1167

OutputSlot& slot,

1168

TensorHandleFactoryRegistry& registry)

1169

{

1170

Layer& layer = slot.GetOwningLayer();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1171

ARMNN_ASSERT(layer.GetType() == LayerType::Input);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1172

1173

// Explicitly select the tensorhandle factory for InputLayer because the rules for it are slightly different. It

1174

// doesn't matter which backend it is assigned to because they all use the same implementation, which

1175

// requires Map/Unmap support. This means that, so long as the handle type supports map/unmap semantics, we can

1176

// select a factory with maximum compatibility with the layers connected to the InputLayer.

1177

1178

// First ensure the from backends can support the TensorHandeAPI

1179

auto frmBackend = backends.find(layer.GetBackendId());

1180

if (frmBackend == backends.end() ||

1181

!frmBackend->second->SupportsTensorAllocatorAPI())

1182

{

1183

return ITensorHandleFactory::LegacyFactoryId;

1184

}

1185

1186

// Go through all connections to the output slot and determine the TensorHandleFactory which results in the

1187

// fewest copies.

1188

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

1189

int topScore = 0;

1190

ITensorHandleFactory::FactoryId topChoice = ITensorHandleFactory::LegacyFactoryId;

1191

1192

for (auto&& connection : slot.GetConnections())

1193

{

1194

const Layer& connectedLayer = connection->GetOwningLayer();

1195

1196

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1197

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1198

1199

if (!toBackend->second.get()->SupportsTensorAllocatorAPI())

1200

{

1201

// The destination backend does not support the tensor allocator API, move to the next one

continue;

}

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1206

for (auto&& dst : dstPrefs)

1207

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1208

// Input layers use the mem copy workload or import, so the selected factory must

1209

// support either the map/unmap API or Import API

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1210

ITensorHandleFactory* factory = registry.GetFactory(dst);

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1211

if (!factory->SupportsMapUnmap() &&

1212

!CheckFlag(factory->GetImportFlags(), MemorySource::Malloc)) // Just support cpu mem imports for now

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1213

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1214

// The current tensor handle factory does not support the map/unmap or import

1215

// strategy, move to the next one

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

continue;

}

auto it = factoryScores.find(dst);

1220

if (it == factoryScores.end())

1221

{

1222

// Add new score to the table

1223

factoryScores[dst] = 0;

1224

if (topChoice == ITensorHandleFactory::LegacyFactoryId)

{

topChoice = dst;

}

}

else

{

// Increase the score

1232

factoryScores[dst]++;

1233

1234

// Track the best option

1235

if (factoryScores[dst] > topScore)

1236

{

1237

topScore = factoryScores[dst];

topChoice = dst;

}

}

}

}

return topChoice;

}

// Find the handle factory for the output layer which results in fewest required copies.

1248

ITensorHandleFactory::FactoryId CalculateSlotOptionForOutput(BackendsMap& backends,

1249

OutputSlot& slot,

1250

TensorHandleFactoryRegistry& registry)

1251

{

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

1252

IgnoreUnused(backends, slot, registry);

Derek Lamberti

94a88d2

2019-12-10 21:12:59 +0000

[diff] [blame]

1253

return ITensorHandleFactory::DeferredFactoryId;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1254

}

1255

1256

// For all handle factories supported on the source backend, we wish to find the one which requires the fewest copies

1257

// when considering all connections.

1258

ITensorHandleFactory::FactoryId CalculateSlotOption(BackendsMap& backends,

1259

OutputSlot& outputSlot,

1260

TensorHandleFactoryRegistry& registry)

1261

{

1262

// First ensure the from backends can support the TensorHandeAPI

1263

Layer& layer = outputSlot.GetOwningLayer();

1264

auto frmBackend = backends.find(layer.GetBackendId());

1265

if (frmBackend == backends.end() ||

1266

!frmBackend->second->SupportsTensorAllocatorAPI())

1267

{

1268

return ITensorHandleFactory::LegacyFactoryId;

1269

}

1270

1271

// Connections to Output Layers requires support for map/unmap on the TensorHandle.

1272

bool requiresMapUnmap = false;

1273

for (auto&& connection : outputSlot.GetConnections())

1274

{

1275

const Layer& connectedLayer = connection->GetOwningLayer();

1276

if (connectedLayer.GetType() == LayerType::Output)

1277

{

1278

requiresMapUnmap = true;

}

}

IBackendInternal* srcBackend = frmBackend->second.get();

1283

auto srcPrefs = srcBackend->GetHandleFactoryPreferences();

1284

1285

// Initialize the scores

1286

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

1287

for (auto&& pref : srcPrefs)

1288

{

1289

if (requiresMapUnmap) // Only consider factories that support map/unmap if required

1290

{

1291

ITensorHandleFactory* factory = registry.GetFactory(pref);

1292

if (!factory->SupportsMapUnmap())

1293

{

1294

// The current tensor handle factory does not support the map/unmap strategy, move to the next one

continue;

}

}

auto it = factoryScores.find(pref);

1300

if (it == factoryScores.end())

1301

{

1302

// Add new score to the table

1303

factoryScores[pref] = 0;

}

}

// Score each handle factory based on how many times it requires copies on the slot connections

1308

for (auto&& connection : outputSlot.GetConnections())

1309

{

1310

const Layer& connectedLayer = connection->GetOwningLayer();

1311

1312

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1313

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1314

1315

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1316

for (auto&& src : srcPrefs)

1317

{

1318

if (factoryScores.find(src) == factoryScores.end()) // Don't consider excluded factories

{

continue;

}

for (auto&& dst : dstPrefs)

1324

{

1325

if (RequiresCopy(src, dst, registry))

1326

{

1327

// Copy avoided, increase the score

1328

factoryScores[src]++;

break;

}

}

}

}

// Find the lowest score

1336

int minScore = std::numeric_limits<int>::max();

1337

for (auto it : factoryScores)

1338

{

1339

minScore = std::min(minScore, it.second);

1340

}

1341

1342

// Collect factories matching the best(lowest) score

1343

std::vector<ITensorHandleFactory::FactoryId> optimalFactories;

1344

for (auto it : factoryScores)

1345

{

1346

if (it.second == minScore)

1347

{

1348

optimalFactories.push_back(it.first);

}

}

// For all compatible Factories matching the best score, find the preferred one for the current layer.

1353

for (auto&& srcPref : srcPrefs)

1354

{

1355

for (auto&& comp : optimalFactories)

{

if (comp == srcPref)

{

return comp;

}

}

}

return ITensorHandleFactory::LegacyFactoryId;

1365

}

1366

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1367

EdgeStrategy CalculateEdgeStrategy(BackendsMap& backends,

1368

ITensorHandleFactory::FactoryId srcFactoryId,

1369

const Layer& layer,

1370

const Layer& connectedLayer,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1371

TensorHandleFactoryRegistry& registry,

1372

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1373

{

1374

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1375

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1376

1377

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1378

1379

// Legacy API check for backward compatibility

1380

if (srcFactoryId == ITensorHandleFactory::LegacyFactoryId || dstPrefs.empty())

1381

{

1382

if (layer.GetBackendId() != connectedLayer.GetBackendId())

1383

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1384

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1385

}

1386

else

1387

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1388

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// TensorHandleFactory API present, so perform more sophisticated strategies.

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1393

// Dst Output layers don't require copy because they use import or map/unmap

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1394

if (connectedLayer.GetType() == LayerType::Output)

1395

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1396

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1397

}

1398

1399

// Search for direct match in prefs

1400

for (auto&& pref : dstPrefs)

1401

{

1402

if (pref == srcFactoryId)

1403

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1404

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// Search for export/import options

1409

ITensorHandleFactory* srcFactory = registry.GetFactory(srcFactoryId);

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1410

if (srcFactory->GetExportFlags() != 0 && importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1411

{

1412

for (auto&& pref : dstPrefs)

1413

{

1414

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1415

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1416

// Handles cases when a destPref is not listed in TensorHandleFactoryRegistry

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1417

if (!dstFactory) {

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1418

continue;

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1419

}

1420

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1421

if ((dstFactory->GetImportFlags() & srcFactory->GetExportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1422

{

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1423

auto srcCapability = srcFactory->GetCapabilities(&layer, &layer, CapabilityClass::PaddingRequired);

1424

auto dstCapability = dstFactory->GetCapabilities(&connectedLayer,

1425

&connectedLayer,

1426

CapabilityClass::PaddingRequired);

1427

// Do not require memory copy if the source and destination do not require padding.

1428

if (srcCapability.empty() && dstCapability.empty())

1429

{

1430

return EdgeStrategy::ExportToTarget;

1431

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

// Search for copy options via map/unmap

1437

if (srcFactory->SupportsMapUnmap())

1438

{

1439

for (auto&& pref : dstPrefs)

1440

{

1441

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1442

if (dstFactory && dstFactory->SupportsMapUnmap())

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1443

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1444

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1449

return EdgeStrategy::Undefined;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1450

}

1451

1452

// Select the TensorHandleFactories and the corresponding memory strategy

1453

OptimizationResult SelectTensorHandleStrategy(Graph& optGraph,

1454

BackendsMap& backends,

1455

TensorHandleFactoryRegistry& registry,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1456

bool importEnabled,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1457

Optional<std::vector<std::string>&> errMessages)

1458

{

1459

OptimizationResult result;

1460

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1461

optGraph.ForEachLayer([&backends, &registry, &result, &errMessages, importEnabled](Layer* layer)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1462

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1463

ARMNN_ASSERT(layer);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1464

1465

// Lets make sure the backend is in our list of supported backends. Something went wrong during backend

1466

// assignment if this check fails

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1467

ARMNN_ASSERT(backends.find(layer->GetBackendId()) != backends.end());

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1468

1469

// Check each output separately

1470

for (unsigned int slotIdx = 0; slotIdx < layer->GetNumOutputSlots(); slotIdx++)

1471

{

1472

OutputSlot& outputSlot = layer->GetOutputSlot(slotIdx);

1473

1474

ITensorHandleFactory::FactoryId slotOption = ITensorHandleFactory::LegacyFactoryId;

1475

1476

// Calculate the factory to use which results in the fewest copies being made.

1477

switch(layer->GetType())

1478

{

1479

case LayerType::Input:

1480

slotOption = CalculateSlotOptionForInput(backends, outputSlot, registry);

1481

break;

1482

case LayerType::Output:

1483

slotOption = CalculateSlotOptionForOutput(backends, outputSlot, registry);

1484

break;

1485

default:

1486

slotOption = CalculateSlotOption(backends, outputSlot, registry);

1487

break;

1488

}

1489

outputSlot.SetTensorHandleFactory(slotOption);

1490

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1491

// Now determine the "best" edge strategy for each connection given the slotOption.

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1492

unsigned int connectionIdx = 0;

1493

for (auto&& connection : outputSlot.GetConnections())

1494

{

1495

const Layer& connectedLayer = connection->GetOwningLayer();

1496

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1497

EdgeStrategy strategy = CalculateEdgeStrategy(backends, slotOption, *layer, connectedLayer,

1498

registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1499

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1500

if (strategy == EdgeStrategy::Undefined)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1501

{

1502

result.m_Error = true;

1503

if (errMessages)

1504

{

1505

errMessages.value().emplace_back("Could not find valid strategy required for compatibility"

1506

" between backends.");

}

return;

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1511

outputSlot.SetEdgeStrategy(connectionIdx, strategy);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

connectionIdx++;

}

}

});

return result;

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1521

IOptimizedNetworkPtr Optimize(const INetwork& inNetwork,

1522

const std::vector<BackendId>& backendPreferences,

1523

const IDeviceSpec& deviceSpec,

1524

const OptimizerOptions& options,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1525

Optional<std::vector<std::string>&> messages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1526

{

1527

if (backendPreferences.empty())

1528

{

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1529

throw InvalidArgumentException("Invoked Optimize with no backends specified");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1530

}

1531

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1532

if (options.m_ReduceFp32ToFp16 && options.m_ReduceFp32ToBf16)

1533

{

1534

throw InvalidArgumentException("BFloat16 and Float16 optimization cannot be enabled at the same time.");

1535

}

1536

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1537

std::unique_ptr<Graph> graph = std::make_unique<Graph>(inNetwork.pNetworkImpl->GetGraph());

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1538

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1539

auto optNet = IOptimizedNetworkPtr(new IOptimizedNetwork(std::move(graph), options.m_ModelOptions),

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

1540

&IOptimizedNetwork::Destroy);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1541

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1542

IOptimizedNetwork* optNetObjPtr = optNet.get();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1543

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1544

// Get the optimized graph

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1545

Graph& optGraph = optNetObjPtr->pOptimizedNetworkImpl->GetGraph();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1546

Narumol Prangnawarat

16f82f9

2020-09-14 16:12:44 +0100

[diff] [blame]

1547

// Perform AddBroadcastReshapeLayer optimisation

1548

using namespace optimizations;

1549

Optimizer::Pass(optGraph, MakeOptimizations(AddBroadcastReshapeLayer()));

1550

Narumol Prangnawarat

bbf71a6

2020-09-07 14:05:22 +0100

[diff] [blame]

1551

// Infer the tensor infos for all output slots. Throws an exception on failure

1552

optGraph.InferTensorInfos();

1553

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1554

// Perform optimisation passes

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1555

Optimizer::Pass(optGraph, MakeOptimizations(SquashEqualPermuteSiblings(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1556

SquashEqualTransposeSiblings(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1557

SquashEqualReshapeSiblings(),

1558

OptimizeInversePermutes(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1559

OptimizeInverseTransposes(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1560

MovePermuteUp(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1561

MoveTransposeUp(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1562

PermuteAsReshape(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1563

TransposeAsReshape(),

Nina Drozd

861985f

2019-04-18 14:48:51 +0100

[diff] [blame]

1564

OptimizeConsecutiveReshapes(),

Rob Hughes

3a7d3a7

2019-09-24 16:59:56 +0100

[diff] [blame]

1565

FoldPadIntoConvolution2d(),

Diego Lopez Recas

fe95d72

2021-03-19 12:40:16 +0000

[diff] [blame^]

1566

FoldPadIntoPooling2d(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1567

PermuteAndBatchToSpaceAsDepthToSpace(),

Teresa Charlin

06e0300

2020-10-15 13:16:07 +0100

[diff] [blame]

1568

TransposeAndBatchToSpaceAsDepthToSpace(),

Mike Kelly

90231b8

2020-11-05 15:44:56 +0000

[diff] [blame]

1569

FuseBatchNormIntoConvolution2DFloat32(),

1570

FuseBatchNormIntoConvolution2DFloat16(),

1571

FuseBatchNormIntoDepthwiseConvolution2DFloat32(),

1572

FuseBatchNormIntoDepthwiseConvolution2DFloat16()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1573

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1574

// If Fp32 to Fp16 optimization is set convert Fp32 network to Fp16

1575

if (options.m_ReduceFp32ToFp16)

1576

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1577

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToFp16Converter()));

Derek Lamberti

dd6804b

2019-11-27 09:29:57 +0000

[diff] [blame]

1578

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1579

}

1580

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1581

// If Fp32 to Bf16 optimization is set convert Fp32 network to Bf16

Narumol Prangnawarat

57ef008

2020-03-26 09:20:43 +0000

[diff] [blame]

1582

// Convert input of Convolution2d and FullyConnected from Fp32 to Bf16

1583

// Only Constant weight of Convolution2d and FullyConnected are converted from Fp32 to Bf16

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1584

if (options.m_ReduceFp32ToBf16)

1585

{

1586

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToBf16Converter()));

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1587

}

1588

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1589

// Initialize backend settings

1590

BackendSettings backendSettings(backendPreferences, deviceSpec);

1591

if (backendSettings.GetAvailablePreferredBackends().empty())

1592

{

1593

std::stringstream failureMsg;

1594

failureMsg << "None of the preferred backends " << backendPreferences

1595

<< " are supported. Current platform provides " << backendSettings.m_SupportedBackends;

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1596

ReportError(failureMsg.str(), messages);

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1597

throw InvalidArgumentException(failureMsg.str());

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1598

}

1599

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1600

// Create a map to temporarily hold initialized backend objects

1601

TensorHandleFactoryRegistry tensorHandleFactoryRegistry;

1602

BackendsMap backends = CreateSupportedBackends(tensorHandleFactoryRegistry, backendSettings);

1603

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1604

// Assign an available backend to each layer

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1605

Graph::Iterator firstLayer = optGraph.begin();

1606

Graph::Iterator lastLayer = optGraph.end();

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1607

OptimizationResult assignBackendsResult = AssignBackends(optNetObjPtr->pOptimizedNetworkImpl.get(),

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1608

backendSettings,

1609

firstLayer,

1610

lastLayer,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1611

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1612

if (assignBackendsResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1613

{

1614

// Failed to assign a backend to each layer

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1615

throw InvalidArgumentException("Failed to assign a backend to each layer");

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

1616

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1617

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1618

Optimizer::Pass(optGraph, MakeOptimizations(OptimizeInverseConversionsFp16(),

1619

OptimizeInverseConversionsFp32()));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1620

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1621

// Apply the backend-specific optimizations

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1622

OptimizationResult backendOptimizationResult = ApplyBackendOptimizations(optNetObjPtr->pOptimizedNetworkImpl.get(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1623

backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1624

backends,

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1625

options.m_ModelOptions,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1626

messages);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1627

if (backendOptimizationResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1628

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1629

// Failed to apply the backend-specific optimizations

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1630

throw InvalidArgumentException("Failed to apply the backend-specific optimizations");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1631

}

1632

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1633

// If the debug flag is set, then insert a DebugLayer after each layer

1634

// Doing this after applying the backend optimizations as they might have changed some layers

1635

if (options.m_Debug)

1636

{

1637

Optimizer::Pass(optGraph, MakeOptimizations(InsertDebugLayer()));

1638

}

1639

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1640

// Calculate the compatibility strategies for tensor handles

1641

OptimizationResult strategyResult = SelectTensorHandleStrategy(optGraph,

1642

backends,

1643

tensorHandleFactoryRegistry,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1644

options.m_ImportEnabled,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1645

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1646

if (strategyResult.m_Error)

1647

{

1648

// Failed to apply the backend-specific optimizations

1649

return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);

1650

}

1651

1652

// Based on the tensor handle strategy determined above, insert copy layers where required.

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1653

optGraph.AddCompatibilityLayers(backends, tensorHandleFactoryRegistry);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1654

1655

// Convert constants

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1656

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

1657

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsHalfToFloat()));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1658

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1659

// Run backend specific optimizations (deprecated)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1660

for (auto&& chosenBackend : backendSettings.m_SelectedBackends)

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1661

{

1662

auto factoryFun = BackendRegistryInstance().GetFactory(chosenBackend);

1663

auto backendPtr = factoryFun();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1664

ARMNN_ASSERT(backendPtr.get() != nullptr);

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1665

Matteo Martincigh

ed73504

2019-05-22 09:42:43 +0100

[diff] [blame]

1666

ARMNN_NO_DEPRECATE_WARN_BEGIN

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1667

auto backendSpecificOptimizations = backendPtr->GetOptimizations();

Matteo Martincigh

ed73504

2019-05-22 09:42:43 +0100

[diff] [blame]

1668

ARMNN_NO_DEPRECATE_WARN_END

1669

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1670

if (!backendSpecificOptimizations.empty())

1671

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1672

Optimizer::Pass(optNetObjPtr->pOptimizedNetworkImpl->GetGraph(), backendSpecificOptimizations);

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

}

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1676

return optNet;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1677

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1678

bool NetworkImpl::GetShapeInferenceMethod()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1679

{

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

1680

if (m_NetworkOptions.size() > 0 && m_NetworkOptions[0].GetBackendId().Get() == "ShapeInferenceMethod")

1681

{

1682

return m_NetworkOptions[0].GetOption(0).GetValue().AsBool();

1683

}

1684

1685

return false;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1686

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1687

NetworkImpl::NetworkImpl(NetworkOptions networkOptions)

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

1688

: m_NetworkOptions(networkOptions),

1689

m_Graph(std::make_unique<Graph>(GetShapeInferenceMethod()))

1690

{}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1691

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1692

NetworkImpl::~NetworkImpl()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1696

Status NetworkImpl::PrintGraph()

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

1697

{

1698

m_Graph->Print();

1699

return Status::Success;

1700

}

1701

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1702

IConnectableLayer* NetworkImpl::AddInputLayer(LayerBindingId id, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1703

{

1704

return m_Graph->AddLayer<InputLayer>(id, name);

1705

}

1706

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1707

IConnectableLayer* NetworkImpl::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

Éanna Ó Catháin

4e1e136

2018-11-12 11:36:34 +0000

[diff] [blame]

1708

const char* name)

1709

{

1710

return m_Graph->AddLayer<BatchToSpaceNdLayer>(batchToSpaceNdDescriptor, name);

1711

}

1712

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

1713

IConnectableLayer* NetworkImpl::AddCastLayer(const char* name)

1714

{

1715

return m_Graph->AddLayer<CastLayer>(name);

1716

}

1717

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1718

IConnectableLayer* NetworkImpl::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

1719

const char* name)

1720

{

1721

return m_Graph->AddLayer<ComparisonLayer>(comparisonDescriptor, name);

1722

}

1723

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1724

IConnectableLayer* NetworkImpl::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

1725

const char* name)

1726

{

1727

return m_Graph->AddLayer<ElementwiseUnaryLayer>(elementwiseUnaryDescriptor, name);

1728

}

1729

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1730

IConnectableLayer* NetworkImpl::AddFillLayer(const FillDescriptor& fillDescriptor,

Ryan OShea

ec6c680

2020-06-05 17:17:06 +0100

[diff] [blame]

1731

const char* name)

1732

{

1733

return m_Graph->AddLayer<FillLayer>(fillDescriptor, name);

1734

}

1735

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1736

IConnectableLayer* NetworkImpl::AddFullyConnectedLayerImpl(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1737

const Optional<ConstTensor>& weights,

1738

const Optional<ConstTensor>& biases,

1739

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1740

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1741

if (fullyConnectedDescriptor.m_ConstantWeights && !weights.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1742

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1743

throw InvalidArgumentException("AddFullyConnectedLayer: weights cannot be empty");

1744

1745

if (fullyConnectedDescriptor.m_BiasEnabled && !biases.has_value())

1746

{

1747

throw InvalidArgumentException("AddFullyConnectedLayer: biases cannot be empty");

1748

}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1749

}

1750

1751

const auto layer = m_Graph->AddLayer<FullyConnectedLayer>(fullyConnectedDescriptor, name);

1752

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1753

if (fullyConnectedDescriptor.m_ConstantWeights)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1754

{

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

1755

layer->m_Weight = std::make_shared<ScopedCpuTensorHandle>(weights.value());

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1756

if (fullyConnectedDescriptor.m_BiasEnabled)

1757

{

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

1758

layer->m_Bias = std::make_shared<ScopedCpuTensorHandle>(biases.value());

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1759

}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1765

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1766

const Optional<ConstTensor>& weights,

1767

const Optional<ConstTensor>& biases,

1768

const char* name)

1769

{

1770

return AddFullyConnectedLayerImpl(fullyConnectedDescriptor, weights, biases, name);

1771

}

1772

1773

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1774

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1775

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1776

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1777

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1778

Optional<ConstTensor> optionalWeights(weights);

1779

return AddFullyConnectedLayerImpl(fullyConnectedDescriptor, optionalWeights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1780

}

1781

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1782

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1783

const ConstTensor& weights,

1784

const char* name)

1785

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1786

Optional<ConstTensor> optionalWeights(weights);

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

1787

Optional<ConstTensor> biases;

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1788

return AddFullyConnectedLayerImpl(fullyConnectedDescriptor, optionalWeights, biases, name);

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1789

}

1790

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1791

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1792

const ConstTensor& weights,

1793

const ConstTensor& biases,

1794

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1795

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1796

Optional<ConstTensor> optionalWeights(weights);

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1797

Optional<ConstTensor> optionalBiases(biases);

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1798

return AddFullyConnectedLayerImpl(fullyConnectedDescriptor, optionalWeights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1799

}

1800

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1801

IConnectableLayer* NetworkImpl::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1802

const char* name)

1803

{

Jim Flynn

e242f2d

2019-05-22 14:24:13 +0100

[diff] [blame]

1804

return m_Graph->AddLayer<ConcatLayer>(concatDescriptor, name);

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1805

}

1806

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1807

IConnectableLayer* NetworkImpl::AddConvolution2dLayerImpl(const Convolution2dDescriptor& convolution2dDescriptor,

1808

const ConstTensor& weights,

1809

const Optional<ConstTensor>& biases,

1810

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1811

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1812

if (convolution2dDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1813

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1814

throw InvalidArgumentException("AddConvolution2dLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1815

}

1816

1817

const auto layer = m_Graph->AddLayer<Convolution2dLayer>(convolution2dDescriptor, name);

1818

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

1819

layer->m_Weight = std::make_shared<ScopedCpuTensorHandle>(weights);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1820

1821

if (convolution2dDescriptor.m_BiasEnabled)

1822

{

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

1823

layer->m_Bias = std::make_shared<ScopedCpuTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1829

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1830

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1831

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1832

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1833

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1834

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1835

}

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1836

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1837

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1838

const ConstTensor& weights,

1839

const char* name)

1840

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

1841

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1842

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

1843

}

1844

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1845

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1846

const ConstTensor& weights,

1847

const ConstTensor& biases,

1848

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1849

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1850

Optional<ConstTensor> optionalBiases(biases);

1851

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1852

}

1853

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1854

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayerImpl(

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1855

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1856

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1857

const Optional<ConstTensor>& biases,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1858

const char* name)

1859

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1860

if (convolution2dDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1861

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1862

throw InvalidArgumentException("AddDepthwiseConvolution2dLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1863

}

1864

Matteo Martincigh

3d6898c

2019-01-15 16:11:44 +0000

[diff] [blame]

1865

const auto layer = m_Graph->AddLayer<DepthwiseConvolution2dLayer>(convolution2dDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1866

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

1867

layer->m_Weight = std::make_shared<ScopedCpuTensorHandle>(weights);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1868

1869

if (convolution2dDescriptor.m_BiasEnabled)

1870

{

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

1871

layer->m_Bias = std::make_shared<ScopedCpuTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1877

IConnectableLayer* NetworkImpl::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

Aron Virginas-Tar

dd6247f

2019-09-19 14:31:17 +0100

[diff] [blame]

1878

const char* name)

1879

{

1880

return m_Graph->AddLayer<DepthToSpaceLayer>(depthToSpaceDescriptor, name);

1881

}

1882

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1883

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1884

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1885

const ConstTensor& weights,

1886

const Optional<ConstTensor>& biases,

1887

const char* name)

1888

{

1889

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

1890

}

1891

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1892

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1893

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1894

const ConstTensor& weights,

1895

const char* name)

1896

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

1897

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1898

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1899

}

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1900

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1901

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1902

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1903

const ConstTensor& weights,

1904

const ConstTensor& biases,

1905

const char* name)

1906

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1907

Optional<ConstTensor> optionalBiases(biases);

1908

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1909

}

1910

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1911

IConnectableLayer* NetworkImpl::AddDetectionPostProcessLayer(const armnn::DetectionPostProcessDescriptor& descriptor,

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

1912

const ConstTensor& anchors, const char* name)

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

1913

{

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

1914

const auto layer = m_Graph->AddLayer<DetectionPostProcessLayer>(descriptor, name);

1915

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

1916

layer->m_Anchors = std::make_shared<ScopedCpuTensorHandle>(anchors);

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

1917

1918

return layer;

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

1919

}

1920

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1921

IConnectableLayer* NetworkImpl::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1922

const char* name)

1923

{

1924

return m_Graph->AddLayer<PermuteLayer>(permuteDescriptor, name);

1925

}

1926

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1927

IConnectableLayer* NetworkImpl::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1928

const char* name)

1929

{

1930

return m_Graph->AddLayer<Pooling2dLayer>(pooling2dDescriptor, name);

1931

}

1932

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1933

IConnectableLayer* NetworkImpl::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1934

const char* name)

1935

{

1936

return m_Graph->AddLayer<ActivationLayer>(activationDescriptor, name);

1937

}

1938

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1939

IConnectableLayer* NetworkImpl::AddArgMinMaxLayer(const ArgMinMaxDescriptor& argMinMaxDescriptor,

Nikhil Raj

ee391d5

2019-09-05 17:50:44 +0100

[diff] [blame]

1940

const char* name)

1941

{

1942

return m_Graph->AddLayer<ArgMinMaxLayer>(argMinMaxDescriptor, name);

1943

}

1944

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1945

IConnectableLayer* NetworkImpl::AddNormalizationLayer(const NormalizationDescriptor&

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1946

normalizationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1947

const char* name)

1948

{

1949

return m_Graph->AddLayer<NormalizationLayer>(normalizationDescriptor, name);

1950

}

1951

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1952

IConnectableLayer* NetworkImpl::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

Aron Virginas-Tar

636ab40

2019-09-16 14:27:45 +0100

[diff] [blame]

1953

{

1954

return m_Graph->AddLayer<SliceLayer>(sliceDescriptor, name);

1955

}

1956

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1957

IConnectableLayer* NetworkImpl::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1958

const char* name)

1959

{

1960

return m_Graph->AddLayer<SoftmaxLayer>(softmaxDescriptor, name);

1961

}

1962

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1963

IConnectableLayer* NetworkImpl::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1964

const char* name)

1965

{

1966

return m_Graph->AddLayer<SplitterLayer>(splitterDescriptor, name);

1967

}

1968

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1969

IConnectableLayer* NetworkImpl::AddMaximumLayer(const char* name)

Nattapat Chaimanowong

5a4304a

2018-11-28 10:44:37 +0000

[diff] [blame]

1970

{

1971

return m_Graph->AddLayer<MaximumLayer>(name);

1972

}

1973

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1974

IConnectableLayer* NetworkImpl::AddMinimumLayer(const char* name)

Éanna Ó Catháin

20e5880

2018-12-04 10:29:06 +0000

[diff] [blame]

1975

{

1976

return m_Graph->AddLayer<MinimumLayer>(name);

1977

}

1978

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1979

IConnectableLayer* NetworkImpl::AddMergerLayer(const MergerDescriptor& mergerDescriptor,

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1980

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1981

{

Jim Flynn

e242f2d

2019-05-22 14:24:13 +0100

[diff] [blame]

1982

return AddConcatLayer(mergerDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1983

}

1984

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1985

IConnectableLayer* NetworkImpl::AddAbsLayer(const char * name)

Kevin May

868eb14

2019-09-04 17:29:31 +0100

[diff] [blame]

1986

{

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

1987

return AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Abs), name);

Kevin May

868eb14

2019-09-04 17:29:31 +0100

[diff] [blame]

1988

}

1989

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1990

IConnectableLayer* NetworkImpl::AddAdditionLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1991

{

1992

return m_Graph->AddLayer<AdditionLayer>(name);

1993

}

1994

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1995

IConnectableLayer* NetworkImpl::AddMultiplicationLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1996

{

1997

return m_Graph->AddLayer<MultiplicationLayer>(name);

1998

}

1999

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2000

IConnectableLayer* NetworkImpl::AddOutputLayer(LayerBindingId id, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2001

{

2002

return m_Graph->AddLayer<OutputLayer>(id, name);

2003

}

2004

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2005

IConnectableLayer* NetworkImpl::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2006

const ConstTensor& mean,

2007

const ConstTensor& variance,

2008

const ConstTensor& beta,

2009

const ConstTensor& gamma,

2010

const char* name)

2011

{

2012

const auto layer = m_Graph->AddLayer<BatchNormalizationLayer>(desc, name);

2013

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2014

layer->m_Mean = std::make_shared<ScopedCpuTensorHandle>(mean);

2015

layer->m_Variance = std::make_shared<ScopedCpuTensorHandle>(variance);

2016

layer->m_Beta = std::make_shared<ScopedCpuTensorHandle>(beta);

2017

layer->m_Gamma = std::make_shared<ScopedCpuTensorHandle>(gamma);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2022

IConnectableLayer* NetworkImpl::AddRankLayer(const char* name)

Finn Williams

2605b23

2020-06-10 15:53:46 +0100

[diff] [blame]

2023

{

2024

return m_Graph->AddLayer<RankLayer>(name);

2025

}

2026

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2027

IConnectableLayer* NetworkImpl::AddReduceLayer(const ReduceDescriptor& reduceDescriptor,

2028

const char* name)

Sadik Armagan

0c3ea5b

2021-02-03 09:29:30 +0000

[diff] [blame]

2029

{

2030

return m_Graph->AddLayer<ReduceLayer>(reduceDescriptor, name);

2031

}

2032

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2033

IConnectableLayer* NetworkImpl::AddResizeBilinearLayer(const ResizeBilinearDescriptor& descriptor,

2034

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2035

{

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

2036

ResizeDescriptor resizeDescriptor;

David Monahan

4a0c9b9

2020-05-30 09:48:39 +0100

[diff] [blame]

2037

resizeDescriptor.m_Method = ResizeMethod::Bilinear;

2038

resizeDescriptor.m_DataLayout = descriptor.m_DataLayout;

2039

resizeDescriptor.m_TargetWidth = descriptor.m_TargetWidth;

2040

resizeDescriptor.m_TargetHeight = descriptor.m_TargetHeight;

2041

resizeDescriptor.m_AlignCorners = descriptor.m_AlignCorners;

2042

resizeDescriptor.m_HalfPixelCenters = descriptor.m_HalfPixelCenters;

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

2043

2044

return m_Graph->AddLayer<ResizeLayer>(resizeDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2045

}

2046

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2047

IConnectableLayer* NetworkImpl::AddResizeLayer(const ResizeDescriptor& resizeDescriptor, const char* name)

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

2048

{

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

2049

return m_Graph->AddLayer<ResizeLayer>(resizeDescriptor, name);

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

2050

}

2051

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2052

IConnectableLayer* NetworkImpl::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

2053

const char* name)

Kevin May

ce5045a

2019-10-02 14:07:47 +0100

[diff] [blame]

2054

{

2055

return m_Graph->AddLayer<InstanceNormalizationLayer>(desc, name);

2056

}

2057

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2058

IConnectableLayer* NetworkImpl::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

2059

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2060

{

Matteo Martincigh

bcd3c85

2018-09-28 14:14:12 +0100

[diff] [blame]

2061

return m_Graph->AddLayer<L2NormalizationLayer>(desc, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2062

}

2063

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2064

IConnectableLayer* NetworkImpl::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& desc,

Aron Virginas-Tar

f982dea

2019-10-11 14:07:53 +0100

[diff] [blame]

2065

const char* name)

2066

{

2067

return m_Graph->AddLayer<LogSoftmaxLayer>(desc, name);

2068

}

2069

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2070

IConnectableLayer* NetworkImpl::AddConstantLayer(const ConstTensor& input, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2071

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2072

auto layer = m_Graph->AddLayer<ConstantLayer>(name);

2073

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2074

layer->m_LayerOutput = std::make_shared<ScopedCpuTensorHandle>(input);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2075

2076

return layer;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2077

}

2078

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2079

IConnectableLayer* NetworkImpl::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2080

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2081

{

2082

return m_Graph->AddLayer<ReshapeLayer>(reshapeDescriptor, name);

2083

}

2084

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2085

IConnectableLayer* NetworkImpl::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

Nattapat Chaimanowong

207ef9a

2018-11-02 10:57:25 +0000

[diff] [blame]

2086

const char* name)

2087

{

2088

return m_Graph->AddLayer<SpaceToBatchNdLayer>(spaceToBatchNdDescriptor, name);

2089

}

2090

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2091

IConnectableLayer* NetworkImpl::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

Aron Virginas-Tar

972af15

2019-06-11 14:14:03 +0100

[diff] [blame]

2092

const char* name)

2093

{

2094

return m_Graph->AddLayer<SpaceToDepthLayer>(spaceToDepthDescriptor, name);

2095

}

2096

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2097

IConnectableLayer* NetworkImpl::AddFloorLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2098

{

2099

return m_Graph->AddLayer<FloorLayer>(name);

2100

}

2101

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2102

IConnectableLayer* NetworkImpl::AddLstmLayer(const LstmDescriptor& descriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2103

const LstmInputParams& params,

2104

const char* name)

2105

{

2106

const auto layer = m_Graph->AddLayer<LstmLayer>(descriptor, name);

2107

2108

//Lstm Basic Parameters

2109

layer->m_BasicParameters.m_InputToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2110

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2111

layer->m_BasicParameters.m_InputToCellWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2112

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToCellWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2113

layer->m_BasicParameters.m_InputToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2114

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2115

layer->m_BasicParameters.m_RecurrentToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2116

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2117

layer->m_BasicParameters.m_RecurrentToCellWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2118

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToCellWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2119

layer->m_BasicParameters.m_RecurrentToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2120

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2121

layer->m_BasicParameters.m_ForgetGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2122

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ForgetGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2123

layer->m_BasicParameters.m_CellBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2124

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2125

layer->m_BasicParameters.m_OutputGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2126

std::make_shared<ScopedCpuTensorHandle>(*(params.m_OutputGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2127

2128

//Lstm Cifg parameters

2129

if(!descriptor.m_CifgEnabled)

2130

{

2131

if(params.m_InputToInputWeights == nullptr)

2132

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2133

throw InvalidArgumentException("AddLstmLayer: Input To Input Weights cannot be NULL "

2134

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2135

}

2136

if(params.m_RecurrentToInputWeights == nullptr)

2137

{

2138

throw InvalidArgumentException(

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2139

"AddLstmLayer: Recurrent To Input Weights cannot be NULL "

2140

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2141

}

2142

if(params.m_InputGateBias == nullptr)

2143

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2144

throw InvalidArgumentException("AddLstmLayer: Input Gate Bias cannot be NULL "

2145

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2146

}

2147

layer->m_CifgParameters.m_InputToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2148

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToInputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2149

layer->m_CifgParameters.m_RecurrentToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2150

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToInputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2151

layer->m_CifgParameters.m_InputGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2152

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2153

}

2154

2155

//Lstm projection parameters

2156

if(descriptor.m_ProjectionEnabled)

2157

{

2158

if(params.m_ProjectionWeights == nullptr)

2159

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2160

throw InvalidArgumentException("AddLstmLayer: Projection Weights cannot be NULL "

2161

"when projection is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2162

}

2163

layer->m_ProjectionParameters.m_ProjectionWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2164

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ProjectionWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2165

if(params.m_ProjectionBias != nullptr)

2166

{

2167

layer->m_ProjectionParameters.m_ProjectionBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2168

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ProjectionBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

}

}

//Lstm Peephole params

2173

if(descriptor.m_PeepholeEnabled)

2174

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2175

if(!descriptor.m_CifgEnabled)

2176

{

2177

if(params.m_CellToInputWeights == nullptr)

2178

{

2179

throw InvalidArgumentException("AddLstmLayer: Cell To Input Weights cannot be NULL "

2180

"when Peephole is enabled and CIFG disabled.");

2181

}

2182

2183

layer->m_PeepholeParameters.m_CellToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2184

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellToInputWeights));

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2185

}

2186

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2187

if(params.m_CellToForgetWeights == nullptr)

2188

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2189

throw InvalidArgumentException("AddLstmLayer: Cell To Forget Weights cannot be NULL "

2190

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2191

}

2192

if(params.m_CellToOutputWeights == nullptr)

2193

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2194

throw InvalidArgumentException("AddLstmLayer: Cell To Output Weights cannot be NULL "

2195

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2196

}

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2197

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2198

layer->m_PeepholeParameters.m_CellToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2199

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2200

layer->m_PeepholeParameters.m_CellToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2201

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2202

}

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2203

2204

//Lstm Layer Normalization params

2205

if(descriptor.m_LayerNormEnabled)

2206

{

2207

if(!descriptor.m_CifgEnabled)

2208

{

2209

if(params.m_InputLayerNormWeights == nullptr)

2210

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2211

throw InvalidArgumentException("AddLstmLayer: Input layer normalization weights cannot be NULL "

2212

"when layer normalization is enabled and CIFG disabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2213

}

2214

layer->m_LayerNormParameters.m_InputLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2215

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2216

}

2217

2218

if(params.m_ForgetLayerNormWeights == nullptr)

2219

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2220

throw InvalidArgumentException("AddLstmLayer: Forget layer normalization weights cannot be NULL "

2221

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2222

}

2223

if(params.m_CellLayerNormWeights == nullptr)

2224

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2225

throw InvalidArgumentException("AddLstmLayer: Cell layer normalization weights cannot be NULL "

2226

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2227

}

2228

if(params.m_OutputLayerNormWeights == nullptr)

2229

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2230

throw InvalidArgumentException("AddLstmLayer: Output layer normalization weights cannot be NULL "

2231

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2232

}

2233

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2234

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ForgetLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2235

layer->m_LayerNormParameters.m_CellLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2236

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2237

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2238

std::make_shared<ScopedCpuTensorHandle>(*(params.m_OutputLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2239

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2243

IConnectableLayer* NetworkImpl::AddDivisionLayer(const char* name)

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

2244

{

2245

return m_Graph->AddLayer<DivisionLayer>(name);

2246

}

2247

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2248

IConnectableLayer* NetworkImpl::AddSubtractionLayer(const char* name)

David Beck

1952622

2018-09-12 16:00:08 +0100

[diff] [blame]

2249

{

2250

return m_Graph->AddLayer<SubtractionLayer>(name);

2251

}

2252

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2253

IConnectableLayer* NetworkImpl::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

narpra01

32b9046

2018-09-13 11:07:48 +0100

[diff] [blame]

2254

{

2255

return m_Graph->AddLayer<MeanLayer>(meanDescriptor,name);

2256

}

2257

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2258

IConnectableLayer* NetworkImpl::AddPadLayer(const PadDescriptor& padDescriptor, const char* name)

Mohamed Nour Abouelseoud

5662c20

2018-09-24 13:30:09 +0100

[diff] [blame]

2259

{

2260

return m_Graph->AddLayer<PadLayer>(padDescriptor,name);

2261

}

2262

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2263

IConnectableLayer *NetworkImpl::AddQuantizeLayer(const char *name)

Derek Lamberti

a9cca6a

2019-03-25 15:41:58 +0000

[diff] [blame]

2264

{

2265

return m_Graph->AddLayer<QuantizeLayer>(name);

2266

}

2267

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2268

IConnectableLayer* NetworkImpl::AddDequantizeLayer(const char* name)

Nattapat Chaimanowong

e4294fd

2019-03-28 09:56:53 +0000

[diff] [blame]

2269

{

2270

return m_Graph->AddLayer<DequantizeLayer>(name);

2271

}

2272

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2273

IConnectableLayer* NetworkImpl::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

Conor Kennedy

430b5d8

2018-11-14 15:28:28 +0000

[diff] [blame]

2274

const char* name)

2275

{

2276

return m_Graph->AddLayer<StridedSliceLayer>(stridedSliceDescriptor, name);

2277

}

2278

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2279

IConnectableLayer* NetworkImpl::AddGreaterLayer(const char* name)

Matteo Martincigh

59a950c

2018-12-13 12:48:25 +0000

[diff] [blame]

2280

{

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

2281

return AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Greater), name);

Matteo Martincigh

59a950c

2018-12-13 12:48:25 +0000

[diff] [blame]

2282

}

2283

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2284

IConnectableLayer* NetworkImpl::AddEqualLayer(const char* name)

FrancisMurtagh

2099595

2018-12-17 12:11:36 +0000

[diff] [blame]

2285

{

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

2286

return AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Equal), name);

FrancisMurtagh

2099595

2018-12-17 12:11:36 +0000

[diff] [blame]

2287

}

2288

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2289

IConnectableLayer* NetworkImpl::AddRsqrtLayer(const char * name)

Mohamed Nour Abouelseoud

a1d3c6a

2018-12-27 12:39:16 +0000

[diff] [blame]

2290

{

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

2291

return AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Rsqrt), name);

Mohamed Nour Abouelseoud

a1d3c6a

2018-12-27 12:39:16 +0000

[diff] [blame]

2292

}

2293

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2294

IConnectableLayer* NetworkImpl::AddGatherLayer(const char* name)

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

2295

{

Teresa Charlin

5266473

2020-06-29 16:27:03 +0100

[diff] [blame]

2296

GatherDescriptor gatherDescriptor{};

2297

return AddGatherLayer(gatherDescriptor, name);

2298

}

2299

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2300

IConnectableLayer* NetworkImpl::AddGatherLayer(const GatherDescriptor& gatherDescriptor,

Teresa Charlin

5266473

2020-06-29 16:27:03 +0100

[diff] [blame]

2301

const char* name)

2302

{

2303

return m_Graph->AddLayer<GatherLayer>(gatherDescriptor, name);

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

2304

}

2305

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2306

IConnectableLayer* NetworkImpl::AddMergeLayer(const char* name)

Nattapat Chaimanowong

1f88630

2019-04-05 13:37:19 +0100

[diff] [blame]

2307

{

2308

return m_Graph->AddLayer<MergeLayer>(name);

2309

}

2310

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2311

IConnectableLayer* NetworkImpl::AddSwitchLayer(const char* name)

Sadik Armagan

eff363d

2019-04-05 15:25:46 +0100

[diff] [blame]

2312

{

2313

return m_Graph->AddLayer<SwitchLayer>(name);

2314

}

2315

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2316

IConnectableLayer* NetworkImpl::AddPreluLayer(const char* name)

Matteo Martincigh

0e406ee

2019-06-12 15:42:18 +0100

[diff] [blame]

2317

{

2318

return m_Graph->AddLayer<PreluLayer>(name);

2319

}

2320

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2321

IConnectableLayer* NetworkImpl::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

2322

const ConstTensor& weights,

2323

const Optional<ConstTensor>& biases,

2324

const char* name)

2325

{

2326

if (descriptor.m_BiasEnabled && !biases.has_value())

2327

{

2328

throw InvalidArgumentException("AddTransposeConvolution2dLayer: Biases cannot be empty");

2329

}

2330

2331

const auto layer = m_Graph->AddLayer<TransposeConvolution2dLayer>(descriptor, name);

2332

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2333

layer->m_Weight = std::make_shared<ScopedCpuTensorHandle>(weights);

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

2334

2335

if (descriptor.m_BiasEnabled)

2336

{

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2337

layer->m_Bias = std::make_shared<ScopedCpuTensorHandle>(biases.value());

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2343

IConnectableLayer* NetworkImpl::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

Mike Kelly

c9ea45a

2020-02-28 18:11:58 +0000

[diff] [blame]

2344

const char* name)

2345

{

2346

return m_Graph->AddLayer<TransposeLayer>(transposeDescriptor, name);

2347

}

2348

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2349

IConnectableLayer* NetworkImpl::AddStackLayer(const StackDescriptor& stackDescriptor,

Matthew Jackson

2b8c1da

2019-07-04 14:59:16 +0100

[diff] [blame]

2350

const char* name)

2351

{

2352

return m_Graph->AddLayer<StackLayer>(stackDescriptor, name);

2353

}

2354

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

2355

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2356

IConnectableLayer* NetworkImpl::AddStandInLayer(const StandInDescriptor& desc,

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

2357

const char* name)

2358

{

2359

return m_Graph->AddLayer<StandInLayer>(desc, name);

2360

}

2361

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2362

IConnectableLayer* NetworkImpl::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2363

const char* name)

2364

{

2365

const auto layer = m_Graph->AddLayer<QuantizedLstmLayer>(name);

2366

2367

// InputToX weights

2368

layer->m_QuantizedLstmParameters.m_InputToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2369

std::make_shared<ScopedCpuTensorHandle>(params.GetInputToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2370

layer->m_QuantizedLstmParameters.m_InputToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2371

std::make_shared<ScopedCpuTensorHandle>(params.GetInputToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2372

layer->m_QuantizedLstmParameters.m_InputToCellWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2373

std::make_shared<ScopedCpuTensorHandle>(params.GetInputToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2374

layer->m_QuantizedLstmParameters.m_InputToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2375

std::make_shared<ScopedCpuTensorHandle>(params.GetInputToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2376

2377

// RecurrentToX weights

2378

layer->m_QuantizedLstmParameters.m_RecurrentToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2379

std::make_shared<ScopedCpuTensorHandle>(params.GetRecurrentToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2380

layer->m_QuantizedLstmParameters.m_RecurrentToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2381

std::make_shared<ScopedCpuTensorHandle>(params.GetRecurrentToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2382

layer->m_QuantizedLstmParameters.m_RecurrentToCellWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2383

std::make_shared<ScopedCpuTensorHandle>(params.GetRecurrentToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2384

layer->m_QuantizedLstmParameters.m_RecurrentToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2385

std::make_shared<ScopedCpuTensorHandle>(params.GetRecurrentToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2386

2387

// Bias

2388

layer->m_QuantizedLstmParameters.m_InputGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2389

std::make_shared<ScopedCpuTensorHandle>(params.GetInputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2390

layer->m_QuantizedLstmParameters.m_ForgetGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2391

std::make_shared<ScopedCpuTensorHandle>(params.GetForgetGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2392

layer->m_QuantizedLstmParameters.m_CellBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2393

std::make_shared<ScopedCpuTensorHandle>(params.GetCellBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2394

layer->m_QuantizedLstmParameters.m_OutputGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2395

std::make_shared<ScopedCpuTensorHandle>(params.GetOutputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2400

IConnectableLayer* NetworkImpl::AddQLstmLayer(const QLstmDescriptor& descriptor,

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2401

const LstmInputParams& params,

2402

const char* name)

2403

{

2404

const auto layer = m_Graph->AddLayer<QLstmLayer>(descriptor, name);

2405

2406

// QLstm Basic Parameters

2407

layer->m_BasicParameters.m_InputToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2408

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2409

layer->m_BasicParameters.m_InputToCellWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2410

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToCellWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2411

layer->m_BasicParameters.m_InputToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2412

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2413

layer->m_BasicParameters.m_RecurrentToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2414

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2415

layer->m_BasicParameters.m_RecurrentToCellWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2416

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToCellWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2417

layer->m_BasicParameters.m_RecurrentToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2418

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2419

layer->m_BasicParameters.m_ForgetGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2420

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ForgetGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2421

layer->m_BasicParameters.m_CellBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2422

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2423

layer->m_BasicParameters.m_OutputGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2424

std::make_shared<ScopedCpuTensorHandle>(*(params.m_OutputGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2425

2426

// QLstm Cifg parameters

2427

if(!descriptor.m_CifgEnabled)

2428

{

2429

if(params.m_InputToInputWeights == nullptr)

2430

{

2431

throw InvalidArgumentException("AddQLstmLayer: Input To Input Weights cannot be NULL");

2432

}

2433

2434

if(params.m_RecurrentToInputWeights == nullptr)

2435

{

2436

throw InvalidArgumentException(

2437

"AddQLstmLayer: Recurrent To Input Weights cannot be NULL");

2438

}

2439

2440

if(params.m_InputGateBias == nullptr)

2441

{

2442

throw InvalidArgumentException("AddQLstmLayer: Input Gate Bias cannot be NULL");

2443

}

2444

2445

layer->m_CifgParameters.m_InputToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2446

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2447

layer->m_CifgParameters.m_RecurrentToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2448

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2449

layer->m_CifgParameters.m_InputGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2450

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2451

}

2452

2453

// QLstm Projection parameters

2454

if(descriptor.m_ProjectionEnabled)

2455

{

2456

if(params.m_ProjectionWeights == nullptr)

2457

{

2458

throw InvalidArgumentException("AddQLstmLayer: Projection Weights cannot be NULL");

2459

}

2460

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2461

layer->m_ProjectionParameters.m_ProjectionWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2462

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ProjectionWeights));

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

2463

2464

// Projection bias is optional even if projection is enabled

2465

if(params.m_ProjectionWeights != nullptr)

2466

{

2467

layer->m_ProjectionParameters.m_ProjectionBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2468

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ProjectionBias));

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

2469

}

2470

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2471

}

2472

2473

// QLstm Peephole params

2474

if(descriptor.m_PeepholeEnabled)

2475

{

2476

if(params.m_CellToForgetWeights == nullptr)

2477

{

2478

throw InvalidArgumentException("AddQLstmLayer: Cell To Forget Weights cannot be NULL");

2479

}

2480

2481

if(params.m_CellToOutputWeights == nullptr)

2482

{

2483

throw InvalidArgumentException("AddQLstmLayer: Cell To Output Weights cannot be NULL");

2484

}

2485

2486

if(!descriptor.m_CifgEnabled)

2487

{

2488

if(params.m_CellToInputWeights == nullptr)

2489

{

2490

throw InvalidArgumentException("AddQLstmLayer: Cell To Input Weights cannot be NULL");

2491

}

2492

2493

layer->m_PeepholeParameters.m_CellToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2494

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2495

}

2496

2497

layer->m_PeepholeParameters.m_CellToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2498

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2499

layer->m_PeepholeParameters.m_CellToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2500

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2501

}

2502

2503

// QLstm Layer Normalization params

2504

if(descriptor.m_LayerNormEnabled)

2505

{

2506

if(params.m_ForgetLayerNormWeights == nullptr)

2507

{

2508

throw InvalidArgumentException("AddQLstmLayer: Forget layer normalization weights cannot be NULL");

2509

}

2510

2511

if(params.m_CellLayerNormWeights == nullptr)

2512

{

2513

throw InvalidArgumentException("AddQLstmLayer: Cell layer normalization weights cannot be NULL");

2514

}

2515

2516

if(params.m_OutputLayerNormWeights == nullptr)

2517

{

2518

throw InvalidArgumentException("AddQLstmLayer: Output layer normalization weights cannot be NULL");

2519

}

2520

2521

if(!descriptor.m_CifgEnabled)

2522

{

2523

if(params.m_InputLayerNormWeights == nullptr)

2524

{

2525

throw InvalidArgumentException("AddQLstmLayer: Input layer normalization weights cannot be NULL");

2526

}

2527

2528

layer->m_LayerNormParameters.m_InputLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2529

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2530

}

2531

2532

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2533

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ForgetLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2534

layer->m_LayerNormParameters.m_CellLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2535

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2536

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame]

2537

std::make_shared<ScopedCpuTensorHandle>(*(params.m_OutputLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2542

IConnectableLayer* NetworkImpl::AddLogicalBinaryLayer(const LogicalBinaryDescriptor& logicalBinaryDescriptor,

James Conroy

aba90cd

2020-11-06 16:28:18 +0000

[diff] [blame]

2543

const char* name)

2544

{

2545

return m_Graph->AddLayer<LogicalBinaryLayer>(logicalBinaryDescriptor, name);

2546

}

2547

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2548

void NetworkImpl::Accept(ILayerVisitor& visitor) const

Mike Kelly

8c1701a

2019-02-11 17:01:27 +0000

[diff] [blame]

2549

{

2550

for (auto layer : GetGraph())

2551

{

2552

layer->Accept(visitor);

};

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2556

void NetworkImpl::ExecuteStrategy(IStrategy& strategy) const

Finn Williams

b454c5c

2021-02-09 15:56:23 +0000

[diff] [blame]

2557

{

2558

for (auto layer : GetGraph())

2559

{

2560

layer->ExecuteStrategy(strategy);

};

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2564

OptimizedNetworkImpl::OptimizedNetworkImpl(std::unique_ptr<Graph> graph)

Sadik Armagan

3184c90

2020-03-18 10:57:30 +0000

[diff] [blame]

2565

: m_Graph(std::move(graph)), m_Guid(profiling::ProfilingService::GetNextGuid())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2569

OptimizedNetworkImpl::OptimizedNetworkImpl(std::unique_ptr<Graph> graph, const ModelOptions& modelOptions)

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

2570

: m_Graph(std::move(graph)), m_Guid(profiling::ProfilingService::GetNextGuid()), m_ModelOptions(modelOptions)

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2574

OptimizedNetworkImpl::~OptimizedNetworkImpl()

telsoa01