Blame - src/armnn/Network.cpp - ml/armnn

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

5

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

6

#include "Network.hpp"

7

#include "Graph.hpp"

8

#include "Layer.hpp"

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

9

#include "DeviceSpec.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

10

#include "Optimizer.hpp"

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

11

#include "SubgraphViewSelector.hpp"

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

12

#include "BackendSettings.hpp"

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

13

#include "optimizations/All.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

14

Aron Virginas-Tar

c9cc804

2018-11-01 16:15:57 +0000

[diff] [blame]

15

#include <backendsCommon/CpuTensorHandle.hpp>

16

#include <backendsCommon/WorkloadFactory.hpp>

Matteo Martincigh

e5b8eb9

2019-11-28 15:45:42 +0000

[diff] [blame]

17

#include <armnn/backends/IBackendInternal.hpp>

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

18

#include <backendsCommon/TensorHandleFactoryRegistry.hpp>

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

19

20

#include <armnn/Exceptions.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

21

#include <armnn/Utils.hpp>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

22

#include <armnn/TypesUtils.hpp>

Matteo Martincigh

c601aa6

2019-10-29 15:03:22 +0000

[diff] [blame]

23

#include <armnn/BackendRegistry.hpp>

Matthew Bentham

f48afc6

2020-01-15 17:55:08 +0000

[diff] [blame]

24

#include <armnn/Logging.hpp>

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

25

#include <armnn/utility/Assert.hpp>

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

26

#include <armnn/utility/IgnoreUnused.hpp>

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

27

#include <armnn/utility/PolymorphicDowncast.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

28

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

29

#include <ProfilingService.hpp>

30

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

#include <fcntl.h>

#include <algorithm>

#include <fstream>

#include <memory>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

35

#include <vector>

36

#include <algorithm>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

37

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

namespace armnn

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

41

INetwork::INetwork(NetworkOptions networkOptions) : pNetworkImpl(new NetworkImpl(networkOptions)) {}

42

43

INetwork::~INetwork() = default;

44

45

Status INetwork::PrintGraph()

46

{

47

return pNetworkImpl->PrintGraph();

48

}

49

50

IConnectableLayer* INetwork::AddInputLayer(LayerBindingId id, const char* name)

51

{

52

return pNetworkImpl->AddInputLayer(id, name);

}

IConnectableLayer* INetwork::AddArgMinMaxLayer(const ArgMinMaxDescriptor& desc,

57

const char* name)

58

{

59

return pNetworkImpl->AddArgMinMaxLayer(desc, name);

}

IConnectableLayer* INetwork::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

64

const char* name)

65

{

66

return pNetworkImpl->AddComparisonLayer(comparisonDescriptor, name);

}

IConnectableLayer* INetwork::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

71

const char* name)

72

{

73

return pNetworkImpl->AddConcatLayer(concatDescriptor, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

78

const ConstTensor& weights,

79

const Optional<ConstTensor>& biases,

80

const char* name)

81

{

82

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

87

const ConstTensor& weights,

88

const char* name)

89

{

90

Optional<ConstTensor> biases;

91

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

96

const ConstTensor& weights,

97

const ConstTensor& biases,

const char* name )

{

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor,

102

weights,

103

armnn::Optional<ConstTensor>(biases),

name);

}

IConnectableLayer* INetwork::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

109

const char* name)

110

{

111

return pNetworkImpl->AddDepthToSpaceLayer(depthToSpaceDescriptor, name);

}

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

116

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

117

const ConstTensor& weights,

118

const Optional<ConstTensor>& biases,

119

const char* name)

120

{

121

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

126

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

127

const ConstTensor& weights,

128

const char* name)

129

{

130

Optional<ConstTensor> biases;

131

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

136

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

137

const ConstTensor& weights,

138

const ConstTensor& biases,

139

const char* name)

140

{

141

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, weights,

142

armnn::Optional<ConstTensor>(biases), name);

}

IConnectableLayer* INetwork::AddDequantizeLayer(const char* name)

147

{

148

return pNetworkImpl->AddDequantizeLayer(name);

}

IConnectableLayer* INetwork::AddDetectionPostProcessLayer(

153

const DetectionPostProcessDescriptor& descriptor,

154

const ConstTensor& anchors,

155

const char* name)

156

{

157

return pNetworkImpl->AddDetectionPostProcessLayer(descriptor, anchors, name);

}

IConnectableLayer* INetwork::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

162

const char* name)

163

{

164

return pNetworkImpl->AddElementwiseUnaryLayer(elementwiseUnaryDescriptor, name);

}

IConnectableLayer* INetwork::AddFillLayer(const FillDescriptor& fillDescriptor,

169

const char* name)

170

{

171

return pNetworkImpl->AddFillLayer(fillDescriptor, name);

172

}

173

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

174

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

175

const ConstTensor& weights,

176

const Optional<ConstTensor>& biases,

177

const char* name)

178

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

179

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor,

180

armnn::Optional<ConstTensor>(weights),

181

biases,

182

name);

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

183

}

184

185

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

186

const ConstTensor& weights,

187

const char* name)

188

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

189

armnn::Optional<ConstTensor> biases;

190

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor,

191

armnn::Optional<ConstTensor>(weights),

192

biases,

193

name);

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

194

}

195

196

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

197

const ConstTensor& weights,

198

const ConstTensor& biases,

199

const char* name)

200

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

201

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor,

202

armnn::Optional<ConstTensor>(weights),

203

armnn::Optional<ConstTensor>(biases),

name);

}

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

208

const Optional<ConstTensor>& weights,

209

const Optional<ConstTensor>& biases,

210

const char* name)

211

{

212

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor, weights, biases, name);

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

213

}

214

215

IConnectableLayer* INetwork::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

216

const char* name)

217

{

218

return pNetworkImpl->AddPermuteLayer(permuteDescriptor, name);

219

}

220

221

IConnectableLayer* INetwork::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

222

const char* name)

223

{

224

return pNetworkImpl->AddBatchToSpaceNdLayer(batchToSpaceNdDescriptor, name);

225

}

226

227

IConnectableLayer* INetwork::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

228

const char* name)

229

{

230

return pNetworkImpl->AddPooling2dLayer(pooling2dDescriptor, name);

231

}

232

233

IConnectableLayer* INetwork::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

234

const char* name)

235

{

236

return pNetworkImpl->AddActivationLayer(activationDescriptor, name);

237

}

238

239

IConnectableLayer* INetwork::AddNormalizationLayer(const NormalizationDescriptor& normalizationDescriptor,

240

const char* name)

241

{

242

return pNetworkImpl->AddNormalizationLayer(normalizationDescriptor, name);

243

}

244

245

IConnectableLayer* INetwork::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

246

{

247

return pNetworkImpl->AddSliceLayer(sliceDescriptor, name);

248

}

249

IConnectableLayer* INetwork::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

250

const char* name)

251

{

252

return pNetworkImpl->AddSoftmaxLayer(softmaxDescriptor, name);

253

}

254

255

IConnectableLayer* INetwork::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

256

const char* name)

257

{

258

return pNetworkImpl->AddSplitterLayer(splitterDescriptor, name);

259

}

260

261

IConnectableLayer* INetwork::AddMergeLayer(const char* name)

262

{

263

return pNetworkImpl->AddMergeLayer(name);

264

}

265

266

IConnectableLayer* INetwork::AddMergerLayer(const MergerDescriptor& mergerDescriptor,

267

const char* name)

268

{

269

return pNetworkImpl->AddConcatLayer(mergerDescriptor, name);

270

}

271

272

IConnectableLayer* INetwork::AddAbsLayer(const char* name)

273

{

274

return pNetworkImpl->AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Abs), name);

275

}

276

277

IConnectableLayer* INetwork::AddAdditionLayer(const char* name)

278

{

279

return pNetworkImpl->AddAdditionLayer(name);

280

}

281

282

IConnectableLayer* INetwork::AddMultiplicationLayer(const char* name)

283

{

284

return pNetworkImpl->AddMultiplicationLayer(name);

285

}

286

287

IConnectableLayer* INetwork::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

288

const ConstTensor& mean,

289

const ConstTensor& variance,

290

const ConstTensor& beta,

291

const ConstTensor& gamma,

292

const char* name)

293

{

294

return pNetworkImpl->AddBatchNormalizationLayer(desc, mean, variance, beta, gamma, name);

295

}

296

297

IConnectableLayer* INetwork::AddRankLayer(const char* name)

298

{

299

return pNetworkImpl->AddRankLayer(name);

300

}

301

302

IConnectableLayer* INetwork::AddResizeBilinearLayer(const ResizeBilinearDescriptor& descriptor,

303

const char* name)

304

{

305

ResizeDescriptor resizeDescriptor;

306

resizeDescriptor.m_Method = ResizeMethod::Bilinear;

307

resizeDescriptor.m_DataLayout = descriptor.m_DataLayout;

308

resizeDescriptor.m_TargetWidth = descriptor.m_TargetWidth;

309

resizeDescriptor.m_TargetHeight = descriptor.m_TargetHeight;

310

resizeDescriptor.m_AlignCorners = descriptor.m_AlignCorners;

311

resizeDescriptor.m_HalfPixelCenters = descriptor.m_HalfPixelCenters;

312

313

return pNetworkImpl->AddResizeLayer(resizeDescriptor, name);

314

}

315

316

IConnectableLayer* INetwork::AddResizeLayer(const ResizeDescriptor& resizeDescriptor,

317

const char* name)

318

{

319

return pNetworkImpl->AddResizeLayer(resizeDescriptor, name);

320

}

321

322

IConnectableLayer* INetwork::AddReduceLayer(const ReduceDescriptor& reduceDescriptor,

323

const char* name)

324

{

325

return pNetworkImpl->AddReduceLayer(reduceDescriptor, name);

326

}

327

328

IConnectableLayer* INetwork::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

329

const char* name)

330

{

331

return pNetworkImpl->AddInstanceNormalizationLayer(desc, name);

332

}

333

334

IConnectableLayer* INetwork::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

335

const char* name)

336

{

337

return pNetworkImpl->AddL2NormalizationLayer(desc, name);

338

}

339

340

IConnectableLayer* INetwork::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& logSoftmaxDescriptor,

341

const char* name)

342

{

343

return pNetworkImpl->AddLogSoftmaxLayer(logSoftmaxDescriptor, name);

344

}

345

346

IConnectableLayer* INetwork::AddConstantLayer(const ConstTensor& input,

347

const char* name)

348

{

349

return pNetworkImpl->AddConstantLayer(input, name);

350

}

351

352

IConnectableLayer* INetwork::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

353

const char* name)

354

{

355

return pNetworkImpl->AddReshapeLayer(reshapeDescriptor, name);

356

}

357

358

IConnectableLayer* INetwork::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

359

const char* name)

360

{

361

return pNetworkImpl->AddSpaceToBatchNdLayer(spaceToBatchNdDescriptor, name);

362

}

363

364

IConnectableLayer* INetwork::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

365

const char* name)

366

{

367

return pNetworkImpl->AddSpaceToDepthLayer(spaceToDepthDescriptor, name);

368

}

369

370

IConnectableLayer* INetwork::AddFloorLayer(const char* name)

371

{

372

return pNetworkImpl->AddFloorLayer(name);

373

}

374

IConnectableLayer* INetwork::AddOutputLayer(LayerBindingId id, const char* name)

375

{

376

return pNetworkImpl->AddOutputLayer(id, name);

377

}

378

379

IConnectableLayer* INetwork::AddLstmLayer(const LstmDescriptor& descriptor,

380

const LstmInputParams& params,

381

const char* name)

382

{

383

return pNetworkImpl->AddLstmLayer(descriptor, params, name);

384

}

385

386

IConnectableLayer* INetwork::AddDivisionLayer(const char* name)

387

{

388

return pNetworkImpl->AddDivisionLayer(name);

389

}

390

391

IConnectableLayer* INetwork::AddSubtractionLayer(const char* name)

392

{

393

return pNetworkImpl->AddSubtractionLayer(name);

394

}

395

396

IConnectableLayer* INetwork::AddMaximumLayer(const char* name)

397

{

398

return pNetworkImpl->AddMaximumLayer(name);

399

}

400

401

IConnectableLayer* INetwork::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

402

{

403

return pNetworkImpl->AddMeanLayer(meanDescriptor, name);

404

}

405

406

IConnectableLayer* INetwork::AddPadLayer(const PadDescriptor& padDescriptor,

407

const char* name)

408

{

409

return pNetworkImpl->AddPadLayer(padDescriptor, name);

410

}

411

412

IConnectableLayer* INetwork::AddQuantizeLayer(const char* name)

413

{

414

return pNetworkImpl->AddQuantizeLayer(name);

415

}

416

417

IConnectableLayer* INetwork::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

418

const char* name)

419

{

420

return pNetworkImpl->AddStridedSliceLayer(stridedSliceDescriptor, name);

421

}

422

423

IConnectableLayer* INetwork::AddMinimumLayer(const char* name)

424

{

425

return pNetworkImpl->AddMinimumLayer(name);

426

}

427

428

IConnectableLayer* INetwork::AddGreaterLayer(const char* name)

429

{

430

return pNetworkImpl->AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Greater), name);

431

}

432

433

IConnectableLayer* INetwork::AddEqualLayer(const char* name)

434

{

435

return pNetworkImpl->AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Equal), name);

436

}

437

438

IConnectableLayer* INetwork::AddRsqrtLayer(const char* name)

439

{

440

return pNetworkImpl->AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Rsqrt), name);

441

}

442

443

IConnectableLayer* INetwork::AddGatherLayer(const char* name)

444

{

445

GatherDescriptor gatherDescriptor{};

446

return pNetworkImpl->AddGatherLayer(gatherDescriptor, name);

447

}

448

449

IConnectableLayer* INetwork::AddGatherLayer(const GatherDescriptor& descriptor,

450

const char* name)

451

{

452

return pNetworkImpl->AddGatherLayer(descriptor, name);

453

}

454

455

IConnectableLayer* INetwork::AddSwitchLayer(const char* name)

456

{

457

return pNetworkImpl->AddSwitchLayer(name);

458

}

459

460

IConnectableLayer* INetwork::AddPreluLayer(const char* name)

461

{

462

return pNetworkImpl->AddPreluLayer(name);

463

}

464

465

IConnectableLayer* INetwork::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

466

const ConstTensor& weights,

467

const Optional<ConstTensor>& biases,

468

const char* name)

469

{

470

return pNetworkImpl->AddTransposeConvolution2dLayer(descriptor, weights, biases, name);

471

}

472

473

IConnectableLayer* INetwork::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

474

const char* name)

475

{

476

return pNetworkImpl->AddTransposeLayer(transposeDescriptor, name);

477

}

478

479

IConnectableLayer* INetwork::AddStackLayer(const StackDescriptor& descriptor,

480

const char* name)

481

{

482

return pNetworkImpl->AddStackLayer(descriptor, name);

483

}

484

485

IConnectableLayer* INetwork::AddStandInLayer(const StandInDescriptor& descriptor,

486

const char* name)

487

{

488

return pNetworkImpl->AddStandInLayer(descriptor, name);

489

}

490

491

IConnectableLayer* INetwork::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

492

const char* name)

493

{

494

return pNetworkImpl->AddQuantizedLstmLayer(params, name);

495

}

496

497

IConnectableLayer* INetwork::AddQLstmLayer(const QLstmDescriptor& descriptor,

498

const LstmInputParams& params,

499

const char* name)

500

{

501

return pNetworkImpl->AddQLstmLayer(descriptor, params, name);

502

}

503

504

IConnectableLayer* INetwork::AddLogicalBinaryLayer(const LogicalBinaryDescriptor& descriptor,

505

const char* name)

506

{

507

return pNetworkImpl->AddLogicalBinaryLayer(descriptor, name);

508

}

509

510

void INetwork::Accept(ILayerVisitor& visitor) const

511

{

512

return pNetworkImpl->Accept(visitor);

513

}

514

515

void INetwork::ExecuteStrategy(IStrategy& strategy) const

516

{

517

return pNetworkImpl->ExecuteStrategy(strategy);

518

}

519

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

520

armnn::INetwork* INetwork::CreateRaw(NetworkOptions networkOptions)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

521

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

522

return new INetwork(networkOptions);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

523

}

524

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

525

armnn::INetworkPtr INetwork::Create(NetworkOptions networkOptions)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

526

{

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

527

return INetworkPtr(CreateRaw(networkOptions), &INetwork::Destroy);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

528

}

529

530

void INetwork::Destroy(INetwork* network)

531

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

532

delete network;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

533

}

534

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

535

536

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<Graph> graph)

537

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph))) {}

538

539

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<OptimizedNetworkImpl> impl)

540

: pOptimizedNetworkImpl(std::move(impl)) {}

541

542

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<Graph> graph, const ModelOptions& modelOptions)

543

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph), modelOptions)) {}

544

545

IOptimizedNetwork::~IOptimizedNetwork() = default;

546

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

547

void IOptimizedNetwork::Destroy(IOptimizedNetwork* network)

548

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

549

delete network;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

550

}

551

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

552

Status IOptimizedNetwork::PrintGraph()

553

{

554

return pOptimizedNetworkImpl->PrintGraph();

555

}

556

557

Status IOptimizedNetwork::SerializeToDot(std::ostream& stream) const

558

{

559

return pOptimizedNetworkImpl->SerializeToDot(stream);

560

}

561

562

profiling::ProfilingGuid IOptimizedNetwork::GetGuid() const

563

{

564

return pOptimizedNetworkImpl->GetGuid();

565

}

566

567

Status OptimizedNetworkImpl::PrintGraph()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

568

{

569

m_Graph->Print();

570

return Status::Success;

571

}

572

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

573

Status OptimizedNetworkImpl::SerializeToDot(std::ostream& stream) const

surmeh01

bceff2f

2018-03-29 16:29:27 +0100

[diff] [blame]

574

{

575

return m_Graph->SerializeToDot(stream);

576

}

577

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

578

void ReportError(const std::string& errorMessage,

579

Optional<std::vector<std::string>&> errorMessages)

580

{

581

std::stringstream fullErrorMessage;

582

fullErrorMessage << "ERROR: " << errorMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

583

ARMNN_LOG(warning) << fullErrorMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

584

if (errorMessages)

585

{

586

errorMessages.value().push_back(fullErrorMessage.str());

}

}

void ReportWarning(const std::string& warningMessage,

591

Optional<std::vector<std::string>&> warningMessages)

592

{

593

std::stringstream fullWarningMessage;

594

fullWarningMessage << "WARNING: " << warningMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

595

ARMNN_LOG(warning) << fullWarningMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

596

if (warningMessages)

597

{

598

warningMessages.value().push_back(fullWarningMessage.str());

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

602

OptimizationResult ReturnWithError(OptimizationResult res,

603

const Layer* layer,

604

const BackendSettings& backendSettings,

605

Optional<std::vector<std::string>&> errMessages)

606

{

607

std::stringstream failureMsg;

608

failureMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

609

<< " is not supported on any preferred backend " << backendSettings.m_PreferredBackends;

610

ReportError(failureMsg.str(), errMessages);

res.m_Error = true;

return res;

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

617

bool CheckScaleSetOnQuantizedType(Layer* layer, Optional<std::vector<std::string>&> errMessages)

618

{

619

bool noErrors = true;

620

unsigned int numOutputs = layer->GetNumOutputSlots();

621

for (unsigned int i = 0; i < numOutputs; i++) {

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

622

OutputSlot& outputSlot = layer->GetOutputSlot(i);

623

TensorInfo info = outputSlot.GetTensorInfo();

Derek Lamberti

f90c56d

2020-01-10 17:14:08 +0000

[diff] [blame]

624

if (DataType::QAsymmU8 == info.GetDataType()) {

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

625

if (0.f == info.GetQuantizationScale()) {

626

noErrors = false;

627

std::stringstream ss;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

628

ss << "output " << i << " of layer " << GetLayerTypeAsCString(layer->GetType())

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

629

<< " (" << layer->GetNameStr() << ") is of type"

630

<< " Quantized 8 bit but its scale parameter has not been set";

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

631

ReportError(ss.str(), errMessages);

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

632

}

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

633

// Softmax under QuantisedAsymm8 must always be scale (1.0f/256.0f) and offset 0

634

if ((info.GetQuantizationScale() != (1.0f / 256.0f) ||

635

info.GetQuantizationOffset() != 0) &&

636

layer->GetType() == armnn::LayerType::Softmax)

637

{

638

std::stringstream ss;

639

ss << "Quantization parameters for Softmax layer (Scale: " <<

640

info.GetQuantizationScale() << " and Offset: " << info.GetQuantizationOffset() <<

641

") are incorrect and have been updated to Scale: 0.00390625 and Offset: 0";

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

642

ARMNN_LOG(warning) << ss.str();

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

643

info.SetQuantizationScale((1.0f /256.0f));

644

info.SetQuantizationOffset(0);

645

outputSlot.SetTensorInfo(info);

646

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

}

}

return noErrors;

}

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

652

template <typename LayerT>

653

LayerT* ConvertBf16ToFp32Weight(Layer* l)

654

{

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

655

LayerT* layer = PolymorphicDowncast<LayerT*>(l);

Narumol Prangnawarat

250d392

2020-03-30 16:11:04 +0100

[diff] [blame]

656

if ((layer->GetType() == LayerType::Convolution2d || layer->GetType() == LayerType::FullyConnected)

657

&& layer->m_Weight)

658

{

659

const TensorInfo& info = layer->m_Weight->GetTensorInfo();

660

661

if (info.GetDataType() == DataType::BFloat16)

662

{

663

std::vector<float> newValues(info.GetNumElements());

664

665

armnnUtils::FloatingPointConverter::ConvertBFloat16ToFloat32(

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

666

layer->m_Weight->template GetConstTensor<armnn::BFloat16>(), info.GetNumElements(), newValues.data());

Narumol Prangnawarat

250d392

2020-03-30 16:11:04 +0100

[diff] [blame]

667

668

TensorInfo newInfo(info.GetShape(), DataType::Float32);

669

ConstTensor newInput(newInfo, newValues);

670

layer->m_Weight.reset(new ScopedCpuTensorHandle(newInput));

}

}

return layer;

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

676

OptimizationResult AttemptBackendAssignment(BackendSettings& backendSettings,

Graph& graph,

Layer* layer,

BackendId backend,

DataType dataTypeIn,

DataType dataTypeOut,

682

const std::vector<BackendId>& availablePreferredBackends,

683

std::string& reasonIfUnsupported,

684

Optional<std::vector<std::string>&> errMessages)

685

{

686

OptimizationResult result;

687

688

// Helper lambda to compose meaningful error message before returning with error

689

auto ReturnError = [&](const Layer* layer)

690

{

691

return ReturnWithError(result, layer, backendSettings, errMessages);

692

};

693

694

// need to set the compute device on the layer

695

// before we can check if it is supported

696

layer->SetBackendId(backend);

697

if (!IWorkloadFactory::IsLayerSupported(*layer, EmptyOptional(), reasonIfUnsupported))

698

{

699

if (dataTypeIn == DataType::Float16 || dataTypeOut == DataType::Float16)

700

{

701

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

702

&& layer->GetType() != LayerType::ConvertFp32ToFp16

703

&& layer->GetType() != LayerType::ConvertFp16ToFp32)

704

{

705

// Insert FP16 -> FP32 conversion layer before current layer

706

std::vector<ConvertFp16ToFp32Layer*> convertFp16ToFp32Layers;

707

if (dataTypeIn == DataType::Float16)

708

{

709

convertFp16ToFp32Layers =

710

InsertConvertFp16ToFp32LayersBefore(graph, *layer);

711

}

712

713

// Insert FP32 -> FP16 conversion layer after current layer

714

std::vector<ConvertFp32ToFp16Layer*> convertFp32ToFp16Layers;

715

if (dataTypeOut == DataType::Float16)

716

{

717

convertFp32ToFp16Layers =

718

InsertConvertFp32ToFp16LayersAfter(graph, *layer);

719

}

720

721

// Assign a supported backend to the newly introduced conversion layers

722

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

723

{

724

bool supportedBackendFound = false;

725

std::string reasonIfUnsupported;

726

727

// Try preferred backend first

728

layer->SetBackendId(preferredBackend);

729

if (IWorkloadFactory::IsLayerSupported(*layer,

730

EmptyOptional(),

731

reasonIfUnsupported))

732

{

733

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

738

{

739

// Skip preferred backend (we already determined that it is not supported)

740

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

746

if (IWorkloadFactory::IsLayerSupported(*layer,

747

EmptyOptional(),

748

reasonIfUnsupported))

749

{

750

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

757

};

758

759

for (ConvertFp16ToFp32Layer* convertLayer : convertFp16ToFp32Layers)

760

{

761

if (!AssignFirstSupportedBackend(convertLayer, backend))

762

{

763

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToFp16Layer* convertLayer : convertFp32ToFp16Layers)

768

{

769

if (!AssignFirstSupportedBackend(convertLayer, backend))

770

{

771

return ReturnError(convertLayer);

}

}

return result;

}

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

778

else if (dataTypeIn == DataType::BFloat16 || dataTypeOut == DataType::BFloat16)

779

{

780

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

781

&& layer->GetType() != LayerType::ConvertFp32ToBf16

782

&& layer->GetType() != LayerType::ConvertBf16ToFp32)

783

{

784

// Insert BF16 -> FP32 conversion layer before current layer

785

std::vector<ConvertBf16ToFp32Layer*> convertBf16ToFp32Layers;

786

if (dataTypeIn == DataType::BFloat16)

787

{

788

convertBf16ToFp32Layers =

789

InsertConvertBf16ToFp32LayersBefore(graph, *layer);

Narumol Prangnawarat

250d392

2020-03-30 16:11:04 +0100

[diff] [blame]

790

if (layer->GetType() == LayerType::Convolution2d)

791

{

792

ConvertBf16ToFp32Weight<Convolution2dLayer>(layer);

793

}

794

else if (layer->GetType() == LayerType::FullyConnected)

795

{

796

ConvertBf16ToFp32Weight<FullyConnectedLayer>(layer);

797

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

798

}

799

800

// Insert FP32 -> BF16 conversion layer after current layer

801

std::vector<ConvertFp32ToBf16Layer*> convertFp32ToBf16Layers;

802

if (dataTypeOut == DataType::BFloat16)

803

{

804

convertFp32ToBf16Layers =

805

InsertConvertFp32ToBf16LayersAfter(graph, *layer);

806

}

807

808

// Assign a supported backend to the newly introduced conversion layers

809

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

810

{

811

bool supportedBackendFound = false;

812

std::string reasonIfUnsupported;

813

814

// Try preferred backend first

815

layer->SetBackendId(preferredBackend);

816

if (IWorkloadFactory::IsLayerSupported(*layer,

817

EmptyOptional(),

818

reasonIfUnsupported))

819

{

820

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

825

{

826

// Skip preferred backend (we already determined that it is not supported)

827

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

833

if (IWorkloadFactory::IsLayerSupported(*layer,

834

EmptyOptional(),

835

reasonIfUnsupported))

836

{

837

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

844

};

845

846

for (ConvertBf16ToFp32Layer* convertLayer : convertBf16ToFp32Layers)

847

{

848

if (!AssignFirstSupportedBackend(convertLayer, backend))

849

{

850

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToBf16Layer* convertLayer : convertFp32ToBf16Layers)

855

{

856

if (!AssignFirstSupportedBackend(convertLayer, backend))

857

{

858

return ReturnError(convertLayer);

}

}

return result;

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

866

std::stringstream warningMsg;

867

warningMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

868

<< " is not supported on requested backend " << layer->GetBackendId().Get()

869

<< " for input data type " << GetDataTypeName(dataTypeIn)

870

<< " and output data type " << GetDataTypeName(dataTypeOut)

871

<< " (reason: " << reasonIfUnsupported

872

<< "), falling back to the next backend.";

873

ReportWarning(warningMsg.str(), errMessages);

874

875

return OptimizationResult(true, false);

}

else

{

return result;

}

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

884

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

885

BackendSettings& backendSettings,

886

Graph::Iterator& firstLayer,

887

Graph::Iterator& lastLayer,

888

Optional<std::vector<std::string>&> errMessages)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

889

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

890

OptimizationResult result;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

891

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

892

// Helper lambda to compose meaningful error message before returning with error

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

893

auto ReturnError = [&](const Layer* layer)

894

{

895

return ReturnWithError(result, layer, backendSettings, errMessages);

896

};

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

897

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

898

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

899

auto availablePreferredBackends = backendSettings.GetAvailablePreferredBackends();

900

if (availablePreferredBackends.empty())

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

901

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

902

std::stringstream failureMsg;

903

failureMsg << "No preferred backends are available";

904

ReportError(failureMsg.str(), errMessages);

905

906

result.m_Error = true;

return result;

}

for (auto it = firstLayer; it != lastLayer; ++it)

911

{

912

auto layer = *it;

Aron Virginas-Tar

87972be

2019-11-13 15:16:28 +0000

[diff] [blame]

913

914

DataType dataTypeIn = layer->GetNumInputSlots() == 0 ? DataType::Float32 :

915

layer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo().GetDataType();

916

DataType dataTypeOut = layer->GetNumOutputSlots() == 0 ? DataType::Float32 :

917

layer->GetOutputSlot(0).GetTensorInfo().GetDataType();

918

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

919

std::string reasonIfUnsupported;

920

bool found = false;

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

921

if (!CheckScaleSetOnQuantizedType(layer, errMessages))

922

{

923

// don't bomb immediately, find all the quantized outputs

924

// which haven't had a scale set and report them all back.

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

925

result.m_Error = true;

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

926

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

927

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

928

// First try assign layer to hint backend

929

if (layer->GetBackendHint().has_value() &&

930

backendSettings.IsBackendSupported(layer->GetBackendHint().value()) &&

931

AttemptBackendAssignment(backendSettings,

932

optNetObjPtr->GetGraph(),

933

layer,

934

layer->GetBackendHint().value(),

935

dataTypeIn,

936

dataTypeOut,

937

availablePreferredBackends,

938

reasonIfUnsupported,

939

errMessages).IsOk())

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

940

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

941

found = true;

942

backendSettings.m_SelectedBackends.insert(layer->GetBackendHint().value());

}

else

{

// Try assign layer to prefered list of backends

947

for (const auto& backend : availablePreferredBackends)

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

948

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

949

if (layer->GetBackendHint().has_value() &&

950

layer->GetBackendHint().value() == backend)

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

951

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

952

continue; //Don't re-test the backend hint

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

953

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

954

955

OptimizationResult res = AttemptBackendAssignment(backendSettings,

956

optNetObjPtr->GetGraph(),

layer,

backend,

dataTypeIn,

dataTypeOut,

availablePreferredBackends,

reasonIfUnsupported,

errMessages);

if (res.IsOk())

{

found = true;

backendSettings.m_SelectedBackends.insert(backend);

969

break;

970

}

971

else if (res.IsError())

972

{

973

return res; // Cannot continue.

974

// Note: we don't need to log the error as it would already

975

// be logged in AttemptBackendAssignment().

976

}

977

else

978

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

979

ARMNN_ASSERT_MSG(res.IsWarningOnly(), "OptimizationResult in unexpected state.");

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

980

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

}

}

// If the layer is unsupported by any devices, log and return a null network.

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

985

if (!found)

986

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

987

// NOTE: if the layer is not an operation queue type AND we have not got CpuRef as a

988

// fallback we should set the compute device on the layer to CpuRef (these are not

989

// available as accelerated operations, or are only available under certain

990

// conditions, currently they comprise MemCopy, Constant, Permute)

991

armnn::LayerType layerType = layer->GetType();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

992

if (!backendSettings.IsCpuRefUsed() && (layerType == armnn::LayerType::MemCopy ||

993

layerType == armnn::LayerType::Constant ||

994

layerType == armnn::LayerType::Permute))

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

995

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

996

BackendId cpuBackendId(armnn::Compute::CpuRef);

997

layer->SetBackendId(cpuBackendId);

998

backendSettings.m_SelectedBackends.insert(cpuBackendId);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

999

}

1000

else

1001

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

1002

return ReturnError(layer);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1003

}

1004

}

1005

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

return result;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1010

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1011

BackendSettings& backendSettings,

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1012

SubgraphView& subgraph,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1013

Optional<std::vector<std::string>&> errMessages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1014

{

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1015

Graph::Iterator firstLayer = subgraph.begin();

1016

Graph::Iterator lastLayer = subgraph.end();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1017

return AssignBackends(optNetObjPtr,

backendSettings,

firstLayer,

lastLayer,

errMessages);

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1024

BackendsMap CreateSupportedBackends(TensorHandleFactoryRegistry& handleFactoryRegistry,

1025

BackendSettings& backendSettings)

1026

{

1027

BackendsMap backends;

1028

auto const& backendRegistry = BackendRegistryInstance();

1029

for (auto&& selectedBackend : backendSettings.m_SupportedBackends)

1030

{

1031

auto backendFactory = backendRegistry.GetFactory(selectedBackend);

1032

auto backendObjPtr = backendFactory();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1033

ARMNN_ASSERT(backendObjPtr);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1034

1035

backendObjPtr->RegisterTensorHandleFactories(handleFactoryRegistry);

1036

1037

backends[backendObjPtr->GetId()] = std::move(backendObjPtr);

}

return backends;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1043

OptimizationResult ApplyBackendOptimizations(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1044

BackendSettings& backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1045

BackendsMap& backends,

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1046

const ModelOptions& modelOptions,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1047

Optional<std::vector<std::string>&> errMessages)

1048

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1049

ARMNN_ASSERT(optNetObjPtr);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1050

1051

OptimizationResult result;

1052

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1053

// Get the optimized graph

1054

Graph& optGraph = optNetObjPtr->GetGraph();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1055

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1056

// Run backend specific optimizations

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1057

for (auto&& selectedBackend : backendSettings.m_SelectedBackends)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1058

{

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1059

auto backendObjPtr = backends.find(selectedBackend)->second.get();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1060

ARMNN_ASSERT(backendObjPtr);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1061

1062

// Select sub-graphs based on backend

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1063

SubgraphViewSelector::Subgraphs subgraphs =

Rob Hughes

65c3226

2019-07-23 15:33:39 +0100

[diff] [blame]

1064

SubgraphViewSelector::SelectSubgraphs(optGraph,

Matteo Martincigh

602af09

2019-05-01 10:31:27 +0100

[diff] [blame]

1065

// Select layers assigned to the requested backend

1066

[&backendObjPtr](const Layer& layer)

1067

{

1068

return layer.GetType() != LayerType::Input &&

1069

layer.GetType() != LayerType::Output &&

1070

layer.GetBackendId() == backendObjPtr->GetId();

1071

});

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1072

if (subgraphs.empty())

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1073

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1074

// No sub-graphs found, try with next selected backend

1075

continue;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1076

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1077

1078

// Try to optimize each sub-graph

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1079

for (auto& subgraph : subgraphs)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1080

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1081

// Try to optimize the current sub-graph

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1082

OptimizationViews optimizationViews = backendObjPtr->OptimizeSubgraphView(*subgraph, modelOptions);

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1083

ARMNN_ASSERT(optimizationViews.Validate(*subgraph));

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1084

1085

// Optimization attempted, check the resulting optimized sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1086

for (auto& substitution : optimizationViews.GetSubstitutions())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1087

{

1088

// Sub-graph optimized, substitute the sub-graph with the new optimized one in the main optimized graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1089

SubgraphView& replacementSubgraph = substitution.m_ReplacementSubgraph;

1090

SubgraphView& substitutableSubgraph = substitution.m_SubstitutableSubgraph;

1091

optGraph.SubstituteSubgraph(substitutableSubgraph, replacementSubgraph);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1092

1093

// Assign the current backend to the optimized sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1094

std::for_each(replacementSubgraph.begin(), replacementSubgraph.end(), [&selectedBackend](Layer* l)

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1095

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1096

ARMNN_ASSERT(l);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1097

l->SetBackendId(selectedBackend);

1098

});

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1099

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1100

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1101

if (!optimizationViews.GetFailedSubgraphs().empty())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1102

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1103

std::stringstream warningMsg;

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1104

warningMsg << "Some sub-graph(s) failed to optimized on " << backendObjPtr->GetId() << " backend.";

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1105

ReportWarning(warningMsg.str(), errMessages);

1106

1107

// Failed to optimize the given sub-graph, re-assign the sub-graph layers to other available backends

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1108

BackendSettings settingsCopy(backendSettings);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1109

if (!backendObjPtr->GetId().IsCpuRef())

1110

{

1111

// Add the current backend to the list of backends to ignore

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1112

settingsCopy.m_IgnoredBackends.insert(backendObjPtr->GetId());

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1113

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1114

1115

int count=0;

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1116

for (auto& failedSubgraph : optimizationViews.GetFailedSubgraphs())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1117

{

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1118

// An error occurred: the optimization was attempted but not performed, try different backends

1119

std::stringstream subgraphMsg;

1120

subgraphMsg << "Re-assigning backends to " << failedSubgraph.GetLayers().size()

1121

<< " layers inside sub-graph " << count++;

Matteo Martincigh

328d92b

2019-07-04 17:52:55 +0100

[diff] [blame]

1122

ReportWarning(subgraphMsg.str(), errMessages);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1123

1124

OptimizationResult reassignmentResult = AssignBackends(optNetObjPtr,

settingsCopy,

*subgraph,

errMessages);

if (reassignmentResult.m_Error)

1129

{

1130

// Failed to re-assign one of the remaining backends to each layer of the sub-graph

1131

result.m_Error = true;

1132

return result;

1133

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1134

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

}

}

}

return result;

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1142

bool RequiresCopy(ITensorHandleFactory::FactoryId src,

1143

ITensorHandleFactory::FactoryId dst,

1144

TensorHandleFactoryRegistry& registry)

{

if (src != dst)

{

ITensorHandleFactory* srcFactory = registry.GetFactory(src);

1149

ITensorHandleFactory* dstFactory = registry.GetFactory(dst);

1150

Matteo Martincigh

a6539ed

2019-08-27 13:43:32 +0100

[diff] [blame]

1151

if (srcFactory && dstFactory &&

1152

(srcFactory->GetExportFlags() & dstFactory->GetImportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

{

return false;

}

return true;

}

return false;

}

// Find the handle factory for the input layer which results in fewest required copies.

1162

ITensorHandleFactory::FactoryId CalculateSlotOptionForInput(BackendsMap& backends,

1163

OutputSlot& slot,

1164

TensorHandleFactoryRegistry& registry)

1165

{

1166

Layer& layer = slot.GetOwningLayer();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1167

ARMNN_ASSERT(layer.GetType() == LayerType::Input);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1168

1169

// Explicitly select the tensorhandle factory for InputLayer because the rules for it are slightly different. It

1170

// doesn't matter which backend it is assigned to because they all use the same implementation, which

1171

// requires Map/Unmap support. This means that, so long as the handle type supports map/unmap semantics, we can

1172

// select a factory with maximum compatibility with the layers connected to the InputLayer.

1173

1174

// First ensure the from backends can support the TensorHandeAPI

1175

auto frmBackend = backends.find(layer.GetBackendId());

1176

if (frmBackend == backends.end() ||

1177

!frmBackend->second->SupportsTensorAllocatorAPI())

1178

{

1179

return ITensorHandleFactory::LegacyFactoryId;

1180

}

1181

1182

// Go through all connections to the output slot and determine the TensorHandleFactory which results in the

1183

// fewest copies.

1184

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

1185

int topScore = 0;

1186

ITensorHandleFactory::FactoryId topChoice = ITensorHandleFactory::LegacyFactoryId;

1187

1188

for (auto&& connection : slot.GetConnections())

1189

{

1190

const Layer& connectedLayer = connection->GetOwningLayer();

1191

1192

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1193

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1194

1195

if (!toBackend->second.get()->SupportsTensorAllocatorAPI())

1196

{

1197

// The destination backend does not support the tensor allocator API, move to the next one

continue;

}

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1202

for (auto&& dst : dstPrefs)

1203

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1204

// Input layers use the mem copy workload or import, so the selected factory must

1205

// support either the map/unmap API or Import API

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1206

ITensorHandleFactory* factory = registry.GetFactory(dst);

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1207

if (!factory->SupportsMapUnmap() &&

1208

!CheckFlag(factory->GetImportFlags(), MemorySource::Malloc)) // Just support cpu mem imports for now

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1209

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1210

// The current tensor handle factory does not support the map/unmap or import

1211

// strategy, move to the next one

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

continue;

}

auto it = factoryScores.find(dst);

1216

if (it == factoryScores.end())

1217

{

1218

// Add new score to the table

1219

factoryScores[dst] = 0;

1220

if (topChoice == ITensorHandleFactory::LegacyFactoryId)

{

topChoice = dst;

}

}

else

{

// Increase the score

1228

factoryScores[dst]++;

1229

1230

// Track the best option

1231

if (factoryScores[dst] > topScore)

1232

{

1233

topScore = factoryScores[dst];

topChoice = dst;

}

}

}

}

return topChoice;

}

// Find the handle factory for the output layer which results in fewest required copies.

1244

ITensorHandleFactory::FactoryId CalculateSlotOptionForOutput(BackendsMap& backends,

1245

OutputSlot& slot,

1246

TensorHandleFactoryRegistry& registry)

1247

{

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

1248

IgnoreUnused(backends, slot, registry);

Derek Lamberti

94a88d2

2019-12-10 21:12:59 +0000

[diff] [blame]

1249

return ITensorHandleFactory::DeferredFactoryId;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1250

}

1251

1252

// For all handle factories supported on the source backend, we wish to find the one which requires the fewest copies

1253

// when considering all connections.

1254

ITensorHandleFactory::FactoryId CalculateSlotOption(BackendsMap& backends,

1255

OutputSlot& outputSlot,

1256

TensorHandleFactoryRegistry& registry)

1257

{

1258

// First ensure the from backends can support the TensorHandeAPI

1259

Layer& layer = outputSlot.GetOwningLayer();

1260

auto frmBackend = backends.find(layer.GetBackendId());

1261

if (frmBackend == backends.end() ||

1262

!frmBackend->second->SupportsTensorAllocatorAPI())

1263

{

1264

return ITensorHandleFactory::LegacyFactoryId;

1265

}

1266

1267

// Connections to Output Layers requires support for map/unmap on the TensorHandle.

1268

bool requiresMapUnmap = false;

1269

for (auto&& connection : outputSlot.GetConnections())

1270

{

1271

const Layer& connectedLayer = connection->GetOwningLayer();

1272

if (connectedLayer.GetType() == LayerType::Output)

1273

{

1274

requiresMapUnmap = true;

}

}

IBackendInternal* srcBackend = frmBackend->second.get();

1279

auto srcPrefs = srcBackend->GetHandleFactoryPreferences();

1280

1281

// Initialize the scores

1282

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

1283

for (auto&& pref : srcPrefs)

1284

{

1285

if (requiresMapUnmap) // Only consider factories that support map/unmap if required

1286

{

1287

ITensorHandleFactory* factory = registry.GetFactory(pref);

1288

if (!factory->SupportsMapUnmap())

1289

{

1290

// The current tensor handle factory does not support the map/unmap strategy, move to the next one

continue;

}

}

auto it = factoryScores.find(pref);

1296

if (it == factoryScores.end())

1297

{

1298

// Add new score to the table

1299

factoryScores[pref] = 0;

}

}

// Score each handle factory based on how many times it requires copies on the slot connections

1304

for (auto&& connection : outputSlot.GetConnections())

1305

{

1306

const Layer& connectedLayer = connection->GetOwningLayer();

1307

1308

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1309

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1310

1311

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1312

for (auto&& src : srcPrefs)

1313

{

1314

if (factoryScores.find(src) == factoryScores.end()) // Don't consider excluded factories

{

continue;

}

for (auto&& dst : dstPrefs)

1320

{

1321

if (RequiresCopy(src, dst, registry))

1322

{

1323

// Copy avoided, increase the score

1324

factoryScores[src]++;

break;

}

}

}

}

// Find the lowest score

1332

int minScore = std::numeric_limits<int>::max();

1333

for (auto it : factoryScores)

1334

{

1335

minScore = std::min(minScore, it.second);

1336

}

1337

1338

// Collect factories matching the best(lowest) score

1339

std::vector<ITensorHandleFactory::FactoryId> optimalFactories;

1340

for (auto it : factoryScores)

1341

{

1342

if (it.second == minScore)

1343

{

1344

optimalFactories.push_back(it.first);

}

}

// For all compatible Factories matching the best score, find the preferred one for the current layer.

1349

for (auto&& srcPref : srcPrefs)

1350

{

1351

for (auto&& comp : optimalFactories)

{

if (comp == srcPref)

{

return comp;

}

}

}

return ITensorHandleFactory::LegacyFactoryId;

1361

}

1362

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1363

EdgeStrategy CalculateEdgeStrategy(BackendsMap& backends,

1364

ITensorHandleFactory::FactoryId srcFactoryId,

1365

const Layer& layer,

1366

const Layer& connectedLayer,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1367

TensorHandleFactoryRegistry& registry,

1368

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1369

{

1370

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1371

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1372

1373

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1374

1375

// Legacy API check for backward compatibility

1376

if (srcFactoryId == ITensorHandleFactory::LegacyFactoryId || dstPrefs.empty())

1377

{

1378

if (layer.GetBackendId() != connectedLayer.GetBackendId())

1379

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1380

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1381

}

1382

else

1383

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1384

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// TensorHandleFactory API present, so perform more sophisticated strategies.

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1389

// Dst Output layers don't require copy because they use import or map/unmap

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1390

if (connectedLayer.GetType() == LayerType::Output)

1391

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1392

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1393

}

1394

1395

// Search for direct match in prefs

1396

for (auto&& pref : dstPrefs)

1397

{

1398

if (pref == srcFactoryId)

1399

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1400

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// Search for export/import options

1405

ITensorHandleFactory* srcFactory = registry.GetFactory(srcFactoryId);

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1406

if (srcFactory->GetExportFlags() != 0 && importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1407

{

1408

for (auto&& pref : dstPrefs)

1409

{

1410

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1411

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1412

// Handles cases when a destPref is not listed in TensorHandleFactoryRegistry

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1413

if (!dstFactory) {

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1414

continue;

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1415

}

1416

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1417

if ((dstFactory->GetImportFlags() & srcFactory->GetExportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1418

{

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1419

auto srcCapability = srcFactory->GetCapabilities(&layer, &layer, CapabilityClass::PaddingRequired);

1420

auto dstCapability = dstFactory->GetCapabilities(&connectedLayer,

1421

&connectedLayer,

1422

CapabilityClass::PaddingRequired);

1423

// Do not require memory copy if the source and destination do not require padding.

1424

if (srcCapability.empty() && dstCapability.empty())

1425

{

1426

return EdgeStrategy::ExportToTarget;

1427

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

// Search for copy options via map/unmap

1433

if (srcFactory->SupportsMapUnmap())

1434

{

1435

for (auto&& pref : dstPrefs)

1436

{

1437

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1438

if (dstFactory && dstFactory->SupportsMapUnmap())

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1439

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1440

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1445

return EdgeStrategy::Undefined;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1446

}

1447

1448

// Select the TensorHandleFactories and the corresponding memory strategy

1449

OptimizationResult SelectTensorHandleStrategy(Graph& optGraph,

1450

BackendsMap& backends,

1451

TensorHandleFactoryRegistry& registry,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1452

bool importEnabled,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1453

Optional<std::vector<std::string>&> errMessages)

1454

{

1455

OptimizationResult result;

1456

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1457

optGraph.ForEachLayer([&backends, &registry, &result, &errMessages, importEnabled](Layer* layer)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1458

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1459

ARMNN_ASSERT(layer);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1460

1461

// Lets make sure the backend is in our list of supported backends. Something went wrong during backend

1462

// assignment if this check fails

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1463

ARMNN_ASSERT(backends.find(layer->GetBackendId()) != backends.end());

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1464

1465

// Check each output separately

1466

for (unsigned int slotIdx = 0; slotIdx < layer->GetNumOutputSlots(); slotIdx++)

1467

{

1468

OutputSlot& outputSlot = layer->GetOutputSlot(slotIdx);

1469

1470

ITensorHandleFactory::FactoryId slotOption = ITensorHandleFactory::LegacyFactoryId;

1471

1472

// Calculate the factory to use which results in the fewest copies being made.

1473

switch(layer->GetType())

1474

{

1475

case LayerType::Input:

1476

slotOption = CalculateSlotOptionForInput(backends, outputSlot, registry);

1477

break;

1478

case LayerType::Output:

1479

slotOption = CalculateSlotOptionForOutput(backends, outputSlot, registry);

1480

break;

1481

default:

1482

slotOption = CalculateSlotOption(backends, outputSlot, registry);

1483

break;

1484

}

1485

outputSlot.SetTensorHandleFactory(slotOption);

1486

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1487

// Now determine the "best" edge strategy for each connection given the slotOption.

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1488

unsigned int connectionIdx = 0;

1489

for (auto&& connection : outputSlot.GetConnections())

1490

{

1491

const Layer& connectedLayer = connection->GetOwningLayer();

1492

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1493

EdgeStrategy strategy = CalculateEdgeStrategy(backends, slotOption, *layer, connectedLayer,

1494

registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1495

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1496

if (strategy == EdgeStrategy::Undefined)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1497

{

1498

result.m_Error = true;

1499

if (errMessages)

1500

{

1501

errMessages.value().emplace_back("Could not find valid strategy required for compatibility"

1502

" between backends.");

}

return;

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1507

outputSlot.SetEdgeStrategy(connectionIdx, strategy);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

connectionIdx++;

}

}

});

return result;

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1517

IOptimizedNetworkPtr Optimize(const INetwork& inNetwork,

1518

const std::vector<BackendId>& backendPreferences,

1519

const IDeviceSpec& deviceSpec,

1520

const OptimizerOptions& options,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1521

Optional<std::vector<std::string>&> messages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1522

{

1523

if (backendPreferences.empty())

1524

{

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1525

throw InvalidArgumentException("Invoked Optimize with no backends specified");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1526

}

1527

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1528

if (options.m_ReduceFp32ToFp16 && options.m_ReduceFp32ToBf16)

1529

{

1530

throw InvalidArgumentException("BFloat16 and Float16 optimization cannot be enabled at the same time.");

1531

}

1532

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1533

std::unique_ptr<Graph> graph = std::make_unique<Graph>(inNetwork.pNetworkImpl->GetGraph());

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1534

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1535

auto optNet = IOptimizedNetworkPtr(new IOptimizedNetwork(std::move(graph), options.m_ModelOptions),

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

1536

&IOptimizedNetwork::Destroy);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1537

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1538

IOptimizedNetwork* optNetObjPtr = optNet.get();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1539

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1540

// Get the optimized graph

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1541

Graph& optGraph = optNetObjPtr->pOptimizedNetworkImpl->GetGraph();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1542

Narumol Prangnawarat

16f82f9

2020-09-14 16:12:44 +0100

[diff] [blame]

1543

// Perform AddBroadcastReshapeLayer optimisation

1544

using namespace optimizations;

1545

Optimizer::Pass(optGraph, MakeOptimizations(AddBroadcastReshapeLayer()));

1546

Narumol Prangnawarat

bbf71a6

2020-09-07 14:05:22 +0100

[diff] [blame]

1547

// Infer the tensor infos for all output slots. Throws an exception on failure

1548

optGraph.InferTensorInfos();

1549

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1550

// Perform optimisation passes

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1551

Optimizer::Pass(optGraph, MakeOptimizations(SquashEqualPermuteSiblings(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1552

SquashEqualTransposeSiblings(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1553

SquashEqualReshapeSiblings(),

1554

OptimizeInversePermutes(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1555

OptimizeInverseTransposes(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1556

MovePermuteUp(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1557

MoveTransposeUp(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1558

PermuteAsReshape(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1559

TransposeAsReshape(),

Nina Drozd

861985f

2019-04-18 14:48:51 +0100

[diff] [blame]

1560

OptimizeConsecutiveReshapes(),

Rob Hughes

3a7d3a7

2019-09-24 16:59:56 +0100

[diff] [blame]

1561

FoldPadIntoConvolution2d(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1562

PermuteAndBatchToSpaceAsDepthToSpace(),

Teresa Charlin

06e0300

2020-10-15 13:16:07 +0100

[diff] [blame]

1563

TransposeAndBatchToSpaceAsDepthToSpace(),

Mike Kelly

90231b8

2020-11-05 15:44:56 +0000

[diff] [blame]

1564

FuseBatchNormIntoConvolution2DFloat32(),

1565

FuseBatchNormIntoConvolution2DFloat16(),

1566

FuseBatchNormIntoDepthwiseConvolution2DFloat32(),

1567

FuseBatchNormIntoDepthwiseConvolution2DFloat16()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1568

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1569

// If Fp32 to Fp16 optimization is set convert Fp32 network to Fp16

1570

if (options.m_ReduceFp32ToFp16)

1571

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1572

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToFp16Converter()));

Derek Lamberti

dd6804b

2019-11-27 09:29:57 +0000

[diff] [blame]

1573

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1574

}

1575

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1576

// If Fp32 to Bf16 optimization is set convert Fp32 network to Bf16

Narumol Prangnawarat

57ef008

2020-03-26 09:20:43 +0000

[diff] [blame]

1577

// Convert input of Convolution2d and FullyConnected from Fp32 to Bf16

1578

// Only Constant weight of Convolution2d and FullyConnected are converted from Fp32 to Bf16

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1579

if (options.m_ReduceFp32ToBf16)

1580

{

1581

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToBf16Converter()));

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1582

}

1583

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1584

// Initialize backend settings

1585

BackendSettings backendSettings(backendPreferences, deviceSpec);

1586

if (backendSettings.GetAvailablePreferredBackends().empty())

1587

{

1588

std::stringstream failureMsg;

1589

failureMsg << "None of the preferred backends " << backendPreferences

1590

<< " are supported. Current platform provides " << backendSettings.m_SupportedBackends;

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1591

ReportError(failureMsg.str(), messages);

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1592

throw InvalidArgumentException(failureMsg.str());

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1593

}

1594

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1595

// Create a map to temporarily hold initialized backend objects

1596

TensorHandleFactoryRegistry tensorHandleFactoryRegistry;

1597

BackendsMap backends = CreateSupportedBackends(tensorHandleFactoryRegistry, backendSettings);

1598

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1599

// Assign an available backend to each layer

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1600

Graph::Iterator firstLayer = optGraph.begin();

1601

Graph::Iterator lastLayer = optGraph.end();

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1602

OptimizationResult assignBackendsResult = AssignBackends(optNetObjPtr->pOptimizedNetworkImpl.get(),

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1603

backendSettings,

1604

firstLayer,

1605

lastLayer,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1606

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1607

if (assignBackendsResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1608

{

1609

// Failed to assign a backend to each layer

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1610

throw InvalidArgumentException("Failed to assign a backend to each layer");

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

1611

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1612

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1613

Optimizer::Pass(optGraph, MakeOptimizations(OptimizeInverseConversionsFp16(),

1614

OptimizeInverseConversionsFp32()));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1615

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1616

// Apply the backend-specific optimizations

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1617

OptimizationResult backendOptimizationResult = ApplyBackendOptimizations(optNetObjPtr->pOptimizedNetworkImpl.get(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1618

backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1619

backends,

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1620

options.m_ModelOptions,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1621

messages);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1622

if (backendOptimizationResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1623

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1624

// Failed to apply the backend-specific optimizations

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1625

throw InvalidArgumentException("Failed to apply the backend-specific optimizations");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1626

}

1627

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1628

// If the debug flag is set, then insert a DebugLayer after each layer

1629

// Doing this after applying the backend optimizations as they might have changed some layers

1630

if (options.m_Debug)

1631

{

1632

Optimizer::Pass(optGraph, MakeOptimizations(InsertDebugLayer()));

1633

}

1634

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1635

// Calculate the compatibility strategies for tensor handles

1636

OptimizationResult strategyResult = SelectTensorHandleStrategy(optGraph,

1637

backends,

1638

tensorHandleFactoryRegistry,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1639

options.m_ImportEnabled,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1640

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1641

if (strategyResult.m_Error)

1642

{

1643

// Failed to apply the backend-specific optimizations

1644

return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);

1645

}

1646

1647

// Based on the tensor handle strategy determined above, insert copy layers where required.

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1648

optGraph.AddCompatibilityLayers(backends, tensorHandleFactoryRegistry);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1649

1650

// Convert constants

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1651

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

1652

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsHalfToFloat()));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1653

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1654

// Run backend specific optimizations (deprecated)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1655

for (auto&& chosenBackend : backendSettings.m_SelectedBackends)

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1656

{

1657

auto factoryFun = BackendRegistryInstance().GetFactory(chosenBackend);

1658

auto backendPtr = factoryFun();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1659

ARMNN_ASSERT(backendPtr.get() != nullptr);

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1660

Matteo Martincigh

ed73504

2019-05-22 09:42:43 +0100

[diff] [blame]

1661

ARMNN_NO_DEPRECATE_WARN_BEGIN

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1662

auto backendSpecificOptimizations = backendPtr->GetOptimizations();

Matteo Martincigh

ed73504

2019-05-22 09:42:43 +0100

[diff] [blame]

1663

ARMNN_NO_DEPRECATE_WARN_END

1664

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1665

if (!backendSpecificOptimizations.empty())

1666

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1667

Optimizer::Pass(optNetObjPtr->pOptimizedNetworkImpl->GetGraph(), backendSpecificOptimizations);

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

}

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1671

return optNet;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1672

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1673

bool NetworkImpl::GetShapeInferenceMethod()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1674

{

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

1675

if (m_NetworkOptions.size() > 0 && m_NetworkOptions[0].GetBackendId().Get() == "ShapeInferenceMethod")

1676

{

1677

return m_NetworkOptions[0].GetOption(0).GetValue().AsBool();

1678

}

1679

1680

return false;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1681

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1682

NetworkImpl::NetworkImpl(NetworkOptions networkOptions)

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

1683

: m_NetworkOptions(networkOptions),

1684

m_Graph(std::make_unique<Graph>(GetShapeInferenceMethod()))

1685

{}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1686

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1687

NetworkImpl::~NetworkImpl()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1691

Status NetworkImpl::PrintGraph()

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

1692

{

1693

m_Graph->Print();

1694

return Status::Success;

1695

}

1696

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1697

IConnectableLayer* NetworkImpl::AddInputLayer(LayerBindingId id, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1698

{

1699

return m_Graph->AddLayer<InputLayer>(id, name);

1700

}

1701

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1702

IConnectableLayer* NetworkImpl::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

Éanna Ó Catháin

4e1e136

2018-11-12 11:36:34 +0000

[diff] [blame]

1703

const char* name)

1704

{

1705

return m_Graph->AddLayer<BatchToSpaceNdLayer>(batchToSpaceNdDescriptor, name);

1706

}

1707

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1708

IConnectableLayer* NetworkImpl::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

1709

const char* name)

1710

{

1711

return m_Graph->AddLayer<ComparisonLayer>(comparisonDescriptor, name);

1712

}

1713

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1714

IConnectableLayer* NetworkImpl::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

1715

const char* name)

1716

{

1717

return m_Graph->AddLayer<ElementwiseUnaryLayer>(elementwiseUnaryDescriptor, name);

1718

}

1719

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1720

IConnectableLayer* NetworkImpl::AddFillLayer(const FillDescriptor& fillDescriptor,

Ryan OShea

ec6c680

2020-06-05 17:17:06 +0100

[diff] [blame]

1721

const char* name)

1722

{

1723

return m_Graph->AddLayer<FillLayer>(fillDescriptor, name);

1724

}

1725

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1726

IConnectableLayer* NetworkImpl::AddFullyConnectedLayerImpl(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1727

const Optional<ConstTensor>& weights,

1728

const Optional<ConstTensor>& biases,

1729

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1730

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1731

if (fullyConnectedDescriptor.m_ConstantWeights && !weights.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1732

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1733

throw InvalidArgumentException("AddFullyConnectedLayer: weights cannot be empty");

1734

1735

if (fullyConnectedDescriptor.m_BiasEnabled && !biases.has_value())

1736

{

1737

throw InvalidArgumentException("AddFullyConnectedLayer: biases cannot be empty");

1738

}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1739

}

1740

1741

const auto layer = m_Graph->AddLayer<FullyConnectedLayer>(fullyConnectedDescriptor, name);

1742

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1743

if (fullyConnectedDescriptor.m_ConstantWeights)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1744

{

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

1745

layer->m_Weight = std::make_shared<ScopedCpuTensorHandle>(weights.value());

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1746

if (fullyConnectedDescriptor.m_BiasEnabled)

1747

{

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

1748

layer->m_Bias = std::make_shared<ScopedCpuTensorHandle>(biases.value());

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1749

}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1755

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1756

const Optional<ConstTensor>& weights,

1757

const Optional<ConstTensor>& biases,

1758

const char* name)

1759

{

1760

return AddFullyConnectedLayerImpl(fullyConnectedDescriptor, weights, biases, name);

1761

}

1762

1763

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1764

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1765

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1766

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1767

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1768

Optional<ConstTensor> optionalWeights(weights);

1769

return AddFullyConnectedLayerImpl(fullyConnectedDescriptor, optionalWeights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1770

}

1771

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1772

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1773

const ConstTensor& weights,

1774

const char* name)

1775

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1776

Optional<ConstTensor> optionalWeights(weights);

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

1777

Optional<ConstTensor> biases;

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1778

return AddFullyConnectedLayerImpl(fullyConnectedDescriptor, optionalWeights, biases, name);

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1779

}

1780

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1781

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1782

const ConstTensor& weights,

1783

const ConstTensor& biases,

1784

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1785

{

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1786

Optional<ConstTensor> optionalWeights(weights);

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1787

Optional<ConstTensor> optionalBiases(biases);

Sadik Armagan

2021-03-25 07:46:55 +0000

[diff] [blame]

1788

return AddFullyConnectedLayerImpl(fullyConnectedDescriptor, optionalWeights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1789

}

1790

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1791

IConnectableLayer* NetworkImpl::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1792

const char* name)

1793

{

Jim Flynn

e242f2d

2019-05-22 14:24:13 +0100

[diff] [blame]

1794

return m_Graph->AddLayer<ConcatLayer>(concatDescriptor, name);

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1795

}

1796

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1797

IConnectableLayer* NetworkImpl::AddConvolution2dLayerImpl(const Convolution2dDescriptor& convolution2dDescriptor,

1798

const ConstTensor& weights,

1799

const Optional<ConstTensor>& biases,

1800

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1801

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1802

if (convolution2dDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1803

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1804

throw InvalidArgumentException("AddConvolution2dLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1805

}

1806

1807

const auto layer = m_Graph->AddLayer<Convolution2dLayer>(convolution2dDescriptor, name);

1808

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

1809

layer->m_Weight = std::make_shared<ScopedCpuTensorHandle>(weights);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1810

1811

if (convolution2dDescriptor.m_BiasEnabled)

1812

{

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

1813

layer->m_Bias = std::make_shared<ScopedCpuTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1819

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1820

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1821

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1822

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1823

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1824

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1825

}

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1826

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1827

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1828

const ConstTensor& weights,

1829

const char* name)

1830

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

1831

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1832

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

1833

}

1834

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1835

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1836

const ConstTensor& weights,

1837

const ConstTensor& biases,

1838

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1839

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1840

Optional<ConstTensor> optionalBiases(biases);

1841

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1842

}

1843

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1844

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayerImpl(

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1845

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1846

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1847

const Optional<ConstTensor>& biases,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1848

const char* name)

1849

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1850

if (convolution2dDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1851

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1852

throw InvalidArgumentException("AddDepthwiseConvolution2dLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1853

}

1854

Matteo Martincigh

3d6898c

2019-01-15 16:11:44 +0000

[diff] [blame]

1855

const auto layer = m_Graph->AddLayer<DepthwiseConvolution2dLayer>(convolution2dDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1856

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

1857

layer->m_Weight = std::make_shared<ScopedCpuTensorHandle>(weights);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1858

1859

if (convolution2dDescriptor.m_BiasEnabled)

1860

{

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

1861

layer->m_Bias = std::make_shared<ScopedCpuTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1867

IConnectableLayer* NetworkImpl::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

Aron Virginas-Tar

dd6247f

2019-09-19 14:31:17 +0100

[diff] [blame]

1868

const char* name)

1869

{

1870

return m_Graph->AddLayer<DepthToSpaceLayer>(depthToSpaceDescriptor, name);

1871

}

1872

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1873

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1874

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1875

const ConstTensor& weights,

1876

const Optional<ConstTensor>& biases,

1877

const char* name)

1878

{

1879

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

1880

}

1881

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1882

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1883

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1884

const ConstTensor& weights,

1885

const char* name)

1886

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

1887

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1888

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1889

}

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1890

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1891

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1892

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1893

const ConstTensor& weights,

1894

const ConstTensor& biases,

1895

const char* name)

1896

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1897

Optional<ConstTensor> optionalBiases(biases);

1898

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1899

}

1900

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1901

IConnectableLayer* NetworkImpl::AddDetectionPostProcessLayer(const armnn::DetectionPostProcessDescriptor& descriptor,

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

1902

const ConstTensor& anchors, const char* name)

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

1903

{

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

1904

const auto layer = m_Graph->AddLayer<DetectionPostProcessLayer>(descriptor, name);

1905

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

1906

layer->m_Anchors = std::make_shared<ScopedCpuTensorHandle>(anchors);

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

1907

1908

return layer;

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

1909

}

1910

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1911

IConnectableLayer* NetworkImpl::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1912

const char* name)

1913

{

1914

return m_Graph->AddLayer<PermuteLayer>(permuteDescriptor, name);

1915

}

1916

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1917

IConnectableLayer* NetworkImpl::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1918

const char* name)

1919

{

1920

return m_Graph->AddLayer<Pooling2dLayer>(pooling2dDescriptor, name);

1921

}

1922

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1923

IConnectableLayer* NetworkImpl::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1924

const char* name)

1925

{

1926

return m_Graph->AddLayer<ActivationLayer>(activationDescriptor, name);

1927

}

1928

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1929

IConnectableLayer* NetworkImpl::AddArgMinMaxLayer(const ArgMinMaxDescriptor& argMinMaxDescriptor,

Nikhil Raj

ee391d5

2019-09-05 17:50:44 +0100

[diff] [blame]

1930

const char* name)

1931

{

1932

return m_Graph->AddLayer<ArgMinMaxLayer>(argMinMaxDescriptor, name);

1933

}

1934

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1935

IConnectableLayer* NetworkImpl::AddNormalizationLayer(const NormalizationDescriptor&

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1936

normalizationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1937

const char* name)

1938

{

1939

return m_Graph->AddLayer<NormalizationLayer>(normalizationDescriptor, name);

1940

}

1941

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1942

IConnectableLayer* NetworkImpl::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

Aron Virginas-Tar

636ab40

2019-09-16 14:27:45 +0100

[diff] [blame]

1943

{

1944

return m_Graph->AddLayer<SliceLayer>(sliceDescriptor, name);

1945

}

1946

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1947

IConnectableLayer* NetworkImpl::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1948

const char* name)

1949

{

1950

return m_Graph->AddLayer<SoftmaxLayer>(softmaxDescriptor, name);

1951

}

1952

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1953

IConnectableLayer* NetworkImpl::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1954

const char* name)

1955

{

1956

return m_Graph->AddLayer<SplitterLayer>(splitterDescriptor, name);

1957

}

1958

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1959

IConnectableLayer* NetworkImpl::AddMaximumLayer(const char* name)

Nattapat Chaimanowong

5a4304a

2018-11-28 10:44:37 +0000

[diff] [blame]

1960

{

1961

return m_Graph->AddLayer<MaximumLayer>(name);

1962

}

1963

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1964

IConnectableLayer* NetworkImpl::AddMinimumLayer(const char* name)

Éanna Ó Catháin

20e5880

2018-12-04 10:29:06 +0000

[diff] [blame]

1965

{

1966

return m_Graph->AddLayer<MinimumLayer>(name);

1967

}

1968

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1969

IConnectableLayer* NetworkImpl::AddMergerLayer(const MergerDescriptor& mergerDescriptor,

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1970

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1971

{

Jim Flynn

e242f2d

2019-05-22 14:24:13 +0100

[diff] [blame]

1972

return AddConcatLayer(mergerDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1973

}

1974

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1975

IConnectableLayer* NetworkImpl::AddAbsLayer(const char * name)

Kevin May

868eb14

2019-09-04 17:29:31 +0100

[diff] [blame]

1976

{

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

1977

return AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Abs), name);

Kevin May

868eb14

2019-09-04 17:29:31 +0100

[diff] [blame]

1978

}

1979

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1980

IConnectableLayer* NetworkImpl::AddAdditionLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1981

{

1982

return m_Graph->AddLayer<AdditionLayer>(name);

1983

}

1984

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1985

IConnectableLayer* NetworkImpl::AddMultiplicationLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1986

{

1987

return m_Graph->AddLayer<MultiplicationLayer>(name);

1988

}

1989

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1990

IConnectableLayer* NetworkImpl::AddOutputLayer(LayerBindingId id, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1991

{

1992

return m_Graph->AddLayer<OutputLayer>(id, name);

1993

}

1994

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1995

IConnectableLayer* NetworkImpl::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1996

const ConstTensor& mean,

1997

const ConstTensor& variance,

1998

const ConstTensor& beta,

1999

const ConstTensor& gamma,

2000

const char* name)

2001

{

2002

const auto layer = m_Graph->AddLayer<BatchNormalizationLayer>(desc, name);

2003

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2004

layer->m_Mean = std::make_shared<ScopedCpuTensorHandle>(mean);

2005

layer->m_Variance = std::make_shared<ScopedCpuTensorHandle>(variance);

2006

layer->m_Beta = std::make_shared<ScopedCpuTensorHandle>(beta);

2007

layer->m_Gamma = std::make_shared<ScopedCpuTensorHandle>(gamma);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2012

IConnectableLayer* NetworkImpl::AddRankLayer(const char* name)

Finn Williams

2605b23

2020-06-10 15:53:46 +0100

[diff] [blame]

2013

{

2014

return m_Graph->AddLayer<RankLayer>(name);

2015

}

2016

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2017

IConnectableLayer* NetworkImpl::AddReduceLayer(const ReduceDescriptor& reduceDescriptor,

2018

const char* name)

Sadik Armagan

0c3ea5b

2021-02-03 09:29:30 +0000

[diff] [blame]

2019

{

2020

return m_Graph->AddLayer<ReduceLayer>(reduceDescriptor, name);

2021

}

2022

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2023

IConnectableLayer* NetworkImpl::AddResizeBilinearLayer(const ResizeBilinearDescriptor& descriptor,

2024

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2025

{

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

2026

ResizeDescriptor resizeDescriptor;

David Monahan

4a0c9b9

2020-05-30 09:48:39 +0100

[diff] [blame]

2027

resizeDescriptor.m_Method = ResizeMethod::Bilinear;

2028

resizeDescriptor.m_DataLayout = descriptor.m_DataLayout;

2029

resizeDescriptor.m_TargetWidth = descriptor.m_TargetWidth;

2030

resizeDescriptor.m_TargetHeight = descriptor.m_TargetHeight;

2031

resizeDescriptor.m_AlignCorners = descriptor.m_AlignCorners;

2032

resizeDescriptor.m_HalfPixelCenters = descriptor.m_HalfPixelCenters;

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

2033

2034

return m_Graph->AddLayer<ResizeLayer>(resizeDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2035

}

2036

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2037

IConnectableLayer* NetworkImpl::AddResizeLayer(const ResizeDescriptor& resizeDescriptor, const char* name)

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

2038

{

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

2039

return m_Graph->AddLayer<ResizeLayer>(resizeDescriptor, name);

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

2040

}

2041

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2042

IConnectableLayer* NetworkImpl::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

2043

const char* name)

Kevin May

ce5045a

2019-10-02 14:07:47 +0100

[diff] [blame]

2044

{

2045

return m_Graph->AddLayer<InstanceNormalizationLayer>(desc, name);

2046

}

2047

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2048

IConnectableLayer* NetworkImpl::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

2049

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2050

{

Matteo Martincigh

bcd3c85

2018-09-28 14:14:12 +0100

[diff] [blame]

2051

return m_Graph->AddLayer<L2NormalizationLayer>(desc, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2052

}

2053

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2054

IConnectableLayer* NetworkImpl::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& desc,

Aron Virginas-Tar

f982dea

2019-10-11 14:07:53 +0100

[diff] [blame]

2055

const char* name)

2056

{

2057

return m_Graph->AddLayer<LogSoftmaxLayer>(desc, name);

2058

}

2059

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2060

IConnectableLayer* NetworkImpl::AddConstantLayer(const ConstTensor& input, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2061

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2062

auto layer = m_Graph->AddLayer<ConstantLayer>(name);

2063

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2064

layer->m_LayerOutput = std::make_shared<ScopedCpuTensorHandle>(input);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2065

2066

return layer;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2067

}

2068

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2069

IConnectableLayer* NetworkImpl::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2070

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2071

{

2072

return m_Graph->AddLayer<ReshapeLayer>(reshapeDescriptor, name);

2073

}

2074

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2075

IConnectableLayer* NetworkImpl::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

Nattapat Chaimanowong

207ef9a

2018-11-02 10:57:25 +0000

[diff] [blame]

2076

const char* name)

2077

{

2078

return m_Graph->AddLayer<SpaceToBatchNdLayer>(spaceToBatchNdDescriptor, name);

2079

}

2080

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2081

IConnectableLayer* NetworkImpl::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

Aron Virginas-Tar

972af15

2019-06-11 14:14:03 +0100

[diff] [blame]

2082

const char* name)

2083

{

2084

return m_Graph->AddLayer<SpaceToDepthLayer>(spaceToDepthDescriptor, name);

2085

}

2086

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2087

IConnectableLayer* NetworkImpl::AddFloorLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2088

{

2089

return m_Graph->AddLayer<FloorLayer>(name);

2090

}

2091

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2092

IConnectableLayer* NetworkImpl::AddLstmLayer(const LstmDescriptor& descriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2093

const LstmInputParams& params,

2094

const char* name)

2095

{

2096

const auto layer = m_Graph->AddLayer<LstmLayer>(descriptor, name);

2097

2098

//Lstm Basic Parameters

2099

layer->m_BasicParameters.m_InputToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2100

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2101

layer->m_BasicParameters.m_InputToCellWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2102

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToCellWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2103

layer->m_BasicParameters.m_InputToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2104

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2105

layer->m_BasicParameters.m_RecurrentToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2106

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2107

layer->m_BasicParameters.m_RecurrentToCellWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2108

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToCellWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2109

layer->m_BasicParameters.m_RecurrentToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2110

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2111

layer->m_BasicParameters.m_ForgetGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2112

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ForgetGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2113

layer->m_BasicParameters.m_CellBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2114

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2115

layer->m_BasicParameters.m_OutputGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2116

std::make_shared<ScopedCpuTensorHandle>(*(params.m_OutputGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2117

2118

//Lstm Cifg parameters

2119

if(!descriptor.m_CifgEnabled)

2120

{

2121

if(params.m_InputToInputWeights == nullptr)

2122

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2123

throw InvalidArgumentException("AddLstmLayer: Input To Input Weights cannot be NULL "

2124

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2125

}

2126

if(params.m_RecurrentToInputWeights == nullptr)

2127

{

2128

throw InvalidArgumentException(

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2129

"AddLstmLayer: Recurrent To Input Weights cannot be NULL "

2130

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2131

}

2132

if(params.m_InputGateBias == nullptr)

2133

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2134

throw InvalidArgumentException("AddLstmLayer: Input Gate Bias cannot be NULL "

2135

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2136

}

2137

layer->m_CifgParameters.m_InputToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2138

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToInputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2139

layer->m_CifgParameters.m_RecurrentToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2140

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToInputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2141

layer->m_CifgParameters.m_InputGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2142

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2143

}

2144

2145

//Lstm projection parameters

2146

if(descriptor.m_ProjectionEnabled)

2147

{

2148

if(params.m_ProjectionWeights == nullptr)

2149

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2150

throw InvalidArgumentException("AddLstmLayer: Projection Weights cannot be NULL "

2151

"when projection is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2152

}

2153

layer->m_ProjectionParameters.m_ProjectionWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2154

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ProjectionWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2155

if(params.m_ProjectionBias != nullptr)

2156

{

2157

layer->m_ProjectionParameters.m_ProjectionBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2158

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ProjectionBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

}

}

//Lstm Peephole params

2163

if(descriptor.m_PeepholeEnabled)

2164

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2165

if(!descriptor.m_CifgEnabled)

2166

{

2167

if(params.m_CellToInputWeights == nullptr)

2168

{

2169

throw InvalidArgumentException("AddLstmLayer: Cell To Input Weights cannot be NULL "

2170

"when Peephole is enabled and CIFG disabled.");

2171

}

2172

2173

layer->m_PeepholeParameters.m_CellToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2174

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellToInputWeights));

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2175

}

2176

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2177

if(params.m_CellToForgetWeights == nullptr)

2178

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2179

throw InvalidArgumentException("AddLstmLayer: Cell To Forget Weights cannot be NULL "

2180

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2181

}

2182

if(params.m_CellToOutputWeights == nullptr)

2183

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2184

throw InvalidArgumentException("AddLstmLayer: Cell To Output Weights cannot be NULL "

2185

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2186

}

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2187

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2188

layer->m_PeepholeParameters.m_CellToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2189

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2190

layer->m_PeepholeParameters.m_CellToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2191

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2192

}

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2193

2194

//Lstm Layer Normalization params

2195

if(descriptor.m_LayerNormEnabled)

2196

{

2197

if(!descriptor.m_CifgEnabled)

2198

{

2199

if(params.m_InputLayerNormWeights == nullptr)

2200

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2201

throw InvalidArgumentException("AddLstmLayer: Input layer normalization weights cannot be NULL "

2202

"when layer normalization is enabled and CIFG disabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2203

}

2204

layer->m_LayerNormParameters.m_InputLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2205

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2206

}

2207

2208

if(params.m_ForgetLayerNormWeights == nullptr)

2209

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2210

throw InvalidArgumentException("AddLstmLayer: Forget layer normalization weights cannot be NULL "

2211

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2212

}

2213

if(params.m_CellLayerNormWeights == nullptr)

2214

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2215

throw InvalidArgumentException("AddLstmLayer: Cell layer normalization weights cannot be NULL "

2216

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2217

}

2218

if(params.m_OutputLayerNormWeights == nullptr)

2219

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2220

throw InvalidArgumentException("AddLstmLayer: Output layer normalization weights cannot be NULL "

2221

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2222

}

2223

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2224

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ForgetLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2225

layer->m_LayerNormParameters.m_CellLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2226

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2227

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2228

std::make_shared<ScopedCpuTensorHandle>(*(params.m_OutputLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2229

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2233

IConnectableLayer* NetworkImpl::AddDivisionLayer(const char* name)

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

2234

{

2235

return m_Graph->AddLayer<DivisionLayer>(name);

2236

}

2237

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2238

IConnectableLayer* NetworkImpl::AddSubtractionLayer(const char* name)

David Beck

1952622

2018-09-12 16:00:08 +0100

[diff] [blame]

2239

{

2240

return m_Graph->AddLayer<SubtractionLayer>(name);

2241

}

2242

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2243

IConnectableLayer* NetworkImpl::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

narpra01

32b9046

2018-09-13 11:07:48 +0100

[diff] [blame]

2244

{

2245

return m_Graph->AddLayer<MeanLayer>(meanDescriptor,name);

2246

}

2247

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2248

IConnectableLayer* NetworkImpl::AddPadLayer(const PadDescriptor& padDescriptor, const char* name)

Mohamed Nour Abouelseoud

5662c20

2018-09-24 13:30:09 +0100

[diff] [blame]

2249

{

2250

return m_Graph->AddLayer<PadLayer>(padDescriptor,name);

2251

}

2252

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2253

IConnectableLayer *NetworkImpl::AddQuantizeLayer(const char *name)

Derek Lamberti

a9cca6a

2019-03-25 15:41:58 +0000

[diff] [blame]

2254

{

2255

return m_Graph->AddLayer<QuantizeLayer>(name);

2256

}

2257

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2258

IConnectableLayer* NetworkImpl::AddDequantizeLayer(const char* name)

Nattapat Chaimanowong

e4294fd

2019-03-28 09:56:53 +0000

[diff] [blame]

2259

{

2260

return m_Graph->AddLayer<DequantizeLayer>(name);

2261

}

2262

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2263

IConnectableLayer* NetworkImpl::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

Conor Kennedy

430b5d8

2018-11-14 15:28:28 +0000

[diff] [blame]

2264

const char* name)

2265

{

2266

return m_Graph->AddLayer<StridedSliceLayer>(stridedSliceDescriptor, name);

2267

}

2268

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2269

IConnectableLayer* NetworkImpl::AddGreaterLayer(const char* name)

Matteo Martincigh

59a950c

2018-12-13 12:48:25 +0000

[diff] [blame]

2270

{

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

2271

return AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Greater), name);

Matteo Martincigh

59a950c

2018-12-13 12:48:25 +0000

[diff] [blame]

2272

}

2273

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2274

IConnectableLayer* NetworkImpl::AddEqualLayer(const char* name)

FrancisMurtagh

2099595

2018-12-17 12:11:36 +0000

[diff] [blame]

2275

{

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

2276

return AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Equal), name);

FrancisMurtagh

2099595

2018-12-17 12:11:36 +0000

[diff] [blame]

2277

}

2278

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2279

IConnectableLayer* NetworkImpl::AddRsqrtLayer(const char * name)

Mohamed Nour Abouelseoud

a1d3c6a

2018-12-27 12:39:16 +0000

[diff] [blame]

2280

{

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

2281

return AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Rsqrt), name);

Mohamed Nour Abouelseoud

a1d3c6a

2018-12-27 12:39:16 +0000

[diff] [blame]

2282

}

2283

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2284

IConnectableLayer* NetworkImpl::AddGatherLayer(const char* name)

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

2285

{

Teresa Charlin

5266473

2020-06-29 16:27:03 +0100

[diff] [blame]

2286

GatherDescriptor gatherDescriptor{};

2287

return AddGatherLayer(gatherDescriptor, name);

2288

}

2289

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2290

IConnectableLayer* NetworkImpl::AddGatherLayer(const GatherDescriptor& gatherDescriptor,

Teresa Charlin

5266473

2020-06-29 16:27:03 +0100

[diff] [blame]

2291

const char* name)

2292

{

2293

return m_Graph->AddLayer<GatherLayer>(gatherDescriptor, name);

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

2294

}

2295

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2296

IConnectableLayer* NetworkImpl::AddMergeLayer(const char* name)

Nattapat Chaimanowong

1f88630

2019-04-05 13:37:19 +0100

[diff] [blame]

2297

{

2298

return m_Graph->AddLayer<MergeLayer>(name);

2299

}

2300

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2301

IConnectableLayer* NetworkImpl::AddSwitchLayer(const char* name)

Sadik Armagan

eff363d

2019-04-05 15:25:46 +0100

[diff] [blame]

2302

{

2303

return m_Graph->AddLayer<SwitchLayer>(name);

2304

}

2305

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2306

IConnectableLayer* NetworkImpl::AddPreluLayer(const char* name)

Matteo Martincigh

0e406ee

2019-06-12 15:42:18 +0100

[diff] [blame]

2307

{

2308

return m_Graph->AddLayer<PreluLayer>(name);

2309

}

2310

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2311

IConnectableLayer* NetworkImpl::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

2312

const ConstTensor& weights,

2313

const Optional<ConstTensor>& biases,

2314

const char* name)

2315

{

2316

if (descriptor.m_BiasEnabled && !biases.has_value())

2317

{

2318

throw InvalidArgumentException("AddTransposeConvolution2dLayer: Biases cannot be empty");

2319

}

2320

2321

const auto layer = m_Graph->AddLayer<TransposeConvolution2dLayer>(descriptor, name);

2322

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2323

layer->m_Weight = std::make_shared<ScopedCpuTensorHandle>(weights);

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

2324

2325

if (descriptor.m_BiasEnabled)

2326

{

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2327

layer->m_Bias = std::make_shared<ScopedCpuTensorHandle>(biases.value());

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2333

IConnectableLayer* NetworkImpl::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

Mike Kelly

c9ea45a

2020-02-28 18:11:58 +0000

[diff] [blame]

2334

const char* name)

2335

{

2336

return m_Graph->AddLayer<TransposeLayer>(transposeDescriptor, name);

2337

}

2338

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2339

IConnectableLayer* NetworkImpl::AddStackLayer(const StackDescriptor& stackDescriptor,

Matthew Jackson

2b8c1da

2019-07-04 14:59:16 +0100

[diff] [blame]

2340

const char* name)

2341

{

2342

return m_Graph->AddLayer<StackLayer>(stackDescriptor, name);

2343

}

2344

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

2345

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2346

IConnectableLayer* NetworkImpl::AddStandInLayer(const StandInDescriptor& desc,

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

2347

const char* name)

2348

{

2349

return m_Graph->AddLayer<StandInLayer>(desc, name);

2350

}

2351

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2352

IConnectableLayer* NetworkImpl::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2353

const char* name)

2354

{

2355

const auto layer = m_Graph->AddLayer<QuantizedLstmLayer>(name);

2356

2357

// InputToX weights

2358

layer->m_QuantizedLstmParameters.m_InputToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2359

std::make_shared<ScopedCpuTensorHandle>(params.GetInputToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2360

layer->m_QuantizedLstmParameters.m_InputToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2361

std::make_shared<ScopedCpuTensorHandle>(params.GetInputToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2362

layer->m_QuantizedLstmParameters.m_InputToCellWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2363

std::make_shared<ScopedCpuTensorHandle>(params.GetInputToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2364

layer->m_QuantizedLstmParameters.m_InputToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2365

std::make_shared<ScopedCpuTensorHandle>(params.GetInputToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2366

2367

// RecurrentToX weights

2368

layer->m_QuantizedLstmParameters.m_RecurrentToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2369

std::make_shared<ScopedCpuTensorHandle>(params.GetRecurrentToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2370

layer->m_QuantizedLstmParameters.m_RecurrentToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2371

std::make_shared<ScopedCpuTensorHandle>(params.GetRecurrentToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2372

layer->m_QuantizedLstmParameters.m_RecurrentToCellWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2373

std::make_shared<ScopedCpuTensorHandle>(params.GetRecurrentToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2374

layer->m_QuantizedLstmParameters.m_RecurrentToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2375

std::make_shared<ScopedCpuTensorHandle>(params.GetRecurrentToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2376

2377

// Bias

2378

layer->m_QuantizedLstmParameters.m_InputGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2379

std::make_shared<ScopedCpuTensorHandle>(params.GetInputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2380

layer->m_QuantizedLstmParameters.m_ForgetGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2381

std::make_shared<ScopedCpuTensorHandle>(params.GetForgetGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2382

layer->m_QuantizedLstmParameters.m_CellBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2383

std::make_shared<ScopedCpuTensorHandle>(params.GetCellBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2384

layer->m_QuantizedLstmParameters.m_OutputGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2385

std::make_shared<ScopedCpuTensorHandle>(params.GetOutputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2390

IConnectableLayer* NetworkImpl::AddQLstmLayer(const QLstmDescriptor& descriptor,

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2391

const LstmInputParams& params,

2392

const char* name)

2393

{

2394

const auto layer = m_Graph->AddLayer<QLstmLayer>(descriptor, name);

2395

2396

// QLstm Basic Parameters

2397

layer->m_BasicParameters.m_InputToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2398

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2399

layer->m_BasicParameters.m_InputToCellWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2400

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToCellWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2401

layer->m_BasicParameters.m_InputToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2402

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2403

layer->m_BasicParameters.m_RecurrentToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2404

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2405

layer->m_BasicParameters.m_RecurrentToCellWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2406

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToCellWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2407

layer->m_BasicParameters.m_RecurrentToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2408

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2409

layer->m_BasicParameters.m_ForgetGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2410

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ForgetGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2411

layer->m_BasicParameters.m_CellBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2412

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2413

layer->m_BasicParameters.m_OutputGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2414

std::make_shared<ScopedCpuTensorHandle>(*(params.m_OutputGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2415

2416

// QLstm Cifg parameters

2417

if(!descriptor.m_CifgEnabled)

2418

{

2419

if(params.m_InputToInputWeights == nullptr)

2420

{

2421

throw InvalidArgumentException("AddQLstmLayer: Input To Input Weights cannot be NULL");

2422

}

2423

2424

if(params.m_RecurrentToInputWeights == nullptr)

2425

{

2426

throw InvalidArgumentException(

2427

"AddQLstmLayer: Recurrent To Input Weights cannot be NULL");

2428

}

2429

2430

if(params.m_InputGateBias == nullptr)

2431

{

2432

throw InvalidArgumentException("AddQLstmLayer: Input Gate Bias cannot be NULL");

2433

}

2434

2435

layer->m_CifgParameters.m_InputToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2436

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2437

layer->m_CifgParameters.m_RecurrentToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2438

std::make_shared<ScopedCpuTensorHandle>(*(params.m_RecurrentToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2439

layer->m_CifgParameters.m_InputGateBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2440

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2441

}

2442

2443

// QLstm Projection parameters

2444

if(descriptor.m_ProjectionEnabled)

2445

{

2446

if(params.m_ProjectionWeights == nullptr)

2447

{

2448

throw InvalidArgumentException("AddQLstmLayer: Projection Weights cannot be NULL");

2449

}

2450

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2451

layer->m_ProjectionParameters.m_ProjectionWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2452

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ProjectionWeights));

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

2453

2454

// Projection bias is optional even if projection is enabled

2455

if(params.m_ProjectionWeights != nullptr)

2456

{

2457

layer->m_ProjectionParameters.m_ProjectionBias =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2458

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ProjectionBias));

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

2459

}

2460

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2461

}

2462

2463

// QLstm Peephole params

2464

if(descriptor.m_PeepholeEnabled)

2465

{

2466

if(params.m_CellToForgetWeights == nullptr)

2467

{

2468

throw InvalidArgumentException("AddQLstmLayer: Cell To Forget Weights cannot be NULL");

2469

}

2470

2471

if(params.m_CellToOutputWeights == nullptr)

2472

{

2473

throw InvalidArgumentException("AddQLstmLayer: Cell To Output Weights cannot be NULL");

2474

}

2475

2476

if(!descriptor.m_CifgEnabled)

2477

{

2478

if(params.m_CellToInputWeights == nullptr)

2479

{

2480

throw InvalidArgumentException("AddQLstmLayer: Cell To Input Weights cannot be NULL");

2481

}

2482

2483

layer->m_PeepholeParameters.m_CellToInputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2484

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2485

}

2486

2487

layer->m_PeepholeParameters.m_CellToForgetWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2488

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2489

layer->m_PeepholeParameters.m_CellToOutputWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2490

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2491

}

2492

2493

// QLstm Layer Normalization params

2494

if(descriptor.m_LayerNormEnabled)

2495

{

2496

if(params.m_ForgetLayerNormWeights == nullptr)

2497

{

2498

throw InvalidArgumentException("AddQLstmLayer: Forget layer normalization weights cannot be NULL");

2499

}

2500

2501

if(params.m_CellLayerNormWeights == nullptr)

2502

{

2503

throw InvalidArgumentException("AddQLstmLayer: Cell layer normalization weights cannot be NULL");

2504

}

2505

2506

if(params.m_OutputLayerNormWeights == nullptr)

2507

{

2508

throw InvalidArgumentException("AddQLstmLayer: Output layer normalization weights cannot be NULL");

2509

}

2510

2511

if(!descriptor.m_CifgEnabled)

2512

{

2513

if(params.m_InputLayerNormWeights == nullptr)

2514

{

2515

throw InvalidArgumentException("AddQLstmLayer: Input layer normalization weights cannot be NULL");

2516

}

2517

2518

layer->m_LayerNormParameters.m_InputLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2519

std::make_shared<ScopedCpuTensorHandle>(*(params.m_InputLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2520

}

2521

2522

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2523

std::make_shared<ScopedCpuTensorHandle>(*(params.m_ForgetLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2524

layer->m_LayerNormParameters.m_CellLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2525

std::make_shared<ScopedCpuTensorHandle>(*(params.m_CellLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2526

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

Finn Williams

2021-03-22 17:51:06 +0000

[diff] [blame^]

2527

std::make_shared<ScopedCpuTensorHandle>(*(params.m_OutputLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2532

IConnectableLayer* NetworkImpl::AddLogicalBinaryLayer(const LogicalBinaryDescriptor& logicalBinaryDescriptor,

James Conroy

aba90cd

2020-11-06 16:28:18 +0000

[diff] [blame]

2533

const char* name)

2534

{

2535

return m_Graph->AddLayer<LogicalBinaryLayer>(logicalBinaryDescriptor, name);

2536

}

2537

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2538

void NetworkImpl::Accept(ILayerVisitor& visitor) const

Mike Kelly

8c1701a

2019-02-11 17:01:27 +0000

[diff] [blame]

2539

{

2540

for (auto layer : GetGraph())

2541

{

2542

layer->Accept(visitor);

};

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2546

void NetworkImpl::ExecuteStrategy(IStrategy& strategy) const

Finn Williams

b454c5c

2021-02-09 15:56:23 +0000

[diff] [blame]

2547

{

2548

for (auto layer : GetGraph())

2549

{

2550

layer->ExecuteStrategy(strategy);

};

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2554

OptimizedNetworkImpl::OptimizedNetworkImpl(std::unique_ptr<Graph> graph)

Sadik Armagan

3184c90

2020-03-18 10:57:30 +0000

[diff] [blame]

2555

: m_Graph(std::move(graph)), m_Guid(profiling::ProfilingService::GetNextGuid())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2559

OptimizedNetworkImpl::OptimizedNetworkImpl(std::unique_ptr<Graph> graph, const ModelOptions& modelOptions)

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

2560

: m_Graph(std::move(graph)), m_Guid(profiling::ProfilingService::GetNextGuid()), m_ModelOptions(modelOptions)

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2564

OptimizedNetworkImpl::~OptimizedNetworkImpl()

telsoa01