Blame - src/armnn/Network.cpp - ml/armnn

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

5

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

6

#include "Network.hpp"

7

#include "Graph.hpp"

8

#include "Layer.hpp"

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

9

#include "DeviceSpec.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

10

#include "Optimizer.hpp"

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

11

#include "SubgraphViewSelector.hpp"

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

12

#include "BackendSettings.hpp"

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

13

#include "optimizations/All.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

14

Colm Donelan

0c47974

2021-12-10 12:43:54 +0000

[diff] [blame]

15

#include <armnn/backends/TensorHandle.hpp>

16

#include <armnn/backends/WorkloadFactory.hpp>

Matteo Martincigh

e5b8eb9

2019-11-28 15:45:42 +0000

[diff] [blame]

17

#include <armnn/backends/IBackendInternal.hpp>

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

18

#include <backendsCommon/TensorHandleFactoryRegistry.hpp>

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

19

20

#include <armnn/Exceptions.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

21

#include <armnn/Utils.hpp>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

22

#include <armnn/TypesUtils.hpp>

Matteo Martincigh

c601aa6

2019-10-29 15:03:22 +0000

[diff] [blame]

23

#include <armnn/BackendRegistry.hpp>

Matthew Bentham

f48afc6

2020-01-15 17:55:08 +0000

[diff] [blame]

24

#include <armnn/Logging.hpp>

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

25

#include <armnn/utility/Assert.hpp>

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

26

#include <armnn/utility/IgnoreUnused.hpp>

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

27

#include <armnn/utility/PolymorphicDowncast.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

28

Jim Flynn

2776183

2022-03-20 21:52:17 +0000

[diff] [blame]

29

#include <client/include/IProfilingService.hpp>

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

30

Nikhil Raj

77fe76b

2021-06-09 14:55:32 +0100

[diff] [blame]

31

#include <common/include/ProfilingGuid.hpp>

32

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

33

#include <fmt/format.h>

34

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

#include <fcntl.h>

#include <algorithm>

#include <fstream>

#include <memory>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

39

#include <vector>

40

#include <algorithm>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

41

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

namespace armnn

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

45

INetwork::INetwork(NetworkOptions networkOptions) : pNetworkImpl(new NetworkImpl(networkOptions)) {}

46

47

INetwork::~INetwork() = default;

48

49

Status INetwork::PrintGraph()

50

{

51

return pNetworkImpl->PrintGraph();

52

}

53

54

IConnectableLayer* INetwork::AddInputLayer(LayerBindingId id, const char* name)

55

{

56

return pNetworkImpl->AddInputLayer(id, name);

}

IConnectableLayer* INetwork::AddArgMinMaxLayer(const ArgMinMaxDescriptor& desc,

61

const char* name)

62

{

63

return pNetworkImpl->AddArgMinMaxLayer(desc, name);

64

}

65

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

66

IConnectableLayer* INetwork::AddCastLayer(const char* name)

67

{

68

return pNetworkImpl->AddCastLayer(name);

69

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

70

71

IConnectableLayer* INetwork::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

72

const char* name)

73

{

74

return pNetworkImpl->AddComparisonLayer(comparisonDescriptor, name);

}

IConnectableLayer* INetwork::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

79

const char* name)

80

{

81

return pNetworkImpl->AddConcatLayer(concatDescriptor, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

86

const ConstTensor& weights,

87

const Optional<ConstTensor>& biases,

88

const char* name)

89

{

90

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

95

const ConstTensor& weights,

96

const char* name)

97

{

98

Optional<ConstTensor> biases;

99

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

104

const ConstTensor& weights,

105

const ConstTensor& biases,

const char* name )

{

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor,

110

weights,

111

armnn::Optional<ConstTensor>(biases),

name);

}

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

116

IConnectableLayer* INetwork::AddConvolution3dLayer(const Convolution3dDescriptor& convolution3dDescriptor,

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

117

const char* name)

118

{

Matthew Sloyan

5d7b0a3

2021-10-18 13:07:49 +0100

[diff] [blame]

119

return pNetworkImpl->AddConvolution3dLayer(convolution3dDescriptor, name);

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

123

IConnectableLayer* INetwork::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

124

const char* name)

125

{

126

return pNetworkImpl->AddDepthToSpaceLayer(depthToSpaceDescriptor, name);

}

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

131

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

Cathal Corbett

2022-04-14 17:55:11 +0100

[diff] [blame^]

132

const char* name)

133

{

134

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, name);

}

ARMNN_NO_DEPRECATE_WARN_BEGIN

139

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

140

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

141

const ConstTensor& weights,

142

const Optional<ConstTensor>& biases,

143

const char* name)

144

{

145

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

146

}

Cathal Corbett

2022-04-14 17:55:11 +0100

[diff] [blame^]

147

ARMNN_NO_DEPRECATE_WARN_END

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

148

149

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

150

IConnectableLayer* INetwork::AddDequantizeLayer(const char* name)

151

{

152

return pNetworkImpl->AddDequantizeLayer(name);

}

IConnectableLayer* INetwork::AddDetectionPostProcessLayer(

157

const DetectionPostProcessDescriptor& descriptor,

158

const ConstTensor& anchors,

159

const char* name)

160

{

161

return pNetworkImpl->AddDetectionPostProcessLayer(descriptor, anchors, name);

}

IConnectableLayer* INetwork::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

166

const char* name)

167

{

168

return pNetworkImpl->AddElementwiseUnaryLayer(elementwiseUnaryDescriptor, name);

}

IConnectableLayer* INetwork::AddFillLayer(const FillDescriptor& fillDescriptor,

173

const char* name)

174

{

175

return pNetworkImpl->AddFillLayer(fillDescriptor, name);

176

}

177

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

178

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

179

const char* name)

180

{

181

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor, name);

182

}

183

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

184

IConnectableLayer* INetwork::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

185

const char* name)

186

{

187

return pNetworkImpl->AddPermuteLayer(permuteDescriptor, name);

188

}

189

190

IConnectableLayer* INetwork::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

191

const char* name)

192

{

193

return pNetworkImpl->AddBatchToSpaceNdLayer(batchToSpaceNdDescriptor, name);

194

}

195

196

IConnectableLayer* INetwork::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

197

const char* name)

198

{

199

return pNetworkImpl->AddPooling2dLayer(pooling2dDescriptor, name);

200

}

201

Tamás Nyíri

7b885b3

2021-10-26 14:47:57 +0100

[diff] [blame]

202

IConnectableLayer* INetwork::AddPooling3dLayer(const Pooling3dDescriptor& pooling3dDescriptor,

203

const char* name)

204

{

205

return pNetworkImpl->AddPooling3dLayer(pooling3dDescriptor, name);

206

}

207

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

208

IConnectableLayer* INetwork::AddPrecompiledLayer(const PreCompiledDescriptor& preCompiledDescriptor,

Cathal Corbett

3ea0107

2022-01-06 10:29:43 +0000

[diff] [blame]

209

CompiledBlobPtr compiledBlobPtr,

Cathal Corbett

cbfd718

2021-12-15 17:12:59 +0000

[diff] [blame]

210

const Optional<BackendId>& backend,

211

const char* name)

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

212

{

Cathal Corbett

3ea0107

2022-01-06 10:29:43 +0000

[diff] [blame]

213

return pNetworkImpl->AddPrecompiledLayer(preCompiledDescriptor, std::move(compiledBlobPtr), backend, name);

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

214

}

215

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

216

IConnectableLayer* INetwork::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

217

const char* name)

218

{

219

return pNetworkImpl->AddActivationLayer(activationDescriptor, name);

220

}

221

222

IConnectableLayer* INetwork::AddNormalizationLayer(const NormalizationDescriptor& normalizationDescriptor,

223

const char* name)

224

{

225

return pNetworkImpl->AddNormalizationLayer(normalizationDescriptor, name);

226

}

227

228

IConnectableLayer* INetwork::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

229

{

230

return pNetworkImpl->AddSliceLayer(sliceDescriptor, name);

231

}

232

IConnectableLayer* INetwork::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

233

const char* name)

234

{

235

return pNetworkImpl->AddSoftmaxLayer(softmaxDescriptor, name);

236

}

237

238

IConnectableLayer* INetwork::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

239

const char* name)

240

{

241

return pNetworkImpl->AddSplitterLayer(splitterDescriptor, name);

242

}

243

244

IConnectableLayer* INetwork::AddMergeLayer(const char* name)

245

{

246

return pNetworkImpl->AddMergeLayer(name);

247

}

248

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

249

IConnectableLayer* INetwork::AddAdditionLayer(const char* name)

250

{

251

return pNetworkImpl->AddAdditionLayer(name);

252

}

253

254

IConnectableLayer* INetwork::AddMultiplicationLayer(const char* name)

255

{

256

return pNetworkImpl->AddMultiplicationLayer(name);

257

}

258

259

IConnectableLayer* INetwork::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

260

const ConstTensor& mean,

261

const ConstTensor& variance,

262

const ConstTensor& beta,

263

const ConstTensor& gamma,

264

const char* name)

265

{

266

return pNetworkImpl->AddBatchNormalizationLayer(desc, mean, variance, beta, gamma, name);

267

}

268

269

IConnectableLayer* INetwork::AddRankLayer(const char* name)

270

{

271

return pNetworkImpl->AddRankLayer(name);

272

}

273

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

274

IConnectableLayer* INetwork::AddResizeLayer(const ResizeDescriptor& resizeDescriptor,

275

const char* name)

276

{

277

return pNetworkImpl->AddResizeLayer(resizeDescriptor, name);

278

}

279

280

IConnectableLayer* INetwork::AddReduceLayer(const ReduceDescriptor& reduceDescriptor,

281

const char* name)

282

{

283

return pNetworkImpl->AddReduceLayer(reduceDescriptor, name);

284

}

285

286

IConnectableLayer* INetwork::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

287

const char* name)

288

{

289

return pNetworkImpl->AddInstanceNormalizationLayer(desc, name);

290

}

291

292

IConnectableLayer* INetwork::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

293

const char* name)

294

{

295

return pNetworkImpl->AddL2NormalizationLayer(desc, name);

296

}

297

298

IConnectableLayer* INetwork::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& logSoftmaxDescriptor,

299

const char* name)

300

{

301

return pNetworkImpl->AddLogSoftmaxLayer(logSoftmaxDescriptor, name);

302

}

303

304

IConnectableLayer* INetwork::AddConstantLayer(const ConstTensor& input,

305

const char* name)

306

{

307

return pNetworkImpl->AddConstantLayer(input, name);

308

}

309

310

IConnectableLayer* INetwork::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

311

const char* name)

312

{

313

return pNetworkImpl->AddReshapeLayer(reshapeDescriptor, name);

314

}

315

316

IConnectableLayer* INetwork::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

317

const char* name)

318

{

319

return pNetworkImpl->AddSpaceToBatchNdLayer(spaceToBatchNdDescriptor, name);

320

}

321

322

IConnectableLayer* INetwork::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

323

const char* name)

324

{

325

return pNetworkImpl->AddSpaceToDepthLayer(spaceToDepthDescriptor, name);

326

}

327

328

IConnectableLayer* INetwork::AddFloorLayer(const char* name)

329

{

330

return pNetworkImpl->AddFloorLayer(name);

331

}

332

IConnectableLayer* INetwork::AddOutputLayer(LayerBindingId id, const char* name)

333

{

334

return pNetworkImpl->AddOutputLayer(id, name);

335

}

336

337

IConnectableLayer* INetwork::AddLstmLayer(const LstmDescriptor& descriptor,

338

const LstmInputParams& params,

339

const char* name)

340

{

341

return pNetworkImpl->AddLstmLayer(descriptor, params, name);

342

}

343

344

IConnectableLayer* INetwork::AddDivisionLayer(const char* name)

345

{

346

return pNetworkImpl->AddDivisionLayer(name);

347

}

348

349

IConnectableLayer* INetwork::AddSubtractionLayer(const char* name)

350

{

351

return pNetworkImpl->AddSubtractionLayer(name);

352

}

353

354

IConnectableLayer* INetwork::AddMaximumLayer(const char* name)

355

{

356

return pNetworkImpl->AddMaximumLayer(name);

357

}

358

359

IConnectableLayer* INetwork::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

360

{

361

return pNetworkImpl->AddMeanLayer(meanDescriptor, name);

362

}

363

364

IConnectableLayer* INetwork::AddPadLayer(const PadDescriptor& padDescriptor,

365

const char* name)

366

{

367

return pNetworkImpl->AddPadLayer(padDescriptor, name);

368

}

369

370

IConnectableLayer* INetwork::AddQuantizeLayer(const char* name)

371

{

372

return pNetworkImpl->AddQuantizeLayer(name);

373

}

374

375

IConnectableLayer* INetwork::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

376

const char* name)

377

{

378

return pNetworkImpl->AddStridedSliceLayer(stridedSliceDescriptor, name);

379

}

380

381

IConnectableLayer* INetwork::AddMinimumLayer(const char* name)

382

{

383

return pNetworkImpl->AddMinimumLayer(name);

384

}

385

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

386

IConnectableLayer* INetwork::AddGatherLayer(const GatherDescriptor& descriptor,

387

const char* name)

388

{

389

return pNetworkImpl->AddGatherLayer(descriptor, name);

390

}

391

Teresa Charlin

2022-04-12 22:07:09 +0100

[diff] [blame]

392

IConnectableLayer* INetwork::AddGatherNdLayer(const char* name)

393

{

394

return pNetworkImpl->AddGatherNdLayer(name);

395

}

396

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

397

IConnectableLayer* INetwork::AddSwitchLayer(const char* name)

398

{

399

return pNetworkImpl->AddSwitchLayer(name);

400

}

401

402

IConnectableLayer* INetwork::AddPreluLayer(const char* name)

403

{

404

return pNetworkImpl->AddPreluLayer(name);

405

}

406

407

IConnectableLayer* INetwork::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

408

const ConstTensor& weights,

409

const Optional<ConstTensor>& biases,

410

const char* name)

411

{

412

return pNetworkImpl->AddTransposeConvolution2dLayer(descriptor, weights, biases, name);

413

}

414

415

IConnectableLayer* INetwork::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

416

const char* name)

417

{

418

return pNetworkImpl->AddTransposeLayer(transposeDescriptor, name);

419

}

420

Keith Davis

3ae3f97

2021-05-21 16:33:48 +0100

[diff] [blame]

421

IConnectableLayer* INetwork::AddShapeLayer(const char* name)

422

{

423

return pNetworkImpl->AddShapeLayer(name);

424

}

425

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

426

IConnectableLayer* INetwork::AddStackLayer(const StackDescriptor& descriptor,

427

const char* name)

428

{

429

return pNetworkImpl->AddStackLayer(descriptor, name);

430

}

431

432

IConnectableLayer* INetwork::AddStandInLayer(const StandInDescriptor& descriptor,

433

const char* name)

434

{

435

return pNetworkImpl->AddStandInLayer(descriptor, name);

436

}

437

438

IConnectableLayer* INetwork::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

439

const char* name)

440

{

441

return pNetworkImpl->AddQuantizedLstmLayer(params, name);

442

}

443

444

IConnectableLayer* INetwork::AddQLstmLayer(const QLstmDescriptor& descriptor,

445

const LstmInputParams& params,

446

const char* name)

447

{

448

return pNetworkImpl->AddQLstmLayer(descriptor, params, name);

449

}

450

451

IConnectableLayer* INetwork::AddLogicalBinaryLayer(const LogicalBinaryDescriptor& descriptor,

452

const char* name)

453

{

454

return pNetworkImpl->AddLogicalBinaryLayer(descriptor, name);

455

}

456

Narumol Prangnawarat

8ed39ae

2021-07-15 16:16:25 +0100

[diff] [blame]

457

IConnectableLayer* INetwork::AddUnidirectionalSequenceLstmLayer(

458

const UnidirectionalSequenceLstmDescriptor& descriptor,

459

const LstmInputParams& params,

460

const char* name)

461

{

462

return pNetworkImpl->AddUnidirectionalSequenceLstmLayer(descriptor, params, name);

463

}

464

Simon Obute

51f6777

2021-09-03 15:50:13 +0100

[diff] [blame]

465

IConnectableLayer* INetwork::AddChannelShuffleLayer(const ChannelShuffleDescriptor &descriptor,

466

const char* name)

467

{

468

return pNetworkImpl->AddChannelShuffleLayer(descriptor, name);

469

}

470

Jan Eilers

1b2654f

2021-09-24 15:45:46 +0100

[diff] [blame]

471

ARMNN_NO_DEPRECATE_WARN_BEGIN

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

472

void INetwork::Accept(ILayerVisitor& visitor) const

473

{

474

return pNetworkImpl->Accept(visitor);

475

}

Jan Eilers

1b2654f

2021-09-24 15:45:46 +0100

[diff] [blame]

476

ARMNN_NO_DEPRECATE_WARN_END

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

477

478

void INetwork::ExecuteStrategy(IStrategy& strategy) const

479

{

480

return pNetworkImpl->ExecuteStrategy(strategy);

481

}

482

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

483

armnn::INetwork* INetwork::CreateRaw(NetworkOptions networkOptions)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

484

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

485

return new INetwork(networkOptions);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

486

}

487

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

488

armnn::INetworkPtr INetwork::Create(NetworkOptions networkOptions)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

489

{

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

490

return INetworkPtr(CreateRaw(networkOptions), &INetwork::Destroy);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

491

}

492

493

void INetwork::Destroy(INetwork* network)

494

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

495

delete network;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

496

}

497

Mike Kelly

0d677db

2021-06-27 22:39:21 +0100

[diff] [blame]

498

IOptimizedNetwork::IOptimizedNetwork(const IOptimizedNetwork& other, const ModelOptions& modelOptions)

499

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(*other.pOptimizedNetworkImpl.get(), modelOptions)) {}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

500

501

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<Graph> graph)

502

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph))) {}

503

504

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<OptimizedNetworkImpl> impl)

505

: pOptimizedNetworkImpl(std::move(impl)) {}

506

507

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<Graph> graph, const ModelOptions& modelOptions)

508

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph), modelOptions)) {}

509

510

IOptimizedNetwork::~IOptimizedNetwork() = default;

511

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

512

void IOptimizedNetwork::Destroy(IOptimizedNetwork* network)

513

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

514

delete network;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

515

}

516

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

517

Status IOptimizedNetwork::PrintGraph()

518

{

519

return pOptimizedNetworkImpl->PrintGraph();

520

}

521

522

Status IOptimizedNetwork::SerializeToDot(std::ostream& stream) const

523

{

524

return pOptimizedNetworkImpl->SerializeToDot(stream);

525

}

526

Derek Lamberti

e155bbf

2021-10-13 14:32:12 +0100

[diff] [blame]

527

const std::shared_ptr<IProfiler>& IOptimizedNetwork::GetProfiler() const

528

{

529

return pOptimizedNetworkImpl->GetGraph().GetProfiler();

530

}

531

Cathal Corbett

5aa9fd7

2022-02-25 15:33:28 +0000

[diff] [blame]

532

arm::pipe::ProfilingGuid IOptimizedNetwork::GetGuid() const

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

533

{

534

return pOptimizedNetworkImpl->GetGuid();

535

}

536

Sadik Armagan

b7851f9

2021-10-06 16:37:02 +0100

[diff] [blame]

537

size_t IOptimizedNetwork::GetNumInputs() const

538

{

539

return pOptimizedNetworkImpl->GetNumInputs();

540

}

541

542

size_t IOptimizedNetwork::GetNumOutputs() const

543

{

544

return pOptimizedNetworkImpl->GetNumOutputs();

545

}

546

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

547

Status OptimizedNetworkImpl::PrintGraph()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

548

{

549

m_Graph->Print();

550

return Status::Success;

551

}

552

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

553

Status OptimizedNetworkImpl::SerializeToDot(std::ostream& stream) const

surmeh01

bceff2f

2018-03-29 16:29:27 +0100

[diff] [blame]

554

{

555

return m_Graph->SerializeToDot(stream);

556

}

557

Sadik Armagan

b7851f9

2021-10-06 16:37:02 +0100

[diff] [blame]

558

size_t OptimizedNetworkImpl::GetNumInputs() const

559

{

560

return m_Graph->GetNumInputs();

561

}

562

563

size_t OptimizedNetworkImpl::GetNumOutputs() const

564

{

565

return m_Graph->GetNumOutputs();

566

}

567

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

568

void ReportError(const std::string& errorMessage,

569

Optional<std::vector<std::string>&> errorMessages)

570

{

571

std::stringstream fullErrorMessage;

572

fullErrorMessage << "ERROR: " << errorMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

573

ARMNN_LOG(warning) << fullErrorMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

574

if (errorMessages)

575

{

576

errorMessages.value().push_back(fullErrorMessage.str());

}

}

void ReportWarning(const std::string& warningMessage,

581

Optional<std::vector<std::string>&> warningMessages)

582

{

583

std::stringstream fullWarningMessage;

584

fullWarningMessage << "WARNING: " << warningMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

585

ARMNN_LOG(warning) << fullWarningMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

586

if (warningMessages)

587

{

588

warningMessages.value().push_back(fullWarningMessage.str());

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

592

OptimizationResult ReturnWithError(OptimizationResult res,

593

const Layer* layer,

594

const BackendSettings& backendSettings,

595

Optional<std::vector<std::string>&> errMessages)

596

{

597

std::stringstream failureMsg;

598

failureMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

599

<< " is not supported on any preferred backend " << backendSettings.m_PreferredBackends;

600

ReportError(failureMsg.str(), errMessages);

res.m_Error = true;

return res;

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

607

bool CheckScaleSetOnQuantizedType(Layer* layer, Optional<std::vector<std::string>&> errMessages)

608

{

609

bool noErrors = true;

610

unsigned int numOutputs = layer->GetNumOutputSlots();

611

for (unsigned int i = 0; i < numOutputs; i++) {

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

612

OutputSlot& outputSlot = layer->GetOutputSlot(i);

613

TensorInfo info = outputSlot.GetTensorInfo();

Derek Lamberti

f90c56d

2020-01-10 17:14:08 +0000

[diff] [blame]

614

if (DataType::QAsymmU8 == info.GetDataType()) {

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

615

if (0.f == info.GetQuantizationScale()) {

616

noErrors = false;

617

std::stringstream ss;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

618

ss << "output " << i << " of layer " << GetLayerTypeAsCString(layer->GetType())

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

619

<< " (" << layer->GetNameStr() << ") is of type"

620

<< " Quantized 8 bit but its scale parameter has not been set";

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

621

ReportError(ss.str(), errMessages);

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

622

}

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

623

// Softmax under QuantisedAsymm8 must always be scale (1.0f/256.0f) and offset 0

624

if ((info.GetQuantizationScale() != (1.0f / 256.0f) ||

625

info.GetQuantizationOffset() != 0) &&

626

layer->GetType() == armnn::LayerType::Softmax)

627

{

628

std::stringstream ss;

629

ss << "Quantization parameters for Softmax layer (Scale: " <<

630

info.GetQuantizationScale() << " and Offset: " << info.GetQuantizationOffset() <<

631

") are incorrect and have been updated to Scale: 0.00390625 and Offset: 0";

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

632

ARMNN_LOG(warning) << ss.str();

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

633

info.SetQuantizationScale((1.0f /256.0f));

634

info.SetQuantizationOffset(0);

635

outputSlot.SetTensorInfo(info);

636

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

}

}

return noErrors;

}

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

642

template <typename LayerT>

643

LayerT* ConvertBf16ToFp32Weight(Layer* l)

644

{

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

645

LayerT* layer = PolymorphicDowncast<LayerT*>(l);

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

646

if ((layer->GetType() == LayerType::Convolution2d || layer->GetType() == LayerType::FullyConnected)

647

&& layer->m_Weight)

648

{

649

const TensorInfo& info = layer->m_Weight->GetTensorInfo();

650

651

if (info.GetDataType() == DataType::BFloat16)

652

{

653

std::vector<float> newValues(info.GetNumElements());

654

655

armnnUtils::FloatingPointConverter::ConvertBFloat16ToFloat32(

Finn Williams

4422cec

2021-03-22 17:51:06 +0000

[diff] [blame]

656

layer->m_Weight->template GetConstTensor<armnn::BFloat16>(), info.GetNumElements(), newValues.data());

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

657

658

TensorInfo newInfo(info.GetShape(), DataType::Float32);

659

ConstTensor newInput(newInfo, newValues);

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

660

layer->m_Weight.reset(new ScopedTensorHandle(newInput));

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

}

}

return layer;

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

666

OptimizationResult AttemptBackendAssignment(BackendSettings& backendSettings,

Graph& graph,

Layer* layer,

BackendId backend,

DataType dataTypeIn,

DataType dataTypeOut,

672

const std::vector<BackendId>& availablePreferredBackends,

673

std::string& reasonIfUnsupported,

674

Optional<std::vector<std::string>&> errMessages)

675

{

676

OptimizationResult result;

677

678

// Helper lambda to compose meaningful error message before returning with error

679

auto ReturnError = [&](const Layer* layer)

680

{

681

return ReturnWithError(result, layer, backendSettings, errMessages);

682

};

683

684

// need to set the compute device on the layer

685

// before we can check if it is supported

686

layer->SetBackendId(backend);

687

if (!IWorkloadFactory::IsLayerSupported(*layer, EmptyOptional(), reasonIfUnsupported))

688

{

689

if (dataTypeIn == DataType::Float16 || dataTypeOut == DataType::Float16)

690

{

691

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

692

&& layer->GetType() != LayerType::ConvertFp32ToFp16

693

&& layer->GetType() != LayerType::ConvertFp16ToFp32)

694

{

Jan Eilers

0c0019c

2021-08-20 16:42:58 +0100

[diff] [blame]

695

auto ConstantLayerFromFp16ToFp32 = [](Layer& layer)

696

{

697

if (layer.GetType() == LayerType::Constant)

698

{

699

ConstantLayer* constantLayer = PolymorphicDowncast<ConstantLayer*>(&layer);

700

701

auto& info = constantLayer->m_LayerOutput->GetTensorInfo();

702

703

if (info.GetDataType() == DataType::Float16)

704

{

705

std::vector<float> newValues(info.GetNumElements());

706

707

armnnUtils::FloatingPointConverter::ConvertFloat16To32(

708

constantLayer->m_LayerOutput->GetConstTensor<Half>(),

709

info.GetNumElements(),

710

newValues.data());

711

712

TensorInfo newInfo(info);

713

newInfo.SetDataType(DataType::Float32);

714

ConstTensor newInput(newInfo, newValues);

715

constantLayer->m_LayerOutput.reset(new ScopedTensorHandle(newInput));

716

717

layer.GetOutputSlot(0).SetTensorInfo(newInfo);

}

}

};

bool checkType = false;

723

724

for (auto inputSlot : layer->GetInputSlots())

725

{

726

auto connectedOutputSlot = inputSlot.GetConnectedOutputSlot();

727

if (connectedOutputSlot->GetOwningLayer().GetType() == LayerType::Constant)

728

{

729

if (connectedOutputSlot->GetNumConnections() == 1)

730

{

731

checkType = true;

732

ConstantLayerFromFp16ToFp32(connectedOutputSlot->GetOwningLayer());

}

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

737

// Insert FP16 -> FP32 conversion layer before current layer

738

std::vector<ConvertFp16ToFp32Layer*> convertFp16ToFp32Layers;

739

if (dataTypeIn == DataType::Float16)

740

{

741

convertFp16ToFp32Layers =

Jan Eilers

0c0019c

2021-08-20 16:42:58 +0100

[diff] [blame]

742

InsertConvertFp16ToFp32LayersBefore(graph, *layer, checkType);

Derek Lamberti

4a9e24b

2020-01-03 16:53:38 +0000

[diff] [blame]

743

}

744

745

// Insert FP32 -> FP16 conversion layer after current layer

746

std::vector<ConvertFp32ToFp16Layer*> convertFp32ToFp16Layers;

747

if (dataTypeOut == DataType::Float16)

748

{

749

convertFp32ToFp16Layers =

750

InsertConvertFp32ToFp16LayersAfter(graph, *layer);

751

}

752

753

// Assign a supported backend to the newly introduced conversion layers

754

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

755

{

756

bool supportedBackendFound = false;

757

std::string reasonIfUnsupported;

758

759

// Try preferred backend first

760

layer->SetBackendId(preferredBackend);

761

if (IWorkloadFactory::IsLayerSupported(*layer,

762

EmptyOptional(),

763

reasonIfUnsupported))

764

{

765

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

770

{

771

// Skip preferred backend (we already determined that it is not supported)

772

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

778

if (IWorkloadFactory::IsLayerSupported(*layer,

779

EmptyOptional(),

780

reasonIfUnsupported))

781

{

782

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

789

};

790

791

for (ConvertFp16ToFp32Layer* convertLayer : convertFp16ToFp32Layers)

792

{

793

if (!AssignFirstSupportedBackend(convertLayer, backend))

794

{

795

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToFp16Layer* convertLayer : convertFp32ToFp16Layers)

800

{

801

if (!AssignFirstSupportedBackend(convertLayer, backend))

802

{

803

return ReturnError(convertLayer);

}

}

return result;

}

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

810

else if (dataTypeIn == DataType::BFloat16 || dataTypeOut == DataType::BFloat16)

811

{

812

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

813

&& layer->GetType() != LayerType::ConvertFp32ToBf16

814

&& layer->GetType() != LayerType::ConvertBf16ToFp32)

815

{

816

// Insert BF16 -> FP32 conversion layer before current layer

817

std::vector<ConvertBf16ToFp32Layer*> convertBf16ToFp32Layers;

818

if (dataTypeIn == DataType::BFloat16)

819

{

820

convertBf16ToFp32Layers =

821

InsertConvertBf16ToFp32LayersBefore(graph, *layer);

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

822

if (layer->GetType() == LayerType::Convolution2d)

823

{

824

ConvertBf16ToFp32Weight<Convolution2dLayer>(layer);

825

}

826

else if (layer->GetType() == LayerType::FullyConnected)

827

{

828

ConvertBf16ToFp32Weight<FullyConnectedLayer>(layer);

829

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

830

}

831

832

// Insert FP32 -> BF16 conversion layer after current layer

833

std::vector<ConvertFp32ToBf16Layer*> convertFp32ToBf16Layers;

834

if (dataTypeOut == DataType::BFloat16)

835

{

836

convertFp32ToBf16Layers =

837

InsertConvertFp32ToBf16LayersAfter(graph, *layer);

838

}

839

840

// Assign a supported backend to the newly introduced conversion layers

841

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

842

{

843

bool supportedBackendFound = false;

844

std::string reasonIfUnsupported;

845

846

// Try preferred backend first

847

layer->SetBackendId(preferredBackend);

848

if (IWorkloadFactory::IsLayerSupported(*layer,

849

EmptyOptional(),

850

reasonIfUnsupported))

851

{

852

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

857

{

858

// Skip preferred backend (we already determined that it is not supported)

859

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

865

if (IWorkloadFactory::IsLayerSupported(*layer,

866

EmptyOptional(),

867

reasonIfUnsupported))

868

{

869

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

876

};

877

878

for (ConvertBf16ToFp32Layer* convertLayer : convertBf16ToFp32Layers)

879

{

880

if (!AssignFirstSupportedBackend(convertLayer, backend))

881

{

882

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToBf16Layer* convertLayer : convertFp32ToBf16Layers)

887

{

888

if (!AssignFirstSupportedBackend(convertLayer, backend))

889

{

890

return ReturnError(convertLayer);

}

}

return result;

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

898

std::stringstream warningMsg;

899

warningMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

900

<< " is not supported on requested backend " << layer->GetBackendId().Get()

901

<< " for input data type " << GetDataTypeName(dataTypeIn)

902

<< " and output data type " << GetDataTypeName(dataTypeOut)

903

<< " (reason: " << reasonIfUnsupported

904

<< "), falling back to the next backend.";

905

ReportWarning(warningMsg.str(), errMessages);

906

907

return OptimizationResult(true, false);

}

else

{

return result;

}

}

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

915

// Refactor to allow passing the IConnectableLayer* rather than Layer Iterator

916

// on Graph and SubgraphView which are different types.

917

void AssignBackendsIConnectable(OptimizedNetworkImpl* optNetObjPtr,

918

IConnectableLayer* it,

919

Optional<std::vector<std::string>&> errMessages,

920

OptimizationResult& result,

921

BackendSettings& backendSettings,

922

std::vector<BackendId>& availablePreferredBackends)

923

{

924

auto ReturnError = [&](const Layer* layer)

925

{

926

return ReturnWithError(result, layer, backendSettings, errMessages);

927

};

928

929

auto layer = PolymorphicDowncast<Layer*>(it);

930

931

if (layer->GetType() == LayerType::Input)

{

return;

}

DataType dataTypeIn = layer->GetNumInputSlots() == 0 ? DataType::Float32 :

937

layer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo().GetDataType();

938

DataType dataTypeOut = layer->GetNumOutputSlots() == 0 ? DataType::Float32 :

939

layer->GetOutputSlot(0).GetTensorInfo().GetDataType();

940

941

std::string reasonIfUnsupported;

942

bool found = false;

943

if (!CheckScaleSetOnQuantizedType(layer, errMessages))

944

{

945

// don't bomb immediately, find all the quantized outputs

946

// which haven't had a scale set and report them all back.

947

result.m_Error = true;

948

}

949

950

// First try assign layer to hint backend

951

if (layer->GetBackendHint().has_value() &&

952

backendSettings.IsBackendSupported(layer->GetBackendHint().value()) &&

953

AttemptBackendAssignment(backendSettings,

954

optNetObjPtr->GetGraph(),

955

layer,

956

layer->GetBackendHint().value(),

957

dataTypeIn,

958

dataTypeOut,

959

availablePreferredBackends,

reasonIfUnsupported,

errMessages).IsOk())

{

found = true;

backendSettings.m_SelectedBackends.insert(layer->GetBackendHint().value());

}

else

{

// Try assign layer to prefered list of backends

969

for (const auto& backend : availablePreferredBackends)

970

{

971

if (layer->GetBackendHint().has_value() &&

972

layer->GetBackendHint().value() == backend)

973

{

974

continue; //Don't re-test the backend hint

975

}

976

977

OptimizationResult res = AttemptBackendAssignment(backendSettings,

978

optNetObjPtr->GetGraph(),

layer,

backend,

dataTypeIn,

dataTypeOut,

availablePreferredBackends,

reasonIfUnsupported,

errMessages);

if (res.IsOk())

{

found = true;

backendSettings.m_SelectedBackends.insert(backend);

991

break;

992

}

993

else if (res.IsError())

994

{

995

result = res; // Cannot continue.

996

// Note: we don't need to log the error as it would already

997

// be logged in AttemptBackendAssignment().

}

else

{

ARMNN_ASSERT_MSG(res.IsWarningOnly(), "OptimizationResult in unexpected state.");

}

}

}

// If the layer is unsupported by any devices, log and return a null network.

1007

if (!found)

1008

{

1009

// NOTE: if the layer is not an operation queue type AND we have not got CpuRef as a

1010

// fallback we should set the compute device on the layer to CpuRef (these are not

1011

// available as accelerated operations, or are only available under certain

1012

// conditions, currently they comprise MemCopy, Constant, Permute)

1013

armnn::LayerType layerType = layer->GetType();

1014

if (!backendSettings.IsCpuRefUsed() && (layerType == armnn::LayerType::MemCopy ||

1015

layerType == armnn::LayerType::Constant ||

1016

layerType == armnn::LayerType::Permute))

1017

{

1018

BackendId cpuBackendId(armnn::Compute::CpuRef);

1019

layer->SetBackendId(cpuBackendId);

1020

backendSettings.m_SelectedBackends.insert(cpuBackendId);

}

else

{

result = ReturnError(layer);

}

}

}

Derek Lamberti

4a9e24b

2020-01-03 16:53:38 +0000

[diff] [blame]

1029

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1030

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1031

BackendSettings& backendSettings,

1032

Graph::Iterator& firstLayer,

1033

Graph::Iterator& lastLayer,

1034

Optional<std::vector<std::string>&> errMessages)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1035

{

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1036

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_AssignBackends");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1037

OptimizationResult result;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1038

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1039

auto availablePreferredBackends = backendSettings.GetAvailablePreferredBackends();

1040

if (availablePreferredBackends.empty())

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1041

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1042

std::stringstream failureMsg;

1043

failureMsg << "No preferred backends are available";

1044

ReportError(failureMsg.str(), errMessages);

1045

1046

result.m_Error = true;

return result;

}

for (auto it = firstLayer; it != lastLayer; ++it)

1051

{

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1052

AssignBackendsIConnectable(optNetObjPtr,

*it,

errMessages,

result,

backendSettings,

availablePreferredBackends);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1058

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1059

Finn Williams

b1aad42

2021-10-28 19:07:32 +0100

[diff] [blame]

1060

for (auto it = firstLayer; it != lastLayer; ++it)

1061

{

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1062

auto layer = PolymorphicDowncast<Layer*>(*it);

1063

1064

if(layer->GetType() == LayerType::Input)

1065

{

1066

BackendId connectedBackendId = layer->GetOutputSlot(0).GetConnection(0)->GetOwningLayer().GetBackendId();

1067

layer->SetBackendId(connectedBackendId);

}

}

return result;

}

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

1075

BackendSettings& backendSettings,

1076

SubgraphView::IConnectableLayerIterator& firstLayer,

1077

SubgraphView::IConnectableLayerIterator& lastLayer,

1078

Optional<std::vector<std::string>&> errMessages)

1079

{

1080

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_AssignBackends");

1081

OptimizationResult result;

1082

1083

auto availablePreferredBackends = backendSettings.GetAvailablePreferredBackends();

1084

if (availablePreferredBackends.empty())

1085

{

1086

std::stringstream failureMsg;

1087

failureMsg << "No preferred backends are available";

1088

ReportError(failureMsg.str(), errMessages);

1089

1090

result.m_Error = true;

return result;

}

for (auto it = firstLayer; it != lastLayer; ++it)

1095

{

1096

AssignBackendsIConnectable(optNetObjPtr,

*it,

errMessages,

result,

backendSettings,

availablePreferredBackends);

1102

}

1103

1104

for (auto it = firstLayer; it != lastLayer; ++it)

1105

{

1106

auto layer = PolymorphicDowncast<Layer*>(*it);

Finn Williams

b1aad42

2021-10-28 19:07:32 +0100

[diff] [blame]

1107

1108

if(layer->GetType() == LayerType::Input)

1109

{

1110

BackendId connectedBackendId = layer->GetOutputSlot(0).GetConnection(0)->GetOwningLayer().GetBackendId();

1111

layer->SetBackendId(connectedBackendId);

}

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

return result;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1118

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1119

BackendSettings& backendSettings,

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1120

SubgraphView& subgraph,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1121

Optional<std::vector<std::string>&> errMessages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1122

{

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1123

SubgraphView::IConnectableLayerIterator firstLayer = subgraph.beginIConnectable();

1124

SubgraphView::IConnectableLayerIterator lastLayer = subgraph.endIConnectable();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1125

return AssignBackends(optNetObjPtr,

backendSettings,

firstLayer,

lastLayer,

errMessages);

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1132

BackendsMap CreateSupportedBackends(TensorHandleFactoryRegistry& handleFactoryRegistry,

1133

BackendSettings& backendSettings)

1134

{

1135

BackendsMap backends;

1136

auto const& backendRegistry = BackendRegistryInstance();

1137

for (auto&& selectedBackend : backendSettings.m_SupportedBackends)

1138

{

1139

auto backendFactory = backendRegistry.GetFactory(selectedBackend);

1140

auto backendObjPtr = backendFactory();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1141

ARMNN_ASSERT(backendObjPtr);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1142

1143

backendObjPtr->RegisterTensorHandleFactories(handleFactoryRegistry);

1144

1145

backends[backendObjPtr->GetId()] = std::move(backendObjPtr);

}

return backends;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1151

OptimizationResult ApplyBackendOptimizations(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1152

BackendSettings& backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1153

BackendsMap& backends,

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1154

const ModelOptions& modelOptions,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1155

Optional<std::vector<std::string>&> errMessages)

1156

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1157

ARMNN_ASSERT(optNetObjPtr);

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1158

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_ApplyBackendOptimizations")

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1159

OptimizationResult result;

1160

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1161

// Get the optimized graph

1162

Graph& optGraph = optNetObjPtr->GetGraph();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1163

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1164

// Run backend specific optimizations

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1165

for (auto&& selectedBackend : backendSettings.m_SelectedBackends)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1166

{

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1167

auto backendObjPtr = backends.find(selectedBackend)->second.get();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1168

ARMNN_ASSERT(backendObjPtr);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1169

1170

// Select sub-graphs based on backend

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1171

SubgraphViewSelector::Subgraphs subgraphs =

Rob Hughes

65c3226

2019-07-23 15:33:39 +0100

[diff] [blame]

1172

SubgraphViewSelector::SelectSubgraphs(optGraph,

Matteo Martincigh

602af09

2019-05-01 10:31:27 +0100

[diff] [blame]

1173

// Select layers assigned to the requested backend

1174

[&backendObjPtr](const Layer& layer)

1175

{

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1176

Matteo Martincigh

602af09

2019-05-01 10:31:27 +0100

[diff] [blame]

1177

return layer.GetType() != LayerType::Input &&

1178

layer.GetType() != LayerType::Output &&

1179

layer.GetBackendId() == backendObjPtr->GetId();

1180

});

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1181

if (subgraphs.empty())

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1182

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1183

// No sub-graphs found, try with next selected backend

1184

continue;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1185

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1186

1187

// Try to optimize each sub-graph

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1188

for (auto& subgraph : subgraphs)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1189

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1190

// Try to optimize the current sub-graph

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1191

ARMNN_SCOPED_PROFILING_EVENT(backendObjPtr->GetId(), "Optimizer_OptimizeSubgraph");

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1192

OptimizationViews optimizationViews = backendObjPtr->OptimizeSubgraphView(*subgraph, modelOptions);

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1193

ARMNN_ASSERT(optimizationViews.Validate(*subgraph));

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1194

1195

// Optimization attempted, check the resulting optimized sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1196

for (auto& substitution : optimizationViews.GetSubstitutions())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1197

{

1198

// Sub-graph optimized, substitute the sub-graph with the new optimized one in the main optimized graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1199

SubgraphView& replacementSubgraph = substitution.m_ReplacementSubgraph;

1200

SubgraphView& substitutableSubgraph = substitution.m_SubstitutableSubgraph;

1201

optGraph.SubstituteSubgraph(substitutableSubgraph, replacementSubgraph);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1202

1203

// Assign the current backend to the optimized sub-graph

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1204

const SubgraphView::IConnectableLayers& subgraphLayers = replacementSubgraph.GetIConnectableLayers();

1205

std::for_each(subgraphLayers.begin(), subgraphLayers.end(), [&selectedBackend](IConnectableLayer* l)

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1206

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1207

ARMNN_ASSERT(l);

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1208

PolymorphicDowncast<Layer*>(l)->SetBackendId(selectedBackend);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1209

});

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1210

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1211

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1212

if (!optimizationViews.GetFailedSubgraphs().empty())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1213

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1214

std::stringstream warningMsg;

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1215

warningMsg << "Some sub-graph(s) failed to optimized on " << backendObjPtr->GetId() << " backend.";

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1216

ReportWarning(warningMsg.str(), errMessages);

1217

1218

// Failed to optimize the given sub-graph, re-assign the sub-graph layers to other available backends

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1219

BackendSettings settingsCopy(backendSettings);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1220

if (!backendObjPtr->GetId().IsCpuRef())

1221

{

1222

// Add the current backend to the list of backends to ignore

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1223

settingsCopy.m_IgnoredBackends.insert(backendObjPtr->GetId());

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1224

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1225

1226

int count=0;

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1227

for (auto& failedSubgraph : optimizationViews.GetFailedSubgraphs())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1228

{

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1229

// An error occurred: the optimization was attempted but not performed, try different backends

1230

std::stringstream subgraphMsg;

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1231

subgraphMsg << "Re-assigning backends to " << failedSubgraph.GetIConnectableLayers().size()

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1232

<< " layers inside sub-graph " << count++;

Matteo Martincigh

328d92b

2019-07-04 17:52:55 +0100

[diff] [blame]

1233

ReportWarning(subgraphMsg.str(), errMessages);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1234

1235

OptimizationResult reassignmentResult = AssignBackends(optNetObjPtr,

settingsCopy,

*subgraph,

errMessages);

if (reassignmentResult.m_Error)

1240

{

1241

// Failed to re-assign one of the remaining backends to each layer of the sub-graph

1242

result.m_Error = true;

1243

return result;

1244

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1245

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

}

}

}

return result;

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1253

bool RequiresCopy(ITensorHandleFactory::FactoryId src,

1254

ITensorHandleFactory::FactoryId dst,

1255

TensorHandleFactoryRegistry& registry)

{

if (src != dst)

{

ITensorHandleFactory* srcFactory = registry.GetFactory(src);

1260

ITensorHandleFactory* dstFactory = registry.GetFactory(dst);

1261

Matteo Martincigh

a6539ed

2019-08-27 13:43:32 +0100

[diff] [blame]

1262

if (srcFactory && dstFactory &&

1263

(srcFactory->GetExportFlags() & dstFactory->GetImportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

{

return false;

}

return true;

}

return false;

}

// Find the handle factory for the input layer which results in fewest required copies.

1273

ITensorHandleFactory::FactoryId CalculateSlotOptionForInput(BackendsMap& backends,

1274

OutputSlot& slot,

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1275

TensorHandleFactoryRegistry& registry,

1276

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1277

{

1278

Layer& layer = slot.GetOwningLayer();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1279

ARMNN_ASSERT(layer.GetType() == LayerType::Input);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1280

1281

// Explicitly select the tensorhandle factory for InputLayer because the rules for it are slightly different. It

1282

// doesn't matter which backend it is assigned to because they all use the same implementation, which

1283

// requires Map/Unmap support. This means that, so long as the handle type supports map/unmap semantics, we can

1284

// select a factory with maximum compatibility with the layers connected to the InputLayer.

1285

1286

// First ensure the from backends can support the TensorHandeAPI

1287

auto frmBackend = backends.find(layer.GetBackendId());

1288

if (frmBackend == backends.end() ||

1289

!frmBackend->second->SupportsTensorAllocatorAPI())

1290

{

1291

return ITensorHandleFactory::LegacyFactoryId;

1292

}

1293

1294

// Go through all connections to the output slot and determine the TensorHandleFactory which results in the

1295

// fewest copies.

1296

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

1297

int topScore = 0;

1298

ITensorHandleFactory::FactoryId topChoice = ITensorHandleFactory::LegacyFactoryId;

1299

1300

for (auto&& connection : slot.GetConnections())

1301

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1302

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1303

const Layer& connectedLayer = connection->GetOwningLayer();

1304

1305

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1306

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1307

1308

if (!toBackend->second.get()->SupportsTensorAllocatorAPI())

1309

{

1310

// The destination backend does not support the tensor allocator API, move to the next one

continue;

}

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1315

for (auto&& dst : dstPrefs)

1316

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1317

// Input layers use the mem copy workload or import, so the selected factory must

1318

// support either the map/unmap API or Import API

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1319

ITensorHandleFactory* factory = registry.GetFactory(dst);

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1320

if (importEnabled && factory->GetImportFlags() == 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1321

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1322

continue;

1323

}

1324

else if (!importEnabled && !factory->SupportsMapUnmap())

1325

{

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

continue;

}

auto it = factoryScores.find(dst);

1330

if (it == factoryScores.end())

1331

{

1332

// Add new score to the table

1333

factoryScores[dst] = 0;

1334

if (topChoice == ITensorHandleFactory::LegacyFactoryId)

{

topChoice = dst;

}

}

else

{

// Increase the score

1342

factoryScores[dst]++;

1343

1344

// Track the best option

1345

if (factoryScores[dst] > topScore)

1346

{

1347

topScore = factoryScores[dst];

topChoice = dst;

}

}

}

}

return topChoice;

}

// Find the handle factory for the output layer which results in fewest required copies.

1358

ITensorHandleFactory::FactoryId CalculateSlotOptionForOutput(BackendsMap& backends,

1359

OutputSlot& slot,

1360

TensorHandleFactoryRegistry& registry)

1361

{

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

1362

IgnoreUnused(backends, slot, registry);

Derek Lamberti

94a88d2

2019-12-10 21:12:59 +0000

[diff] [blame]

1363

return ITensorHandleFactory::DeferredFactoryId;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1364

}

1365

1366

// For all handle factories supported on the source backend, we wish to find the one which requires the fewest copies

1367

// when considering all connections.

1368

ITensorHandleFactory::FactoryId CalculateSlotOption(BackendsMap& backends,

1369

OutputSlot& outputSlot,

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1370

TensorHandleFactoryRegistry& registry,

1371

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1372

{

1373

// First ensure the from backends can support the TensorHandeAPI

1374

Layer& layer = outputSlot.GetOwningLayer();

1375

auto frmBackend = backends.find(layer.GetBackendId());

1376

if (frmBackend == backends.end() ||

1377

!frmBackend->second->SupportsTensorAllocatorAPI())

1378

{

1379

return ITensorHandleFactory::LegacyFactoryId;

1380

}

1381

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1382

bool outputConnection = false;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1383

for (auto&& connection : outputSlot.GetConnections())

1384

{

1385

const Layer& connectedLayer = connection->GetOwningLayer();

1386

if (connectedLayer.GetType() == LayerType::Output)

1387

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1388

outputConnection = true;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

IBackendInternal* srcBackend = frmBackend->second.get();

1393

auto srcPrefs = srcBackend->GetHandleFactoryPreferences();

1394

1395

// Initialize the scores

1396

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

1397

for (auto&& pref : srcPrefs)

1398

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1399

if (importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1400

{

1401

ITensorHandleFactory* factory = registry.GetFactory(pref);

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1402

if (outputConnection)

1403

{

1404

// Check if this is fallback case

1405

bool fallbackConnection = false;

1406

for (auto&& inputSlot : layer.GetInputSlots())

1407

{

1408

if (inputSlot.GetConnectedOutputSlot()->GetOwningLayer().GetBackendId() != layer.GetBackendId())

1409

{

1410

fallbackConnection = true;

1411

}

1412

}

1413

if (fallbackConnection)

1414

{

1415

auto factoryCap = factory->GetCapabilities(&layer, &layer, CapabilityClass::FallbackImportDisabled);

1416

// Cannot use factory import if fallback import is not supported.

1417

if (!factoryCap.empty())

{

continue;

}

}

else if (factory->GetExportFlags() == 0)

{

continue;

}

}

if (!outputConnection)

1428

{

1429

auto factoryCap = factory->GetCapabilities(&layer, &layer, CapabilityClass::FallbackImportDisabled);

1430

// Cannot use factory import if fallback import is not supported.

1431

if (!factoryCap.empty())

{

continue;

}

}

}

else

{

// Only consider factories that support map/unmap

1441

ITensorHandleFactory* factory = registry.GetFactory(pref);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1442

if (!factory->SupportsMapUnmap())

1443

{

1444

// The current tensor handle factory does not support the map/unmap strategy, move to the next one

continue;

}

}

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1449

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1450

auto it = factoryScores.find(pref);

1451

if (it == factoryScores.end())

1452

{

1453

// Add new score to the table

1454

factoryScores[pref] = 0;

}

}

// Score each handle factory based on how many times it requires copies on the slot connections

1459

for (auto&& connection : outputSlot.GetConnections())

1460

{

1461

const Layer& connectedLayer = connection->GetOwningLayer();

1462

1463

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1464

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1465

1466

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1467

for (auto&& src : srcPrefs)

1468

{

1469

if (factoryScores.find(src) == factoryScores.end()) // Don't consider excluded factories

{

continue;

}

for (auto&& dst : dstPrefs)

1475

{

1476

if (RequiresCopy(src, dst, registry))

1477

{

1478

// Copy avoided, increase the score

1479

factoryScores[src]++;

break;

}

}

}

}

// Find the lowest score

1487

int minScore = std::numeric_limits<int>::max();

1488

for (auto it : factoryScores)

1489

{

1490

minScore = std::min(minScore, it.second);

1491

}

1492

1493

// Collect factories matching the best(lowest) score

1494

std::vector<ITensorHandleFactory::FactoryId> optimalFactories;

1495

for (auto it : factoryScores)

1496

{

1497

if (it.second == minScore)

1498

{

1499

optimalFactories.push_back(it.first);

}

}

// For all compatible Factories matching the best score, find the preferred one for the current layer.

1504

for (auto&& srcPref : srcPrefs)

1505

{

1506

for (auto&& comp : optimalFactories)

{

if (comp == srcPref)

{

return comp;

}

}

}

return ITensorHandleFactory::LegacyFactoryId;

1516

}

1517

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1518

EdgeStrategy CalculateEdgeStrategy(BackendsMap& backends,

1519

ITensorHandleFactory::FactoryId srcFactoryId,

1520

const Layer& layer,

1521

const Layer& connectedLayer,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1522

TensorHandleFactoryRegistry& registry,

1523

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1524

{

1525

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1526

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1527

1528

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1529

1530

// Legacy API check for backward compatibility

1531

if (srcFactoryId == ITensorHandleFactory::LegacyFactoryId || dstPrefs.empty())

1532

{

1533

if (layer.GetBackendId() != connectedLayer.GetBackendId())

1534

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1535

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1536

}

1537

else

1538

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1539

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// TensorHandleFactory API present, so perform more sophisticated strategies.

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1544

// Dst Output layers don't require copy because they use import or map/unmap

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1545

if (connectedLayer.GetType() == LayerType::Output)

1546

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1547

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1548

}

1549

1550

// Search for direct match in prefs

1551

for (auto&& pref : dstPrefs)

1552

{

1553

if (pref == srcFactoryId)

1554

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1555

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// Search for export/import options

1560

ITensorHandleFactory* srcFactory = registry.GetFactory(srcFactoryId);

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1561

if (srcFactory->GetExportFlags() != 0 && importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1562

{

1563

for (auto&& pref : dstPrefs)

1564

{

1565

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1566

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1567

// Handles cases when a destPref is not listed in TensorHandleFactoryRegistry

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1568

if (!dstFactory) {

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1569

continue;

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1570

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1571

if ((dstFactory->GetImportFlags() & srcFactory->GetExportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1572

{

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1573

auto srcCapability = srcFactory->GetCapabilities(&layer, &layer, CapabilityClass::PaddingRequired);

1574

auto dstCapability = dstFactory->GetCapabilities(&connectedLayer,

1575

&connectedLayer,

1576

CapabilityClass::PaddingRequired);

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1577

auto srcFallback = srcFactory->GetCapabilities(&layer, &layer, CapabilityClass::FallbackImportDisabled);

1578

auto dstFallback = dstFactory->GetCapabilities(&connectedLayer,

1579

&connectedLayer,

1580

CapabilityClass::FallbackImportDisabled);

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1581

// Do not require memory copy if the source and destination do not require padding.

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1582

if (srcCapability.empty() && dstCapability.empty() && srcFallback.empty() && dstFallback.empty())

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1583

{

1584

return EdgeStrategy::ExportToTarget;

1585

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

// Search for copy options via map/unmap

1591

if (srcFactory->SupportsMapUnmap())

1592

{

1593

for (auto&& pref : dstPrefs)

1594

{

1595

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1596

if (dstFactory && dstFactory->SupportsMapUnmap())

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1597

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1598

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1603

return EdgeStrategy::Undefined;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1604

}

1605

1606

// Select the TensorHandleFactories and the corresponding memory strategy

1607

OptimizationResult SelectTensorHandleStrategy(Graph& optGraph,

1608

BackendsMap& backends,

1609

TensorHandleFactoryRegistry& registry,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1610

bool importEnabled,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1611

Optional<std::vector<std::string>&> errMessages)

1612

{

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1613

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_SelectTensorHandleStrategy");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1614

OptimizationResult result;

1615

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1616

optGraph.ForEachLayer([&backends, &registry, &result, &errMessages, importEnabled](Layer* layer)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1617

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1618

ARMNN_ASSERT(layer);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1619

1620

// Lets make sure the backend is in our list of supported backends. Something went wrong during backend

1621

// assignment if this check fails

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1622

ARMNN_ASSERT(backends.find(layer->GetBackendId()) != backends.end());

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1623

1624

// Check each output separately

1625

for (unsigned int slotIdx = 0; slotIdx < layer->GetNumOutputSlots(); slotIdx++)

1626

{

1627

OutputSlot& outputSlot = layer->GetOutputSlot(slotIdx);

1628

1629

ITensorHandleFactory::FactoryId slotOption = ITensorHandleFactory::LegacyFactoryId;

1630

1631

// Calculate the factory to use which results in the fewest copies being made.

1632

switch(layer->GetType())

1633

{

1634

case LayerType::Input:

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1635

slotOption = CalculateSlotOptionForInput(backends, outputSlot, registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1636

break;

1637

case LayerType::Output:

1638

slotOption = CalculateSlotOptionForOutput(backends, outputSlot, registry);

1639

break;

1640

default:

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1641

slotOption = CalculateSlotOption(backends, outputSlot, registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1642

break;

1643

}

1644

outputSlot.SetTensorHandleFactory(slotOption);

1645

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1646

// Now determine the "best" edge strategy for each connection given the slotOption.

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1647

unsigned int connectionIdx = 0;

1648

for (auto&& connection : outputSlot.GetConnections())

1649

{

1650

const Layer& connectedLayer = connection->GetOwningLayer();

1651

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1652

EdgeStrategy strategy = CalculateEdgeStrategy(backends, slotOption, *layer, connectedLayer,

1653

registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1654

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1655

if (strategy == EdgeStrategy::Undefined)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1656

{

1657

result.m_Error = true;

1658

if (errMessages)

1659

{

1660

errMessages.value().emplace_back("Could not find valid strategy required for compatibility"

1661

" between backends.");

}

return;

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1666

outputSlot.SetEdgeStrategy(connectionIdx, strategy);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

connectionIdx++;

}

}

});

return result;

}

Cathal Corbett

2022-03-21 09:27:08 +0000

[diff] [blame]

1676

IOptimizedNetworkPtr Optimize(const Graph& inGraph,

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1677

const std::vector<BackendId>& backendPreferences,

1678

const IDeviceSpec& deviceSpec,

1679

const OptimizerOptions& options,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1680

Optional<std::vector<std::string>&> messages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1681

{

Jan Eilers

17d34da

2021-12-08 16:15:12 +0000

[diff] [blame]

1682

ARMNN_LOG(debug) << options.ToString();

Jan Eilers

6a71bb5

2021-10-26 17:41:18 +0100

[diff] [blame]

1683

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1684

// Enable profiling

Cathal Corbett

2022-03-21 09:27:08 +0000

[diff] [blame]

1685

auto profiler = inGraph.GetProfiler();

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1686

ProfilerManager::GetInstance().RegisterProfiler(profiler.get());

1687

profiler->EnableProfiling(options.m_ProfilingEnabled);

1688

1689

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1690

if (backendPreferences.empty())

1691

{

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1692

throw InvalidArgumentException("Invoked Optimize with no backends specified");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1693

}

1694

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1695

if (options.m_ReduceFp32ToFp16 && options.m_ReduceFp32ToBf16)

1696

{

1697

throw InvalidArgumentException("BFloat16 and Float16 optimization cannot be enabled at the same time.");

1698

}

1699

Cathal Corbett

521032f

2021-10-07 11:46:40 +0100

[diff] [blame]

1700

// Ensure TensorInfo is set on all output slots of ConstantLayers in the graph

Cathal Corbett

2022-03-21 09:27:08 +0000

[diff] [blame]

1701

inGraph.VerifyConstantLayerSetTensorInfo();

Cathal Corbett

521032f

2021-10-07 11:46:40 +0100

[diff] [blame]

1702

Cathal Corbett

2022-03-21 09:27:08 +0000

[diff] [blame]

1703

std::unique_ptr<Graph> graph = std::make_unique<Graph>(inGraph);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1704

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1705

auto optNet = IOptimizedNetworkPtr(new IOptimizedNetwork(std::move(graph), options.m_ModelOptions),

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

1706

&IOptimizedNetwork::Destroy);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1707

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1708

IOptimizedNetwork* optNetObjPtr = optNet.get();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1709

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1710

// Get the optimized graph

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1711

Graph& optGraph = optNetObjPtr->pOptimizedNetworkImpl->GetGraph();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1712

Finn Williams

d218d98

2021-08-09 13:00:08 +0100

[diff] [blame]

1713

if(options.m_shapeInferenceMethod == ShapeInferenceMethod::InferAndValidate)

1714

{

1715

// Infer the tensor infos for all output slots. Throws an exception on failure

1716

optGraph.InferTensorInfos();

1717

}

Finn Williams

84e025a

2021-08-05 17:29:32 +0100

[diff] [blame]

1718

Narumol Prangnawarat

16f82f9

2020-09-14 16:12:44 +0100

[diff] [blame]

1719

// Perform AddBroadcastReshapeLayer optimisation

1720

using namespace optimizations;

1721

Optimizer::Pass(optGraph, MakeOptimizations(AddBroadcastReshapeLayer()));

1722

Finn Williams

d218d98

2021-08-09 13:00:08 +0100

[diff] [blame]

1723

if(options.m_shapeInferenceMethod == ShapeInferenceMethod::ValidateOnly)

1724

{

1725

// Validate the tensor infos for all output slots. Throws an exception on failure

1726

optGraph.InferTensorInfos();

1727

}

1728

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1729

// Perform optimisation passes

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1730

Optimizer::Pass(optGraph, MakeOptimizations(SquashEqualPermuteSiblings(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1731

SquashEqualTransposeSiblings(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1732

SquashEqualReshapeSiblings(),

1733

OptimizeInversePermutes(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1734

OptimizeInverseTransposes(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1735

MovePermuteUp(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1736

MoveTransposeUp(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1737

PermuteAsReshape(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1738

TransposeAsReshape(),

Nina Drozd

861985f

2019-04-18 14:48:51 +0100

[diff] [blame]

1739

OptimizeConsecutiveReshapes(),

Rob Hughes

3a7d3a7

2019-09-24 16:59:56 +0100

[diff] [blame]

1740

FoldPadIntoConvolution2d(),

Teresa Charlin

5786eb7

2021-05-21 16:29:45 +0100

[diff] [blame]

1741

FoldPadIntoDepthwiseConvolution2d(),

Diego Lopez Recas

fe95d72

2021-03-19 12:40:16 +0000

[diff] [blame]

1742

FoldPadIntoPooling2d(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1743

PermuteAndBatchToSpaceAsDepthToSpace(),

Teresa Charlin

06e0300

2020-10-15 13:16:07 +0100

[diff] [blame]

1744

TransposeAndBatchToSpaceAsDepthToSpace(),

Mike Kelly

90231b8

2020-11-05 15:44:56 +0000

[diff] [blame]

1745

FuseBatchNormIntoConvolution2DFloat32(),

1746

FuseBatchNormIntoConvolution2DFloat16(),

1747

FuseBatchNormIntoDepthwiseConvolution2DFloat32(),

Cathal Corbett

2022-04-14 17:55:11 +0100

[diff] [blame^]

1748

FuseBatchNormIntoDepthwiseConvolution2DFloat16(),

1749

RedirectMembersToConstantInputs()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1750

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1751

// If Fp32 to Fp16 optimization is set convert Fp32 network to Fp16

1752

if (options.m_ReduceFp32ToFp16)

1753

{

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1754

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_ReduceFp32ToFp16");

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1755

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToFp16Converter()));

Derek Lamberti

dd6804b

2019-11-27 09:29:57 +0000

[diff] [blame]

1756

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1757

}

1758

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1759

// If Fp32 to Bf16 optimization is set convert Fp32 network to Bf16

Narumol Prangnawarat

57ef008

2020-03-26 09:20:43 +0000

[diff] [blame]

1760

// Convert input of Convolution2d and FullyConnected from Fp32 to Bf16

1761

// Only Constant weight of Convolution2d and FullyConnected are converted from Fp32 to Bf16

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1762

if (options.m_ReduceFp32ToBf16)

1763

{

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1764

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_ReduceFp32ToBf16");

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1765

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToBf16Converter()));

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1766

}

1767

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1768

// Initialize backend settings

1769

BackendSettings backendSettings(backendPreferences, deviceSpec);

1770

if (backendSettings.GetAvailablePreferredBackends().empty())

1771

{

1772

std::stringstream failureMsg;

1773

failureMsg << "None of the preferred backends " << backendPreferences

1774

<< " are supported. Current platform provides " << backendSettings.m_SupportedBackends;

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1775

ReportError(failureMsg.str(), messages);

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1776

throw InvalidArgumentException(failureMsg.str());

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1777

}

1778

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1779

// Create a map to temporarily hold initialized backend objects

1780

TensorHandleFactoryRegistry tensorHandleFactoryRegistry;

1781

BackendsMap backends = CreateSupportedBackends(tensorHandleFactoryRegistry, backendSettings);

1782

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1783

// Assign an available backend to each layer

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1784

Graph::Iterator firstLayer = optGraph.begin();

1785

Graph::Iterator lastLayer = optGraph.end();

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1786

OptimizationResult assignBackendsResult = AssignBackends(optNetObjPtr->pOptimizedNetworkImpl.get(),

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1787

backendSettings,

1788

firstLayer,

1789

lastLayer,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1790

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1791

if (assignBackendsResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1792

{

1793

// Failed to assign a backend to each layer

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1794

throw InvalidArgumentException("Failed to assign a backend to each layer");

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

1795

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1796

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1797

Optimizer::Pass(optGraph, MakeOptimizations(OptimizeInverseConversionsFp16(),

1798

OptimizeInverseConversionsFp32()));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1799

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1800

// Apply the backend-specific optimizations

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1801

OptimizationResult backendOptimizationResult = ApplyBackendOptimizations(optNetObjPtr->pOptimizedNetworkImpl.get(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1802

backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1803

backends,

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1804

options.m_ModelOptions,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1805

messages);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1806

if (backendOptimizationResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1807

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1808

// Failed to apply the backend-specific optimizations

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1809

throw InvalidArgumentException("Failed to apply the backend-specific optimizations");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1810

}

1811

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1812

// If the debug flag is set, then insert a DebugLayer after each layer

1813

// Doing this after applying the backend optimizations as they might have changed some layers

1814

if (options.m_Debug)

1815

{

1816

Optimizer::Pass(optGraph, MakeOptimizations(InsertDebugLayer()));

1817

}

1818

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1819

// Calculate the compatibility strategies for tensor handles

1820

OptimizationResult strategyResult = SelectTensorHandleStrategy(optGraph,

1821

backends,

1822

tensorHandleFactoryRegistry,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1823

options.m_ImportEnabled,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1824

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1825

if (strategyResult.m_Error)

1826

{

1827

// Failed to apply the backend-specific optimizations

1828

return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);

1829

}

1830

1831

// Based on the tensor handle strategy determined above, insert copy layers where required.

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1832

{

1833

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_AddCompatibilityLayers");

1834

optGraph.AddCompatibilityLayers(backends, tensorHandleFactoryRegistry);

1835

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1836

1837

// Convert constants

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1838

{

1839

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_ConvertConstants");

1840

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

1841

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsHalfToFloat()));

1842

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1843

return optNet;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1844

}

Cathal Corbett

2022-03-21 09:27:08 +0000

[diff] [blame]

1845

1846

IOptimizedNetworkPtr Optimize(const INetwork& inNetwork,

1847

const std::vector<BackendId>& backendPreferences,

1848

const IDeviceSpec& deviceSpec,

1849

const OptimizerOptions& options,

1850

Optional<std::vector<std::string>&> messages)

1851

{

1852

return Optimize(inNetwork.pNetworkImpl->GetGraph(),

backendPreferences,

deviceSpec,

options,

messages);

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1859

bool NetworkImpl::GetShapeInferenceMethod()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1860

{

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

1861

if (m_NetworkOptions.size() > 0 && m_NetworkOptions[0].GetBackendId().Get() == "ShapeInferenceMethod")

1862

{

1863

return m_NetworkOptions[0].GetOption(0).GetValue().AsBool();

1864

}

1865

1866

return false;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1867

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1868

NetworkImpl::NetworkImpl(NetworkOptions networkOptions)

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

1869

: m_NetworkOptions(networkOptions),

1870

m_Graph(std::make_unique<Graph>(GetShapeInferenceMethod()))

1871

{}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1872

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1873

NetworkImpl::~NetworkImpl()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1877

Status NetworkImpl::PrintGraph()

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

1878

{

1879

m_Graph->Print();

1880

return Status::Success;

1881

}

1882

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1883

IConnectableLayer* NetworkImpl::AddInputLayer(LayerBindingId id, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1884

{

1885

return m_Graph->AddLayer<InputLayer>(id, name);

1886

}

1887

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1888

IConnectableLayer* NetworkImpl::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

Éanna Ó Catháin

4e1e136

2018-11-12 11:36:34 +0000

[diff] [blame]

1889

const char* name)

1890

{

1891

return m_Graph->AddLayer<BatchToSpaceNdLayer>(batchToSpaceNdDescriptor, name);

1892

}

1893

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

1894

IConnectableLayer* NetworkImpl::AddCastLayer(const char* name)

1895

{

1896

return m_Graph->AddLayer<CastLayer>(name);

1897

}

Simon Obute

51f6777

2021-09-03 15:50:13 +0100

[diff] [blame]

1898

IConnectableLayer* NetworkImpl::AddChannelShuffleLayer(const ChannelShuffleDescriptor& channelShuffleDescriptor,

1899

const char* name)

1900

{

1901

return m_Graph->AddLayer<ChannelShuffleLayer>(channelShuffleDescriptor, name);

1902

}

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

1903

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1904

IConnectableLayer* NetworkImpl::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

1905

const char* name)

1906

{

1907

return m_Graph->AddLayer<ComparisonLayer>(comparisonDescriptor, name);

1908

}

1909

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1910

IConnectableLayer* NetworkImpl::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

1911

const char* name)

1912

{

1913

return m_Graph->AddLayer<ElementwiseUnaryLayer>(elementwiseUnaryDescriptor, name);

1914

}

1915

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1916

IConnectableLayer* NetworkImpl::AddFillLayer(const FillDescriptor& fillDescriptor,

Ryan OShea

ec6c680

2020-06-05 17:17:06 +0100

[diff] [blame]

1917

const char* name)

1918

{

1919

return m_Graph->AddLayer<FillLayer>(fillDescriptor, name);

1920

}

1921

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1922

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

1923

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1924

{

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1925

return m_Graph->AddLayer<FullyConnectedLayer>(fullyConnectedDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1926

}

1927

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1928

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Sadik Armagan

f0a6dec

2021-03-25 07:46:55 +0000

[diff] [blame]

1929

const Optional<ConstTensor>& weights,

1930

const Optional<ConstTensor>& biases,

1931

const char* name)

1932

{

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1933

ConstantLayer* weightsLayer = nullptr;

1934

ConstantLayer* biasLayer = nullptr;

1935

unsigned int numInputs = fullyConnectedDescriptor.GetNumInputs();

1936

1937

// Add a constant layer for weights

1938

if (weights.has_value())

1939

{

1940

weightsLayer = m_Graph->AddLayer<ConstantLayer>("Weights");

1941

weightsLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(weights.value());

Matthew Sloyan

b20d1d4

2021-08-09 15:33:41 +0100

[diff] [blame]

1942

1943

TensorInfo weightsInfo = weightsLayer->m_LayerOutput->GetTensorInfo();

1944

weightsInfo.SetConstant();

1945

1946

weightsLayer->GetOutputSlot(0).SetTensorInfo(weightsInfo);

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1947

}

1948

else if (fullyConnectedDescriptor.m_ConstantWeights)

1949

{

1950

throw InvalidArgumentException("AddFullyConnectedLayer: Constant weights tensor is empty.");

1951

}

1952

1953

// Add a constant layer for biases

1954

if (biases.has_value() && fullyConnectedDescriptor.m_BiasEnabled)

1955

{

1956

biasLayer = m_Graph->AddLayer<ConstantLayer>("Biases");

1957

biasLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(biases.value());

Matthew Sloyan

b20d1d4

2021-08-09 15:33:41 +0100

[diff] [blame]

1958

1959

TensorInfo biasInfo = biasLayer->m_LayerOutput->GetTensorInfo();

1960

biasInfo.SetConstant();

1961

1962

biasLayer->GetOutputSlot(0).SetTensorInfo(biasInfo);

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

}

if (numInputs < 2)

{

throw InvalidArgumentException("AddFullyConnectedLayer: Requires at least 2 input tensors: Input, Weights");

1968

}

1969

1970

auto layer = m_Graph->AddLayer<FullyConnectedLayer>(fullyConnectedDescriptor, name);

if (weightsLayer)

{

// Connect weights layer

1975

weightsLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(1));

1976

}

1977

1978

if ( fullyConnectedDescriptor.m_BiasEnabled && numInputs == 3 )

{

if (biasLayer)

{

// Connect bias layer

1983

biasLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(2));

1984

}

1985

}

1986

else if ( !fullyConnectedDescriptor.m_BiasEnabled && numInputs == 2 )

1987

{

1988

// Bias is disabled

1989

layer->m_Bias = nullptr;

}

else

{

throw InvalidArgumentException(fmt::format(

1994

"AddFullyConnectedLayer: Value mismatch. When bias is enabled in the "

1995

"descriptor the number of inputs is expected to be 3 otherwise 2. "

1996

"BiasEnabled={}, numInputs={}",

1997

fullyConnectedDescriptor.m_BiasEnabled,

numInputs));

}

return layer;

Sadik Armagan

f0a6dec

2021-03-25 07:46:55 +0000

[diff] [blame]

2002

}

2003

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2004

IConnectableLayer* NetworkImpl::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

2005

const char* name)

2006

{

Jim Flynn

e242f2d

2019-05-22 14:24:13 +0100

[diff] [blame]

2007

return m_Graph->AddLayer<ConcatLayer>(concatDescriptor, name);

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

2008

}

2009

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2010

IConnectableLayer* NetworkImpl::AddConvolution2dLayerImpl(const Convolution2dDescriptor& convolution2dDescriptor,

2011

const ConstTensor& weights,

2012

const Optional<ConstTensor>& biases,

2013

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2014

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2015

if (convolution2dDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2016

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2017

throw InvalidArgumentException("AddConvolution2dLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2018

}

2019

2020

const auto layer = m_Graph->AddLayer<Convolution2dLayer>(convolution2dDescriptor, name);

2021

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2022

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2023

2024

if (convolution2dDescriptor.m_BiasEnabled)

2025

{

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2026

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

Cathal Corbett

2022-03-21 09:27:08 +0000

[diff] [blame]

2032

IConnectableLayer* NetworkImpl::AddConvertFp16ToFp32Layer(const char* name)

2033

{

2034

return m_Graph->AddLayer<ConvertFp16ToFp32Layer>(name);

2035

}

2036

2037

IConnectableLayer* NetworkImpl::AddConvertFp32ToFp16Layer(const char* name)

2038

{

2039

return m_Graph->AddLayer<ConvertFp32ToFp16Layer>(name);

2040

}

2041

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2042

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2043

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2044

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2045

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2046

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2047

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2048

}

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2049

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2050

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2051

const ConstTensor& weights,

2052

const char* name)

2053

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

2054

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2055

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

2056

}

2057

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2058

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2059

const ConstTensor& weights,

2060

const ConstTensor& biases,

2061

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2062

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2063

Optional<ConstTensor> optionalBiases(biases);

2064

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2065

}

2066

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

2067

IConnectableLayer* NetworkImpl::AddConvolution3dLayer(const Convolution3dDescriptor& convolution3dDescriptor,

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

2068

const char* name)

2069

{

Matthew Sloyan

5d7b0a3

2021-10-18 13:07:49 +0100

[diff] [blame]

2070

return m_Graph->AddLayer<Convolution3dLayer>(convolution3dDescriptor, name);

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

2071

}

2072

2073

IConnectableLayer* NetworkImpl::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

2074

const char* name)

2075

{

2076

return m_Graph->AddLayer<DepthToSpaceLayer>(depthToSpaceDescriptor, name);

2077

}

2078

Cathal Corbett

2022-04-14 17:55:11 +0100

[diff] [blame^]

2079

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

2080

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

2081

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2082

{

Cathal Corbett

2022-04-14 17:55:11 +0100

[diff] [blame^]

2083

return m_Graph->AddLayer<DepthwiseConvolution2dLayer>(convolution2dDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2084

}

2085

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2086

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

Cathal Corbett

2022-04-14 17:55:11 +0100

[diff] [blame^]

2087

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

2088

const ConstTensor& weights,

2089

const Optional<ConstTensor>& biases,

2090

const char* name)

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2091

{

Cathal Corbett

2022-04-14 17:55:11 +0100

[diff] [blame^]

2092

auto layer = m_Graph->AddLayer<DepthwiseConvolution2dLayer>(convolution2dDescriptor, name);

2093

2094

// Add a constant layer for weights

2095

ConstantLayer* weightsLayer = m_Graph->AddLayer<ConstantLayer>("Weights");

2096

weightsLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(weights);

2097

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

2098

2099

weightsLayer->GetOutputSlot(0).SetTensorInfo(weightsLayer->m_LayerOutput->GetTensorInfo());

2100

weightsLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(1));

2101

2102

// Add a constant layer for biases

2103

if (biases.has_value() && convolution2dDescriptor.m_BiasEnabled)

2104

{

2105

ConstantLayer* biasLayer = m_Graph->AddLayer<ConstantLayer>("Bias");

2106

biasLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(biases.value());

2107

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

2108

2109

biasLayer->GetOutputSlot(0).SetTensorInfo(biasLayer->m_LayerOutput->GetTensorInfo());

2110

biasLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(2));

2111

}

2112

2113

return layer;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

2114

}

2115

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2116

IConnectableLayer* NetworkImpl::AddDetectionPostProcessLayer(const armnn::DetectionPostProcessDescriptor& descriptor,

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

2117

const ConstTensor& anchors, const char* name)

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

2118

{

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

2119

const auto layer = m_Graph->AddLayer<DetectionPostProcessLayer>(descriptor, name);

2120

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2121

layer->m_Anchors = std::make_shared<ScopedTensorHandle>(anchors);

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

2122

2123

return layer;

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

2124

}

2125

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2126

IConnectableLayer* NetworkImpl::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2127

const char* name)

2128

{

2129

return m_Graph->AddLayer<PermuteLayer>(permuteDescriptor, name);

2130

}

2131

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2132

IConnectableLayer* NetworkImpl::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2133

const char* name)

2134

{

2135

return m_Graph->AddLayer<Pooling2dLayer>(pooling2dDescriptor, name);

2136

}

2137

Tamás Nyíri

7b885b3

2021-10-26 14:47:57 +0100

[diff] [blame]

2138

IConnectableLayer* NetworkImpl::AddPooling3dLayer(const Pooling3dDescriptor& pooling3dDescriptor,

2139

const char* name)

2140

{

2141

return m_Graph->AddLayer<Pooling3dLayer>(pooling3dDescriptor, name);

2142

}

2143

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2144

IConnectableLayer* NetworkImpl::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2145

const char* name)

2146

{

2147

return m_Graph->AddLayer<ActivationLayer>(activationDescriptor, name);

2148

}

2149

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2150

IConnectableLayer* NetworkImpl::AddArgMinMaxLayer(const ArgMinMaxDescriptor& argMinMaxDescriptor,

Nikhil Raj

ee391d5

2019-09-05 17:50:44 +0100

[diff] [blame]

2151

const char* name)

2152

{

2153

return m_Graph->AddLayer<ArgMinMaxLayer>(argMinMaxDescriptor, name);

2154

}

2155

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2156

IConnectableLayer* NetworkImpl::AddNormalizationLayer(const NormalizationDescriptor&

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2157

normalizationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2158

const char* name)

2159

{

2160

return m_Graph->AddLayer<NormalizationLayer>(normalizationDescriptor, name);

2161

}

2162

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2163

IConnectableLayer* NetworkImpl::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

Aron Virginas-Tar

636ab40

2019-09-16 14:27:45 +0100

[diff] [blame]

2164

{

2165

return m_Graph->AddLayer<SliceLayer>(sliceDescriptor, name);

2166

}

2167

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2168

IConnectableLayer* NetworkImpl::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2169

const char* name)

2170

{

2171

return m_Graph->AddLayer<SoftmaxLayer>(softmaxDescriptor, name);

2172

}

2173

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2174

IConnectableLayer* NetworkImpl::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2175

const char* name)

2176

{

2177

return m_Graph->AddLayer<SplitterLayer>(splitterDescriptor, name);

2178

}

2179

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2180

IConnectableLayer* NetworkImpl::AddMaximumLayer(const char* name)

Nattapat Chaimanowong

5a4304a

2018-11-28 10:44:37 +0000

[diff] [blame]

2181

{

2182

return m_Graph->AddLayer<MaximumLayer>(name);

2183

}

2184

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2185

IConnectableLayer* NetworkImpl::AddMinimumLayer(const char* name)

Éanna Ó Catháin

20e5880

2018-12-04 10:29:06 +0000

[diff] [blame]

2186

{

2187

return m_Graph->AddLayer<MinimumLayer>(name);

2188

}

2189

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2190

IConnectableLayer* NetworkImpl::AddAdditionLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2191

{

2192

return m_Graph->AddLayer<AdditionLayer>(name);

2193

}

2194

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2195

IConnectableLayer* NetworkImpl::AddMultiplicationLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2196

{

2197

return m_Graph->AddLayer<MultiplicationLayer>(name);

2198

}

2199

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2200

IConnectableLayer* NetworkImpl::AddOutputLayer(LayerBindingId id, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2201

{

2202

return m_Graph->AddLayer<OutputLayer>(id, name);

2203

}

2204

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2205

IConnectableLayer* NetworkImpl::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2206

const ConstTensor& mean,

2207

const ConstTensor& variance,

2208

const ConstTensor& beta,

2209

const ConstTensor& gamma,

2210

const char* name)

2211

{

2212

const auto layer = m_Graph->AddLayer<BatchNormalizationLayer>(desc, name);

2213

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2214

layer->m_Mean = std::make_shared<ScopedTensorHandle>(mean);

2215

layer->m_Variance = std::make_shared<ScopedTensorHandle>(variance);

2216

layer->m_Beta = std::make_shared<ScopedTensorHandle>(beta);

2217

layer->m_Gamma = std::make_shared<ScopedTensorHandle>(gamma);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2222

IConnectableLayer* NetworkImpl::AddRankLayer(const char* name)

Finn Williams

2605b23

2020-06-10 15:53:46 +0100

[diff] [blame]

2223

{

2224

return m_Graph->AddLayer<RankLayer>(name);

2225

}

2226

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2227

IConnectableLayer* NetworkImpl::AddReduceLayer(const ReduceDescriptor& reduceDescriptor,

2228

const char* name)

Sadik Armagan

0c3ea5b

2021-02-03 09:29:30 +0000

[diff] [blame]

2229

{

2230

return m_Graph->AddLayer<ReduceLayer>(reduceDescriptor, name);

2231

}

2232

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2233

IConnectableLayer* NetworkImpl::AddResizeLayer(const ResizeDescriptor& resizeDescriptor, const char* name)

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

2234

{

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

2235

return m_Graph->AddLayer<ResizeLayer>(resizeDescriptor, name);

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

2236

}

2237

Keith Davis

3ae3f97

2021-05-21 16:33:48 +0100

[diff] [blame]

2238

IConnectableLayer* NetworkImpl::AddShapeLayer(const char* name)

2239

{

2240

return m_Graph->AddLayer<ShapeLayer>(name);

2241

}

2242

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2243

IConnectableLayer* NetworkImpl::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

2244

const char* name)

Kevin May

ce5045a

2019-10-02 14:07:47 +0100

[diff] [blame]

2245

{

2246

return m_Graph->AddLayer<InstanceNormalizationLayer>(desc, name);

2247

}

2248

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2249

IConnectableLayer* NetworkImpl::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

2250

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2251

{

Matteo Martincigh

bcd3c85

2018-09-28 14:14:12 +0100

[diff] [blame]

2252

return m_Graph->AddLayer<L2NormalizationLayer>(desc, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2253

}

2254

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2255

IConnectableLayer* NetworkImpl::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& desc,

Aron Virginas-Tar

f982dea

2019-10-11 14:07:53 +0100

[diff] [blame]

2256

const char* name)

2257

{

2258

return m_Graph->AddLayer<LogSoftmaxLayer>(desc, name);

2259

}

2260

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2261

IConnectableLayer* NetworkImpl::AddConstantLayer(const ConstTensor& input, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2262

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2263

auto layer = m_Graph->AddLayer<ConstantLayer>(name);

2264

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2265

layer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(input);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2266

2267

return layer;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2268

}

2269

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2270

IConnectableLayer* NetworkImpl::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2271

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2272

{

2273

return m_Graph->AddLayer<ReshapeLayer>(reshapeDescriptor, name);

2274

}

2275

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2276

IConnectableLayer* NetworkImpl::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

Nattapat Chaimanowong

207ef9a

2018-11-02 10:57:25 +0000

[diff] [blame]

2277

const char* name)

2278

{

2279

return m_Graph->AddLayer<SpaceToBatchNdLayer>(spaceToBatchNdDescriptor, name);

2280

}

2281

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2282

IConnectableLayer* NetworkImpl::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

Aron Virginas-Tar

972af15

2019-06-11 14:14:03 +0100

[diff] [blame]

2283

const char* name)

2284

{

2285

return m_Graph->AddLayer<SpaceToDepthLayer>(spaceToDepthDescriptor, name);

2286

}

2287

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2288

IConnectableLayer* NetworkImpl::AddFloorLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2289

{

2290

return m_Graph->AddLayer<FloorLayer>(name);

2291

}

2292

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2293

IConnectableLayer* NetworkImpl::AddLstmLayer(const LstmDescriptor& descriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2294

const LstmInputParams& params,

2295

const char* name)

2296

{

2297

const auto layer = m_Graph->AddLayer<LstmLayer>(descriptor, name);

2298

2299

//Lstm Basic Parameters

2300

layer->m_BasicParameters.m_InputToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2301

std::make_shared<ScopedTensorHandle>(*(params.m_InputToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2302

layer->m_BasicParameters.m_InputToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2303

std::make_shared<ScopedTensorHandle>(*(params.m_InputToCellWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2304

layer->m_BasicParameters.m_InputToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2305

std::make_shared<ScopedTensorHandle>(*(params.m_InputToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2306

layer->m_BasicParameters.m_RecurrentToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2307

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2308

layer->m_BasicParameters.m_RecurrentToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2309

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToCellWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2310

layer->m_BasicParameters.m_RecurrentToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2311

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2312

layer->m_BasicParameters.m_ForgetGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2313

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2314

layer->m_BasicParameters.m_CellBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2315

std::make_shared<ScopedTensorHandle>(*(params.m_CellBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2316

layer->m_BasicParameters.m_OutputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2317

std::make_shared<ScopedTensorHandle>(*(params.m_OutputGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2318

2319

//Lstm Cifg parameters

2320

if(!descriptor.m_CifgEnabled)

2321

{

2322

if(params.m_InputToInputWeights == nullptr)

2323

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2324

throw InvalidArgumentException("AddLstmLayer: Input To Input Weights cannot be NULL "

2325

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2326

}

2327

if(params.m_RecurrentToInputWeights == nullptr)

2328

{

2329

throw InvalidArgumentException(

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2330

"AddLstmLayer: Recurrent To Input Weights cannot be NULL "

2331

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2332

}

2333

if(params.m_InputGateBias == nullptr)

2334

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2335

throw InvalidArgumentException("AddLstmLayer: Input Gate Bias cannot be NULL "

2336

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2337

}

2338

layer->m_CifgParameters.m_InputToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2339

std::make_shared<ScopedTensorHandle>(*(params.m_InputToInputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2340

layer->m_CifgParameters.m_RecurrentToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2341

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToInputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2342

layer->m_CifgParameters.m_InputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2343

std::make_shared<ScopedTensorHandle>(*(params.m_InputGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2344

}

2345

2346

//Lstm projection parameters

2347

if(descriptor.m_ProjectionEnabled)

2348

{

2349

if(params.m_ProjectionWeights == nullptr)

2350

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2351

throw InvalidArgumentException("AddLstmLayer: Projection Weights cannot be NULL "

2352

"when projection is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2353

}

2354

layer->m_ProjectionParameters.m_ProjectionWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2355

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2356

if(params.m_ProjectionBias != nullptr)

2357

{

2358

layer->m_ProjectionParameters.m_ProjectionBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2359

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

}

}

//Lstm Peephole params

2364

if(descriptor.m_PeepholeEnabled)

2365

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2366

if(!descriptor.m_CifgEnabled)

2367

{

2368

if(params.m_CellToInputWeights == nullptr)

2369

{

2370

throw InvalidArgumentException("AddLstmLayer: Cell To Input Weights cannot be NULL "

2371

"when Peephole is enabled and CIFG disabled.");

2372

}

2373

2374

layer->m_PeepholeParameters.m_CellToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2375

std::make_shared<ScopedTensorHandle>(*(params.m_CellToInputWeights));

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2376

}

2377

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2378

if(params.m_CellToForgetWeights == nullptr)

2379

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2380

throw InvalidArgumentException("AddLstmLayer: Cell To Forget Weights cannot be NULL "

2381

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2382

}

2383

if(params.m_CellToOutputWeights == nullptr)

2384

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2385

throw InvalidArgumentException("AddLstmLayer: Cell To Output Weights cannot be NULL "

2386

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2387

}

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2388

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2389

layer->m_PeepholeParameters.m_CellToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2390

std::make_shared<ScopedTensorHandle>(*(params.m_CellToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2391

layer->m_PeepholeParameters.m_CellToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2392

std::make_shared<ScopedTensorHandle>(*(params.m_CellToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2393

}

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2394

2395

//Lstm Layer Normalization params

2396

if(descriptor.m_LayerNormEnabled)

2397

{

2398

if(!descriptor.m_CifgEnabled)

2399

{

2400

if(params.m_InputLayerNormWeights == nullptr)

2401

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2402

throw InvalidArgumentException("AddLstmLayer: Input layer normalization weights cannot be NULL "

2403

"when layer normalization is enabled and CIFG disabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2404

}

2405

layer->m_LayerNormParameters.m_InputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2406

std::make_shared<ScopedTensorHandle>(*(params.m_InputLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2407

}

2408

2409

if(params.m_ForgetLayerNormWeights == nullptr)

2410

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2411

throw InvalidArgumentException("AddLstmLayer: Forget layer normalization weights cannot be NULL "

2412

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2413

}

2414

if(params.m_CellLayerNormWeights == nullptr)

2415

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2416

throw InvalidArgumentException("AddLstmLayer: Cell layer normalization weights cannot be NULL "

2417

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2418

}

2419

if(params.m_OutputLayerNormWeights == nullptr)

2420

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2421

throw InvalidArgumentException("AddLstmLayer: Output layer normalization weights cannot be NULL "

2422

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2423

}

2424

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2425

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2426

layer->m_LayerNormParameters.m_CellLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2427

std::make_shared<ScopedTensorHandle>(*(params.m_CellLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2428

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2429

std::make_shared<ScopedTensorHandle>(*(params.m_OutputLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2430

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2434

IConnectableLayer* NetworkImpl::AddDivisionLayer(const char* name)

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

2435

{

2436

return m_Graph->AddLayer<DivisionLayer>(name);

2437

}

2438

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2439

IConnectableLayer* NetworkImpl::AddSubtractionLayer(const char* name)

David Beck

1952622

2018-09-12 16:00:08 +0100

[diff] [blame]

2440

{

2441

return m_Graph->AddLayer<SubtractionLayer>(name);

2442

}

2443

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2444

IConnectableLayer* NetworkImpl::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

narpra01

32b9046

2018-09-13 11:07:48 +0100

[diff] [blame]

2445

{

2446

return m_Graph->AddLayer<MeanLayer>(meanDescriptor,name);

2447

}

2448

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2449

IConnectableLayer* NetworkImpl::AddPadLayer(const PadDescriptor& padDescriptor, const char* name)

Mohamed Nour Abouelseoud

5662c20

2018-09-24 13:30:09 +0100

[diff] [blame]

2450

{

2451

return m_Graph->AddLayer<PadLayer>(padDescriptor,name);

2452

}

2453

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2454

IConnectableLayer *NetworkImpl::AddQuantizeLayer(const char *name)

Derek Lamberti

a9cca6a

2019-03-25 15:41:58 +0000

[diff] [blame]

2455

{

2456

return m_Graph->AddLayer<QuantizeLayer>(name);

2457

}

2458

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2459

IConnectableLayer* NetworkImpl::AddDequantizeLayer(const char* name)

Nattapat Chaimanowong

e4294fd

2019-03-28 09:56:53 +0000

[diff] [blame]

2460

{

2461

return m_Graph->AddLayer<DequantizeLayer>(name);

2462

}

2463

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2464

IConnectableLayer* NetworkImpl::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

Teresa Charlin

2022-04-12 22:07:09 +0100

[diff] [blame]

2465

const char* name)

Conor Kennedy

430b5d8

2018-11-14 15:28:28 +0000

[diff] [blame]

2466

{

2467

return m_Graph->AddLayer<StridedSliceLayer>(stridedSliceDescriptor, name);

2468

}

2469

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2470

IConnectableLayer* NetworkImpl::AddGatherLayer(const GatherDescriptor& gatherDescriptor,

Teresa Charlin

2022-04-12 22:07:09 +0100

[diff] [blame]

2471

const char* name)

Teresa Charlin

5266473

2020-06-29 16:27:03 +0100

[diff] [blame]

2472

{

2473

return m_Graph->AddLayer<GatherLayer>(gatherDescriptor, name);

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

2474

}

2475

Teresa Charlin

2022-04-12 22:07:09 +0100

[diff] [blame]

2476

IConnectableLayer* NetworkImpl::AddGatherNdLayer(const char* name)

2477

{

2478

return m_Graph->AddLayer<GatherNdLayer>(name);

2479

}

2480

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2481

IConnectableLayer* NetworkImpl::AddMergeLayer(const char* name)

Nattapat Chaimanowong

1f88630

2019-04-05 13:37:19 +0100

[diff] [blame]

2482

{

2483

return m_Graph->AddLayer<MergeLayer>(name);

2484

}

2485

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2486

IConnectableLayer* NetworkImpl::AddSwitchLayer(const char* name)

Sadik Armagan

eff363d

2019-04-05 15:25:46 +0100

[diff] [blame]

2487

{

2488

return m_Graph->AddLayer<SwitchLayer>(name);

2489

}

2490

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2491

IConnectableLayer* NetworkImpl::AddPreluLayer(const char* name)

Matteo Martincigh

0e406ee

2019-06-12 15:42:18 +0100

[diff] [blame]

2492

{

2493

return m_Graph->AddLayer<PreluLayer>(name);

2494

}

2495

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2496

IConnectableLayer* NetworkImpl::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

2497

const ConstTensor& weights,

2498

const Optional<ConstTensor>& biases,

2499

const char* name)

2500

{

2501

if (descriptor.m_BiasEnabled && !biases.has_value())

2502

{

2503

throw InvalidArgumentException("AddTransposeConvolution2dLayer: Biases cannot be empty");

2504

}

2505

2506

const auto layer = m_Graph->AddLayer<TransposeConvolution2dLayer>(descriptor, name);

2507

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2508

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

2509

2510

if (descriptor.m_BiasEnabled)

2511

{

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2512

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2518

IConnectableLayer* NetworkImpl::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

Mike Kelly

c9ea45a

2020-02-28 18:11:58 +0000

[diff] [blame]

2519

const char* name)

2520

{

2521

return m_Graph->AddLayer<TransposeLayer>(transposeDescriptor, name);

2522

}

2523

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2524

IConnectableLayer* NetworkImpl::AddStackLayer(const StackDescriptor& stackDescriptor,

Matthew Jackson

2b8c1da

2019-07-04 14:59:16 +0100

[diff] [blame]

2525

const char* name)

2526

{

2527

return m_Graph->AddLayer<StackLayer>(stackDescriptor, name);

2528

}

2529

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

2530

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2531

IConnectableLayer* NetworkImpl::AddStandInLayer(const StandInDescriptor& desc,

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

2532

const char* name)

2533

{

2534

return m_Graph->AddLayer<StandInLayer>(desc, name);

2535

}

2536

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2537

IConnectableLayer* NetworkImpl::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2538

const char* name)

2539

{

2540

const auto layer = m_Graph->AddLayer<QuantizedLstmLayer>(name);

2541

2542

// InputToX weights

2543

layer->m_QuantizedLstmParameters.m_InputToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2544

std::make_shared<ScopedTensorHandle>(params.GetInputToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2545

layer->m_QuantizedLstmParameters.m_InputToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2546

std::make_shared<ScopedTensorHandle>(params.GetInputToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2547

layer->m_QuantizedLstmParameters.m_InputToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2548

std::make_shared<ScopedTensorHandle>(params.GetInputToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2549

layer->m_QuantizedLstmParameters.m_InputToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2550

std::make_shared<ScopedTensorHandle>(params.GetInputToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2551

2552

// RecurrentToX weights

2553

layer->m_QuantizedLstmParameters.m_RecurrentToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2554

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2555

layer->m_QuantizedLstmParameters.m_RecurrentToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2556

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2557

layer->m_QuantizedLstmParameters.m_RecurrentToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2558

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2559

layer->m_QuantizedLstmParameters.m_RecurrentToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2560

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2561

2562

// Bias

2563

layer->m_QuantizedLstmParameters.m_InputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2564

std::make_shared<ScopedTensorHandle>(params.GetInputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2565

layer->m_QuantizedLstmParameters.m_ForgetGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2566

std::make_shared<ScopedTensorHandle>(params.GetForgetGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2567

layer->m_QuantizedLstmParameters.m_CellBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2568

std::make_shared<ScopedTensorHandle>(params.GetCellBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2569

layer->m_QuantizedLstmParameters.m_OutputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2570

std::make_shared<ScopedTensorHandle>(params.GetOutputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2575

IConnectableLayer* NetworkImpl::AddQLstmLayer(const QLstmDescriptor& descriptor,

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2576

const LstmInputParams& params,

2577

const char* name)

2578

{

2579

const auto layer = m_Graph->AddLayer<QLstmLayer>(descriptor, name);

2580

2581

// QLstm Basic Parameters

2582

layer->m_BasicParameters.m_InputToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2583

std::make_shared<ScopedTensorHandle>(*(params.m_InputToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2584

layer->m_BasicParameters.m_InputToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2585

std::make_shared<ScopedTensorHandle>(*(params.m_InputToCellWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2586

layer->m_BasicParameters.m_InputToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2587

std::make_shared<ScopedTensorHandle>(*(params.m_InputToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2588

layer->m_BasicParameters.m_RecurrentToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2589

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2590

layer->m_BasicParameters.m_RecurrentToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2591

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToCellWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2592

layer->m_BasicParameters.m_RecurrentToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2593

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2594

layer->m_BasicParameters.m_ForgetGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2595

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2596

layer->m_BasicParameters.m_CellBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2597

std::make_shared<ScopedTensorHandle>(*(params.m_CellBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2598

layer->m_BasicParameters.m_OutputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2599

std::make_shared<ScopedTensorHandle>(*(params.m_OutputGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2600

2601

// QLstm Cifg parameters

2602

if(!descriptor.m_CifgEnabled)

2603

{

2604

if(params.m_InputToInputWeights == nullptr)

2605

{

2606

throw InvalidArgumentException("AddQLstmLayer: Input To Input Weights cannot be NULL");

2607

}

2608

2609

if(params.m_RecurrentToInputWeights == nullptr)

2610

{

2611

throw InvalidArgumentException(

2612

"AddQLstmLayer: Recurrent To Input Weights cannot be NULL");

2613

}

2614

2615

if(params.m_InputGateBias == nullptr)

2616

{

2617

throw InvalidArgumentException("AddQLstmLayer: Input Gate Bias cannot be NULL");

2618

}

2619

2620

layer->m_CifgParameters.m_InputToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2621

std::make_shared<ScopedTensorHandle>(*(params.m_InputToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2622

layer->m_CifgParameters.m_RecurrentToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2623

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2624

layer->m_CifgParameters.m_InputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2625

std::make_shared<ScopedTensorHandle>(*(params.m_InputGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2626

}

2627

2628

// QLstm Projection parameters

2629

if(descriptor.m_ProjectionEnabled)

2630

{

2631

if(params.m_ProjectionWeights == nullptr)

2632

{

2633

throw InvalidArgumentException("AddQLstmLayer: Projection Weights cannot be NULL");

2634

}

2635

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2636

layer->m_ProjectionParameters.m_ProjectionWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2637

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionWeights));

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

2638

2639

// Projection bias is optional even if projection is enabled

2640

if(params.m_ProjectionWeights != nullptr)

2641

{

2642

layer->m_ProjectionParameters.m_ProjectionBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2643

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionBias));

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

2644

}

2645

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2646

}

2647

2648

// QLstm Peephole params

2649

if(descriptor.m_PeepholeEnabled)

2650

{

2651

if(params.m_CellToForgetWeights == nullptr)

2652

{

2653

throw InvalidArgumentException("AddQLstmLayer: Cell To Forget Weights cannot be NULL");

2654

}

2655

2656

if(params.m_CellToOutputWeights == nullptr)

2657

{

2658

throw InvalidArgumentException("AddQLstmLayer: Cell To Output Weights cannot be NULL");

2659

}

2660

2661

if(!descriptor.m_CifgEnabled)

2662

{

2663

if(params.m_CellToInputWeights == nullptr)

2664

{

2665

throw InvalidArgumentException("AddQLstmLayer: Cell To Input Weights cannot be NULL");

2666

}

2667

2668

layer->m_PeepholeParameters.m_CellToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2669

std::make_shared<ScopedTensorHandle>(*(params.m_CellToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2670

}

2671

2672

layer->m_PeepholeParameters.m_CellToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2673

std::make_shared<ScopedTensorHandle>(*(params.m_CellToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2674

layer->m_PeepholeParameters.m_CellToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2675

std::make_shared<ScopedTensorHandle>(*(params.m_CellToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2676

}

2677

2678

// QLstm Layer Normalization params

2679

if(descriptor.m_LayerNormEnabled)

2680

{

2681

if(params.m_ForgetLayerNormWeights == nullptr)

2682

{

2683

throw InvalidArgumentException("AddQLstmLayer: Forget layer normalization weights cannot be NULL");

2684

}

2685

2686

if(params.m_CellLayerNormWeights == nullptr)

2687

{

2688

throw InvalidArgumentException("AddQLstmLayer: Cell layer normalization weights cannot be NULL");

2689

}

2690

2691

if(params.m_OutputLayerNormWeights == nullptr)

2692

{

2693

throw InvalidArgumentException("AddQLstmLayer: Output layer normalization weights cannot be NULL");

2694

}

2695

2696

if(!descriptor.m_CifgEnabled)

2697

{

2698

if(params.m_InputLayerNormWeights == nullptr)

2699

{

2700

throw InvalidArgumentException("AddQLstmLayer: Input layer normalization weights cannot be NULL");

2701

}

2702

2703

layer->m_LayerNormParameters.m_InputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2704

std::make_shared<ScopedTensorHandle>(*(params.m_InputLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2705

}

2706

2707

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2708

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2709

layer->m_LayerNormParameters.m_CellLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2710

std::make_shared<ScopedTensorHandle>(*(params.m_CellLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2711

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2712

std::make_shared<ScopedTensorHandle>(*(params.m_OutputLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2717

IConnectableLayer* NetworkImpl::AddLogicalBinaryLayer(const LogicalBinaryDescriptor& logicalBinaryDescriptor,

Narumol Prangnawarat

8ed39ae

2021-07-15 16:16:25 +0100

[diff] [blame]

2718

const char* name)

James Conroy

aba90cd

2020-11-06 16:28:18 +0000

[diff] [blame]

2719

{

2720

return m_Graph->AddLayer<LogicalBinaryLayer>(logicalBinaryDescriptor, name);

2721

}

2722

Narumol Prangnawarat

8ed39ae

2021-07-15 16:16:25 +0100

[diff] [blame]

2723

IConnectableLayer* NetworkImpl::AddUnidirectionalSequenceLstmLayer(

2724

const UnidirectionalSequenceLstmDescriptor& descriptor,

2725

const LstmInputParams& params,

2726

const char* name)

2727

{

2728

const auto layer = m_Graph->AddLayer<UnidirectionalSequenceLstmLayer>(descriptor, name);

2729

2730

//Lstm Basic Parameters

2731

layer->m_BasicParameters.m_InputToForgetWeights =

2732

std::make_shared<ScopedTensorHandle>(*(params.m_InputToForgetWeights));

2733

layer->m_BasicParameters.m_InputToCellWeights =

2734

std::make_shared<ScopedTensorHandle>(*(params.m_InputToCellWeights));

2735

layer->m_BasicParameters.m_InputToOutputWeights =

2736

std::make_shared<ScopedTensorHandle>(*(params.m_InputToOutputWeights));

2737

layer->m_BasicParameters.m_RecurrentToForgetWeights =

2738

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToForgetWeights));

2739

layer->m_BasicParameters.m_RecurrentToCellWeights =

2740

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToCellWeights));

2741

layer->m_BasicParameters.m_RecurrentToOutputWeights =

2742

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToOutputWeights));

2743

layer->m_BasicParameters.m_ForgetGateBias =

2744

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetGateBias));

2745

layer->m_BasicParameters.m_CellBias =

2746

std::make_shared<ScopedTensorHandle>(*(params.m_CellBias));

2747

layer->m_BasicParameters.m_OutputGateBias =

2748

std::make_shared<ScopedTensorHandle>(*(params.m_OutputGateBias));

2749

2750

//Lstm Cifg parameters

2751

if(!descriptor.m_CifgEnabled)

2752

{

2753

if(params.m_InputToInputWeights == nullptr)

2754

{

2755

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Input To Input Weights cannot be NULL "

2756

"when CIFG is disabled.");

2757

}

2758

if(params.m_RecurrentToInputWeights == nullptr)

2759

{

2760

throw InvalidArgumentException(

2761

"AddUnidirectionalSequenceLstmLayer: Recurrent To Input Weights cannot be NULL "

2762

"when CIFG is disabled.");

2763

}

2764

if(params.m_InputGateBias == nullptr)

2765

{

2766

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Input Gate Bias cannot be NULL "

2767

"when CIFG is disabled.");

2768

}

2769

layer->m_CifgParameters.m_InputToInputWeights =

2770

std::make_shared<ScopedTensorHandle>(*(params.m_InputToInputWeights));

2771

layer->m_CifgParameters.m_RecurrentToInputWeights =

2772

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToInputWeights));

2773

layer->m_CifgParameters.m_InputGateBias =

2774

std::make_shared<ScopedTensorHandle>(*(params.m_InputGateBias));

2775

}

2776

2777

//Lstm projection parameters

2778

if(descriptor.m_ProjectionEnabled)

2779

{

2780

if(params.m_ProjectionWeights == nullptr)

2781

{

2782

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Projection Weights cannot be NULL "

2783

"when projection is enabled.");

2784

}

2785

layer->m_ProjectionParameters.m_ProjectionWeights =

2786

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionWeights));

2787

if(params.m_ProjectionBias != nullptr)

2788

{

2789

layer->m_ProjectionParameters.m_ProjectionBias =

2790

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionBias));

}

}

//Lstm Peephole params

2795

if(descriptor.m_PeepholeEnabled)

2796

{

2797

if(!descriptor.m_CifgEnabled)

2798

{

2799

if(params.m_CellToInputWeights == nullptr)

2800

{

2801

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell To Input Weights "

2802

"cannot be NULL when Peephole is enabled and CIFG disabled.");

2803

}

2804

2805

layer->m_PeepholeParameters.m_CellToInputWeights =

2806

std::make_shared<ScopedTensorHandle>(*(params.m_CellToInputWeights));

2807

}

2808

2809

if(params.m_CellToForgetWeights == nullptr)

2810

{

2811

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell To Forget Weights cannot be NULL "

2812

"when Peephole is enabled.");

2813

}

2814

if(params.m_CellToOutputWeights == nullptr)

2815

{

2816

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell To Output Weights cannot be NULL "

2817

"when Peephole is enabled.");

2818

}

2819

2820

layer->m_PeepholeParameters.m_CellToForgetWeights =

2821

std::make_shared<ScopedTensorHandle>(*(params.m_CellToForgetWeights));

2822

layer->m_PeepholeParameters.m_CellToOutputWeights =

2823

std::make_shared<ScopedTensorHandle>(*(params.m_CellToOutputWeights));

2824

}

2825

2826

//Lstm Layer Normalization params

2827

if(descriptor.m_LayerNormEnabled)

2828

{

2829

if(!descriptor.m_CifgEnabled)

2830

{

2831

if(params.m_InputLayerNormWeights == nullptr)

2832

{

2833

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Input layer normalization weights "

2834

"cannot be NULL when layer normalization is enabled and CIFG disabled.");

2835

}

2836

layer->m_LayerNormParameters.m_InputLayerNormWeights =

2837

std::make_shared<ScopedTensorHandle>(*(params.m_InputLayerNormWeights));

2838

}

2839

2840

if(params.m_ForgetLayerNormWeights == nullptr)

2841

{

2842

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Forget layer normalization weights "

2843

"cannot be NULL when layer normalization is enabled.");

2844

}

2845

if(params.m_CellLayerNormWeights == nullptr)

2846

{

2847

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell layer normalization weights "

2848

"cannot be NULL when layer normalization is enabled.");

2849

}

2850

if(params.m_OutputLayerNormWeights == nullptr)

2851

{

2852

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Output layer normalization weights "

2853

"cannot be NULL when layer normalization is enabled.");

2854

}

2855

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

2856

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetLayerNormWeights));

2857

layer->m_LayerNormParameters.m_CellLayerNormWeights =

2858

std::make_shared<ScopedTensorHandle>(*(params.m_CellLayerNormWeights));

2859

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

2860

std::make_shared<ScopedTensorHandle>(*(params.m_OutputLayerNormWeights));

}

return layer;

}

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

2865

IConnectableLayer* NetworkImpl::AddPrecompiledLayer(const PreCompiledDescriptor& preCompiledDescriptor,

Cathal Corbett

3ea0107

2022-01-06 10:29:43 +0000

[diff] [blame]

2866

CompiledBlobPtr compiledBlobPtr,

Cathal Corbett

cbfd718

2021-12-15 17:12:59 +0000

[diff] [blame]

2867

const Optional<BackendId>& backend,

2868

const char* name)

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

2869

{

2870

// Method use is for backend users.

Cathal Corbett

cbfd718

2021-12-15 17:12:59 +0000

[diff] [blame]

2871

PreCompiledLayer* layer;

2872

if (name)

2873

{

2874

layer = m_Graph->AddLayer<PreCompiledLayer>(preCompiledDescriptor, name);

}

else

{

layer = m_Graph->AddLayer<PreCompiledLayer>(preCompiledDescriptor, "pre-compiled");

2879

}

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

2880

2881

// Assign the pre-compiled object to layer

2882

// Pass only one compiled network, Arm NN does not handle multiple

2883

// pre-compiled objects in a single pre-compiled layer currently

2884

layer->SetPreCompiledObject(std::move(compiledBlobPtr));

2885

2886

if (backend.has_value())

2887

{

2888

layer->SetBackendId(backend.value());

2889

}

Francis Murtagh

9d74ba6

2022-01-19 16:31:58 +0000

[diff] [blame]

2890

else if (layer->GetBackendHint().has_value())

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

2891

{

2892

layer->SetBackendId(layer->GetBackendHint().value());

}

return layer;

}

Jan Eilers

2021-09-24 15:45:46 +0100

[diff] [blame]

2898

ARMNN_NO_DEPRECATE_WARN_BEGIN

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2899

void NetworkImpl::Accept(ILayerVisitor& visitor) const

Mike Kelly

8c1701a

2019-02-11 17:01:27 +0000

[diff] [blame]

2900

{

2901

for (auto layer : GetGraph())

2902

{

2903

layer->Accept(visitor);

2904

};

2905

}

Jan Eilers

1b2654f

2021-09-24 15:45:46 +0100

[diff] [blame]

2906

ARMNN_NO_DEPRECATE_WARN_END

Mike Kelly

8c1701a

2019-02-11 17:01:27 +0000

[diff] [blame]

2907

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2908

void NetworkImpl::ExecuteStrategy(IStrategy& strategy) const

Finn Williams

b454c5c

2021-02-09 15:56:23 +0000

[diff] [blame]

2909

{

2910

for (auto layer : GetGraph())

2911

{

2912

layer->ExecuteStrategy(strategy);

};

}

Mike Kelly

2021-06-27 22:39:21 +0100

[diff] [blame]

2916

OptimizedNetworkImpl::OptimizedNetworkImpl(const OptimizedNetworkImpl& other, const ModelOptions& modelOptions)

2917

: m_Graph(new Graph(*other.m_Graph.get()))

Jim Flynn

af94772

2022-03-02 11:04:47 +0000

[diff] [blame]

2918

, m_Guid(arm::pipe::IProfilingService::GetNextGuid())

Mike Kelly

0d677db

2021-06-27 22:39:21 +0100

[diff] [blame]

2919

, m_ModelOptions(modelOptions)

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2923

OptimizedNetworkImpl::OptimizedNetworkImpl(std::unique_ptr<Graph> graph)

Jim Flynn

af94772

2022-03-02 11:04:47 +0000

[diff] [blame]

2924

: m_Graph(std::move(graph)), m_Guid(arm::pipe::IProfilingService::GetNextGuid())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2928

OptimizedNetworkImpl::OptimizedNetworkImpl(std::unique_ptr<Graph> graph, const ModelOptions& modelOptions)

Jim Flynn

af94772

2022-03-02 11:04:47 +0000

[diff] [blame]

2929

: m_Graph(std::move(graph)), m_Guid(arm::pipe::IProfilingService::GetNextGuid()), m_ModelOptions(modelOptions)

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2933

OptimizedNetworkImpl::~OptimizedNetworkImpl()

telsoa01