Blame - src/armnn/Network.cpp - ml/armnn

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

5

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

6

#include "Network.hpp"

7

#include "Graph.hpp"

8

#include "Layer.hpp"

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

9

#include "DeviceSpec.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

10

#include "Optimizer.hpp"

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

11

#include "SubgraphViewSelector.hpp"

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

12

#include "BackendSettings.hpp"

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

13

#include "optimizations/All.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

14

Colm Donelan

0c47974

2021-12-10 12:43:54 +0000

[diff] [blame]

15

#include <armnn/backends/TensorHandle.hpp>

16

#include <armnn/backends/WorkloadFactory.hpp>

Matteo Martincigh

e5b8eb9

2019-11-28 15:45:42 +0000

[diff] [blame]

17

#include <armnn/backends/IBackendInternal.hpp>

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

18

#include <backendsCommon/TensorHandleFactoryRegistry.hpp>

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

19

20

#include <armnn/Exceptions.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

21

#include <armnn/Utils.hpp>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

22

#include <armnn/TypesUtils.hpp>

Matteo Martincigh

c601aa6

2019-10-29 15:03:22 +0000

[diff] [blame]

23

#include <armnn/BackendRegistry.hpp>

Matthew Bentham

f48afc6

2020-01-15 17:55:08 +0000

[diff] [blame]

24

#include <armnn/Logging.hpp>

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

25

#include <armnn/utility/Assert.hpp>

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

26

#include <armnn/utility/IgnoreUnused.hpp>

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

27

#include <armnn/utility/PolymorphicDowncast.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

28

Jim Flynn

2776183

2022-03-20 21:52:17 +0000

[diff] [blame]

29

#include <client/include/IProfilingService.hpp>

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

30

Nikhil Raj

77fe76b

2021-06-09 14:55:32 +0100

[diff] [blame]

31

#include <common/include/ProfilingGuid.hpp>

32

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

33

#include <fmt/format.h>

34

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

#include <fcntl.h>

#include <algorithm>

#include <fstream>

#include <memory>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

39

#include <vector>

40

#include <algorithm>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

41

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

namespace armnn

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

45

INetwork::INetwork(NetworkOptions networkOptions) : pNetworkImpl(new NetworkImpl(networkOptions)) {}

46

47

INetwork::~INetwork() = default;

48

49

Status INetwork::PrintGraph()

50

{

51

return pNetworkImpl->PrintGraph();

52

}

53

54

IConnectableLayer* INetwork::AddInputLayer(LayerBindingId id, const char* name)

55

{

56

return pNetworkImpl->AddInputLayer(id, name);

}

IConnectableLayer* INetwork::AddArgMinMaxLayer(const ArgMinMaxDescriptor& desc,

61

const char* name)

62

{

63

return pNetworkImpl->AddArgMinMaxLayer(desc, name);

64

}

65

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

66

IConnectableLayer* INetwork::AddCastLayer(const char* name)

67

{

68

return pNetworkImpl->AddCastLayer(name);

69

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

70

71

IConnectableLayer* INetwork::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

72

const char* name)

73

{

74

return pNetworkImpl->AddComparisonLayer(comparisonDescriptor, name);

}

IConnectableLayer* INetwork::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

79

const char* name)

80

{

81

return pNetworkImpl->AddConcatLayer(concatDescriptor, name);

}

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

86

const char* name)

87

{

Keith Davis

2022-04-07 11:32:00 +0100

[diff] [blame]

88

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor, name);

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

89

}

90

Keith Davis

2022-04-07 11:32:00 +0100

[diff] [blame]

91

ARMNN_NO_DEPRECATE_WARN_BEGIN

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

92

IConnectableLayer* INetwork::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

Keith Davis

721e629

2022-05-17 10:06:53 +0100

[diff] [blame]

93

const ConstTensor& weights,

94

const Optional<ConstTensor>& biases,

95

const char* name)

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

96

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

97

return pNetworkImpl->AddConvolution2dLayer(convolution2dDescriptor,

98

weights,

99

armnn::Optional<ConstTensor>(biases),

100

name);

101

}

Keith Davis

2022-04-07 11:32:00 +0100

[diff] [blame]

102

ARMNN_NO_DEPRECATE_WARN_END

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

103

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

104

IConnectableLayer* INetwork::AddConvolution3dLayer(const Convolution3dDescriptor& convolution3dDescriptor,

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

105

const char* name)

106

{

Matthew Sloyan

5d7b0a3

2021-10-18 13:07:49 +0100

[diff] [blame]

107

return pNetworkImpl->AddConvolution3dLayer(convolution3dDescriptor, name);

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

111

IConnectableLayer* INetwork::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

112

const char* name)

113

{

114

return pNetworkImpl->AddDepthToSpaceLayer(depthToSpaceDescriptor, name);

}

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

119

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

Cathal Corbett

2022-04-14 17:55:11 +0100

[diff] [blame]

120

const char* name)

121

{

122

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, name);

}

ARMNN_NO_DEPRECATE_WARN_BEGIN

127

IConnectableLayer* INetwork::AddDepthwiseConvolution2dLayer(

128

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

129

const ConstTensor& weights,

130

const Optional<ConstTensor>& biases,

131

const char* name)

132

{

133

return pNetworkImpl->AddDepthwiseConvolution2dLayer(convolution2dDescriptor, weights, biases, name);

134

}

Cathal Corbett

2022-04-14 17:55:11 +0100

[diff] [blame]

135

ARMNN_NO_DEPRECATE_WARN_END

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

136

137

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

138

IConnectableLayer* INetwork::AddDequantizeLayer(const char* name)

139

{

140

return pNetworkImpl->AddDequantizeLayer(name);

}

IConnectableLayer* INetwork::AddDetectionPostProcessLayer(

145

const DetectionPostProcessDescriptor& descriptor,

146

const ConstTensor& anchors,

147

const char* name)

148

{

149

return pNetworkImpl->AddDetectionPostProcessLayer(descriptor, anchors, name);

}

IConnectableLayer* INetwork::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

154

const char* name)

155

{

156

return pNetworkImpl->AddElementwiseUnaryLayer(elementwiseUnaryDescriptor, name);

}

IConnectableLayer* INetwork::AddFillLayer(const FillDescriptor& fillDescriptor,

161

const char* name)

162

{

163

return pNetworkImpl->AddFillLayer(fillDescriptor, name);

164

}

165

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

166

IConnectableLayer* INetwork::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

167

const char* name)

168

{

169

return pNetworkImpl->AddFullyConnectedLayer(fullyConnectedDescriptor, name);

170

}

171

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

172

IConnectableLayer* INetwork::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

173

const char* name)

174

{

175

return pNetworkImpl->AddPermuteLayer(permuteDescriptor, name);

176

}

177

178

IConnectableLayer* INetwork::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

179

const char* name)

180

{

181

return pNetworkImpl->AddBatchToSpaceNdLayer(batchToSpaceNdDescriptor, name);

182

}

183

184

IConnectableLayer* INetwork::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

185

const char* name)

186

{

187

return pNetworkImpl->AddPooling2dLayer(pooling2dDescriptor, name);

188

}

189

Tamás Nyíri

7b885b3

2021-10-26 14:47:57 +0100

[diff] [blame]

190

IConnectableLayer* INetwork::AddPooling3dLayer(const Pooling3dDescriptor& pooling3dDescriptor,

191

const char* name)

192

{

193

return pNetworkImpl->AddPooling3dLayer(pooling3dDescriptor, name);

194

}

195

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

196

IConnectableLayer* INetwork::AddPrecompiledLayer(const PreCompiledDescriptor& preCompiledDescriptor,

Cathal Corbett

3ea0107

2022-01-06 10:29:43 +0000

[diff] [blame]

197

CompiledBlobPtr compiledBlobPtr,

Cathal Corbett

cbfd718

2021-12-15 17:12:59 +0000

[diff] [blame]

198

const Optional<BackendId>& backend,

199

const char* name)

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

200

{

Cathal Corbett

3ea0107

2022-01-06 10:29:43 +0000

[diff] [blame]

201

return pNetworkImpl->AddPrecompiledLayer(preCompiledDescriptor, std::move(compiledBlobPtr), backend, name);

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

202

}

203

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

204

IConnectableLayer* INetwork::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

205

const char* name)

206

{

207

return pNetworkImpl->AddActivationLayer(activationDescriptor, name);

208

}

209

210

IConnectableLayer* INetwork::AddNormalizationLayer(const NormalizationDescriptor& normalizationDescriptor,

211

const char* name)

212

{

213

return pNetworkImpl->AddNormalizationLayer(normalizationDescriptor, name);

214

}

215

216

IConnectableLayer* INetwork::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

217

{

218

return pNetworkImpl->AddSliceLayer(sliceDescriptor, name);

219

}

220

IConnectableLayer* INetwork::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

221

const char* name)

222

{

223

return pNetworkImpl->AddSoftmaxLayer(softmaxDescriptor, name);

224

}

225

226

IConnectableLayer* INetwork::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

227

const char* name)

228

{

229

return pNetworkImpl->AddSplitterLayer(splitterDescriptor, name);

230

}

231

232

IConnectableLayer* INetwork::AddMergeLayer(const char* name)

233

{

234

return pNetworkImpl->AddMergeLayer(name);

235

}

236

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

237

IConnectableLayer* INetwork::AddAdditionLayer(const char* name)

238

{

239

return pNetworkImpl->AddAdditionLayer(name);

240

}

241

242

IConnectableLayer* INetwork::AddMultiplicationLayer(const char* name)

243

{

244

return pNetworkImpl->AddMultiplicationLayer(name);

245

}

246

247

IConnectableLayer* INetwork::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

248

const ConstTensor& mean,

249

const ConstTensor& variance,

250

const ConstTensor& beta,

251

const ConstTensor& gamma,

252

const char* name)

253

{

254

return pNetworkImpl->AddBatchNormalizationLayer(desc, mean, variance, beta, gamma, name);

255

}

256

257

IConnectableLayer* INetwork::AddRankLayer(const char* name)

258

{

259

return pNetworkImpl->AddRankLayer(name);

260

}

261

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

262

IConnectableLayer* INetwork::AddResizeLayer(const ResizeDescriptor& resizeDescriptor,

263

const char* name)

264

{

265

return pNetworkImpl->AddResizeLayer(resizeDescriptor, name);

266

}

267

268

IConnectableLayer* INetwork::AddReduceLayer(const ReduceDescriptor& reduceDescriptor,

269

const char* name)

270

{

271

return pNetworkImpl->AddReduceLayer(reduceDescriptor, name);

272

}

273

274

IConnectableLayer* INetwork::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

275

const char* name)

276

{

277

return pNetworkImpl->AddInstanceNormalizationLayer(desc, name);

278

}

279

280

IConnectableLayer* INetwork::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

281

const char* name)

282

{

283

return pNetworkImpl->AddL2NormalizationLayer(desc, name);

284

}

285

286

IConnectableLayer* INetwork::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& logSoftmaxDescriptor,

287

const char* name)

288

{

289

return pNetworkImpl->AddLogSoftmaxLayer(logSoftmaxDescriptor, name);

290

}

291

292

IConnectableLayer* INetwork::AddConstantLayer(const ConstTensor& input,

293

const char* name)

294

{

295

return pNetworkImpl->AddConstantLayer(input, name);

296

}

297

298

IConnectableLayer* INetwork::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

299

const char* name)

300

{

301

return pNetworkImpl->AddReshapeLayer(reshapeDescriptor, name);

302

}

303

304

IConnectableLayer* INetwork::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

305

const char* name)

306

{

307

return pNetworkImpl->AddSpaceToBatchNdLayer(spaceToBatchNdDescriptor, name);

308

}

309

310

IConnectableLayer* INetwork::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

311

const char* name)

312

{

313

return pNetworkImpl->AddSpaceToDepthLayer(spaceToDepthDescriptor, name);

314

}

315

316

IConnectableLayer* INetwork::AddFloorLayer(const char* name)

317

{

318

return pNetworkImpl->AddFloorLayer(name);

319

}

320

IConnectableLayer* INetwork::AddOutputLayer(LayerBindingId id, const char* name)

321

{

322

return pNetworkImpl->AddOutputLayer(id, name);

323

}

324

325

IConnectableLayer* INetwork::AddLstmLayer(const LstmDescriptor& descriptor,

326

const LstmInputParams& params,

327

const char* name)

328

{

329

return pNetworkImpl->AddLstmLayer(descriptor, params, name);

330

}

331

332

IConnectableLayer* INetwork::AddDivisionLayer(const char* name)

333

{

334

return pNetworkImpl->AddDivisionLayer(name);

335

}

336

337

IConnectableLayer* INetwork::AddSubtractionLayer(const char* name)

338

{

339

return pNetworkImpl->AddSubtractionLayer(name);

340

}

341

342

IConnectableLayer* INetwork::AddMaximumLayer(const char* name)

343

{

344

return pNetworkImpl->AddMaximumLayer(name);

345

}

346

347

IConnectableLayer* INetwork::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

348

{

349

return pNetworkImpl->AddMeanLayer(meanDescriptor, name);

350

}

351

352

IConnectableLayer* INetwork::AddPadLayer(const PadDescriptor& padDescriptor,

353

const char* name)

354

{

355

return pNetworkImpl->AddPadLayer(padDescriptor, name);

356

}

357

358

IConnectableLayer* INetwork::AddQuantizeLayer(const char* name)

359

{

360

return pNetworkImpl->AddQuantizeLayer(name);

361

}

362

363

IConnectableLayer* INetwork::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

364

const char* name)

365

{

366

return pNetworkImpl->AddStridedSliceLayer(stridedSliceDescriptor, name);

367

}

368

369

IConnectableLayer* INetwork::AddMinimumLayer(const char* name)

370

{

371

return pNetworkImpl->AddMinimumLayer(name);

372

}

373

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

374

IConnectableLayer* INetwork::AddGatherLayer(const GatherDescriptor& descriptor,

375

const char* name)

376

{

377

return pNetworkImpl->AddGatherLayer(descriptor, name);

378

}

379

Teresa Charlin

2022-04-12 22:07:09 +0100

[diff] [blame]

380

IConnectableLayer* INetwork::AddGatherNdLayer(const char* name)

381

{

382

return pNetworkImpl->AddGatherNdLayer(name);

383

}

384

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

385

IConnectableLayer* INetwork::AddSwitchLayer(const char* name)

386

{

387

return pNetworkImpl->AddSwitchLayer(name);

388

}

389

390

IConnectableLayer* INetwork::AddPreluLayer(const char* name)

391

{

392

return pNetworkImpl->AddPreluLayer(name);

393

}

394

395

IConnectableLayer* INetwork::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

396

const ConstTensor& weights,

397

const Optional<ConstTensor>& biases,

398

const char* name)

399

{

400

return pNetworkImpl->AddTransposeConvolution2dLayer(descriptor, weights, biases, name);

401

}

402

403

IConnectableLayer* INetwork::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

404

const char* name)

405

{

406

return pNetworkImpl->AddTransposeLayer(transposeDescriptor, name);

407

}

408

Keith Davis

3ae3f97

2021-05-21 16:33:48 +0100

[diff] [blame]

409

IConnectableLayer* INetwork::AddShapeLayer(const char* name)

410

{

411

return pNetworkImpl->AddShapeLayer(name);

412

}

413

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

414

IConnectableLayer* INetwork::AddStackLayer(const StackDescriptor& descriptor,

415

const char* name)

416

{

417

return pNetworkImpl->AddStackLayer(descriptor, name);

418

}

419

420

IConnectableLayer* INetwork::AddStandInLayer(const StandInDescriptor& descriptor,

421

const char* name)

422

{

423

return pNetworkImpl->AddStandInLayer(descriptor, name);

424

}

425

426

IConnectableLayer* INetwork::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

427

const char* name)

428

{

429

return pNetworkImpl->AddQuantizedLstmLayer(params, name);

430

}

431

432

IConnectableLayer* INetwork::AddQLstmLayer(const QLstmDescriptor& descriptor,

433

const LstmInputParams& params,

434

const char* name)

435

{

436

return pNetworkImpl->AddQLstmLayer(descriptor, params, name);

437

}

438

439

IConnectableLayer* INetwork::AddLogicalBinaryLayer(const LogicalBinaryDescriptor& descriptor,

440

const char* name)

441

{

442

return pNetworkImpl->AddLogicalBinaryLayer(descriptor, name);

443

}

444

Narumol Prangnawarat

8ed39ae

2021-07-15 16:16:25 +0100

[diff] [blame]

445

IConnectableLayer* INetwork::AddUnidirectionalSequenceLstmLayer(

446

const UnidirectionalSequenceLstmDescriptor& descriptor,

447

const LstmInputParams& params,

448

const char* name)

449

{

450

return pNetworkImpl->AddUnidirectionalSequenceLstmLayer(descriptor, params, name);

451

}

452

Simon Obute

51f6777

2021-09-03 15:50:13 +0100

[diff] [blame]

453

IConnectableLayer* INetwork::AddChannelShuffleLayer(const ChannelShuffleDescriptor &descriptor,

454

const char* name)

455

{

456

return pNetworkImpl->AddChannelShuffleLayer(descriptor, name);

457

}

458

Jan Eilers

1b2654f

2021-09-24 15:45:46 +0100

[diff] [blame]

459

ARMNN_NO_DEPRECATE_WARN_BEGIN

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

460

void INetwork::Accept(ILayerVisitor& visitor) const

461

{

462

return pNetworkImpl->Accept(visitor);

463

}

Jan Eilers

1b2654f

2021-09-24 15:45:46 +0100

[diff] [blame]

464

ARMNN_NO_DEPRECATE_WARN_END

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

465

466

void INetwork::ExecuteStrategy(IStrategy& strategy) const

467

{

468

return pNetworkImpl->ExecuteStrategy(strategy);

469

}

470

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

471

armnn::INetwork* INetwork::CreateRaw(NetworkOptions networkOptions)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

472

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

473

return new INetwork(networkOptions);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

474

}

475

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

476

armnn::INetworkPtr INetwork::Create(NetworkOptions networkOptions)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

477

{

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

478

return INetworkPtr(CreateRaw(networkOptions), &INetwork::Destroy);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

479

}

480

481

void INetwork::Destroy(INetwork* network)

482

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

483

delete network;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

484

}

485

Mike Kelly

0d677db

2021-06-27 22:39:21 +0100

[diff] [blame]

486

IOptimizedNetwork::IOptimizedNetwork(const IOptimizedNetwork& other, const ModelOptions& modelOptions)

487

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(*other.pOptimizedNetworkImpl.get(), modelOptions)) {}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

488

489

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<Graph> graph)

490

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph))) {}

491

492

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<OptimizedNetworkImpl> impl)

493

: pOptimizedNetworkImpl(std::move(impl)) {}

494

495

IOptimizedNetwork::IOptimizedNetwork(std::unique_ptr<Graph> graph, const ModelOptions& modelOptions)

496

: pOptimizedNetworkImpl(new OptimizedNetworkImpl(std::move(graph), modelOptions)) {}

497

498

IOptimizedNetwork::~IOptimizedNetwork() = default;

499

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

500

void IOptimizedNetwork::Destroy(IOptimizedNetwork* network)

501

{

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

502

delete network;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

503

}

504

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

505

Status IOptimizedNetwork::PrintGraph()

506

{

507

return pOptimizedNetworkImpl->PrintGraph();

508

}

509

510

Status IOptimizedNetwork::SerializeToDot(std::ostream& stream) const

511

{

512

return pOptimizedNetworkImpl->SerializeToDot(stream);

513

}

514

Derek Lamberti

e155bbf

2021-10-13 14:32:12 +0100

[diff] [blame]

515

const std::shared_ptr<IProfiler>& IOptimizedNetwork::GetProfiler() const

516

{

517

return pOptimizedNetworkImpl->GetGraph().GetProfiler();

518

}

519

Cathal Corbett

5aa9fd7

2022-02-25 15:33:28 +0000

[diff] [blame]

520

arm::pipe::ProfilingGuid IOptimizedNetwork::GetGuid() const

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

521

{

522

return pOptimizedNetworkImpl->GetGuid();

523

}

524

Sadik Armagan

b7851f9

2021-10-06 16:37:02 +0100

[diff] [blame]

525

size_t IOptimizedNetwork::GetNumInputs() const

526

{

527

return pOptimizedNetworkImpl->GetNumInputs();

528

}

529

530

size_t IOptimizedNetwork::GetNumOutputs() const

531

{

532

return pOptimizedNetworkImpl->GetNumOutputs();

533

}

534

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

535

Status OptimizedNetworkImpl::PrintGraph()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

536

{

537

m_Graph->Print();

538

return Status::Success;

539

}

540

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

541

Status OptimizedNetworkImpl::SerializeToDot(std::ostream& stream) const

surmeh01

bceff2f

2018-03-29 16:29:27 +0100

[diff] [blame]

542

{

543

return m_Graph->SerializeToDot(stream);

544

}

545

Sadik Armagan

b7851f9

2021-10-06 16:37:02 +0100

[diff] [blame]

546

size_t OptimizedNetworkImpl::GetNumInputs() const

547

{

548

return m_Graph->GetNumInputs();

549

}

550

551

size_t OptimizedNetworkImpl::GetNumOutputs() const

552

{

553

return m_Graph->GetNumOutputs();

554

}

555

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

556

void ReportError(const std::string& errorMessage,

557

Optional<std::vector<std::string>&> errorMessages)

558

{

559

std::stringstream fullErrorMessage;

560

fullErrorMessage << "ERROR: " << errorMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

561

ARMNN_LOG(warning) << fullErrorMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

562

if (errorMessages)

563

{

564

errorMessages.value().push_back(fullErrorMessage.str());

}

}

void ReportWarning(const std::string& warningMessage,

569

Optional<std::vector<std::string>&> warningMessages)

570

{

571

std::stringstream fullWarningMessage;

572

fullWarningMessage << "WARNING: " << warningMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

573

ARMNN_LOG(warning) << fullWarningMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

574

if (warningMessages)

575

{

576

warningMessages.value().push_back(fullWarningMessage.str());

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

580

OptimizationResult ReturnWithError(OptimizationResult res,

581

const Layer* layer,

582

const BackendSettings& backendSettings,

583

Optional<std::vector<std::string>&> errMessages)

584

{

585

std::stringstream failureMsg;

586

failureMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

587

<< " is not supported on any preferred backend " << backendSettings.m_PreferredBackends;

588

ReportError(failureMsg.str(), errMessages);

res.m_Error = true;

return res;

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

595

bool CheckScaleSetOnQuantizedType(Layer* layer, Optional<std::vector<std::string>&> errMessages)

596

{

597

bool noErrors = true;

598

unsigned int numOutputs = layer->GetNumOutputSlots();

599

for (unsigned int i = 0; i < numOutputs; i++) {

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

600

OutputSlot& outputSlot = layer->GetOutputSlot(i);

601

TensorInfo info = outputSlot.GetTensorInfo();

Derek Lamberti

f90c56d

2020-01-10 17:14:08 +0000

[diff] [blame]

602

if (DataType::QAsymmU8 == info.GetDataType()) {

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

603

if (0.f == info.GetQuantizationScale()) {

604

noErrors = false;

605

std::stringstream ss;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

606

ss << "output " << i << " of layer " << GetLayerTypeAsCString(layer->GetType())

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

607

<< " (" << layer->GetNameStr() << ") is of type"

608

<< " Quantized 8 bit but its scale parameter has not been set";

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

609

ReportError(ss.str(), errMessages);

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

610

}

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

611

// Softmax under QuantisedAsymm8 must always be scale (1.0f/256.0f) and offset 0

612

if ((info.GetQuantizationScale() != (1.0f / 256.0f) ||

613

info.GetQuantizationOffset() != 0) &&

614

layer->GetType() == armnn::LayerType::Softmax)

615

{

616

std::stringstream ss;

617

ss << "Quantization parameters for Softmax layer (Scale: " <<

618

info.GetQuantizationScale() << " and Offset: " << info.GetQuantizationOffset() <<

619

") are incorrect and have been updated to Scale: 0.00390625 and Offset: 0";

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

620

ARMNN_LOG(warning) << ss.str();

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

621

info.SetQuantizationScale((1.0f /256.0f));

622

info.SetQuantizationOffset(0);

623

outputSlot.SetTensorInfo(info);

624

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

}

}

return noErrors;

}

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

630

template <typename LayerT>

631

LayerT* ConvertBf16ToFp32Weight(Layer* l)

632

{

Jan Eilers

bb446e5

2020-04-02 13:56:54 +0100

[diff] [blame]

633

LayerT* layer = PolymorphicDowncast<LayerT*>(l);

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

634

if ((layer->GetType() == LayerType::Convolution2d || layer->GetType() == LayerType::FullyConnected)

635

&& layer->m_Weight)

636

{

637

const TensorInfo& info = layer->m_Weight->GetTensorInfo();

638

639

if (info.GetDataType() == DataType::BFloat16)

640

{

641

std::vector<float> newValues(info.GetNumElements());

642

643

armnnUtils::FloatingPointConverter::ConvertBFloat16ToFloat32(

Finn Williams

4422cec

2021-03-22 17:51:06 +0000

[diff] [blame]

644

layer->m_Weight->template GetConstTensor<armnn::BFloat16>(), info.GetNumElements(), newValues.data());

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

645

646

TensorInfo newInfo(info.GetShape(), DataType::Float32);

647

ConstTensor newInput(newInfo, newValues);

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

648

layer->m_Weight.reset(new ScopedTensorHandle(newInput));

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

}

}

return layer;

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

654

OptimizationResult AttemptBackendAssignment(BackendSettings& backendSettings,

Graph& graph,

Layer* layer,

BackendId backend,

DataType dataTypeIn,

DataType dataTypeOut,

660

const std::vector<BackendId>& availablePreferredBackends,

661

std::string& reasonIfUnsupported,

662

Optional<std::vector<std::string>&> errMessages)

663

{

664

OptimizationResult result;

665

666

// Helper lambda to compose meaningful error message before returning with error

667

auto ReturnError = [&](const Layer* layer)

668

{

669

return ReturnWithError(result, layer, backendSettings, errMessages);

670

};

671

672

// need to set the compute device on the layer

673

// before we can check if it is supported

674

layer->SetBackendId(backend);

675

if (!IWorkloadFactory::IsLayerSupported(*layer, EmptyOptional(), reasonIfUnsupported))

676

{

677

if (dataTypeIn == DataType::Float16 || dataTypeOut == DataType::Float16)

678

{

679

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

680

&& layer->GetType() != LayerType::ConvertFp32ToFp16

681

&& layer->GetType() != LayerType::ConvertFp16ToFp32)

682

{

Jan Eilers

0c0019c

2021-08-20 16:42:58 +0100

[diff] [blame]

683

auto ConstantLayerFromFp16ToFp32 = [](Layer& layer)

684

{

685

if (layer.GetType() == LayerType::Constant)

686

{

687

ConstantLayer* constantLayer = PolymorphicDowncast<ConstantLayer*>(&layer);

688

689

auto& info = constantLayer->m_LayerOutput->GetTensorInfo();

690

691

if (info.GetDataType() == DataType::Float16)

692

{

693

std::vector<float> newValues(info.GetNumElements());

694

695

armnnUtils::FloatingPointConverter::ConvertFloat16To32(

696

constantLayer->m_LayerOutput->GetConstTensor<Half>(),

697

info.GetNumElements(),

698

newValues.data());

699

700

TensorInfo newInfo(info);

701

newInfo.SetDataType(DataType::Float32);

702

ConstTensor newInput(newInfo, newValues);

703

constantLayer->m_LayerOutput.reset(new ScopedTensorHandle(newInput));

704

705

layer.GetOutputSlot(0).SetTensorInfo(newInfo);

}

}

};

bool checkType = false;

711

712

for (auto inputSlot : layer->GetInputSlots())

713

{

714

auto connectedOutputSlot = inputSlot.GetConnectedOutputSlot();

715

if (connectedOutputSlot->GetOwningLayer().GetType() == LayerType::Constant)

716

{

717

if (connectedOutputSlot->GetNumConnections() == 1)

718

{

719

checkType = true;

720

ConstantLayerFromFp16ToFp32(connectedOutputSlot->GetOwningLayer());

}

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

725

// Insert FP16 -> FP32 conversion layer before current layer

726

std::vector<ConvertFp16ToFp32Layer*> convertFp16ToFp32Layers;

727

if (dataTypeIn == DataType::Float16)

728

{

729

convertFp16ToFp32Layers =

Jan Eilers

0c0019c

2021-08-20 16:42:58 +0100

[diff] [blame]

730

InsertConvertFp16ToFp32LayersBefore(graph, *layer, checkType);

Derek Lamberti

4a9e24b

2020-01-03 16:53:38 +0000

[diff] [blame]

731

}

732

733

// Insert FP32 -> FP16 conversion layer after current layer

734

std::vector<ConvertFp32ToFp16Layer*> convertFp32ToFp16Layers;

735

if (dataTypeOut == DataType::Float16)

736

{

737

convertFp32ToFp16Layers =

738

InsertConvertFp32ToFp16LayersAfter(graph, *layer);

739

}

740

741

// Assign a supported backend to the newly introduced conversion layers

742

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

743

{

744

bool supportedBackendFound = false;

745

std::string reasonIfUnsupported;

746

747

// Try preferred backend first

748

layer->SetBackendId(preferredBackend);

749

if (IWorkloadFactory::IsLayerSupported(*layer,

750

EmptyOptional(),

751

reasonIfUnsupported))

752

{

753

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

758

{

759

// Skip preferred backend (we already determined that it is not supported)

760

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

766

if (IWorkloadFactory::IsLayerSupported(*layer,

767

EmptyOptional(),

768

reasonIfUnsupported))

769

{

770

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

777

};

778

779

for (ConvertFp16ToFp32Layer* convertLayer : convertFp16ToFp32Layers)

780

{

781

if (!AssignFirstSupportedBackend(convertLayer, backend))

782

{

783

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToFp16Layer* convertLayer : convertFp32ToFp16Layers)

788

{

789

if (!AssignFirstSupportedBackend(convertLayer, backend))

790

{

791

return ReturnError(convertLayer);

}

}

return result;

}

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

798

else if (dataTypeIn == DataType::BFloat16 || dataTypeOut == DataType::BFloat16)

799

{

800

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

801

&& layer->GetType() != LayerType::ConvertFp32ToBf16

802

&& layer->GetType() != LayerType::ConvertBf16ToFp32)

803

{

804

// Insert BF16 -> FP32 conversion layer before current layer

805

std::vector<ConvertBf16ToFp32Layer*> convertBf16ToFp32Layers;

806

if (dataTypeIn == DataType::BFloat16)

807

{

808

convertBf16ToFp32Layers =

809

InsertConvertBf16ToFp32LayersBefore(graph, *layer);

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

810

if (layer->GetType() == LayerType::Convolution2d)

811

{

812

ConvertBf16ToFp32Weight<Convolution2dLayer>(layer);

813

}

814

else if (layer->GetType() == LayerType::FullyConnected)

815

{

816

ConvertBf16ToFp32Weight<FullyConnectedLayer>(layer);

817

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

818

}

819

820

// Insert FP32 -> BF16 conversion layer after current layer

821

std::vector<ConvertFp32ToBf16Layer*> convertFp32ToBf16Layers;

822

if (dataTypeOut == DataType::BFloat16)

823

{

824

convertFp32ToBf16Layers =

825

InsertConvertFp32ToBf16LayersAfter(graph, *layer);

826

}

827

828

// Assign a supported backend to the newly introduced conversion layers

829

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

830

{

831

bool supportedBackendFound = false;

832

std::string reasonIfUnsupported;

833

834

// Try preferred backend first

835

layer->SetBackendId(preferredBackend);

836

if (IWorkloadFactory::IsLayerSupported(*layer,

837

EmptyOptional(),

838

reasonIfUnsupported))

839

{

840

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

845

{

846

// Skip preferred backend (we already determined that it is not supported)

847

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

853

if (IWorkloadFactory::IsLayerSupported(*layer,

854

EmptyOptional(),

855

reasonIfUnsupported))

856

{

857

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

864

};

865

866

for (ConvertBf16ToFp32Layer* convertLayer : convertBf16ToFp32Layers)

867

{

868

if (!AssignFirstSupportedBackend(convertLayer, backend))

869

{

870

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToBf16Layer* convertLayer : convertFp32ToBf16Layers)

875

{

876

if (!AssignFirstSupportedBackend(convertLayer, backend))

877

{

878

return ReturnError(convertLayer);

}

}

return result;

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

886

std::stringstream warningMsg;

887

warningMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

888

<< " is not supported on requested backend " << layer->GetBackendId().Get()

889

<< " for input data type " << GetDataTypeName(dataTypeIn)

890

<< " and output data type " << GetDataTypeName(dataTypeOut)

891

<< " (reason: " << reasonIfUnsupported

892

<< "), falling back to the next backend.";

893

ReportWarning(warningMsg.str(), errMessages);

894

895

return OptimizationResult(true, false);

}

else

{

return result;

}

}

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

903

// Refactor to allow passing the IConnectableLayer* rather than Layer Iterator

904

// on Graph and SubgraphView which are different types.

905

void AssignBackendsIConnectable(OptimizedNetworkImpl* optNetObjPtr,

906

IConnectableLayer* it,

907

Optional<std::vector<std::string>&> errMessages,

908

OptimizationResult& result,

909

BackendSettings& backendSettings,

910

std::vector<BackendId>& availablePreferredBackends)

911

{

912

auto ReturnError = [&](const Layer* layer)

913

{

914

return ReturnWithError(result, layer, backendSettings, errMessages);

915

};

916

917

auto layer = PolymorphicDowncast<Layer*>(it);

918

919

if (layer->GetType() == LayerType::Input)

{

return;

}

DataType dataTypeIn = layer->GetNumInputSlots() == 0 ? DataType::Float32 :

925

layer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo().GetDataType();

926

DataType dataTypeOut = layer->GetNumOutputSlots() == 0 ? DataType::Float32 :

927

layer->GetOutputSlot(0).GetTensorInfo().GetDataType();

928

929

std::string reasonIfUnsupported;

930

bool found = false;

931

if (!CheckScaleSetOnQuantizedType(layer, errMessages))

932

{

933

// don't bomb immediately, find all the quantized outputs

934

// which haven't had a scale set and report them all back.

935

result.m_Error = true;

936

}

937

938

// First try assign layer to hint backend

939

if (layer->GetBackendHint().has_value() &&

940

backendSettings.IsBackendSupported(layer->GetBackendHint().value()) &&

941

AttemptBackendAssignment(backendSettings,

942

optNetObjPtr->GetGraph(),

943

layer,

944

layer->GetBackendHint().value(),

945

dataTypeIn,

946

dataTypeOut,

947

availablePreferredBackends,

reasonIfUnsupported,

errMessages).IsOk())

{

found = true;

backendSettings.m_SelectedBackends.insert(layer->GetBackendHint().value());

}

else

{

// Try assign layer to prefered list of backends

957

for (const auto& backend : availablePreferredBackends)

958

{

959

if (layer->GetBackendHint().has_value() &&

960

layer->GetBackendHint().value() == backend)

961

{

962

continue; //Don't re-test the backend hint

963

}

964

965

OptimizationResult res = AttemptBackendAssignment(backendSettings,

966

optNetObjPtr->GetGraph(),

layer,

backend,

dataTypeIn,

dataTypeOut,

availablePreferredBackends,

reasonIfUnsupported,

errMessages);

if (res.IsOk())

{

found = true;

backendSettings.m_SelectedBackends.insert(backend);

979

break;

980

}

981

else if (res.IsError())

982

{

983

result = res; // Cannot continue.

984

// Note: we don't need to log the error as it would already

985

// be logged in AttemptBackendAssignment().

}

else

{

ARMNN_ASSERT_MSG(res.IsWarningOnly(), "OptimizationResult in unexpected state.");

}

}

}

// If the layer is unsupported by any devices, log and return a null network.

995

if (!found)

996

{

997

// NOTE: if the layer is not an operation queue type AND we have not got CpuRef as a

998

// fallback we should set the compute device on the layer to CpuRef (these are not

999

// available as accelerated operations, or are only available under certain

1000

// conditions, currently they comprise MemCopy, Constant, Permute)

1001

armnn::LayerType layerType = layer->GetType();

1002

if (!backendSettings.IsCpuRefUsed() && (layerType == armnn::LayerType::MemCopy ||

1003

layerType == armnn::LayerType::Constant ||

1004

layerType == armnn::LayerType::Permute))

1005

{

1006

BackendId cpuBackendId(armnn::Compute::CpuRef);

1007

layer->SetBackendId(cpuBackendId);

1008

backendSettings.m_SelectedBackends.insert(cpuBackendId);

}

else

{

result = ReturnError(layer);

}

}

}

Derek Lamberti

4a9e24b

2020-01-03 16:53:38 +0000

[diff] [blame]

1017

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1018

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1019

BackendSettings& backendSettings,

1020

Graph::Iterator& firstLayer,

1021

Graph::Iterator& lastLayer,

1022

Optional<std::vector<std::string>&> errMessages)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1023

{

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1024

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_AssignBackends");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1025

OptimizationResult result;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1026

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1027

auto availablePreferredBackends = backendSettings.GetAvailablePreferredBackends();

1028

if (availablePreferredBackends.empty())

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1029

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1030

std::stringstream failureMsg;

1031

failureMsg << "No preferred backends are available";

1032

ReportError(failureMsg.str(), errMessages);

1033

1034

result.m_Error = true;

return result;

}

for (auto it = firstLayer; it != lastLayer; ++it)

1039

{

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1040

AssignBackendsIConnectable(optNetObjPtr,

*it,

errMessages,

result,

backendSettings,

availablePreferredBackends);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1046

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1047

Finn Williams

b1aad42

2021-10-28 19:07:32 +0100

[diff] [blame]

1048

for (auto it = firstLayer; it != lastLayer; ++it)

1049

{

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1050

auto layer = PolymorphicDowncast<Layer*>(*it);

1051

1052

if(layer->GetType() == LayerType::Input)

1053

{

1054

BackendId connectedBackendId = layer->GetOutputSlot(0).GetConnection(0)->GetOwningLayer().GetBackendId();

1055

layer->SetBackendId(connectedBackendId);

}

}

return result;

}

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

1063

BackendSettings& backendSettings,

1064

SubgraphView::IConnectableLayerIterator& firstLayer,

1065

SubgraphView::IConnectableLayerIterator& lastLayer,

1066

Optional<std::vector<std::string>&> errMessages)

1067

{

1068

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_AssignBackends");

1069

OptimizationResult result;

1070

1071

auto availablePreferredBackends = backendSettings.GetAvailablePreferredBackends();

1072

if (availablePreferredBackends.empty())

1073

{

1074

std::stringstream failureMsg;

1075

failureMsg << "No preferred backends are available";

1076

ReportError(failureMsg.str(), errMessages);

1077

1078

result.m_Error = true;

return result;

}

for (auto it = firstLayer; it != lastLayer; ++it)

1083

{

1084

AssignBackendsIConnectable(optNetObjPtr,

*it,

errMessages,

result,

backendSettings,

availablePreferredBackends);

1090

}

1091

1092

for (auto it = firstLayer; it != lastLayer; ++it)

1093

{

1094

auto layer = PolymorphicDowncast<Layer*>(*it);

Finn Williams

b1aad42

2021-10-28 19:07:32 +0100

[diff] [blame]

1095

1096

if(layer->GetType() == LayerType::Input)

1097

{

1098

BackendId connectedBackendId = layer->GetOutputSlot(0).GetConnection(0)->GetOwningLayer().GetBackendId();

1099

layer->SetBackendId(connectedBackendId);

}

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

return result;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1106

OptimizationResult AssignBackends(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1107

BackendSettings& backendSettings,

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1108

SubgraphView& subgraph,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1109

Optional<std::vector<std::string>&> errMessages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1110

{

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1111

SubgraphView::IConnectableLayerIterator firstLayer = subgraph.beginIConnectable();

1112

SubgraphView::IConnectableLayerIterator lastLayer = subgraph.endIConnectable();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1113

return AssignBackends(optNetObjPtr,

backendSettings,

firstLayer,

lastLayer,

errMessages);

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1120

BackendsMap CreateSupportedBackends(TensorHandleFactoryRegistry& handleFactoryRegistry,

1121

BackendSettings& backendSettings)

1122

{

1123

BackendsMap backends;

1124

auto const& backendRegistry = BackendRegistryInstance();

1125

for (auto&& selectedBackend : backendSettings.m_SupportedBackends)

1126

{

1127

auto backendFactory = backendRegistry.GetFactory(selectedBackend);

1128

auto backendObjPtr = backendFactory();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1129

ARMNN_ASSERT(backendObjPtr);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1130

1131

backendObjPtr->RegisterTensorHandleFactories(handleFactoryRegistry);

1132

1133

backends[backendObjPtr->GetId()] = std::move(backendObjPtr);

}

return backends;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1139

OptimizationResult ApplyBackendOptimizations(OptimizedNetworkImpl* optNetObjPtr,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1140

BackendSettings& backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1141

BackendsMap& backends,

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1142

const ModelOptions& modelOptions,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1143

Optional<std::vector<std::string>&> errMessages)

1144

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1145

ARMNN_ASSERT(optNetObjPtr);

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1146

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_ApplyBackendOptimizations")

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1147

OptimizationResult result;

1148

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1149

// Get the optimized graph

1150

Graph& optGraph = optNetObjPtr->GetGraph();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1151

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1152

// Run backend specific optimizations

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1153

for (auto&& selectedBackend : backendSettings.m_SelectedBackends)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1154

{

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1155

auto backendObjPtr = backends.find(selectedBackend)->second.get();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1156

ARMNN_ASSERT(backendObjPtr);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1157

Cathal Corbett

4b19d22

2022-05-11 20:12:17 +0100

[diff] [blame]

1158

if(selectedBackend == armnn::Compute::GpuAcc || selectedBackend == armnn::Compute::CpuAcc)

1159

{

1160

Optimizer::Pass(optGraph, MakeOptimizations(optimizations::PermuteDepthwiseConv2dWeights()));

Cathal Corbett

541880f

2022-05-16 15:20:56 +0100

[diff] [blame]

1161

Optimizer::Pass(optGraph, MakeOptimizations(optimizations::FusePermuteIntoConstLayer()));

Cathal Corbett

4b19d22

2022-05-11 20:12:17 +0100

[diff] [blame]

1162

}

1163

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1164

// Select sub-graphs based on backend

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1165

SubgraphViewSelector::Subgraphs subgraphs =

Rob Hughes

65c3226

2019-07-23 15:33:39 +0100

[diff] [blame]

1166

SubgraphViewSelector::SelectSubgraphs(optGraph,

Matteo Martincigh

602af09

2019-05-01 10:31:27 +0100

[diff] [blame]

1167

// Select layers assigned to the requested backend

1168

[&backendObjPtr](const Layer& layer)

1169

{

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1170

Matteo Martincigh

602af09

2019-05-01 10:31:27 +0100

[diff] [blame]

1171

return layer.GetType() != LayerType::Input &&

1172

layer.GetType() != LayerType::Output &&

1173

layer.GetBackendId() == backendObjPtr->GetId();

1174

});

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1175

if (subgraphs.empty())

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1176

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1177

// No sub-graphs found, try with next selected backend

1178

continue;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1179

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1180

1181

// Try to optimize each sub-graph

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

1182

for (auto& subgraph : subgraphs)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1183

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1184

// Try to optimize the current sub-graph

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1185

ARMNN_SCOPED_PROFILING_EVENT(backendObjPtr->GetId(), "Optimizer_OptimizeSubgraph");

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1186

OptimizationViews optimizationViews = backendObjPtr->OptimizeSubgraphView(*subgraph, modelOptions);

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1187

ARMNN_ASSERT(optimizationViews.Validate(*subgraph));

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1188

1189

// Optimization attempted, check the resulting optimized sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1190

for (auto& substitution : optimizationViews.GetSubstitutions())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1191

{

1192

// Sub-graph optimized, substitute the sub-graph with the new optimized one in the main optimized graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1193

SubgraphView& replacementSubgraph = substitution.m_ReplacementSubgraph;

1194

SubgraphView& substitutableSubgraph = substitution.m_SubstitutableSubgraph;

1195

optGraph.SubstituteSubgraph(substitutableSubgraph, replacementSubgraph);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1196

1197

// Assign the current backend to the optimized sub-graph

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1198

const SubgraphView::IConnectableLayers& subgraphLayers = replacementSubgraph.GetIConnectableLayers();

1199

std::for_each(subgraphLayers.begin(), subgraphLayers.end(), [&selectedBackend](IConnectableLayer* l)

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1200

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1201

ARMNN_ASSERT(l);

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1202

PolymorphicDowncast<Layer*>(l)->SetBackendId(selectedBackend);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1203

});

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1204

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1205

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1206

if (!optimizationViews.GetFailedSubgraphs().empty())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1207

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1208

std::stringstream warningMsg;

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1209

warningMsg << "Some sub-graph(s) failed to optimized on " << backendObjPtr->GetId() << " backend.";

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1210

ReportWarning(warningMsg.str(), errMessages);

1211

1212

// Failed to optimize the given sub-graph, re-assign the sub-graph layers to other available backends

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1213

BackendSettings settingsCopy(backendSettings);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1214

if (!backendObjPtr->GetId().IsCpuRef())

1215

{

1216

// Add the current backend to the list of backends to ignore

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1217

settingsCopy.m_IgnoredBackends.insert(backendObjPtr->GetId());

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1218

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1219

1220

int count=0;

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

1221

for (auto& failedSubgraph : optimizationViews.GetFailedSubgraphs())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1222

{

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1223

// An error occurred: the optimization was attempted but not performed, try different backends

1224

std::stringstream subgraphMsg;

Francis Murtagh

2021-12-13 18:48:12 +0000

[diff] [blame]

1225

subgraphMsg << "Re-assigning backends to " << failedSubgraph.GetIConnectableLayers().size()

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1226

<< " layers inside sub-graph " << count++;

Matteo Martincigh

328d92b

2019-07-04 17:52:55 +0100

[diff] [blame]

1227

ReportWarning(subgraphMsg.str(), errMessages);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

1228

1229

OptimizationResult reassignmentResult = AssignBackends(optNetObjPtr,

settingsCopy,

*subgraph,

errMessages);

if (reassignmentResult.m_Error)

1234

{

1235

// Failed to re-assign one of the remaining backends to each layer of the sub-graph

1236

result.m_Error = true;

1237

return result;

1238

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1239

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

}

}

}

return result;

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1247

bool RequiresCopy(ITensorHandleFactory::FactoryId src,

1248

ITensorHandleFactory::FactoryId dst,

1249

TensorHandleFactoryRegistry& registry)

{

if (src != dst)

{

ITensorHandleFactory* srcFactory = registry.GetFactory(src);

1254

ITensorHandleFactory* dstFactory = registry.GetFactory(dst);

1255

Matteo Martincigh

a6539ed

2019-08-27 13:43:32 +0100

[diff] [blame]

1256

if (srcFactory && dstFactory &&

1257

(srcFactory->GetExportFlags() & dstFactory->GetImportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

{

return false;

}

return true;

}

return false;

}

// Find the handle factory for the input layer which results in fewest required copies.

1267

ITensorHandleFactory::FactoryId CalculateSlotOptionForInput(BackendsMap& backends,

1268

OutputSlot& slot,

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1269

TensorHandleFactoryRegistry& registry,

1270

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1271

{

1272

Layer& layer = slot.GetOwningLayer();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1273

ARMNN_ASSERT(layer.GetType() == LayerType::Input);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1274

1275

// Explicitly select the tensorhandle factory for InputLayer because the rules for it are slightly different. It

1276

// doesn't matter which backend it is assigned to because they all use the same implementation, which

1277

// requires Map/Unmap support. This means that, so long as the handle type supports map/unmap semantics, we can

1278

// select a factory with maximum compatibility with the layers connected to the InputLayer.

1279

1280

// First ensure the from backends can support the TensorHandeAPI

1281

auto frmBackend = backends.find(layer.GetBackendId());

1282

if (frmBackend == backends.end() ||

1283

!frmBackend->second->SupportsTensorAllocatorAPI())

1284

{

1285

return ITensorHandleFactory::LegacyFactoryId;

1286

}

1287

1288

// Go through all connections to the output slot and determine the TensorHandleFactory which results in the

1289

// fewest copies.

1290

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

1291

int topScore = 0;

1292

ITensorHandleFactory::FactoryId topChoice = ITensorHandleFactory::LegacyFactoryId;

1293

1294

for (auto&& connection : slot.GetConnections())

1295

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1296

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1297

const Layer& connectedLayer = connection->GetOwningLayer();

1298

1299

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1300

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1301

1302

if (!toBackend->second.get()->SupportsTensorAllocatorAPI())

1303

{

1304

// The destination backend does not support the tensor allocator API, move to the next one

continue;

}

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1309

for (auto&& dst : dstPrefs)

1310

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1311

// Input layers use the mem copy workload or import, so the selected factory must

1312

// support either the map/unmap API or Import API

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1313

ITensorHandleFactory* factory = registry.GetFactory(dst);

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1314

if (importEnabled && factory->GetImportFlags() == 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1315

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1316

continue;

1317

}

1318

else if (!importEnabled && !factory->SupportsMapUnmap())

1319

{

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

continue;

}

auto it = factoryScores.find(dst);

1324

if (it == factoryScores.end())

1325

{

1326

// Add new score to the table

1327

factoryScores[dst] = 0;

1328

if (topChoice == ITensorHandleFactory::LegacyFactoryId)

{

topChoice = dst;

}

}

else

{

// Increase the score

1336

factoryScores[dst]++;

1337

1338

// Track the best option

1339

if (factoryScores[dst] > topScore)

1340

{

1341

topScore = factoryScores[dst];

topChoice = dst;

}

}

}

}

return topChoice;

}

// Find the handle factory for the output layer which results in fewest required copies.

1352

ITensorHandleFactory::FactoryId CalculateSlotOptionForOutput(BackendsMap& backends,

1353

OutputSlot& slot,

1354

TensorHandleFactoryRegistry& registry)

1355

{

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

1356

IgnoreUnused(backends, slot, registry);

Derek Lamberti

94a88d2

2019-12-10 21:12:59 +0000

[diff] [blame]

1357

return ITensorHandleFactory::DeferredFactoryId;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1358

}

1359

1360

// For all handle factories supported on the source backend, we wish to find the one which requires the fewest copies

1361

// when considering all connections.

1362

ITensorHandleFactory::FactoryId CalculateSlotOption(BackendsMap& backends,

1363

OutputSlot& outputSlot,

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1364

TensorHandleFactoryRegistry& registry,

Colm Donelan

2022-05-30 15:20:36 +0100

[diff] [blame^]

1365

bool exportEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1366

{

1367

// First ensure the from backends can support the TensorHandeAPI

1368

Layer& layer = outputSlot.GetOwningLayer();

1369

auto frmBackend = backends.find(layer.GetBackendId());

1370

if (frmBackend == backends.end() ||

1371

!frmBackend->second->SupportsTensorAllocatorAPI())

1372

{

1373

return ITensorHandleFactory::LegacyFactoryId;

1374

}

1375

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1376

bool outputConnection = false;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1377

for (auto&& connection : outputSlot.GetConnections())

1378

{

1379

const Layer& connectedLayer = connection->GetOwningLayer();

1380

if (connectedLayer.GetType() == LayerType::Output)

1381

{

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1382

outputConnection = true;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

IBackendInternal* srcBackend = frmBackend->second.get();

1387

auto srcPrefs = srcBackend->GetHandleFactoryPreferences();

1388

1389

// Initialize the scores

1390

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

1391

for (auto&& pref : srcPrefs)

1392

{

Colm Donelan

2022-05-30 15:20:36 +0100

[diff] [blame^]

1393

if (exportEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1394

{

1395

ITensorHandleFactory* factory = registry.GetFactory(pref);

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1396

if (outputConnection)

1397

{

1398

// Check if this is fallback case

1399

bool fallbackConnection = false;

1400

for (auto&& inputSlot : layer.GetInputSlots())

1401

{

1402

if (inputSlot.GetConnectedOutputSlot()->GetOwningLayer().GetBackendId() != layer.GetBackendId())

1403

{

1404

fallbackConnection = true;

1405

}

1406

}

1407

if (fallbackConnection)

1408

{

1409

auto factoryCap = factory->GetCapabilities(&layer, &layer, CapabilityClass::FallbackImportDisabled);

1410

// Cannot use factory import if fallback import is not supported.

1411

if (!factoryCap.empty())

{

continue;

}

}

else if (factory->GetExportFlags() == 0)

{

continue;

}

}

if (!outputConnection)

1422

{

1423

auto factoryCap = factory->GetCapabilities(&layer, &layer, CapabilityClass::FallbackImportDisabled);

1424

// Cannot use factory import if fallback import is not supported.

1425

if (!factoryCap.empty())

{

continue;

}

}

}

else

{

// Only consider factories that support map/unmap

1435

ITensorHandleFactory* factory = registry.GetFactory(pref);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1436

if (!factory->SupportsMapUnmap())

1437

{

1438

// The current tensor handle factory does not support the map/unmap strategy, move to the next one

continue;

}

}

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1443

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1444

auto it = factoryScores.find(pref);

1445

if (it == factoryScores.end())

1446

{

1447

// Add new score to the table

1448

factoryScores[pref] = 0;

}

}

// Score each handle factory based on how many times it requires copies on the slot connections

1453

for (auto&& connection : outputSlot.GetConnections())

1454

{

1455

const Layer& connectedLayer = connection->GetOwningLayer();

1456

1457

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1458

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1459

1460

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1461

for (auto&& src : srcPrefs)

1462

{

1463

if (factoryScores.find(src) == factoryScores.end()) // Don't consider excluded factories

{

continue;

}

for (auto&& dst : dstPrefs)

1469

{

1470

if (RequiresCopy(src, dst, registry))

1471

{

1472

// Copy avoided, increase the score

1473

factoryScores[src]++;

break;

}

}

}

}

// Find the lowest score

1481

int minScore = std::numeric_limits<int>::max();

1482

for (auto it : factoryScores)

1483

{

1484

minScore = std::min(minScore, it.second);

1485

}

1486

1487

// Collect factories matching the best(lowest) score

1488

std::vector<ITensorHandleFactory::FactoryId> optimalFactories;

1489

for (auto it : factoryScores)

1490

{

1491

if (it.second == minScore)

1492

{

1493

optimalFactories.push_back(it.first);

}

}

// For all compatible Factories matching the best score, find the preferred one for the current layer.

1498

for (auto&& srcPref : srcPrefs)

1499

{

1500

for (auto&& comp : optimalFactories)

{

if (comp == srcPref)

{

return comp;

}

}

}

return ITensorHandleFactory::LegacyFactoryId;

1510

}

1511

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1512

EdgeStrategy CalculateEdgeStrategy(BackendsMap& backends,

1513

ITensorHandleFactory::FactoryId srcFactoryId,

1514

const Layer& layer,

1515

const Layer& connectedLayer,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1516

TensorHandleFactoryRegistry& registry,

1517

bool importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1518

{

1519

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1520

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1521

1522

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

1523

1524

// Legacy API check for backward compatibility

1525

if (srcFactoryId == ITensorHandleFactory::LegacyFactoryId || dstPrefs.empty())

1526

{

1527

if (layer.GetBackendId() != connectedLayer.GetBackendId())

1528

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1529

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1530

}

1531

else

1532

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1533

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// TensorHandleFactory API present, so perform more sophisticated strategies.

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1538

// Dst Output layers don't require copy because they use import or map/unmap

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1539

if (connectedLayer.GetType() == LayerType::Output)

1540

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1541

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1542

}

1543

1544

// Search for direct match in prefs

1545

for (auto&& pref : dstPrefs)

1546

{

1547

if (pref == srcFactoryId)

1548

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1549

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// Search for export/import options

1554

ITensorHandleFactory* srcFactory = registry.GetFactory(srcFactoryId);

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1555

if (srcFactory->GetExportFlags() != 0 && importEnabled)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1556

{

1557

for (auto&& pref : dstPrefs)

1558

{

1559

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1560

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1561

// Handles cases when a destPref is not listed in TensorHandleFactoryRegistry

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1562

if (!dstFactory) {

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1563

continue;

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

1564

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1565

if ((dstFactory->GetImportFlags() & srcFactory->GetExportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1566

{

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1567

auto srcCapability = srcFactory->GetCapabilities(&layer, &layer, CapabilityClass::PaddingRequired);

1568

auto dstCapability = dstFactory->GetCapabilities(&connectedLayer,

1569

&connectedLayer,

1570

CapabilityClass::PaddingRequired);

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1571

auto srcFallback = srcFactory->GetCapabilities(&layer, &layer, CapabilityClass::FallbackImportDisabled);

1572

auto dstFallback = dstFactory->GetCapabilities(&connectedLayer,

1573

&connectedLayer,

1574

CapabilityClass::FallbackImportDisabled);

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1575

// Do not require memory copy if the source and destination do not require padding.

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1576

if (srcCapability.empty() && dstCapability.empty() && srcFallback.empty() && dstFallback.empty())

Narumol Prangnawarat

b8d771a

2020-08-14 11:51:12 +0100

[diff] [blame]

1577

{

1578

return EdgeStrategy::ExportToTarget;

1579

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

// Search for copy options via map/unmap

1585

if (srcFactory->SupportsMapUnmap())

1586

{

1587

for (auto&& pref : dstPrefs)

1588

{

1589

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

1590

if (dstFactory && dstFactory->SupportsMapUnmap())

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1591

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1592

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1597

return EdgeStrategy::Undefined;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1598

}

1599

1600

// Select the TensorHandleFactories and the corresponding memory strategy

1601

OptimizationResult SelectTensorHandleStrategy(Graph& optGraph,

1602

BackendsMap& backends,

1603

TensorHandleFactoryRegistry& registry,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1604

bool importEnabled,

Colm Donelan

2022-05-30 15:20:36 +0100

[diff] [blame^]

1605

bool exportEnabled,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1606

Optional<std::vector<std::string>&> errMessages)

1607

{

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1608

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_SelectTensorHandleStrategy");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1609

OptimizationResult result;

1610

Colm Donelan

2022-05-30 15:20:36 +0100

[diff] [blame^]

1611

optGraph.ForEachLayer([&backends, &registry, &result, &errMessages, importEnabled, exportEnabled](Layer* layer)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1612

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1613

ARMNN_ASSERT(layer);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1614

1615

// Lets make sure the backend is in our list of supported backends. Something went wrong during backend

1616

// assignment if this check fails

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1617

ARMNN_ASSERT(backends.find(layer->GetBackendId()) != backends.end());

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1618

1619

// Check each output separately

1620

for (unsigned int slotIdx = 0; slotIdx < layer->GetNumOutputSlots(); slotIdx++)

1621

{

1622

OutputSlot& outputSlot = layer->GetOutputSlot(slotIdx);

1623

1624

ITensorHandleFactory::FactoryId slotOption = ITensorHandleFactory::LegacyFactoryId;

1625

1626

// Calculate the factory to use which results in the fewest copies being made.

1627

switch(layer->GetType())

1628

{

1629

case LayerType::Input:

Narumol Prangnawarat

2021-05-07 17:52:36 +0100

[diff] [blame]

1630

slotOption = CalculateSlotOptionForInput(backends, outputSlot, registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1631

break;

1632

case LayerType::Output:

1633

slotOption = CalculateSlotOptionForOutput(backends, outputSlot, registry);

1634

break;

1635

default:

Colm Donelan

2022-05-30 15:20:36 +0100

[diff] [blame^]

1636

slotOption = CalculateSlotOption(backends, outputSlot, registry, exportEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1637

break;

1638

}

1639

outputSlot.SetTensorHandleFactory(slotOption);

1640

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1641

// Now determine the "best" edge strategy for each connection given the slotOption.

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1642

unsigned int connectionIdx = 0;

1643

for (auto&& connection : outputSlot.GetConnections())

1644

{

1645

const Layer& connectedLayer = connection->GetOwningLayer();

1646

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1647

EdgeStrategy strategy = CalculateEdgeStrategy(backends, slotOption, *layer, connectedLayer,

1648

registry, importEnabled);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1649

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1650

if (strategy == EdgeStrategy::Undefined)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1651

{

1652

result.m_Error = true;

1653

if (errMessages)

1654

{

1655

errMessages.value().emplace_back("Could not find valid strategy required for compatibility"

1656

" between backends.");

}

return;

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1661

outputSlot.SetEdgeStrategy(connectionIdx, strategy);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

connectionIdx++;

}

}

});

return result;

}

Cathal Corbett

2022-03-21 09:27:08 +0000

[diff] [blame]

1671

IOptimizedNetworkPtr Optimize(const Graph& inGraph,

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1672

const std::vector<BackendId>& backendPreferences,

1673

const IDeviceSpec& deviceSpec,

1674

const OptimizerOptions& options,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1675

Optional<std::vector<std::string>&> messages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1676

{

Jan Eilers

17d34da

2021-12-08 16:15:12 +0000

[diff] [blame]

1677

ARMNN_LOG(debug) << options.ToString();

Jan Eilers

6a71bb5

2021-10-26 17:41:18 +0100

[diff] [blame]

1678

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1679

// Enable profiling

Cathal Corbett

2022-03-21 09:27:08 +0000

[diff] [blame]

1680

auto profiler = inGraph.GetProfiler();

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1681

ProfilerManager::GetInstance().RegisterProfiler(profiler.get());

1682

profiler->EnableProfiling(options.m_ProfilingEnabled);

1683

1684

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1685

if (backendPreferences.empty())

1686

{

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1687

throw InvalidArgumentException("Invoked Optimize with no backends specified");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1688

}

1689

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1690

if (options.m_ReduceFp32ToFp16 && options.m_ReduceFp32ToBf16)

1691

{

1692

throw InvalidArgumentException("BFloat16 and Float16 optimization cannot be enabled at the same time.");

1693

}

1694

Cathal Corbett

521032f

2021-10-07 11:46:40 +0100

[diff] [blame]

1695

// Ensure TensorInfo is set on all output slots of ConstantLayers in the graph

Cathal Corbett

2022-03-21 09:27:08 +0000

[diff] [blame]

1696

inGraph.VerifyConstantLayerSetTensorInfo();

Cathal Corbett

521032f

2021-10-07 11:46:40 +0100

[diff] [blame]

1697

Cathal Corbett

2022-03-21 09:27:08 +0000

[diff] [blame]

1698

std::unique_ptr<Graph> graph = std::make_unique<Graph>(inGraph);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1699

Colm Donelan

2022-05-30 15:20:36 +0100

[diff] [blame^]

1700

// We need to pass on the information about whether import and export is enabled to the LoadNetwork phase.

1701

// The mechanism to do that is to add model options to the optimized network.

1702

armnn::BackendOptions importExport("Global",

1703

{{"ImportEnabled", options.m_ImportEnabled},

1704

{"ExportEnabled", options.m_ExportEnabled}});

1705

ModelOptions optimizedOptions(options.m_ModelOptions);

1706

optimizedOptions.push_back(importExport);

1707

1708

auto optNet = IOptimizedNetworkPtr(new IOptimizedNetwork(std::move(graph), optimizedOptions),

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

1709

&IOptimizedNetwork::Destroy);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1710

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1711

IOptimizedNetwork* optNetObjPtr = optNet.get();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1712

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1713

// Get the optimized graph

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1714

Graph& optGraph = optNetObjPtr->pOptimizedNetworkImpl->GetGraph();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1715

Finn Williams

d218d98

2021-08-09 13:00:08 +0100

[diff] [blame]

1716

if(options.m_shapeInferenceMethod == ShapeInferenceMethod::InferAndValidate)

1717

{

1718

// Infer the tensor infos for all output slots. Throws an exception on failure

1719

optGraph.InferTensorInfos();

1720

}

Finn Williams

84e025a

2021-08-05 17:29:32 +0100

[diff] [blame]

1721

Narumol Prangnawarat

16f82f9

2020-09-14 16:12:44 +0100

[diff] [blame]

1722

// Perform AddBroadcastReshapeLayer optimisation

1723

using namespace optimizations;

1724

Optimizer::Pass(optGraph, MakeOptimizations(AddBroadcastReshapeLayer()));

1725

Finn Williams

d218d98

2021-08-09 13:00:08 +0100

[diff] [blame]

1726

if(options.m_shapeInferenceMethod == ShapeInferenceMethod::ValidateOnly)

1727

{

1728

// Validate the tensor infos for all output slots. Throws an exception on failure

1729

optGraph.InferTensorInfos();

1730

}

1731

Cathal Corbett

541880f

2022-05-16 15:20:56 +0100

[diff] [blame]

1732

// Need to FusePermuteIntoConstantLayer before FoldPadIntoDepthwiseConvolution2d or

1733

// FuseBatchNormIntoDepthwiseConvolution2D optimizations are called.

1734

Optimizer::Pass(optGraph, MakeOptimizations(FusePermuteIntoConstLayer()));

1735

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1736

// Perform optimisation passes

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1737

Optimizer::Pass(optGraph, MakeOptimizations(SquashEqualPermuteSiblings(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1738

SquashEqualTransposeSiblings(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1739

SquashEqualReshapeSiblings(),

1740

OptimizeInversePermutes(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1741

OptimizeInverseTransposes(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1742

MovePermuteUp(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1743

MoveTransposeUp(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1744

PermuteAsReshape(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1745

TransposeAsReshape(),

Nina Drozd

861985f

2019-04-18 14:48:51 +0100

[diff] [blame]

1746

OptimizeConsecutiveReshapes(),

Rob Hughes

3a7d3a7

2019-09-24 16:59:56 +0100

[diff] [blame]

1747

FoldPadIntoConvolution2d(),

Teresa Charlin

5786eb7

2021-05-21 16:29:45 +0100

[diff] [blame]

1748

FoldPadIntoDepthwiseConvolution2d(),

Diego Lopez Recas

fe95d72

2021-03-19 12:40:16 +0000

[diff] [blame]

1749

FoldPadIntoPooling2d(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1750

PermuteAndBatchToSpaceAsDepthToSpace(),

Teresa Charlin

06e0300

2020-10-15 13:16:07 +0100

[diff] [blame]

1751

TransposeAndBatchToSpaceAsDepthToSpace(),

Mike Kelly

90231b8

2020-11-05 15:44:56 +0000

[diff] [blame]

1752

FuseBatchNormIntoConvolution2DFloat32(),

1753

FuseBatchNormIntoConvolution2DFloat16(),

1754

FuseBatchNormIntoDepthwiseConvolution2DFloat32(),

Cathal Corbett

2022-04-14 17:55:11 +0100

[diff] [blame]

1755

FuseBatchNormIntoDepthwiseConvolution2DFloat16(),

Cathal Corbett

541880f

2022-05-16 15:20:56 +0100

[diff] [blame]

1756

ConvertConstDequantisationLayersToConstLayers()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1757

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1758

// If Fp32 to Fp16 optimization is set convert Fp32 network to Fp16

1759

if (options.m_ReduceFp32ToFp16)

1760

{

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1761

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_ReduceFp32ToFp16");

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1762

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToFp16Converter()));

Derek Lamberti

dd6804b

2019-11-27 09:29:57 +0000

[diff] [blame]

1763

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1764

}

1765

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1766

// If Fp32 to Bf16 optimization is set convert Fp32 network to Bf16

Narumol Prangnawarat

57ef008

2020-03-26 09:20:43 +0000

[diff] [blame]

1767

// Convert input of Convolution2d and FullyConnected from Fp32 to Bf16

1768

// Only Constant weight of Convolution2d and FullyConnected are converted from Fp32 to Bf16

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1769

if (options.m_ReduceFp32ToBf16)

1770

{

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1771

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_ReduceFp32ToBf16");

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1772

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToBf16Converter()));

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1773

}

1774

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1775

// Initialize backend settings

1776

BackendSettings backendSettings(backendPreferences, deviceSpec);

1777

if (backendSettings.GetAvailablePreferredBackends().empty())

1778

{

1779

std::stringstream failureMsg;

1780

failureMsg << "None of the preferred backends " << backendPreferences

1781

<< " are supported. Current platform provides " << backendSettings.m_SupportedBackends;

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1782

ReportError(failureMsg.str(), messages);

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1783

throw InvalidArgumentException(failureMsg.str());

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1784

}

1785

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1786

// Create a map to temporarily hold initialized backend objects

1787

TensorHandleFactoryRegistry tensorHandleFactoryRegistry;

1788

BackendsMap backends = CreateSupportedBackends(tensorHandleFactoryRegistry, backendSettings);

1789

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1790

// Assign an available backend to each layer

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1791

Graph::Iterator firstLayer = optGraph.begin();

1792

Graph::Iterator lastLayer = optGraph.end();

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1793

OptimizationResult assignBackendsResult = AssignBackends(optNetObjPtr->pOptimizedNetworkImpl.get(),

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1794

backendSettings,

1795

firstLayer,

1796

lastLayer,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1797

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1798

if (assignBackendsResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1799

{

1800

// Failed to assign a backend to each layer

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1801

throw InvalidArgumentException("Failed to assign a backend to each layer");

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

1802

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1803

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1804

Optimizer::Pass(optGraph, MakeOptimizations(OptimizeInverseConversionsFp16(),

1805

OptimizeInverseConversionsFp32()));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1806

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1807

// Apply the backend-specific optimizations

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1808

OptimizationResult backendOptimizationResult = ApplyBackendOptimizations(optNetObjPtr->pOptimizedNetworkImpl.get(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1809

backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1810

backends,

Mike Kelly

07810fc

2020-11-12 10:58:48 +0000

[diff] [blame]

1811

options.m_ModelOptions,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1812

messages);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1813

if (backendOptimizationResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1814

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1815

// Failed to apply the backend-specific optimizations

Mike Kelly

2020-09-29 20:50:35 +0100

[diff] [blame]

1816

throw InvalidArgumentException("Failed to apply the backend-specific optimizations");

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1817

}

1818

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1819

// If the debug flag is set, then insert a DebugLayer after each layer

1820

// Doing this after applying the backend optimizations as they might have changed some layers

1821

if (options.m_Debug)

1822

{

1823

Optimizer::Pass(optGraph, MakeOptimizations(InsertDebugLayer()));

1824

}

1825

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1826

// Calculate the compatibility strategies for tensor handles

1827

OptimizationResult strategyResult = SelectTensorHandleStrategy(optGraph,

1828

backends,

1829

tensorHandleFactoryRegistry,

Narumol Prangnawarat

2020-08-19 14:39:07 +0100

[diff] [blame]

1830

options.m_ImportEnabled,

Colm Donelan

2022-05-30 15:20:36 +0100

[diff] [blame^]

1831

options.m_ExportEnabled,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1832

messages);

Colm Donelan

2022-05-30 15:20:36 +0100

[diff] [blame^]

1833

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1834

if (strategyResult.m_Error)

1835

{

1836

// Failed to apply the backend-specific optimizations

1837

return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);

1838

}

1839

1840

// Based on the tensor handle strategy determined above, insert copy layers where required.

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1841

{

1842

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_AddCompatibilityLayers");

1843

optGraph.AddCompatibilityLayers(backends, tensorHandleFactoryRegistry);

1844

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1845

1846

// Convert constants

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1847

{

1848

ARMNN_SCOPED_PROFILING_EVENT(Compute::Undefined, "Optimizer_ConvertConstants");

1849

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

1850

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsHalfToFloat()));

Cathal Corbett

8bd5360

2022-05-12 15:54:58 +0100

[diff] [blame]

1851

1852

// Once the constants are converted we can now safely call RedirectMembersToConstantInputs

1853

Optimizer::Pass(optGraph, MakeOptimizations(RedirectMembersToConstantInputs()));

Derek Lamberti

2021-10-13 18:02:25 +0100

[diff] [blame]

1854

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1855

return optNet;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1856

}

Cathal Corbett

2022-03-21 09:27:08 +0000

[diff] [blame]

1857

1858

IOptimizedNetworkPtr Optimize(const INetwork& inNetwork,

1859

const std::vector<BackendId>& backendPreferences,

1860

const IDeviceSpec& deviceSpec,

1861

const OptimizerOptions& options,

1862

Optional<std::vector<std::string>&> messages)

1863

{

1864

return Optimize(inNetwork.pNetworkImpl->GetGraph(),

backendPreferences,

deviceSpec,

options,

messages);

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1871

bool NetworkImpl::GetShapeInferenceMethod()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1872

{

Mike Kelly

2022-05-16 23:10:42 +0100

[diff] [blame]

1873

bool shapeInferenceMethod = false;

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

1874

Mike Kelly

2022-05-16 23:10:42 +0100

[diff] [blame]

1875

ParseOptions(m_NetworkOptions, "ShapeInferenceMethod", [&](std::string name, const BackendOptions::Var& value)

1876

{

1877

if (name == "InferAndValidate")

1878

{

1879

shapeInferenceMethod |= value.AsBool();

1880

}

1881

});

1882

return shapeInferenceMethod;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1883

}

Mike Kelly

2022-05-16 23:10:42 +0100

[diff] [blame]

1884

1885

bool NetworkImpl::GetAllowExpandedDims()

1886

{

1887

bool allowExpandedDims = false;

1888

1889

ParseOptions(m_NetworkOptions, "AllowExpandedDims", [&](std::string name, const BackendOptions::Var& value)

1890

{

1891

if (name == "AllowExpandedDims")

1892

{

1893

allowExpandedDims |= value.AsBool();

1894

}

1895

});

1896

return allowExpandedDims;

1897

}

1898

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1899

NetworkImpl::NetworkImpl(NetworkOptions networkOptions)

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

1900

: m_NetworkOptions(networkOptions),

Mike Kelly

2022-05-16 23:10:42 +0100

[diff] [blame]

1901

m_Graph(std::make_unique<Graph>(GetShapeInferenceMethod(), GetAllowExpandedDims()))

Finn Williams

2020-07-03 10:12:03 +0100

[diff] [blame]

1902

{}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1903

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1904

NetworkImpl::~NetworkImpl()

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1908

Status NetworkImpl::PrintGraph()

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

1909

{

1910

m_Graph->Print();

1911

return Status::Success;

1912

}

1913

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1914

IConnectableLayer* NetworkImpl::AddInputLayer(LayerBindingId id, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1915

{

1916

return m_Graph->AddLayer<InputLayer>(id, name);

1917

}

1918

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1919

IConnectableLayer* NetworkImpl::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

Éanna Ó Catháin

4e1e136

2018-11-12 11:36:34 +0000

[diff] [blame]

1920

const char* name)

1921

{

1922

return m_Graph->AddLayer<BatchToSpaceNdLayer>(batchToSpaceNdDescriptor, name);

1923

}

1924

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

1925

IConnectableLayer* NetworkImpl::AddCastLayer(const char* name)

1926

{

1927

return m_Graph->AddLayer<CastLayer>(name);

1928

}

Simon Obute

51f6777

2021-09-03 15:50:13 +0100

[diff] [blame]

1929

IConnectableLayer* NetworkImpl::AddChannelShuffleLayer(const ChannelShuffleDescriptor& channelShuffleDescriptor,

1930

const char* name)

1931

{

1932

return m_Graph->AddLayer<ChannelShuffleLayer>(channelShuffleDescriptor, name);

1933

}

mathad01

b392e98

2021-04-07 12:07:30 +0100

[diff] [blame]

1934

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1935

IConnectableLayer* NetworkImpl::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

1936

const char* name)

1937

{

1938

return m_Graph->AddLayer<ComparisonLayer>(comparisonDescriptor, name);

1939

}

1940

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1941

IConnectableLayer* NetworkImpl::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

1942

const char* name)

1943

{

1944

return m_Graph->AddLayer<ElementwiseUnaryLayer>(elementwiseUnaryDescriptor, name);

1945

}

1946

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1947

IConnectableLayer* NetworkImpl::AddFillLayer(const FillDescriptor& fillDescriptor,

Ryan OShea

ec6c680

2020-06-05 17:17:06 +0100

[diff] [blame]

1948

const char* name)

1949

{

1950

return m_Graph->AddLayer<FillLayer>(fillDescriptor, name);

1951

}

1952

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1953

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

1954

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1955

{

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1956

return m_Graph->AddLayer<FullyConnectedLayer>(fullyConnectedDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1957

}

1958

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

1959

IConnectableLayer* NetworkImpl::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

Sadik Armagan

f0a6dec

2021-03-25 07:46:55 +0000

[diff] [blame]

1960

const Optional<ConstTensor>& weights,

1961

const Optional<ConstTensor>& biases,

1962

const char* name)

1963

{

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1964

ConstantLayer* weightsLayer = nullptr;

1965

ConstantLayer* biasLayer = nullptr;

1966

unsigned int numInputs = fullyConnectedDescriptor.GetNumInputs();

1967

1968

// Add a constant layer for weights

1969

if (weights.has_value())

1970

{

1971

weightsLayer = m_Graph->AddLayer<ConstantLayer>("Weights");

1972

weightsLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(weights.value());

Matthew Sloyan

b20d1d4

2021-08-09 15:33:41 +0100

[diff] [blame]

1973

1974

TensorInfo weightsInfo = weightsLayer->m_LayerOutput->GetTensorInfo();

1975

weightsInfo.SetConstant();

1976

1977

weightsLayer->GetOutputSlot(0).SetTensorInfo(weightsInfo);

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

1978

}

1979

else if (fullyConnectedDescriptor.m_ConstantWeights)

1980

{

1981

throw InvalidArgumentException("AddFullyConnectedLayer: Constant weights tensor is empty.");

1982

}

1983

1984

// Add a constant layer for biases

1985

if (biases.has_value() && fullyConnectedDescriptor.m_BiasEnabled)

1986

{

1987

biasLayer = m_Graph->AddLayer<ConstantLayer>("Biases");

1988

biasLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(biases.value());

Matthew Sloyan

b20d1d4

2021-08-09 15:33:41 +0100

[diff] [blame]

1989

1990

TensorInfo biasInfo = biasLayer->m_LayerOutput->GetTensorInfo();

1991

biasInfo.SetConstant();

1992

1993

biasLayer->GetOutputSlot(0).SetTensorInfo(biasInfo);

Matthew Sloyan

2021-07-13 19:46:11 +0100

[diff] [blame]

}

if (numInputs < 2)

{

throw InvalidArgumentException("AddFullyConnectedLayer: Requires at least 2 input tensors: Input, Weights");

1999

}

2000

2001

auto layer = m_Graph->AddLayer<FullyConnectedLayer>(fullyConnectedDescriptor, name);

if (weightsLayer)

{

// Connect weights layer

2006

weightsLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(1));

2007

}

2008

2009

if ( fullyConnectedDescriptor.m_BiasEnabled && numInputs == 3 )

{

if (biasLayer)

{

// Connect bias layer

2014

biasLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(2));

2015

}

2016

}

2017

else if ( !fullyConnectedDescriptor.m_BiasEnabled && numInputs == 2 )

2018

{

2019

// Bias is disabled

2020

layer->m_Bias = nullptr;

}

else

{

throw InvalidArgumentException(fmt::format(

2025

"AddFullyConnectedLayer: Value mismatch. When bias is enabled in the "

2026

"descriptor the number of inputs is expected to be 3 otherwise 2. "

2027

"BiasEnabled={}, numInputs={}",

2028

fullyConnectedDescriptor.m_BiasEnabled,

numInputs));

}

return layer;

Sadik Armagan

f0a6dec

2021-03-25 07:46:55 +0000

[diff] [blame]

2033

}

2034

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2035

IConnectableLayer* NetworkImpl::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

2036

const char* name)

2037

{

Jim Flynn

e242f2d

2019-05-22 14:24:13 +0100

[diff] [blame]

2038

return m_Graph->AddLayer<ConcatLayer>(concatDescriptor, name);

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

2039

}

2040

Keith Davis

2022-04-07 11:32:00 +0100

[diff] [blame]

2041

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

2042

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2043

{

Keith Davis

2022-04-07 11:32:00 +0100

[diff] [blame]

2044

return m_Graph->AddLayer<Convolution2dLayer>(convolution2dDescriptor, name);

2045

}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2046

Keith Davis

2022-04-07 11:32:00 +0100

[diff] [blame]

2047

IConnectableLayer* NetworkImpl::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

2048

const ConstTensor& weights,

2049

const Optional<ConstTensor>& biases,

2050

const char* name)

2051

{

2052

auto layer = m_Graph->AddLayer<Convolution2dLayer>(convolution2dDescriptor, name);

2053

// Add a constant layer for weights

2054

ConstantLayer* weightsLayer = m_Graph->AddLayer<ConstantLayer>("Weights");

2055

weightsLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(weights);

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2056

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

Keith Davis

2022-04-07 11:32:00 +0100

[diff] [blame]

2057

weightsLayer->GetOutputSlot(0).SetTensorInfo(weightsLayer->m_LayerOutput->GetTensorInfo());

2058

weightsLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(1));

2059

// Add a constant layer for biases

2060

if (biases.has_value() && convolution2dDescriptor.m_BiasEnabled)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2061

{

Keith Davis

2022-04-07 11:32:00 +0100

[diff] [blame]

2062

ConstantLayer* biasLayer = m_Graph->AddLayer<ConstantLayer>("Bias");

2063

biasLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(biases.value());

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2064

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

Keith Davis

2022-04-07 11:32:00 +0100

[diff] [blame]

2065

biasLayer->GetOutputSlot(0).SetTensorInfo(biasLayer->m_LayerOutput->GetTensorInfo());

2066

biasLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(2));

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2067

}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

return layer;

}

Cathal Corbett

2022-03-21 09:27:08 +0000

[diff] [blame]

2071

IConnectableLayer* NetworkImpl::AddConvertFp16ToFp32Layer(const char* name)

2072

{

2073

return m_Graph->AddLayer<ConvertFp16ToFp32Layer>(name);

2074

}

2075

2076

IConnectableLayer* NetworkImpl::AddConvertFp32ToFp16Layer(const char* name)

2077

{

2078

return m_Graph->AddLayer<ConvertFp32ToFp16Layer>(name);

2079

}

2080

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

2081

IConnectableLayer* NetworkImpl::AddConvolution3dLayer(const Convolution3dDescriptor& convolution3dDescriptor,

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

2082

const char* name)

2083

{

Matthew Sloyan

5d7b0a3

2021-10-18 13:07:49 +0100

[diff] [blame]

2084

return m_Graph->AddLayer<Convolution3dLayer>(convolution3dDescriptor, name);

Matthew Sloyan

2021-09-08 13:05:51 +0100

[diff] [blame]

2085

}

2086

2087

IConnectableLayer* NetworkImpl::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

2088

const char* name)

2089

{

2090

return m_Graph->AddLayer<DepthToSpaceLayer>(depthToSpaceDescriptor, name);

2091

}

2092

Cathal Corbett

2022-04-14 17:55:11 +0100

[diff] [blame]

2093

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

2094

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

2095

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2096

{

Cathal Corbett

2022-04-14 17:55:11 +0100

[diff] [blame]

2097

return m_Graph->AddLayer<DepthwiseConvolution2dLayer>(convolution2dDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2098

}

2099

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2100

IConnectableLayer* NetworkImpl::AddDepthwiseConvolution2dLayer(

Cathal Corbett

2022-04-14 17:55:11 +0100

[diff] [blame]

2101

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

2102

const ConstTensor& weights,

2103

const Optional<ConstTensor>& biases,

2104

const char* name)

Aron Virginas-Tar

ad40270

2019-02-22 17:03:44 +0000

[diff] [blame]

2105

{

Cathal Corbett

2022-04-14 17:55:11 +0100

[diff] [blame]

2106

auto layer = m_Graph->AddLayer<DepthwiseConvolution2dLayer>(convolution2dDescriptor, name);

2107

2108

// Add a constant layer for weights

2109

ConstantLayer* weightsLayer = m_Graph->AddLayer<ConstantLayer>("Weights");

2110

weightsLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(weights);

2111

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

2112

2113

weightsLayer->GetOutputSlot(0).SetTensorInfo(weightsLayer->m_LayerOutput->GetTensorInfo());

2114

weightsLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(1));

2115

2116

// Add a constant layer for biases

2117

if (biases.has_value() && convolution2dDescriptor.m_BiasEnabled)

2118

{

2119

ConstantLayer* biasLayer = m_Graph->AddLayer<ConstantLayer>("Bias");

2120

biasLayer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(biases.value());

2121

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

2122

2123

biasLayer->GetOutputSlot(0).SetTensorInfo(biasLayer->m_LayerOutput->GetTensorInfo());

2124

biasLayer->GetOutputSlot(0).Connect(layer->GetInputSlot(2));

2125

}

2126

2127

return layer;

Aron Virginas-Tar

ad40270

2019-02-22 17:03:44 +0000

[diff] [blame]

2128

}

2129

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2130

IConnectableLayer* NetworkImpl::AddDetectionPostProcessLayer(const armnn::DetectionPostProcessDescriptor& descriptor,

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

2131

const ConstTensor& anchors, const char* name)

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

2132

{

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

2133

const auto layer = m_Graph->AddLayer<DetectionPostProcessLayer>(descriptor, name);

2134

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2135

layer->m_Anchors = std::make_shared<ScopedTensorHandle>(anchors);

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

2136

2137

return layer;

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

2138

}

2139

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2140

IConnectableLayer* NetworkImpl::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2141

const char* name)

2142

{

2143

return m_Graph->AddLayer<PermuteLayer>(permuteDescriptor, name);

2144

}

2145

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2146

IConnectableLayer* NetworkImpl::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2147

const char* name)

2148

{

2149

return m_Graph->AddLayer<Pooling2dLayer>(pooling2dDescriptor, name);

2150

}

2151

Tamás Nyíri

7b885b3

2021-10-26 14:47:57 +0100

[diff] [blame]

2152

IConnectableLayer* NetworkImpl::AddPooling3dLayer(const Pooling3dDescriptor& pooling3dDescriptor,

2153

const char* name)

2154

{

2155

return m_Graph->AddLayer<Pooling3dLayer>(pooling3dDescriptor, name);

2156

}

2157

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2158

IConnectableLayer* NetworkImpl::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2159

const char* name)

2160

{

2161

return m_Graph->AddLayer<ActivationLayer>(activationDescriptor, name);

2162

}

2163

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2164

IConnectableLayer* NetworkImpl::AddArgMinMaxLayer(const ArgMinMaxDescriptor& argMinMaxDescriptor,

Nikhil Raj

ee391d5

2019-09-05 17:50:44 +0100

[diff] [blame]

2165

const char* name)

2166

{

2167

return m_Graph->AddLayer<ArgMinMaxLayer>(argMinMaxDescriptor, name);

2168

}

2169

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2170

IConnectableLayer* NetworkImpl::AddNormalizationLayer(const NormalizationDescriptor&

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2171

normalizationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2172

const char* name)

2173

{

2174

return m_Graph->AddLayer<NormalizationLayer>(normalizationDescriptor, name);

2175

}

2176

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2177

IConnectableLayer* NetworkImpl::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

Aron Virginas-Tar

636ab40

2019-09-16 14:27:45 +0100

[diff] [blame]

2178

{

2179

return m_Graph->AddLayer<SliceLayer>(sliceDescriptor, name);

2180

}

2181

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2182

IConnectableLayer* NetworkImpl::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2183

const char* name)

2184

{

2185

return m_Graph->AddLayer<SoftmaxLayer>(softmaxDescriptor, name);

2186

}

2187

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2188

IConnectableLayer* NetworkImpl::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2189

const char* name)

2190

{

2191

return m_Graph->AddLayer<SplitterLayer>(splitterDescriptor, name);

2192

}

2193

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2194

IConnectableLayer* NetworkImpl::AddMaximumLayer(const char* name)

Nattapat Chaimanowong

5a4304a

2018-11-28 10:44:37 +0000

[diff] [blame]

2195

{

2196

return m_Graph->AddLayer<MaximumLayer>(name);

2197

}

2198

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2199

IConnectableLayer* NetworkImpl::AddMinimumLayer(const char* name)

Éanna Ó Catháin

20e5880

2018-12-04 10:29:06 +0000

[diff] [blame]

2200

{

2201

return m_Graph->AddLayer<MinimumLayer>(name);

2202

}

2203

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2204

IConnectableLayer* NetworkImpl::AddAdditionLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2205

{

2206

return m_Graph->AddLayer<AdditionLayer>(name);

2207

}

2208

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2209

IConnectableLayer* NetworkImpl::AddMultiplicationLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2210

{

2211

return m_Graph->AddLayer<MultiplicationLayer>(name);

2212

}

2213

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2214

IConnectableLayer* NetworkImpl::AddOutputLayer(LayerBindingId id, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2215

{

2216

return m_Graph->AddLayer<OutputLayer>(id, name);

2217

}

2218

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2219

IConnectableLayer* NetworkImpl::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2220

const ConstTensor& mean,

2221

const ConstTensor& variance,

2222

const ConstTensor& beta,

2223

const ConstTensor& gamma,

2224

const char* name)

2225

{

2226

const auto layer = m_Graph->AddLayer<BatchNormalizationLayer>(desc, name);

2227

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2228

layer->m_Mean = std::make_shared<ScopedTensorHandle>(mean);

2229

layer->m_Variance = std::make_shared<ScopedTensorHandle>(variance);

2230

layer->m_Beta = std::make_shared<ScopedTensorHandle>(beta);

2231

layer->m_Gamma = std::make_shared<ScopedTensorHandle>(gamma);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2236

IConnectableLayer* NetworkImpl::AddRankLayer(const char* name)

Finn Williams

2605b23

2020-06-10 15:53:46 +0100

[diff] [blame]

2237

{

2238

return m_Graph->AddLayer<RankLayer>(name);

2239

}

2240

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2241

IConnectableLayer* NetworkImpl::AddReduceLayer(const ReduceDescriptor& reduceDescriptor,

2242

const char* name)

Sadik Armagan

0c3ea5b

2021-02-03 09:29:30 +0000

[diff] [blame]

2243

{

2244

return m_Graph->AddLayer<ReduceLayer>(reduceDescriptor, name);

2245

}

2246

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2247

IConnectableLayer* NetworkImpl::AddResizeLayer(const ResizeDescriptor& resizeDescriptor, const char* name)

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

2248

{

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

2249

return m_Graph->AddLayer<ResizeLayer>(resizeDescriptor, name);

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

2250

}

2251

Keith Davis

3ae3f97

2021-05-21 16:33:48 +0100

[diff] [blame]

2252

IConnectableLayer* NetworkImpl::AddShapeLayer(const char* name)

2253

{

2254

return m_Graph->AddLayer<ShapeLayer>(name);

2255

}

2256

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2257

IConnectableLayer* NetworkImpl::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

2258

const char* name)

Kevin May

ce5045a

2019-10-02 14:07:47 +0100

[diff] [blame]

2259

{

2260

return m_Graph->AddLayer<InstanceNormalizationLayer>(desc, name);

2261

}

2262

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2263

IConnectableLayer* NetworkImpl::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

2264

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2265

{

Matteo Martincigh

bcd3c85

2018-09-28 14:14:12 +0100

[diff] [blame]

2266

return m_Graph->AddLayer<L2NormalizationLayer>(desc, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2267

}

2268

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2269

IConnectableLayer* NetworkImpl::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& desc,

Aron Virginas-Tar

f982dea

2019-10-11 14:07:53 +0100

[diff] [blame]

2270

const char* name)

2271

{

2272

return m_Graph->AddLayer<LogSoftmaxLayer>(desc, name);

2273

}

2274

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2275

IConnectableLayer* NetworkImpl::AddConstantLayer(const ConstTensor& input, const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2276

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2277

auto layer = m_Graph->AddLayer<ConstantLayer>(name);

2278

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2279

layer->m_LayerOutput = std::make_shared<ScopedTensorHandle>(input);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2280

2281

return layer;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2282

}

2283

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2284

IConnectableLayer* NetworkImpl::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2285

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2286

{

2287

return m_Graph->AddLayer<ReshapeLayer>(reshapeDescriptor, name);

2288

}

2289

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2290

IConnectableLayer* NetworkImpl::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

Nattapat Chaimanowong

207ef9a

2018-11-02 10:57:25 +0000

[diff] [blame]

2291

const char* name)

2292

{

2293

return m_Graph->AddLayer<SpaceToBatchNdLayer>(spaceToBatchNdDescriptor, name);

2294

}

2295

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2296

IConnectableLayer* NetworkImpl::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

Aron Virginas-Tar

972af15

2019-06-11 14:14:03 +0100

[diff] [blame]

2297

const char* name)

2298

{

2299

return m_Graph->AddLayer<SpaceToDepthLayer>(spaceToDepthDescriptor, name);

2300

}

2301

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2302

IConnectableLayer* NetworkImpl::AddFloorLayer(const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

2303

{

2304

return m_Graph->AddLayer<FloorLayer>(name);

2305

}

2306

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2307

IConnectableLayer* NetworkImpl::AddLstmLayer(const LstmDescriptor& descriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2308

const LstmInputParams& params,

2309

const char* name)

2310

{

2311

const auto layer = m_Graph->AddLayer<LstmLayer>(descriptor, name);

2312

2313

//Lstm Basic Parameters

2314

layer->m_BasicParameters.m_InputToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2315

std::make_shared<ScopedTensorHandle>(*(params.m_InputToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2316

layer->m_BasicParameters.m_InputToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2317

std::make_shared<ScopedTensorHandle>(*(params.m_InputToCellWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2318

layer->m_BasicParameters.m_InputToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2319

std::make_shared<ScopedTensorHandle>(*(params.m_InputToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2320

layer->m_BasicParameters.m_RecurrentToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2321

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2322

layer->m_BasicParameters.m_RecurrentToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2323

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToCellWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2324

layer->m_BasicParameters.m_RecurrentToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2325

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2326

layer->m_BasicParameters.m_ForgetGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2327

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2328

layer->m_BasicParameters.m_CellBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2329

std::make_shared<ScopedTensorHandle>(*(params.m_CellBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2330

layer->m_BasicParameters.m_OutputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2331

std::make_shared<ScopedTensorHandle>(*(params.m_OutputGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2332

2333

//Lstm Cifg parameters

2334

if(!descriptor.m_CifgEnabled)

2335

{

2336

if(params.m_InputToInputWeights == nullptr)

2337

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2338

throw InvalidArgumentException("AddLstmLayer: Input To Input Weights cannot be NULL "

2339

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2340

}

2341

if(params.m_RecurrentToInputWeights == nullptr)

2342

{

2343

throw InvalidArgumentException(

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2344

"AddLstmLayer: Recurrent To Input Weights cannot be NULL "

2345

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2346

}

2347

if(params.m_InputGateBias == nullptr)

2348

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2349

throw InvalidArgumentException("AddLstmLayer: Input Gate Bias cannot be NULL "

2350

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2351

}

2352

layer->m_CifgParameters.m_InputToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2353

std::make_shared<ScopedTensorHandle>(*(params.m_InputToInputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2354

layer->m_CifgParameters.m_RecurrentToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2355

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToInputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2356

layer->m_CifgParameters.m_InputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2357

std::make_shared<ScopedTensorHandle>(*(params.m_InputGateBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2358

}

2359

2360

//Lstm projection parameters

2361

if(descriptor.m_ProjectionEnabled)

2362

{

2363

if(params.m_ProjectionWeights == nullptr)

2364

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2365

throw InvalidArgumentException("AddLstmLayer: Projection Weights cannot be NULL "

2366

"when projection is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2367

}

2368

layer->m_ProjectionParameters.m_ProjectionWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2369

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2370

if(params.m_ProjectionBias != nullptr)

2371

{

2372

layer->m_ProjectionParameters.m_ProjectionBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2373

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionBias));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

}

}

//Lstm Peephole params

2378

if(descriptor.m_PeepholeEnabled)

2379

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2380

if(!descriptor.m_CifgEnabled)

2381

{

2382

if(params.m_CellToInputWeights == nullptr)

2383

{

2384

throw InvalidArgumentException("AddLstmLayer: Cell To Input Weights cannot be NULL "

2385

"when Peephole is enabled and CIFG disabled.");

2386

}

2387

2388

layer->m_PeepholeParameters.m_CellToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2389

std::make_shared<ScopedTensorHandle>(*(params.m_CellToInputWeights));

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2390

}

2391

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2392

if(params.m_CellToForgetWeights == nullptr)

2393

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2394

throw InvalidArgumentException("AddLstmLayer: Cell To Forget Weights cannot be NULL "

2395

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2396

}

2397

if(params.m_CellToOutputWeights == nullptr)

2398

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2399

throw InvalidArgumentException("AddLstmLayer: Cell To Output Weights cannot be NULL "

2400

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2401

}

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2402

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2403

layer->m_PeepholeParameters.m_CellToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2404

std::make_shared<ScopedTensorHandle>(*(params.m_CellToForgetWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2405

layer->m_PeepholeParameters.m_CellToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2406

std::make_shared<ScopedTensorHandle>(*(params.m_CellToOutputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

2407

}

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2408

2409

//Lstm Layer Normalization params

2410

if(descriptor.m_LayerNormEnabled)

2411

{

2412

if(!descriptor.m_CifgEnabled)

2413

{

2414

if(params.m_InputLayerNormWeights == nullptr)

2415

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2416

throw InvalidArgumentException("AddLstmLayer: Input layer normalization weights cannot be NULL "

2417

"when layer normalization is enabled and CIFG disabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2418

}

2419

layer->m_LayerNormParameters.m_InputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2420

std::make_shared<ScopedTensorHandle>(*(params.m_InputLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2421

}

2422

2423

if(params.m_ForgetLayerNormWeights == nullptr)

2424

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2425

throw InvalidArgumentException("AddLstmLayer: Forget layer normalization weights cannot be NULL "

2426

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2427

}

2428

if(params.m_CellLayerNormWeights == nullptr)

2429

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2430

throw InvalidArgumentException("AddLstmLayer: Cell layer normalization weights cannot be NULL "

2431

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2432

}

2433

if(params.m_OutputLayerNormWeights == nullptr)

2434

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

2435

throw InvalidArgumentException("AddLstmLayer: Output layer normalization weights cannot be NULL "

2436

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2437

}

2438

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2439

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2440

layer->m_LayerNormParameters.m_CellLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2441

std::make_shared<ScopedTensorHandle>(*(params.m_CellLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2442

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2443

std::make_shared<ScopedTensorHandle>(*(params.m_OutputLayerNormWeights));

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

2444

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2448

IConnectableLayer* NetworkImpl::AddDivisionLayer(const char* name)

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

2449

{

2450

return m_Graph->AddLayer<DivisionLayer>(name);

2451

}

2452

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2453

IConnectableLayer* NetworkImpl::AddSubtractionLayer(const char* name)

David Beck

1952622

2018-09-12 16:00:08 +0100

[diff] [blame]

2454

{

2455

return m_Graph->AddLayer<SubtractionLayer>(name);

2456

}

2457

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2458

IConnectableLayer* NetworkImpl::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

narpra01

32b9046

2018-09-13 11:07:48 +0100

[diff] [blame]

2459

{

2460

return m_Graph->AddLayer<MeanLayer>(meanDescriptor,name);

2461

}

2462

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2463

IConnectableLayer* NetworkImpl::AddPadLayer(const PadDescriptor& padDescriptor, const char* name)

Mohamed Nour Abouelseoud

5662c20

2018-09-24 13:30:09 +0100

[diff] [blame]

2464

{

2465

return m_Graph->AddLayer<PadLayer>(padDescriptor,name);

2466

}

2467

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2468

IConnectableLayer *NetworkImpl::AddQuantizeLayer(const char *name)

Derek Lamberti

a9cca6a

2019-03-25 15:41:58 +0000

[diff] [blame]

2469

{

2470

return m_Graph->AddLayer<QuantizeLayer>(name);

2471

}

2472

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2473

IConnectableLayer* NetworkImpl::AddDequantizeLayer(const char* name)

Nattapat Chaimanowong

e4294fd

2019-03-28 09:56:53 +0000

[diff] [blame]

2474

{

2475

return m_Graph->AddLayer<DequantizeLayer>(name);

2476

}

2477

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2478

IConnectableLayer* NetworkImpl::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

Teresa Charlin

2022-04-12 22:07:09 +0100

[diff] [blame]

2479

const char* name)

Conor Kennedy

430b5d8

2018-11-14 15:28:28 +0000

[diff] [blame]

2480

{

2481

return m_Graph->AddLayer<StridedSliceLayer>(stridedSliceDescriptor, name);

2482

}

2483

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2484

IConnectableLayer* NetworkImpl::AddGatherLayer(const GatherDescriptor& gatherDescriptor,

Teresa Charlin

2022-04-12 22:07:09 +0100

[diff] [blame]

2485

const char* name)

Teresa Charlin

5266473

2020-06-29 16:27:03 +0100

[diff] [blame]

2486

{

2487

return m_Graph->AddLayer<GatherLayer>(gatherDescriptor, name);

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

2488

}

2489

Teresa Charlin

2022-04-12 22:07:09 +0100

[diff] [blame]

2490

IConnectableLayer* NetworkImpl::AddGatherNdLayer(const char* name)

2491

{

2492

return m_Graph->AddLayer<GatherNdLayer>(name);

2493

}

2494

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2495

IConnectableLayer* NetworkImpl::AddMergeLayer(const char* name)

Nattapat Chaimanowong

1f88630

2019-04-05 13:37:19 +0100

[diff] [blame]

2496

{

2497

return m_Graph->AddLayer<MergeLayer>(name);

2498

}

2499

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2500

IConnectableLayer* NetworkImpl::AddSwitchLayer(const char* name)

Sadik Armagan

eff363d

2019-04-05 15:25:46 +0100

[diff] [blame]

2501

{

2502

return m_Graph->AddLayer<SwitchLayer>(name);

2503

}

2504

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2505

IConnectableLayer* NetworkImpl::AddPreluLayer(const char* name)

Matteo Martincigh

0e406ee

2019-06-12 15:42:18 +0100

[diff] [blame]

2506

{

2507

return m_Graph->AddLayer<PreluLayer>(name);

2508

}

2509

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2510

IConnectableLayer* NetworkImpl::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

2511

const ConstTensor& weights,

2512

const Optional<ConstTensor>& biases,

2513

const char* name)

2514

{

2515

if (descriptor.m_BiasEnabled && !biases.has_value())

2516

{

2517

throw InvalidArgumentException("AddTransposeConvolution2dLayer: Biases cannot be empty");

2518

}

2519

2520

const auto layer = m_Graph->AddLayer<TransposeConvolution2dLayer>(descriptor, name);

2521

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2522

layer->m_Weight = std::make_shared<ScopedTensorHandle>(weights);

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

2523

2524

if (descriptor.m_BiasEnabled)

2525

{

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2526

layer->m_Bias = std::make_shared<ScopedTensorHandle>(biases.value());

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2532

IConnectableLayer* NetworkImpl::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

Mike Kelly

c9ea45a

2020-02-28 18:11:58 +0000

[diff] [blame]

2533

const char* name)

2534

{

2535

return m_Graph->AddLayer<TransposeLayer>(transposeDescriptor, name);

2536

}

2537

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2538

IConnectableLayer* NetworkImpl::AddStackLayer(const StackDescriptor& stackDescriptor,

Matthew Jackson

2b8c1da

2019-07-04 14:59:16 +0100

[diff] [blame]

2539

const char* name)

2540

{

2541

return m_Graph->AddLayer<StackLayer>(stackDescriptor, name);

2542

}

2543

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

2544

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2545

IConnectableLayer* NetworkImpl::AddStandInLayer(const StandInDescriptor& desc,

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

2546

const char* name)

2547

{

2548

return m_Graph->AddLayer<StandInLayer>(desc, name);

2549

}

2550

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2551

IConnectableLayer* NetworkImpl::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2552

const char* name)

2553

{

2554

const auto layer = m_Graph->AddLayer<QuantizedLstmLayer>(name);

2555

2556

// InputToX weights

2557

layer->m_QuantizedLstmParameters.m_InputToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2558

std::make_shared<ScopedTensorHandle>(params.GetInputToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2559

layer->m_QuantizedLstmParameters.m_InputToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2560

std::make_shared<ScopedTensorHandle>(params.GetInputToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2561

layer->m_QuantizedLstmParameters.m_InputToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2562

std::make_shared<ScopedTensorHandle>(params.GetInputToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2563

layer->m_QuantizedLstmParameters.m_InputToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2564

std::make_shared<ScopedTensorHandle>(params.GetInputToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2565

2566

// RecurrentToX weights

2567

layer->m_QuantizedLstmParameters.m_RecurrentToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2568

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2569

layer->m_QuantizedLstmParameters.m_RecurrentToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2570

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2571

layer->m_QuantizedLstmParameters.m_RecurrentToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2572

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2573

layer->m_QuantizedLstmParameters.m_RecurrentToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2574

std::make_shared<ScopedTensorHandle>(params.GetRecurrentToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2575

2576

// Bias

2577

layer->m_QuantizedLstmParameters.m_InputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2578

std::make_shared<ScopedTensorHandle>(params.GetInputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2579

layer->m_QuantizedLstmParameters.m_ForgetGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2580

std::make_shared<ScopedTensorHandle>(params.GetForgetGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2581

layer->m_QuantizedLstmParameters.m_CellBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2582

std::make_shared<ScopedTensorHandle>(params.GetCellBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

2583

layer->m_QuantizedLstmParameters.m_OutputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2584

std::make_shared<ScopedTensorHandle>(params.GetOutputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2589

IConnectableLayer* NetworkImpl::AddQLstmLayer(const QLstmDescriptor& descriptor,

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2590

const LstmInputParams& params,

2591

const char* name)

2592

{

2593

const auto layer = m_Graph->AddLayer<QLstmLayer>(descriptor, name);

2594

2595

// QLstm Basic Parameters

2596

layer->m_BasicParameters.m_InputToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2597

std::make_shared<ScopedTensorHandle>(*(params.m_InputToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2598

layer->m_BasicParameters.m_InputToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2599

std::make_shared<ScopedTensorHandle>(*(params.m_InputToCellWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2600

layer->m_BasicParameters.m_InputToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2601

std::make_shared<ScopedTensorHandle>(*(params.m_InputToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2602

layer->m_BasicParameters.m_RecurrentToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2603

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2604

layer->m_BasicParameters.m_RecurrentToCellWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2605

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToCellWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2606

layer->m_BasicParameters.m_RecurrentToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2607

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2608

layer->m_BasicParameters.m_ForgetGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2609

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2610

layer->m_BasicParameters.m_CellBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2611

std::make_shared<ScopedTensorHandle>(*(params.m_CellBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2612

layer->m_BasicParameters.m_OutputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2613

std::make_shared<ScopedTensorHandle>(*(params.m_OutputGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2614

2615

// QLstm Cifg parameters

2616

if(!descriptor.m_CifgEnabled)

2617

{

2618

if(params.m_InputToInputWeights == nullptr)

2619

{

2620

throw InvalidArgumentException("AddQLstmLayer: Input To Input Weights cannot be NULL");

2621

}

2622

2623

if(params.m_RecurrentToInputWeights == nullptr)

2624

{

2625

throw InvalidArgumentException(

2626

"AddQLstmLayer: Recurrent To Input Weights cannot be NULL");

2627

}

2628

2629

if(params.m_InputGateBias == nullptr)

2630

{

2631

throw InvalidArgumentException("AddQLstmLayer: Input Gate Bias cannot be NULL");

2632

}

2633

2634

layer->m_CifgParameters.m_InputToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2635

std::make_shared<ScopedTensorHandle>(*(params.m_InputToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2636

layer->m_CifgParameters.m_RecurrentToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2637

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2638

layer->m_CifgParameters.m_InputGateBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2639

std::make_shared<ScopedTensorHandle>(*(params.m_InputGateBias));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2640

}

2641

2642

// QLstm Projection parameters

2643

if(descriptor.m_ProjectionEnabled)

2644

{

2645

if(params.m_ProjectionWeights == nullptr)

2646

{

2647

throw InvalidArgumentException("AddQLstmLayer: Projection Weights cannot be NULL");

2648

}

2649

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2650

layer->m_ProjectionParameters.m_ProjectionWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2651

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionWeights));

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

2652

2653

// Projection bias is optional even if projection is enabled

Cathal Corbett

727c2b5

2022-05-06 12:11:37 +0100

[diff] [blame]

2654

if(params.m_ProjectionBias != nullptr)

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

2655

{

2656

layer->m_ProjectionParameters.m_ProjectionBias =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2657

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionBias));

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

2658

}

2659

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2660

}

2661

2662

// QLstm Peephole params

2663

if(descriptor.m_PeepholeEnabled)

2664

{

2665

if(params.m_CellToForgetWeights == nullptr)

2666

{

2667

throw InvalidArgumentException("AddQLstmLayer: Cell To Forget Weights cannot be NULL");

2668

}

2669

2670

if(params.m_CellToOutputWeights == nullptr)

2671

{

2672

throw InvalidArgumentException("AddQLstmLayer: Cell To Output Weights cannot be NULL");

2673

}

2674

2675

if(!descriptor.m_CifgEnabled)

2676

{

2677

if(params.m_CellToInputWeights == nullptr)

2678

{

2679

throw InvalidArgumentException("AddQLstmLayer: Cell To Input Weights cannot be NULL");

2680

}

2681

2682

layer->m_PeepholeParameters.m_CellToInputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2683

std::make_shared<ScopedTensorHandle>(*(params.m_CellToInputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2684

}

2685

2686

layer->m_PeepholeParameters.m_CellToForgetWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2687

std::make_shared<ScopedTensorHandle>(*(params.m_CellToForgetWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2688

layer->m_PeepholeParameters.m_CellToOutputWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2689

std::make_shared<ScopedTensorHandle>(*(params.m_CellToOutputWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2690

}

2691

2692

// QLstm Layer Normalization params

2693

if(descriptor.m_LayerNormEnabled)

2694

{

2695

if(params.m_ForgetLayerNormWeights == nullptr)

2696

{

2697

throw InvalidArgumentException("AddQLstmLayer: Forget layer normalization weights cannot be NULL");

2698

}

2699

2700

if(params.m_CellLayerNormWeights == nullptr)

2701

{

2702

throw InvalidArgumentException("AddQLstmLayer: Cell layer normalization weights cannot be NULL");

2703

}

2704

2705

if(params.m_OutputLayerNormWeights == nullptr)

2706

{

2707

throw InvalidArgumentException("AddQLstmLayer: Output layer normalization weights cannot be NULL");

2708

}

2709

2710

if(!descriptor.m_CifgEnabled)

2711

{

2712

if(params.m_InputLayerNormWeights == nullptr)

2713

{

2714

throw InvalidArgumentException("AddQLstmLayer: Input layer normalization weights cannot be NULL");

2715

}

2716

2717

layer->m_LayerNormParameters.m_InputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2718

std::make_shared<ScopedTensorHandle>(*(params.m_InputLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2719

}

2720

2721

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2722

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2723

layer->m_LayerNormParameters.m_CellLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2724

std::make_shared<ScopedTensorHandle>(*(params.m_CellLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

2725

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

James Conroy

2021-04-27 17:13:27 +0100

[diff] [blame]

2726

std::make_shared<ScopedTensorHandle>(*(params.m_OutputLayerNormWeights));

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

}

return layer;

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2731

IConnectableLayer* NetworkImpl::AddLogicalBinaryLayer(const LogicalBinaryDescriptor& logicalBinaryDescriptor,

Narumol Prangnawarat

8ed39ae

2021-07-15 16:16:25 +0100

[diff] [blame]

2732

const char* name)

James Conroy

aba90cd

2020-11-06 16:28:18 +0000

[diff] [blame]

2733

{

2734

return m_Graph->AddLayer<LogicalBinaryLayer>(logicalBinaryDescriptor, name);

2735

}

2736

Narumol Prangnawarat

8ed39ae

2021-07-15 16:16:25 +0100

[diff] [blame]

2737

IConnectableLayer* NetworkImpl::AddUnidirectionalSequenceLstmLayer(

2738

const UnidirectionalSequenceLstmDescriptor& descriptor,

2739

const LstmInputParams& params,

2740

const char* name)

2741

{

2742

const auto layer = m_Graph->AddLayer<UnidirectionalSequenceLstmLayer>(descriptor, name);

2743

2744

//Lstm Basic Parameters

2745

layer->m_BasicParameters.m_InputToForgetWeights =

2746

std::make_shared<ScopedTensorHandle>(*(params.m_InputToForgetWeights));

2747

layer->m_BasicParameters.m_InputToCellWeights =

2748

std::make_shared<ScopedTensorHandle>(*(params.m_InputToCellWeights));

2749

layer->m_BasicParameters.m_InputToOutputWeights =

2750

std::make_shared<ScopedTensorHandle>(*(params.m_InputToOutputWeights));

2751

layer->m_BasicParameters.m_RecurrentToForgetWeights =

2752

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToForgetWeights));

2753

layer->m_BasicParameters.m_RecurrentToCellWeights =

2754

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToCellWeights));

2755

layer->m_BasicParameters.m_RecurrentToOutputWeights =

2756

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToOutputWeights));

2757

layer->m_BasicParameters.m_ForgetGateBias =

2758

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetGateBias));

2759

layer->m_BasicParameters.m_CellBias =

2760

std::make_shared<ScopedTensorHandle>(*(params.m_CellBias));

2761

layer->m_BasicParameters.m_OutputGateBias =

2762

std::make_shared<ScopedTensorHandle>(*(params.m_OutputGateBias));

2763

2764

//Lstm Cifg parameters

2765

if(!descriptor.m_CifgEnabled)

2766

{

2767

if(params.m_InputToInputWeights == nullptr)

2768

{

2769

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Input To Input Weights cannot be NULL "

2770

"when CIFG is disabled.");

2771

}

2772

if(params.m_RecurrentToInputWeights == nullptr)

2773

{

2774

throw InvalidArgumentException(

2775

"AddUnidirectionalSequenceLstmLayer: Recurrent To Input Weights cannot be NULL "

2776

"when CIFG is disabled.");

2777

}

2778

if(params.m_InputGateBias == nullptr)

2779

{

2780

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Input Gate Bias cannot be NULL "

2781

"when CIFG is disabled.");

2782

}

2783

layer->m_CifgParameters.m_InputToInputWeights =

2784

std::make_shared<ScopedTensorHandle>(*(params.m_InputToInputWeights));

2785

layer->m_CifgParameters.m_RecurrentToInputWeights =

2786

std::make_shared<ScopedTensorHandle>(*(params.m_RecurrentToInputWeights));

2787

layer->m_CifgParameters.m_InputGateBias =

2788

std::make_shared<ScopedTensorHandle>(*(params.m_InputGateBias));

2789

}

2790

2791

//Lstm projection parameters

2792

if(descriptor.m_ProjectionEnabled)

2793

{

2794

if(params.m_ProjectionWeights == nullptr)

2795

{

2796

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Projection Weights cannot be NULL "

2797

"when projection is enabled.");

2798

}

2799

layer->m_ProjectionParameters.m_ProjectionWeights =

2800

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionWeights));

2801

if(params.m_ProjectionBias != nullptr)

2802

{

2803

layer->m_ProjectionParameters.m_ProjectionBias =

2804

std::make_shared<ScopedTensorHandle>(*(params.m_ProjectionBias));

}

}

//Lstm Peephole params

2809

if(descriptor.m_PeepholeEnabled)

2810

{

2811

if(!descriptor.m_CifgEnabled)

2812

{

2813

if(params.m_CellToInputWeights == nullptr)

2814

{

2815

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell To Input Weights "

2816

"cannot be NULL when Peephole is enabled and CIFG disabled.");

2817

}

2818

2819

layer->m_PeepholeParameters.m_CellToInputWeights =

2820

std::make_shared<ScopedTensorHandle>(*(params.m_CellToInputWeights));

2821

}

2822

2823

if(params.m_CellToForgetWeights == nullptr)

2824

{

2825

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell To Forget Weights cannot be NULL "

2826

"when Peephole is enabled.");

2827

}

2828

if(params.m_CellToOutputWeights == nullptr)

2829

{

2830

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell To Output Weights cannot be NULL "

2831

"when Peephole is enabled.");

2832

}

2833

2834

layer->m_PeepholeParameters.m_CellToForgetWeights =

2835

std::make_shared<ScopedTensorHandle>(*(params.m_CellToForgetWeights));

2836

layer->m_PeepholeParameters.m_CellToOutputWeights =

2837

std::make_shared<ScopedTensorHandle>(*(params.m_CellToOutputWeights));

2838

}

2839

2840

//Lstm Layer Normalization params

2841

if(descriptor.m_LayerNormEnabled)

2842

{

2843

if(!descriptor.m_CifgEnabled)

2844

{

2845

if(params.m_InputLayerNormWeights == nullptr)

2846

{

2847

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Input layer normalization weights "

2848

"cannot be NULL when layer normalization is enabled and CIFG disabled.");

2849

}

2850

layer->m_LayerNormParameters.m_InputLayerNormWeights =

2851

std::make_shared<ScopedTensorHandle>(*(params.m_InputLayerNormWeights));

2852

}

2853

2854

if(params.m_ForgetLayerNormWeights == nullptr)

2855

{

2856

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Forget layer normalization weights "

2857

"cannot be NULL when layer normalization is enabled.");

2858

}

2859

if(params.m_CellLayerNormWeights == nullptr)

2860

{

2861

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Cell layer normalization weights "

2862

"cannot be NULL when layer normalization is enabled.");

2863

}

2864

if(params.m_OutputLayerNormWeights == nullptr)

2865

{

2866

throw InvalidArgumentException("AddUnidirectionalSequenceLstmLayer: Output layer normalization weights "

2867

"cannot be NULL when layer normalization is enabled.");

2868

}

2869

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

2870

std::make_shared<ScopedTensorHandle>(*(params.m_ForgetLayerNormWeights));

2871

layer->m_LayerNormParameters.m_CellLayerNormWeights =

2872

std::make_shared<ScopedTensorHandle>(*(params.m_CellLayerNormWeights));

2873

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

2874

std::make_shared<ScopedTensorHandle>(*(params.m_OutputLayerNormWeights));

}

return layer;

}

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

2879

IConnectableLayer* NetworkImpl::AddPrecompiledLayer(const PreCompiledDescriptor& preCompiledDescriptor,

Cathal Corbett

3ea0107

2022-01-06 10:29:43 +0000

[diff] [blame]

2880

CompiledBlobPtr compiledBlobPtr,

Cathal Corbett

cbfd718

2021-12-15 17:12:59 +0000

[diff] [blame]

2881

const Optional<BackendId>& backend,

2882

const char* name)

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

2883

{

2884

// Method use is for backend users.

Cathal Corbett

cbfd718

2021-12-15 17:12:59 +0000

[diff] [blame]

2885

PreCompiledLayer* layer;

2886

if (name)

2887

{

2888

layer = m_Graph->AddLayer<PreCompiledLayer>(preCompiledDescriptor, name);

}

else

{

layer = m_Graph->AddLayer<PreCompiledLayer>(preCompiledDescriptor, "pre-compiled");

2893

}

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

2894

2895

// Assign the pre-compiled object to layer

2896

// Pass only one compiled network, Arm NN does not handle multiple

2897

// pre-compiled objects in a single pre-compiled layer currently

2898

layer->SetPreCompiledObject(std::move(compiledBlobPtr));

2899

2900

if (backend.has_value())

2901

{

2902

layer->SetBackendId(backend.value());

2903

}

Francis Murtagh

9d74ba6

2022-01-19 16:31:58 +0000

[diff] [blame]

2904

else if (layer->GetBackendHint().has_value())

Cathal Corbett

2021-12-13 13:03:22 +0000

[diff] [blame]

2905

{

2906

layer->SetBackendId(layer->GetBackendHint().value());

}

return layer;

}

Jan Eilers

2021-09-24 15:45:46 +0100

[diff] [blame]

2912

ARMNN_NO_DEPRECATE_WARN_BEGIN

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2913

void NetworkImpl::Accept(ILayerVisitor& visitor) const

Mike Kelly

8c1701a

2019-02-11 17:01:27 +0000

[diff] [blame]

2914

{

2915

for (auto layer : GetGraph())

2916

{

2917

layer->Accept(visitor);

2918

};

2919

}

Jan Eilers

1b2654f

2021-09-24 15:45:46 +0100

[diff] [blame]

2920

ARMNN_NO_DEPRECATE_WARN_END

Mike Kelly

8c1701a

2019-02-11 17:01:27 +0000

[diff] [blame]

2921

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2922

void NetworkImpl::ExecuteStrategy(IStrategy& strategy) const

Finn Williams

b454c5c

2021-02-09 15:56:23 +0000

[diff] [blame]

2923

{

2924

for (auto layer : GetGraph())

2925

{

2926

layer->ExecuteStrategy(strategy);

};

}

Mike Kelly

2021-06-27 22:39:21 +0100

[diff] [blame]

2930

OptimizedNetworkImpl::OptimizedNetworkImpl(const OptimizedNetworkImpl& other, const ModelOptions& modelOptions)

2931

: m_Graph(new Graph(*other.m_Graph.get()))

Jim Flynn

af94772

2022-03-02 11:04:47 +0000

[diff] [blame]

2932

, m_Guid(arm::pipe::IProfilingService::GetNextGuid())

Mike Kelly

0d677db

2021-06-27 22:39:21 +0100

[diff] [blame]

2933

, m_ModelOptions(modelOptions)

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2937

OptimizedNetworkImpl::OptimizedNetworkImpl(std::unique_ptr<Graph> graph)

Jim Flynn

af94772

2022-03-02 11:04:47 +0000

[diff] [blame]

2938

: m_Graph(std::move(graph)), m_Guid(arm::pipe::IProfilingService::GetNextGuid())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2942

OptimizedNetworkImpl::OptimizedNetworkImpl(std::unique_ptr<Graph> graph, const ModelOptions& modelOptions)

Jim Flynn

af94772

2022-03-02 11:04:47 +0000

[diff] [blame]

2943

: m_Graph(std::move(graph)), m_Guid(arm::pipe::IProfilingService::GetNextGuid()), m_ModelOptions(modelOptions)

Sadik Armagan

045f6be

2020-09-10 13:37:32 +0100

[diff] [blame]

{

}

Francis Murtagh

2021-02-15 18:23:17 +0000

[diff] [blame]

2947

OptimizedNetworkImpl::~OptimizedNetworkImpl()

telsoa01