Blame - src/armnn/Network.cpp - ml/armnn

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

5

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

6

#include "Network.hpp"

7

#include "Graph.hpp"

8

#include "Layer.hpp"

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

9

#include "DeviceSpec.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

10

#include "Optimizer.hpp"

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

11

#include "SubgraphViewSelector.hpp"

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

12

#include "BackendSettings.hpp"

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

13

#include "optimizations/All.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

14

Aron Virginas-Tar

c9cc804

2018-11-01 16:15:57 +0000

[diff] [blame]

15

#include <backendsCommon/CpuTensorHandle.hpp>

16

#include <backendsCommon/WorkloadFactory.hpp>

Matteo Martincigh

e5b8eb9

2019-11-28 15:45:42 +0000

[diff] [blame]

17

#include <armnn/backends/IBackendInternal.hpp>

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

18

#include <backendsCommon/TensorHandleFactoryRegistry.hpp>

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

19

20

#include <armnn/Exceptions.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

21

#include <armnn/Utils.hpp>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

22

#include <armnn/TypesUtils.hpp>

Matteo Martincigh

c601aa6

2019-10-29 15:03:22 +0000

[diff] [blame]

23

#include <armnn/BackendRegistry.hpp>

Matthew Bentham

f48afc6

2020-01-15 17:55:08 +0000

[diff] [blame]

24

#include <armnn/Logging.hpp>

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

25

#include <armnn/utility/Assert.hpp>

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

26

#include <armnn/utility/IgnoreUnused.hpp>

Jan Eilers

2020-04-02 13:56:54 +0100

[diff] [blame]

27

#include <armnn/utility/PolymorphicDowncast.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

28

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

29

#include <ProfilingService.hpp>

30

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

#include <fcntl.h>

#include <algorithm>

#include <fstream>

#include <memory>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

35

#include <vector>

36

#include <algorithm>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

37

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

38

#include <boost/format.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

39

#include <boost/numeric/conversion/converter_policies.hpp>

40

#include <boost/cast.hpp>

namespace armnn

{

armnn::INetwork* INetwork::CreateRaw()

46

{

47

return new Network();

48

}

49

50

armnn::INetworkPtr INetwork::Create()

51

{

52

return INetworkPtr(CreateRaw(), &INetwork::Destroy);

53

}

54

55

void INetwork::Destroy(INetwork* network)

56

{

Jan Eilers

2020-04-02 13:56:54 +0100

[diff] [blame]

57

delete PolymorphicDowncast<Network*>(network);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

58

}

59

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

60

void IOptimizedNetwork::Destroy(IOptimizedNetwork* network)

61

{

Jan Eilers

2020-04-02 13:56:54 +0100

[diff] [blame]

62

delete PolymorphicDowncast<OptimizedNetwork*>(network);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

63

}

64

65

Status OptimizedNetwork::PrintGraph()

66

{

67

m_Graph->Print();

68

return Status::Success;

69

}

70

surmeh01

bceff2f

2018-03-29 16:29:27 +0100

[diff] [blame]

71

Status OptimizedNetwork::SerializeToDot(std::ostream& stream) const

72

{

73

return m_Graph->SerializeToDot(stream);

74

}

75

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

76

void ReportError(const std::string& errorMessage,

77

Optional<std::vector<std::string>&> errorMessages)

78

{

79

std::stringstream fullErrorMessage;

80

fullErrorMessage << "ERROR: " << errorMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

81

ARMNN_LOG(warning) << fullErrorMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

82

if (errorMessages)

83

{

84

errorMessages.value().push_back(fullErrorMessage.str());

}

}

void ReportWarning(const std::string& warningMessage,

89

Optional<std::vector<std::string>&> warningMessages)

90

{

91

std::stringstream fullWarningMessage;

92

fullWarningMessage << "WARNING: " << warningMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

93

ARMNN_LOG(warning) << fullWarningMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

94

if (warningMessages)

95

{

96

warningMessages.value().push_back(fullWarningMessage.str());

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

100

OptimizationResult ReturnWithError(OptimizationResult res,

101

const Layer* layer,

102

const BackendSettings& backendSettings,

103

Optional<std::vector<std::string>&> errMessages)

104

{

105

std::stringstream failureMsg;

106

failureMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

107

<< " is not supported on any preferred backend " << backendSettings.m_PreferredBackends;

108

ReportError(failureMsg.str(), errMessages);

res.m_Error = true;

return res;

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

115

bool CheckScaleSetOnQuantizedType(Layer* layer, Optional<std::vector<std::string>&> errMessages)

116

{

117

bool noErrors = true;

118

unsigned int numOutputs = layer->GetNumOutputSlots();

119

for (unsigned int i = 0; i < numOutputs; i++) {

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

120

OutputSlot& outputSlot = layer->GetOutputSlot(i);

121

TensorInfo info = outputSlot.GetTensorInfo();

Derek Lamberti

f90c56d

2020-01-10 17:14:08 +0000

[diff] [blame]

122

if (DataType::QAsymmU8 == info.GetDataType()) {

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

123

if (0.f == info.GetQuantizationScale()) {

124

noErrors = false;

125

std::stringstream ss;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

126

ss << "output " << i << " of layer " << GetLayerTypeAsCString(layer->GetType())

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

127

<< " (" << layer->GetNameStr() << ") is of type"

128

<< " Quantized 8 bit but its scale parameter has not been set";

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

129

ReportError(ss.str(), errMessages);

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

130

}

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

131

// Softmax under QuantisedAsymm8 must always be scale (1.0f/256.0f) and offset 0

132

if ((info.GetQuantizationScale() != (1.0f / 256.0f) ||

133

info.GetQuantizationOffset() != 0) &&

134

layer->GetType() == armnn::LayerType::Softmax)

135

{

136

std::stringstream ss;

137

ss << "Quantization parameters for Softmax layer (Scale: " <<

138

info.GetQuantizationScale() << " and Offset: " << info.GetQuantizationOffset() <<

139

") are incorrect and have been updated to Scale: 0.00390625 and Offset: 0";

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

140

ARMNN_LOG(warning) << ss.str();

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

141

info.SetQuantizationScale((1.0f /256.0f));

142

info.SetQuantizationOffset(0);

143

outputSlot.SetTensorInfo(info);

144

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

}

}

return noErrors;

}

Narumol Prangnawarat

2020-03-30 16:11:04 +0100

[diff] [blame]

150

template <typename LayerT>

151

LayerT* ConvertBf16ToFp32Weight(Layer* l)

152

{

Jan Eilers

2020-04-02 13:56:54 +0100

[diff] [blame]

153

LayerT* layer = PolymorphicDowncast<LayerT*>(l);

Narumol Prangnawarat

250d392

2020-03-30 16:11:04 +0100

[diff] [blame]

154

if ((layer->GetType() == LayerType::Convolution2d || layer->GetType() == LayerType::FullyConnected)

155

&& layer->m_Weight)

156

{

157

const TensorInfo& info = layer->m_Weight->GetTensorInfo();

158

159

if (info.GetDataType() == DataType::BFloat16)

160

{

161

std::vector<float> newValues(info.GetNumElements());

162

163

armnnUtils::FloatingPointConverter::ConvertBFloat16ToFloat32(

164

layer->m_Weight->template GetTensor<armnn::BFloat16>(), info.GetNumElements(), newValues.data());

165

166

TensorInfo newInfo(info.GetShape(), DataType::Float32);

167

ConstTensor newInput(newInfo, newValues);

168

layer->m_Weight.reset(new ScopedCpuTensorHandle(newInput));

}

}

return layer;

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

174

OptimizationResult AttemptBackendAssignment(BackendSettings& backendSettings,

Graph& graph,

Layer* layer,

BackendId backend,

DataType dataTypeIn,

DataType dataTypeOut,

180

const std::vector<BackendId>& availablePreferredBackends,

181

std::string& reasonIfUnsupported,

182

Optional<std::vector<std::string>&> errMessages)

183

{

184

OptimizationResult result;

185

186

// Helper lambda to compose meaningful error message before returning with error

187

auto ReturnError = [&](const Layer* layer)

188

{

189

return ReturnWithError(result, layer, backendSettings, errMessages);

190

};

191

192

// need to set the compute device on the layer

193

// before we can check if it is supported

194

layer->SetBackendId(backend);

195

if (!IWorkloadFactory::IsLayerSupported(*layer, EmptyOptional(), reasonIfUnsupported))

196

{

197

if (dataTypeIn == DataType::Float16 || dataTypeOut == DataType::Float16)

198

{

199

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

200

&& layer->GetType() != LayerType::ConvertFp32ToFp16

201

&& layer->GetType() != LayerType::ConvertFp16ToFp32)

202

{

203

// Insert FP16 -> FP32 conversion layer before current layer

204

std::vector<ConvertFp16ToFp32Layer*> convertFp16ToFp32Layers;

205

if (dataTypeIn == DataType::Float16)

206

{

207

convertFp16ToFp32Layers =

208

InsertConvertFp16ToFp32LayersBefore(graph, *layer);

209

}

210

211

// Insert FP32 -> FP16 conversion layer after current layer

212

std::vector<ConvertFp32ToFp16Layer*> convertFp32ToFp16Layers;

213

if (dataTypeOut == DataType::Float16)

214

{

215

convertFp32ToFp16Layers =

216

InsertConvertFp32ToFp16LayersAfter(graph, *layer);

217

}

218

219

// Assign a supported backend to the newly introduced conversion layers

220

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

221

{

222

bool supportedBackendFound = false;

223

std::string reasonIfUnsupported;

224

225

// Try preferred backend first

226

layer->SetBackendId(preferredBackend);

227

if (IWorkloadFactory::IsLayerSupported(*layer,

228

EmptyOptional(),

229

reasonIfUnsupported))

230

{

231

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

236

{

237

// Skip preferred backend (we already determined that it is not supported)

238

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

244

if (IWorkloadFactory::IsLayerSupported(*layer,

245

EmptyOptional(),

246

reasonIfUnsupported))

247

{

248

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

255

};

256

257

for (ConvertFp16ToFp32Layer* convertLayer : convertFp16ToFp32Layers)

258

{

259

if (!AssignFirstSupportedBackend(convertLayer, backend))

260

{

261

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToFp16Layer* convertLayer : convertFp32ToFp16Layers)

266

{

267

if (!AssignFirstSupportedBackend(convertLayer, backend))

268

{

269

return ReturnError(convertLayer);

}

}

return result;

}

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

276

else if (dataTypeIn == DataType::BFloat16 || dataTypeOut == DataType::BFloat16)

277

{

278

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

279

&& layer->GetType() != LayerType::ConvertFp32ToBf16

280

&& layer->GetType() != LayerType::ConvertBf16ToFp32)

281

{

282

// Insert BF16 -> FP32 conversion layer before current layer

283

std::vector<ConvertBf16ToFp32Layer*> convertBf16ToFp32Layers;

284

if (dataTypeIn == DataType::BFloat16)

285

{

286

convertBf16ToFp32Layers =

287

InsertConvertBf16ToFp32LayersBefore(graph, *layer);

Narumol Prangnawarat

250d392

2020-03-30 16:11:04 +0100

[diff] [blame]

288

if (layer->GetType() == LayerType::Convolution2d)

289

{

290

ConvertBf16ToFp32Weight<Convolution2dLayer>(layer);

291

}

292

else if (layer->GetType() == LayerType::FullyConnected)

293

{

294

ConvertBf16ToFp32Weight<FullyConnectedLayer>(layer);

295

}

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

296

}

297

298

// Insert FP32 -> BF16 conversion layer after current layer

299

std::vector<ConvertFp32ToBf16Layer*> convertFp32ToBf16Layers;

300

if (dataTypeOut == DataType::BFloat16)

301

{

302

convertFp32ToBf16Layers =

303

InsertConvertFp32ToBf16LayersAfter(graph, *layer);

304

}

305

306

// Assign a supported backend to the newly introduced conversion layers

307

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

308

{

309

bool supportedBackendFound = false;

310

std::string reasonIfUnsupported;

311

312

// Try preferred backend first

313

layer->SetBackendId(preferredBackend);

314

if (IWorkloadFactory::IsLayerSupported(*layer,

315

EmptyOptional(),

316

reasonIfUnsupported))

317

{

318

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

323

{

324

// Skip preferred backend (we already determined that it is not supported)

325

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

331

if (IWorkloadFactory::IsLayerSupported(*layer,

332

EmptyOptional(),

333

reasonIfUnsupported))

334

{

335

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

342

};

343

344

for (ConvertBf16ToFp32Layer* convertLayer : convertBf16ToFp32Layers)

345

{

346

if (!AssignFirstSupportedBackend(convertLayer, backend))

347

{

348

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToBf16Layer* convertLayer : convertFp32ToBf16Layers)

353

{

354

if (!AssignFirstSupportedBackend(convertLayer, backend))

355

{

356

return ReturnError(convertLayer);

}

}

return result;

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

364

std::stringstream warningMsg;

365

warningMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

366

<< " is not supported on requested backend " << layer->GetBackendId().Get()

367

<< " for input data type " << GetDataTypeName(dataTypeIn)

368

<< " and output data type " << GetDataTypeName(dataTypeOut)

369

<< " (reason: " << reasonIfUnsupported

370

<< "), falling back to the next backend.";

371

ReportWarning(warningMsg.str(), errMessages);

372

373

return OptimizationResult(true, false);

}

else

{

return result;

}

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

382

OptimizationResult AssignBackends(OptimizedNetwork* optNetObjPtr,

383

BackendSettings& backendSettings,

384

Graph::Iterator& firstLayer,

385

Graph::Iterator& lastLayer,

386

Optional<std::vector<std::string>&> errMessages)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

387

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

388

OptimizationResult result;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

389

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

390

// Helper lambda to compose meaningful error message before returning with error

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

391

auto ReturnError = [&](const Layer* layer)

392

{

393

return ReturnWithError(result, layer, backendSettings, errMessages);

394

};

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

395

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

396

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

397

auto availablePreferredBackends = backendSettings.GetAvailablePreferredBackends();

398

if (availablePreferredBackends.empty())

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

399

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

400

std::stringstream failureMsg;

401

failureMsg << "No preferred backends are available";

402

ReportError(failureMsg.str(), errMessages);

403

404

result.m_Error = true;

return result;

}

for (auto it = firstLayer; it != lastLayer; ++it)

409

{

410

auto layer = *it;

Aron Virginas-Tar

87972be

2019-11-13 15:16:28 +0000

[diff] [blame]

411

412

DataType dataTypeIn = layer->GetNumInputSlots() == 0 ? DataType::Float32 :

413

layer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo().GetDataType();

414

DataType dataTypeOut = layer->GetNumOutputSlots() == 0 ? DataType::Float32 :

415

layer->GetOutputSlot(0).GetTensorInfo().GetDataType();

416

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

417

std::string reasonIfUnsupported;

418

bool found = false;

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

419

if (!CheckScaleSetOnQuantizedType(layer, errMessages))

420

{

421

// don't bomb immediately, find all the quantized outputs

422

// which haven't had a scale set and report them all back.

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

423

result.m_Error = true;

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

424

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

425

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

426

// First try assign layer to hint backend

427

if (layer->GetBackendHint().has_value() &&

428

backendSettings.IsBackendSupported(layer->GetBackendHint().value()) &&

429

AttemptBackendAssignment(backendSettings,

430

optNetObjPtr->GetGraph(),

431

layer,

432

layer->GetBackendHint().value(),

433

dataTypeIn,

434

dataTypeOut,

435

availablePreferredBackends,

436

reasonIfUnsupported,

437

errMessages).IsOk())

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

438

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

439

found = true;

440

backendSettings.m_SelectedBackends.insert(layer->GetBackendHint().value());

}

else

{

// Try assign layer to prefered list of backends

445

for (const auto& backend : availablePreferredBackends)

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

446

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

447

if (layer->GetBackendHint().has_value() &&

448

layer->GetBackendHint().value() == backend)

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

449

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

450

continue; //Don't re-test the backend hint

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

451

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

452

453

OptimizationResult res = AttemptBackendAssignment(backendSettings,

454

optNetObjPtr->GetGraph(),

layer,

backend,

dataTypeIn,

dataTypeOut,

availablePreferredBackends,

reasonIfUnsupported,

errMessages);

if (res.IsOk())

{

found = true;

backendSettings.m_SelectedBackends.insert(backend);

467

break;

468

}

469

else if (res.IsError())

470

{

471

return res; // Cannot continue.

472

// Note: we don't need to log the error as it would already

473

// be logged in AttemptBackendAssignment().

474

}

475

else

476

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

477

ARMNN_ASSERT_MSG(res.IsWarningOnly(), "OptimizationResult in unexpected state.");

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

478

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

}

}

// If the layer is unsupported by any devices, log and return a null network.

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

483

if (!found)

484

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

485

// NOTE: if the layer is not an operation queue type AND we have not got CpuRef as a

486

// fallback we should set the compute device on the layer to CpuRef (these are not

487

// available as accelerated operations, or are only available under certain

488

// conditions, currently they comprise MemCopy, Constant, Permute)

489

armnn::LayerType layerType = layer->GetType();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

490

if (!backendSettings.IsCpuRefUsed() && (layerType == armnn::LayerType::MemCopy ||

491

layerType == armnn::LayerType::Constant ||

492

layerType == armnn::LayerType::Permute))

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

493

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

494

BackendId cpuBackendId(armnn::Compute::CpuRef);

495

layer->SetBackendId(cpuBackendId);

496

backendSettings.m_SelectedBackends.insert(cpuBackendId);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

497

}

498

else

499

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

500

return ReturnError(layer);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

501

}

502

}

503

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

return result;

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

508

OptimizationResult AssignBackends(OptimizedNetwork* optNetObjPtr,

509

BackendSettings& backendSettings,

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

510

SubgraphView& subgraph,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

511

Optional<std::vector<std::string>&> errMessages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

512

{

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

513

Graph::Iterator firstLayer = subgraph.begin();

514

Graph::Iterator lastLayer = subgraph.end();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

515

return AssignBackends(optNetObjPtr,

backendSettings,

firstLayer,

lastLayer,

errMessages);

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

522

BackendsMap CreateSupportedBackends(TensorHandleFactoryRegistry& handleFactoryRegistry,

523

BackendSettings& backendSettings)

524

{

525

BackendsMap backends;

526

auto const& backendRegistry = BackendRegistryInstance();

527

for (auto&& selectedBackend : backendSettings.m_SupportedBackends)

528

{

529

auto backendFactory = backendRegistry.GetFactory(selectedBackend);

530

auto backendObjPtr = backendFactory();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

531

ARMNN_ASSERT(backendObjPtr);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

532

533

backendObjPtr->RegisterTensorHandleFactories(handleFactoryRegistry);

534

535

backends[backendObjPtr->GetId()] = std::move(backendObjPtr);

}

return backends;

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

541

OptimizationResult ApplyBackendOptimizations(OptimizedNetwork* optNetObjPtr,

542

BackendSettings& backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

543

BackendsMap& backends,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

544

Optional<std::vector<std::string>&> errMessages)

545

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

546

ARMNN_ASSERT(optNetObjPtr);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

547

548

OptimizationResult result;

549

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

550

// Get the optimized graph

551

Graph& optGraph = optNetObjPtr->GetGraph();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

552

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

553

// Run backend specific optimizations

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

554

for (auto&& selectedBackend : backendSettings.m_SelectedBackends)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

555

{

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

556

auto backendObjPtr = backends.find(selectedBackend)->second.get();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

557

ARMNN_ASSERT(backendObjPtr);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

558

559

// Select sub-graphs based on backend

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

560

SubgraphViewSelector::Subgraphs subgraphs =

Rob Hughes

65c3226

2019-07-23 15:33:39 +0100

[diff] [blame]

561

SubgraphViewSelector::SelectSubgraphs(optGraph,

Matteo Martincigh

602af09

2019-05-01 10:31:27 +0100

[diff] [blame]

562

// Select layers assigned to the requested backend

563

[&backendObjPtr](const Layer& layer)

564

{

565

return layer.GetType() != LayerType::Input &&

566

layer.GetType() != LayerType::Output &&

567

layer.GetBackendId() == backendObjPtr->GetId();

568

});

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

569

if (subgraphs.empty())

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

570

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

571

// No sub-graphs found, try with next selected backend

572

continue;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

573

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

574

575

// Try to optimize each sub-graph

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

576

for (auto& subgraph : subgraphs)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

577

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

578

// Try to optimize the current sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

579

OptimizationViews optimizationViews = backendObjPtr->OptimizeSubgraphView(*subgraph);

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

580

ARMNN_ASSERT(optimizationViews.Validate(*subgraph));

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

581

582

// Optimization attempted, check the resulting optimized sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

583

for (auto& substitution : optimizationViews.GetSubstitutions())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

584

{

585

// Sub-graph optimized, substitute the sub-graph with the new optimized one in the main optimized graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

586

SubgraphView& replacementSubgraph = substitution.m_ReplacementSubgraph;

587

SubgraphView& substitutableSubgraph = substitution.m_SubstitutableSubgraph;

588

optGraph.SubstituteSubgraph(substitutableSubgraph, replacementSubgraph);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

589

590

// Assign the current backend to the optimized sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

591

std::for_each(replacementSubgraph.begin(), replacementSubgraph.end(), [&selectedBackend](Layer* l)

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

592

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

593

ARMNN_ASSERT(l);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

594

l->SetBackendId(selectedBackend);

595

});

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

596

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

597

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

598

if (!optimizationViews.GetFailedSubgraphs().empty())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

599

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

600

std::stringstream warningMsg;

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

601

warningMsg << "Some sub-graph(s) failed to optimized on " << backendObjPtr->GetId() << " backend.";

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

602

ReportWarning(warningMsg.str(), errMessages);

603

604

// Failed to optimize the given sub-graph, re-assign the sub-graph layers to other available backends

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

605

BackendSettings settingsCopy(backendSettings);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

606

if (!backendObjPtr->GetId().IsCpuRef())

607

{

608

// Add the current backend to the list of backends to ignore

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

609

settingsCopy.m_IgnoredBackends.insert(backendObjPtr->GetId());

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

610

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

611

612

int count=0;

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

613

for (auto& failedSubgraph : optimizationViews.GetFailedSubgraphs())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

614

{

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

615

// An error occurred: the optimization was attempted but not performed, try different backends

616

std::stringstream subgraphMsg;

617

subgraphMsg << "Re-assigning backends to " << failedSubgraph.GetLayers().size()

618

<< " layers inside sub-graph " << count++;

Matteo Martincigh

328d92b

2019-07-04 17:52:55 +0100

[diff] [blame]

619

ReportWarning(subgraphMsg.str(), errMessages);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

620

621

OptimizationResult reassignmentResult = AssignBackends(optNetObjPtr,

settingsCopy,

*subgraph,

errMessages);

if (reassignmentResult.m_Error)

626

{

627

// Failed to re-assign one of the remaining backends to each layer of the sub-graph

628

result.m_Error = true;

629

return result;

630

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

631

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

}

}

}

return result;

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

639

bool RequiresCopy(ITensorHandleFactory::FactoryId src,

640

ITensorHandleFactory::FactoryId dst,

641

TensorHandleFactoryRegistry& registry)

{

if (src != dst)

{

ITensorHandleFactory* srcFactory = registry.GetFactory(src);

646

ITensorHandleFactory* dstFactory = registry.GetFactory(dst);

647

Matteo Martincigh

a6539ed

2019-08-27 13:43:32 +0100

[diff] [blame]

648

if (srcFactory && dstFactory &&

649

(srcFactory->GetExportFlags() & dstFactory->GetImportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

{

return false;

}

return true;

}

return false;

}

// Find the handle factory for the input layer which results in fewest required copies.

659

ITensorHandleFactory::FactoryId CalculateSlotOptionForInput(BackendsMap& backends,

660

OutputSlot& slot,

661

TensorHandleFactoryRegistry& registry)

662

{

663

Layer& layer = slot.GetOwningLayer();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

664

ARMNN_ASSERT(layer.GetType() == LayerType::Input);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

665

666

// Explicitly select the tensorhandle factory for InputLayer because the rules for it are slightly different. It

667

// doesn't matter which backend it is assigned to because they all use the same implementation, which

668

// requires Map/Unmap support. This means that, so long as the handle type supports map/unmap semantics, we can

669

// select a factory with maximum compatibility with the layers connected to the InputLayer.

670

671

// First ensure the from backends can support the TensorHandeAPI

672

auto frmBackend = backends.find(layer.GetBackendId());

673

if (frmBackend == backends.end() ||

674

!frmBackend->second->SupportsTensorAllocatorAPI())

675

{

676

return ITensorHandleFactory::LegacyFactoryId;

677

}

678

679

// Go through all connections to the output slot and determine the TensorHandleFactory which results in the

680

// fewest copies.

681

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

682

int topScore = 0;

683

ITensorHandleFactory::FactoryId topChoice = ITensorHandleFactory::LegacyFactoryId;

684

685

for (auto&& connection : slot.GetConnections())

686

{

687

const Layer& connectedLayer = connection->GetOwningLayer();

688

689

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

690

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

691

692

if (!toBackend->second.get()->SupportsTensorAllocatorAPI())

693

{

694

// The destination backend does not support the tensor allocator API, move to the next one

continue;

}

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

699

for (auto&& dst : dstPrefs)

700

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

701

// Input layers use the mem copy workload or import, so the selected factory must

702

// support either the map/unmap API or Import API

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

703

ITensorHandleFactory* factory = registry.GetFactory(dst);

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

704

if (!factory->SupportsMapUnmap() &&

705

!CheckFlag(factory->GetImportFlags(), MemorySource::Malloc)) // Just support cpu mem imports for now

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

706

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

707

// The current tensor handle factory does not support the map/unmap or import

708

// strategy, move to the next one

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

continue;

}

auto it = factoryScores.find(dst);

713

if (it == factoryScores.end())

714

{

715

// Add new score to the table

716

factoryScores[dst] = 0;

717

if (topChoice == ITensorHandleFactory::LegacyFactoryId)

{

topChoice = dst;

}

}

else

{

// Increase the score

725

factoryScores[dst]++;

726

727

// Track the best option

728

if (factoryScores[dst] > topScore)

729

{

730

topScore = factoryScores[dst];

topChoice = dst;

}

}

}

}

return topChoice;

}

// Find the handle factory for the output layer which results in fewest required copies.

741

ITensorHandleFactory::FactoryId CalculateSlotOptionForOutput(BackendsMap& backends,

742

OutputSlot& slot,

743

TensorHandleFactoryRegistry& registry)

744

{

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

745

IgnoreUnused(backends, slot, registry);

Derek Lamberti

94a88d2

2019-12-10 21:12:59 +0000

[diff] [blame]

746

return ITensorHandleFactory::DeferredFactoryId;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

747

}

748

749

// For all handle factories supported on the source backend, we wish to find the one which requires the fewest copies

750

// when considering all connections.

751

ITensorHandleFactory::FactoryId CalculateSlotOption(BackendsMap& backends,

752

OutputSlot& outputSlot,

753

TensorHandleFactoryRegistry& registry)

754

{

755

// First ensure the from backends can support the TensorHandeAPI

756

Layer& layer = outputSlot.GetOwningLayer();

757

auto frmBackend = backends.find(layer.GetBackendId());

758

if (frmBackend == backends.end() ||

759

!frmBackend->second->SupportsTensorAllocatorAPI())

760

{

761

return ITensorHandleFactory::LegacyFactoryId;

762

}

763

764

// Connections to Output Layers requires support for map/unmap on the TensorHandle.

765

bool requiresMapUnmap = false;

766

for (auto&& connection : outputSlot.GetConnections())

767

{

768

const Layer& connectedLayer = connection->GetOwningLayer();

769

if (connectedLayer.GetType() == LayerType::Output)

770

{

771

requiresMapUnmap = true;

}

}

IBackendInternal* srcBackend = frmBackend->second.get();

776

auto srcPrefs = srcBackend->GetHandleFactoryPreferences();

777

778

// Initialize the scores

779

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

780

for (auto&& pref : srcPrefs)

781

{

782

if (requiresMapUnmap) // Only consider factories that support map/unmap if required

783

{

784

ITensorHandleFactory* factory = registry.GetFactory(pref);

785

if (!factory->SupportsMapUnmap())

786

{

787

// The current tensor handle factory does not support the map/unmap strategy, move to the next one

continue;

}

}

auto it = factoryScores.find(pref);

793

if (it == factoryScores.end())

794

{

795

// Add new score to the table

796

factoryScores[pref] = 0;

}

}

// Score each handle factory based on how many times it requires copies on the slot connections

801

for (auto&& connection : outputSlot.GetConnections())

802

{

803

const Layer& connectedLayer = connection->GetOwningLayer();

804

805

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

806

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

807

808

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

809

for (auto&& src : srcPrefs)

810

{

811

if (factoryScores.find(src) == factoryScores.end()) // Don't consider excluded factories

{

continue;

}

for (auto&& dst : dstPrefs)

817

{

818

if (RequiresCopy(src, dst, registry))

819

{

820

// Copy avoided, increase the score

821

factoryScores[src]++;

break;

}

}

}

}

// Find the lowest score

829

int minScore = std::numeric_limits<int>::max();

830

for (auto it : factoryScores)

831

{

832

minScore = std::min(minScore, it.second);

833

}

834

835

// Collect factories matching the best(lowest) score

836

std::vector<ITensorHandleFactory::FactoryId> optimalFactories;

837

for (auto it : factoryScores)

838

{

839

if (it.second == minScore)

840

{

841

optimalFactories.push_back(it.first);

}

}

// For all compatible Factories matching the best score, find the preferred one for the current layer.

846

for (auto&& srcPref : srcPrefs)

847

{

848

for (auto&& comp : optimalFactories)

{

if (comp == srcPref)

{

return comp;

}

}

}

return ITensorHandleFactory::LegacyFactoryId;

858

}

859

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

860

EdgeStrategy CalculateEdgeStrategy(BackendsMap& backends,

861

ITensorHandleFactory::FactoryId srcFactoryId,

862

const Layer& layer,

863

const Layer& connectedLayer,

864

TensorHandleFactoryRegistry& registry)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

865

{

866

auto toBackend = backends.find(connectedLayer.GetBackendId());

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

867

ARMNN_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

868

869

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

870

871

// Legacy API check for backward compatibility

872

if (srcFactoryId == ITensorHandleFactory::LegacyFactoryId || dstPrefs.empty())

873

{

874

if (layer.GetBackendId() != connectedLayer.GetBackendId())

875

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

876

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

877

}

878

else

879

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

880

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// TensorHandleFactory API present, so perform more sophisticated strategies.

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

885

// Dst Output layers don't require copy because they use import or map/unmap

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

886

if (connectedLayer.GetType() == LayerType::Output)

887

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

888

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

889

}

890

891

// Search for direct match in prefs

892

for (auto&& pref : dstPrefs)

893

{

894

if (pref == srcFactoryId)

895

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

896

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// Search for export/import options

901

ITensorHandleFactory* srcFactory = registry.GetFactory(srcFactoryId);

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

902

if (srcFactory->GetExportFlags() != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

903

{

904

for (auto&& pref : dstPrefs)

905

{

906

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

907

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

908

// Handles cases when a destPref is not listed in TensorHandleFactoryRegistry

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

909

if (!dstFactory) {

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

910

continue;

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

911

}

912

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

913

if ((dstFactory->GetImportFlags() & srcFactory->GetExportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

914

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

915

return EdgeStrategy::ExportToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

// Search for copy options via map/unmap

921

if (srcFactory->SupportsMapUnmap())

922

{

923

for (auto&& pref : dstPrefs)

924

{

925

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

926

if (dstFactory && dstFactory->SupportsMapUnmap())

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

927

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

928

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

933

return EdgeStrategy::Undefined;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

934

}

935

936

// Select the TensorHandleFactories and the corresponding memory strategy

937

OptimizationResult SelectTensorHandleStrategy(Graph& optGraph,

938

BackendsMap& backends,

939

TensorHandleFactoryRegistry& registry,

940

Optional<std::vector<std::string>&> errMessages)

941

{

942

OptimizationResult result;

943

944

optGraph.ForEachLayer([&backends, &registry, &result, &errMessages](Layer* layer)

945

{

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

946

ARMNN_ASSERT(layer);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

947

948

// Lets make sure the backend is in our list of supported backends. Something went wrong during backend

949

// assignment if this check fails

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

950

ARMNN_ASSERT(backends.find(layer->GetBackendId()) != backends.end());

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

951

952

// Check each output separately

953

for (unsigned int slotIdx = 0; slotIdx < layer->GetNumOutputSlots(); slotIdx++)

954

{

955

OutputSlot& outputSlot = layer->GetOutputSlot(slotIdx);

956

957

ITensorHandleFactory::FactoryId slotOption = ITensorHandleFactory::LegacyFactoryId;

958

959

// Calculate the factory to use which results in the fewest copies being made.

960

switch(layer->GetType())

961

{

962

case LayerType::Input:

963

slotOption = CalculateSlotOptionForInput(backends, outputSlot, registry);

964

break;

965

case LayerType::Output:

966

slotOption = CalculateSlotOptionForOutput(backends, outputSlot, registry);

967

break;

968

default:

969

slotOption = CalculateSlotOption(backends, outputSlot, registry);

970

break;

971

}

972

outputSlot.SetTensorHandleFactory(slotOption);

973

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

974

// Now determine the "best" edge strategy for each connection given the slotOption.

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

975

unsigned int connectionIdx = 0;

976

for (auto&& connection : outputSlot.GetConnections())

977

{

978

const Layer& connectedLayer = connection->GetOwningLayer();

979

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

980

EdgeStrategy strategy = CalculateEdgeStrategy(backends, slotOption, *layer, connectedLayer, registry);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

981

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

982

if (strategy == EdgeStrategy::Undefined)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

983

{

984

result.m_Error = true;

985

if (errMessages)

986

{

987

errMessages.value().emplace_back("Could not find valid strategy required for compatibility"

988

" between backends.");

}

return;

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

993

outputSlot.SetEdgeStrategy(connectionIdx, strategy);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

connectionIdx++;

}

}

});

return result;

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1003

IOptimizedNetworkPtr Optimize(const INetwork& inNetwork,

1004

const std::vector<BackendId>& backendPreferences,

1005

const IDeviceSpec& deviceSpec,

1006

const OptimizerOptions& options,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1007

Optional<std::vector<std::string>&> messages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1008

{

1009

if (backendPreferences.empty())

1010

{

1011

throw armnn::InvalidArgumentException("Invoked Optimize with no backends specified");

1012

}

1013

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1014

if (options.m_ReduceFp32ToFp16 && options.m_ReduceFp32ToBf16)

1015

{

1016

throw InvalidArgumentException("BFloat16 and Float16 optimization cannot be enabled at the same time.");

1017

}

1018

Jan Eilers

2020-04-02 13:56:54 +0100

[diff] [blame]

1019

const Network& network = *PolymorphicDowncast<const Network*>(&inNetwork);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1020

std::unique_ptr<Graph> graph = std::make_unique<Graph>(network.GetGraph());

1021

1022

auto optNet = IOptimizedNetworkPtr(new OptimizedNetwork(std::move(graph)), &IOptimizedNetwork::Destroy);

1023

Jan Eilers

2020-04-02 13:56:54 +0100

[diff] [blame]

1024

OptimizedNetwork* optNetObjPtr = PolymorphicDowncast<OptimizedNetwork*>(optNet.get());

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1025

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1026

// Get the optimized graph

1027

Graph& optGraph = optNetObjPtr->GetGraph();

1028

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1029

// Perform optimisation passes

1030

using namespace optimizations;

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1031

Optimizer::Pass(optGraph, MakeOptimizations(SquashEqualPermuteSiblings(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1032

SquashEqualTransposeSiblings(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1033

SquashEqualReshapeSiblings(),

1034

OptimizeInversePermutes(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1035

OptimizeInverseTransposes(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1036

MovePermuteUp(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1037

MoveTransposeUp(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1038

PermuteAsReshape(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1039

TransposeAsReshape(),

Nina Drozd

861985f

2019-04-18 14:48:51 +0100

[diff] [blame]

1040

OptimizeConsecutiveReshapes(),

Rob Hughes

3a7d3a7

2019-09-24 16:59:56 +0100

[diff] [blame]

1041

FoldPadIntoConvolution2d(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

1042

PermuteAndBatchToSpaceAsDepthToSpace(),

1043

TransposeAndBatchToSpaceAsDepthToSpace()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1044

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1045

// Infer the tensor infos for all output slots. Throws an exception on failure

1046

optGraph.InferTensorInfos();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1047

1048

// If Fp32 to Fp16 optimization is set convert Fp32 network to Fp16

1049

if (options.m_ReduceFp32ToFp16)

1050

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1051

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToFp16Converter()));

Derek Lamberti

dd6804b

2019-11-27 09:29:57 +0000

[diff] [blame]

1052

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1053

}

1054

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1055

// If Fp32 to Bf16 optimization is set convert Fp32 network to Bf16

Narumol Prangnawarat

57ef008

2020-03-26 09:20:43 +0000

[diff] [blame]

1056

// Convert input of Convolution2d and FullyConnected from Fp32 to Bf16

1057

// Only Constant weight of Convolution2d and FullyConnected are converted from Fp32 to Bf16

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1058

if (options.m_ReduceFp32ToBf16)

1059

{

1060

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToBf16Converter()));

Narumol Prangnawarat

2020-03-20 15:01:01 +0000

[diff] [blame]

1061

}

1062

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1063

// Initialize backend settings

1064

BackendSettings backendSettings(backendPreferences, deviceSpec);

1065

if (backendSettings.GetAvailablePreferredBackends().empty())

1066

{

1067

std::stringstream failureMsg;

1068

failureMsg << "None of the preferred backends " << backendPreferences

1069

<< " are supported. Current platform provides " << backendSettings.m_SupportedBackends;

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1070

ReportError(failureMsg.str(), messages);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1071

return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);

1072

}

1073

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1074

// Create a map to temporarily hold initialized backend objects

1075

TensorHandleFactoryRegistry tensorHandleFactoryRegistry;

1076

BackendsMap backends = CreateSupportedBackends(tensorHandleFactoryRegistry, backendSettings);

1077

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1078

// Assign an available backend to each layer

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1079

Graph::Iterator firstLayer = optGraph.begin();

1080

Graph::Iterator lastLayer = optGraph.end();

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1081

OptimizationResult assignBackendsResult = AssignBackends(optNetObjPtr,

1082

backendSettings,

1083

firstLayer,

1084

lastLayer,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1085

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1086

if (assignBackendsResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1087

{

1088

// Failed to assign a backend to each layer

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

1089

return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);

1090

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1091

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1092

Optimizer::Pass(optGraph, MakeOptimizations(OptimizeInverseConversionsFp16(),

1093

OptimizeInverseConversionsFp32()));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1094

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1095

// Apply the backend-specific optimizations

1096

OptimizationResult backendOptimizationResult = ApplyBackendOptimizations(optNetObjPtr,

1097

backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1098

backends,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1099

messages);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1100

if (backendOptimizationResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1101

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1102

// Failed to apply the backend-specific optimizations

1103

return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1104

}

1105

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1106

// If the debug flag is set, then insert a DebugLayer after each layer

1107

// Doing this after applying the backend optimizations as they might have changed some layers

1108

if (options.m_Debug)

1109

{

1110

Optimizer::Pass(optGraph, MakeOptimizations(InsertDebugLayer()));

1111

}

1112

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1113

// Calculate the compatibility strategies for tensor handles

1114

OptimizationResult strategyResult = SelectTensorHandleStrategy(optGraph,

1115

backends,

1116

tensorHandleFactoryRegistry,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

1117

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1118

if (strategyResult.m_Error)

1119

{

1120

// Failed to apply the backend-specific optimizations

1121

return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);

1122

}

1123

1124

// Based on the tensor handle strategy determined above, insert copy layers where required.

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

1125

optGraph.AddCompatibilityLayers(backends, tensorHandleFactoryRegistry);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1126

1127

// Convert constants

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1128

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

1129

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsHalfToFloat()));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1130

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1131

// Run backend specific optimizations (deprecated)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1132

for (auto&& chosenBackend : backendSettings.m_SelectedBackends)

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1133

{

1134

auto factoryFun = BackendRegistryInstance().GetFactory(chosenBackend);

1135

auto backendPtr = factoryFun();

Narumol Prangnawarat

2020-04-01 16:51:23 +0100

[diff] [blame]

1136

ARMNN_ASSERT(backendPtr.get() != nullptr);

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1137

Matteo Martincigh

ed73504

2019-05-22 09:42:43 +0100

[diff] [blame]

1138

ARMNN_NO_DEPRECATE_WARN_BEGIN

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1139

auto backendSpecificOptimizations = backendPtr->GetOptimizations();

Matteo Martincigh

ed73504

2019-05-22 09:42:43 +0100

[diff] [blame]

1140

ARMNN_NO_DEPRECATE_WARN_END

1141

David Beck

2018-11-09 14:46:40 +0000

[diff] [blame]

1142

if (!backendSpecificOptimizations.empty())

1143

{

1144

Optimizer::Pass(optNetObjPtr->GetGraph(), backendSpecificOptimizations);

}

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1148

return optNet;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1149

}

1150

1151

Network::Network()

Sadik Armagan

3184c90

2020-03-18 10:57:30 +0000

[diff] [blame]

1152

: m_Graph(std::make_unique<Graph>())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Network::~Network()

{

}

Jan Eilers

2019-11-06 10:02:16 +0000

[diff] [blame]

1160

Status Network::PrintGraph()

1161

{

1162

m_Graph->Print();

1163

return Status::Success;

1164

}

1165

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1166

IConnectableLayer* Network::AddInputLayer(LayerBindingId id, const char* name)

1167

{

1168

return m_Graph->AddLayer<InputLayer>(id, name);

1169

}

1170

Éanna Ó Catháin

4e1e136

2018-11-12 11:36:34 +0000

[diff] [blame]

1171

IConnectableLayer* Network::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

1172

const char* name)

1173

{

1174

return m_Graph->AddLayer<BatchToSpaceNdLayer>(batchToSpaceNdDescriptor, name);

1175

}

1176

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

1177

IConnectableLayer* Network::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

1178

const char* name)

1179

{

1180

return m_Graph->AddLayer<ComparisonLayer>(comparisonDescriptor, name);

1181

}

1182

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

1183

IConnectableLayer* Network::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

1184

const char* name)

1185

{

1186

return m_Graph->AddLayer<ElementwiseUnaryLayer>(elementwiseUnaryDescriptor, name);

1187

}

1188

Ryan OShea

ec6c680

2020-06-05 17:17:06 +0100

[diff] [blame]

1189

IConnectableLayer* Network::AddFillLayer(const FillDescriptor& fillDescriptor,

1190

const char* name)

1191

{

1192

return m_Graph->AddLayer<FillLayer>(fillDescriptor, name);

1193

}

1194

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1195

IConnectableLayer* Network::AddFullyConnectedLayerImpl(const FullyConnectedDescriptor& fullyConnectedDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1196

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1197

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1198

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1199

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1200

if (fullyConnectedDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1201

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1202

throw InvalidArgumentException("AddFullyConnectedLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1203

}

1204

1205

const auto layer = m_Graph->AddLayer<FullyConnectedLayer>(fullyConnectedDescriptor, name);

1206

1207

layer->m_Weight = std::make_unique<ScopedCpuTensorHandle>(weights);

1208

1209

if (fullyConnectedDescriptor.m_BiasEnabled)

1210

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1211

layer->m_Bias = std::make_unique<ScopedCpuTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

IConnectableLayer* Network::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1218

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1219

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1220

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1221

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1222

return AddFullyConnectedLayerImpl(fullyConnectedDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1223

}

1224

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1225

IConnectableLayer* Network::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

1226

const ConstTensor& weights,

1227

const char* name)

1228

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

1229

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1230

return AddFullyConnectedLayerImpl(fullyConnectedDescriptor, weights, biases, name);

1231

}

1232

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1233

IConnectableLayer* Network::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1234

const ConstTensor& weights,

1235

const ConstTensor& biases,

1236

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1237

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1238

Optional<ConstTensor> optionalBiases(biases);

1239

return AddFullyConnectedLayerImpl(fullyConnectedDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1240

}

1241

Jim Flynn

2019-05-22 14:24:13 +0100

[diff] [blame]

1242

IConnectableLayer* Network::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1243

const char* name)

1244

{

Jim Flynn

2019-05-22 14:24:13 +0100

[diff] [blame]

1245

return m_Graph->AddLayer<ConcatLayer>(concatDescriptor, name);

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1246

}

1247

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1248

IConnectableLayer* Network::AddConvolution2dLayerImpl(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1249

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1250

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1251

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1252

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1253

if (convolution2dDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1254

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1255

throw InvalidArgumentException("AddConvolution2dLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1256

}

1257

1258

const auto layer = m_Graph->AddLayer<Convolution2dLayer>(convolution2dDescriptor, name);

1259

1260

layer->m_Weight = std::make_unique<ScopedCpuTensorHandle>(weights);

1261

1262

if (convolution2dDescriptor.m_BiasEnabled)

1263

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1264

layer->m_Bias = std::make_unique<ScopedCpuTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

IConnectableLayer* Network::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1271

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1272

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1273

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1274

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1275

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1276

}

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1277

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1278

IConnectableLayer* Network::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

1279

const ConstTensor& weights,

1280

const char* name)

1281

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

1282

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1283

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

1284

}

1285

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1286

IConnectableLayer* Network::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1287

const ConstTensor& weights,

1288

const ConstTensor& biases,

1289

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1290

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1291

Optional<ConstTensor> optionalBiases(biases);

1292

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1293

}

1294

1295

IConnectableLayer* Network::AddDepthwiseConvolution2dLayerImpl(

1296

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1297

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1298

const Optional<ConstTensor>& biases,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1299

const char* name)

1300

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1301

if (convolution2dDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1302

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1303

throw InvalidArgumentException("AddDepthwiseConvolution2dLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1304

}

1305

Matteo Martincigh

3d6898c

2019-01-15 16:11:44 +0000

[diff] [blame]

1306

const auto layer = m_Graph->AddLayer<DepthwiseConvolution2dLayer>(convolution2dDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1307

1308

layer->m_Weight = std::make_unique<ScopedCpuTensorHandle>(weights);

1309

1310

if (convolution2dDescriptor.m_BiasEnabled)

1311

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1312

layer->m_Bias = std::make_unique<ScopedCpuTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

Aron Virginas-Tar

2019-09-19 14:31:17 +0100

[diff] [blame]

1318

IConnectableLayer* Network::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

1319

const char* name)

1320

{

1321

return m_Graph->AddLayer<DepthToSpaceLayer>(depthToSpaceDescriptor, name);

1322

}

1323

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1324

IConnectableLayer* Network::AddDepthwiseConvolution2dLayer(

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1325

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1326

const ConstTensor& weights,

1327

const Optional<ConstTensor>& biases,

1328

const char* name)

1329

{

1330

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

1331

}

1332

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1333

IConnectableLayer* Network::AddDepthwiseConvolution2dLayer(

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1334

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1335

const ConstTensor& weights,

1336

const char* name)

1337

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

1338

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1339

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1340

}

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1341

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1342

IConnectableLayer* Network::AddDepthwiseConvolution2dLayer(

1343

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1344

const ConstTensor& weights,

1345

const ConstTensor& biases,

1346

const char* name)

1347

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1348

Optional<ConstTensor> optionalBiases(biases);

1349

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1350

}

1351

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

1352

IConnectableLayer* Network::AddDetectionPostProcessLayer(const armnn::DetectionPostProcessDescriptor& descriptor,

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

1353

const ConstTensor& anchors, const char* name)

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

1354

{

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

1355

const auto layer = m_Graph->AddLayer<DetectionPostProcessLayer>(descriptor, name);

1356

1357

layer->m_Anchors = std::make_unique<ScopedCpuTensorHandle>(anchors);

1358

1359

return layer;

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

1360

}

1361

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1362

IConnectableLayer* Network::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

1363

const char* name)

1364

{

1365

return m_Graph->AddLayer<PermuteLayer>(permuteDescriptor, name);

1366

}

1367

1368

IConnectableLayer* Network::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

1369

const char* name)

1370

{

1371

return m_Graph->AddLayer<Pooling2dLayer>(pooling2dDescriptor, name);

1372

}

1373

1374

IConnectableLayer* Network::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

1375

const char* name)

1376

{

1377

return m_Graph->AddLayer<ActivationLayer>(activationDescriptor, name);

1378

}

1379

Nikhil Raj

ee391d5

2019-09-05 17:50:44 +0100

[diff] [blame]

1380

IConnectableLayer* Network::AddArgMinMaxLayer(const ArgMinMaxDescriptor& argMinMaxDescriptor,

1381

const char* name)

1382

{

1383

return m_Graph->AddLayer<ArgMinMaxLayer>(argMinMaxDescriptor, name);

1384

}

1385

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1386

IConnectableLayer* Network::AddNormalizationLayer(const NormalizationDescriptor&

1387

normalizationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1388

const char* name)

1389

{

1390

return m_Graph->AddLayer<NormalizationLayer>(normalizationDescriptor, name);

1391

}

1392

Aron Virginas-Tar

636ab40

2019-09-16 14:27:45 +0100

[diff] [blame]

1393

IConnectableLayer* Network::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

1394

{

1395

return m_Graph->AddLayer<SliceLayer>(sliceDescriptor, name);

1396

}

1397

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1398

IConnectableLayer* Network::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

1399

const char* name)

1400

{

1401

return m_Graph->AddLayer<SoftmaxLayer>(softmaxDescriptor, name);

1402

}

1403

1404

IConnectableLayer* Network::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

1405

const char* name)

1406

{

1407

return m_Graph->AddLayer<SplitterLayer>(splitterDescriptor, name);

1408

}

1409

Nattapat Chaimanowong

5a4304a

2018-11-28 10:44:37 +0000

[diff] [blame]

1410

IConnectableLayer* Network::AddMaximumLayer(const char* name)

1411

{

1412

return m_Graph->AddLayer<MaximumLayer>(name);

1413

}

1414

Éanna Ó Catháin

20e5880

2018-12-04 10:29:06 +0000

[diff] [blame]

1415

IConnectableLayer* Network::AddMinimumLayer(const char* name)

1416

{

1417

return m_Graph->AddLayer<MinimumLayer>(name);

1418

}

1419

Jim Flynn

2019-05-22 14:24:13 +0100

[diff] [blame]

1420

IConnectableLayer* Network::AddMergerLayer(const MergerDescriptor& mergerDescriptor,

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1421

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1422

{

Jim Flynn

2019-05-22 14:24:13 +0100

[diff] [blame]

1423

return AddConcatLayer(mergerDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1424

}

1425

Kevin May

868eb14

2019-09-04 17:29:31 +0100

[diff] [blame]

1426

IConnectableLayer* Network::AddAbsLayer(const char * name)

1427

{

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

1428

return AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Abs), name);

Kevin May

868eb14

2019-09-04 17:29:31 +0100

[diff] [blame]

1429

}

1430

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1431

IConnectableLayer* Network::AddAdditionLayer(const char* name)

1432

{

1433

return m_Graph->AddLayer<AdditionLayer>(name);

1434

}

1435

1436

IConnectableLayer* Network::AddMultiplicationLayer(const char* name)

1437

{

1438

return m_Graph->AddLayer<MultiplicationLayer>(name);

1439

}

1440

1441

IConnectableLayer* Network::AddOutputLayer(LayerBindingId id, const char* name)

1442

{

1443

return m_Graph->AddLayer<OutputLayer>(id, name);

1444

}

1445

1446

IConnectableLayer* Network::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

1447

const ConstTensor& mean,

1448

const ConstTensor& variance,

1449

const ConstTensor& beta,

1450

const ConstTensor& gamma,

1451

const char* name)

1452

{

1453

const auto layer = m_Graph->AddLayer<BatchNormalizationLayer>(desc, name);

1454

1455

layer->m_Mean = std::make_unique<ScopedCpuTensorHandle>(mean);

1456

layer->m_Variance = std::make_unique<ScopedCpuTensorHandle>(variance);

1457

layer->m_Beta = std::make_unique<ScopedCpuTensorHandle>(beta);

1458

layer->m_Gamma = std::make_unique<ScopedCpuTensorHandle>(gamma);

return layer;

}

Finn Williams

2020-06-10 15:53:46 +0100

[diff] [blame^]

1463

IConnectableLayer* Network::AddRankLayer(const char* name)

1464

{

1465

return m_Graph->AddLayer<RankLayer>(name);

1466

}

1467

Aron Virginas-Tar

2019-07-01 19:01:44 +0100

[diff] [blame]

1468

IConnectableLayer* Network::AddResizeBilinearLayer(const ResizeBilinearDescriptor& descriptor,

1469

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1470

{

Aron Virginas-Tar

2019-07-01 19:01:44 +0100

[diff] [blame]

1471

ResizeDescriptor resizeDescriptor;

David Monahan

4a0c9b9

2020-05-30 09:48:39 +0100

[diff] [blame]

1472

resizeDescriptor.m_Method = ResizeMethod::Bilinear;

1473

resizeDescriptor.m_DataLayout = descriptor.m_DataLayout;

1474

resizeDescriptor.m_TargetWidth = descriptor.m_TargetWidth;

1475

resizeDescriptor.m_TargetHeight = descriptor.m_TargetHeight;

1476

resizeDescriptor.m_AlignCorners = descriptor.m_AlignCorners;

1477

resizeDescriptor.m_HalfPixelCenters = descriptor.m_HalfPixelCenters;

Aron Virginas-Tar

2019-07-01 19:01:44 +0100

[diff] [blame]

1478

1479

return m_Graph->AddLayer<ResizeLayer>(resizeDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1480

}

1481

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

1482

IConnectableLayer* Network::AddResizeLayer(const ResizeDescriptor&

1483

resizeDescriptor, const char* name)

1484

{

Aron Virginas-Tar

2019-07-01 19:01:44 +0100

[diff] [blame]

1485

return m_Graph->AddLayer<ResizeLayer>(resizeDescriptor, name);

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

1486

}

1487

Kevin May

ce5045a

2019-10-02 14:07:47 +0100

[diff] [blame]

1488

IConnectableLayer* Network::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

1489

const char* name)

1490

{

1491

return m_Graph->AddLayer<InstanceNormalizationLayer>(desc, name);

1492

}

1493

Matteo Martincigh

bcd3c85

2018-09-28 14:14:12 +0100

[diff] [blame]

1494

IConnectableLayer* Network::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

1495

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1496

{

Matteo Martincigh

bcd3c85

2018-09-28 14:14:12 +0100

[diff] [blame]

1497

return m_Graph->AddLayer<L2NormalizationLayer>(desc, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1498

}

1499

Aron Virginas-Tar

f982dea

2019-10-11 14:07:53 +0100

[diff] [blame]

1500

IConnectableLayer* Network::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& desc,

1501

const char* name)

1502

{

1503

return m_Graph->AddLayer<LogSoftmaxLayer>(desc, name);

1504

}

1505

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1506

IConnectableLayer* Network::AddConstantLayer(const ConstTensor& input, const char* name)

1507

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1508

auto layer = m_Graph->AddLayer<ConstantLayer>(name);

1509

1510

layer->m_LayerOutput = std::make_unique<ScopedCpuTensorHandle>(input);

1511

1512

return layer;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1513

}

1514

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1515

IConnectableLayer* Network::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

1516

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1517

{

1518

return m_Graph->AddLayer<ReshapeLayer>(reshapeDescriptor, name);

1519

}

1520

Nattapat Chaimanowong

207ef9a

2018-11-02 10:57:25 +0000

[diff] [blame]

1521

IConnectableLayer* Network::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

1522

const char* name)

1523

{

1524

return m_Graph->AddLayer<SpaceToBatchNdLayer>(spaceToBatchNdDescriptor, name);

1525

}

1526

Aron Virginas-Tar

972af15

2019-06-11 14:14:03 +0100

[diff] [blame]

1527

IConnectableLayer* Network::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

1528

const char* name)

1529

{

1530

return m_Graph->AddLayer<SpaceToDepthLayer>(spaceToDepthDescriptor, name);

1531

}

1532

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1533

IConnectableLayer* Network::AddFloorLayer(const char* name)

1534

{

1535

return m_Graph->AddLayer<FloorLayer>(name);

1536

}

1537

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1538

IConnectableLayer* Network::AddLstmLayer(const LstmDescriptor& descriptor,

1539

const LstmInputParams& params,

1540

const char* name)

1541

{

1542

const auto layer = m_Graph->AddLayer<LstmLayer>(descriptor, name);

1543

1544

//Lstm Basic Parameters

1545

layer->m_BasicParameters.m_InputToForgetWeights =

1546

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToForgetWeights));

1547

layer->m_BasicParameters.m_InputToCellWeights =

1548

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToCellWeights));

1549

layer->m_BasicParameters.m_InputToOutputWeights =

1550

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToOutputWeights));

1551

layer->m_BasicParameters.m_RecurrentToForgetWeights =

1552

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToForgetWeights));

1553

layer->m_BasicParameters.m_RecurrentToCellWeights =

1554

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToCellWeights));

1555

layer->m_BasicParameters.m_RecurrentToOutputWeights =

1556

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToOutputWeights));

1557

layer->m_BasicParameters.m_ForgetGateBias =

1558

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ForgetGateBias));

1559

layer->m_BasicParameters.m_CellBias =

1560

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellBias));

1561

layer->m_BasicParameters.m_OutputGateBias =

1562

std::make_unique<ScopedCpuTensorHandle>(*(params.m_OutputGateBias));

1563

1564

//Lstm Cifg parameters

1565

if(!descriptor.m_CifgEnabled)

1566

{

1567

if(params.m_InputToInputWeights == nullptr)

1568

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

1569

throw InvalidArgumentException("AddLstmLayer: Input To Input Weights cannot be NULL "

1570

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1571

}

1572

if(params.m_RecurrentToInputWeights == nullptr)

1573

{

1574

throw InvalidArgumentException(

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

1575

"AddLstmLayer: Recurrent To Input Weights cannot be NULL "

1576

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1577

}

1578

if(params.m_InputGateBias == nullptr)

1579

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

1580

throw InvalidArgumentException("AddLstmLayer: Input Gate Bias cannot be NULL "

1581

"when CIFG is disabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1582

}

1583

layer->m_CifgParameters.m_InputToInputWeights =

1584

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToInputWeights));

1585

layer->m_CifgParameters.m_RecurrentToInputWeights =

1586

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToInputWeights));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1587

layer->m_CifgParameters.m_InputGateBias =

1588

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputGateBias));

1589

}

1590

1591

//Lstm projection parameters

1592

if(descriptor.m_ProjectionEnabled)

1593

{

1594

if(params.m_ProjectionWeights == nullptr)

1595

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

1596

throw InvalidArgumentException("AddLstmLayer: Projection Weights cannot be NULL "

1597

"when projection is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1598

}

1599

layer->m_ProjectionParameters.m_ProjectionWeights =

1600

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ProjectionWeights));

1601

if(params.m_ProjectionBias != nullptr)

1602

{

1603

layer->m_ProjectionParameters.m_ProjectionBias =

1604

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ProjectionBias));

}

}

//Lstm Peephole params

1609

if(descriptor.m_PeepholeEnabled)

1610

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

1611

if(!descriptor.m_CifgEnabled)

1612

{

1613

if(params.m_CellToInputWeights == nullptr)

1614

{

1615

throw InvalidArgumentException("AddLstmLayer: Cell To Input Weights cannot be NULL "

1616

"when Peephole is enabled and CIFG disabled.");

1617

}

1618

1619

layer->m_PeepholeParameters.m_CellToInputWeights =

1620

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellToInputWeights));

1621

}

1622

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1623

if(params.m_CellToForgetWeights == nullptr)

1624

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

1625

throw InvalidArgumentException("AddLstmLayer: Cell To Forget Weights cannot be NULL "

1626

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1627

}

1628

if(params.m_CellToOutputWeights == nullptr)

1629

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

1630

throw InvalidArgumentException("AddLstmLayer: Cell To Output Weights cannot be NULL "

1631

"when Peephole is enabled.");

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1632

}

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

1633

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1634

layer->m_PeepholeParameters.m_CellToForgetWeights =

1635

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellToForgetWeights));

1636

layer->m_PeepholeParameters.m_CellToOutputWeights =

1637

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellToOutputWeights));

1638

}

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

1639

1640

//Lstm Layer Normalization params

1641

if(descriptor.m_LayerNormEnabled)

1642

{

1643

if(!descriptor.m_CifgEnabled)

1644

{

1645

if(params.m_InputLayerNormWeights == nullptr)

1646

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

1647

throw InvalidArgumentException("AddLstmLayer: Input layer normalization weights cannot be NULL "

1648

"when layer normalization is enabled and CIFG disabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

1649

}

1650

layer->m_LayerNormParameters.m_InputLayerNormWeights =

1651

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputLayerNormWeights));

1652

}

1653

1654

if(params.m_ForgetLayerNormWeights == nullptr)

1655

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

1656

throw InvalidArgumentException("AddLstmLayer: Forget layer normalization weights cannot be NULL "

1657

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

1658

}

1659

if(params.m_CellLayerNormWeights == nullptr)

1660

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

1661

throw InvalidArgumentException("AddLstmLayer: Cell layer normalization weights cannot be NULL "

1662

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

1663

}

1664

if(params.m_OutputLayerNormWeights == nullptr)

1665

{

Jan Eilers

2020-03-30 15:07:45 +0100

[diff] [blame]

1666

throw InvalidArgumentException("AddLstmLayer: Output layer normalization weights cannot be NULL "

1667

"when layer normalization is enabled.");

Jan Eilers

2019-07-17 11:07:49 +0100

[diff] [blame]

1668

}

1669

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

1670

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ForgetLayerNormWeights));

1671

layer->m_LayerNormParameters.m_CellLayerNormWeights =

1672

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellLayerNormWeights));

1673

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

1674

std::make_unique<ScopedCpuTensorHandle>(*(params.m_OutputLayerNormWeights));

1675

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2018-08-29 12:42:10 +0100

[diff] [blame]

1679

IConnectableLayer* Network::AddDivisionLayer(const char* name)

1680

{

1681

return m_Graph->AddLayer<DivisionLayer>(name);

1682

}

1683

David Beck

1952622

2018-09-12 16:00:08 +0100

[diff] [blame]

1684

IConnectableLayer* Network::AddSubtractionLayer(const char* name)

1685

{

1686

return m_Graph->AddLayer<SubtractionLayer>(name);

1687

}

1688

narpra01

32b9046

2018-09-13 11:07:48 +0100

[diff] [blame]

1689

IConnectableLayer* Network::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

1690

{

1691

return m_Graph->AddLayer<MeanLayer>(meanDescriptor,name);

1692

}

1693

Mohamed Nour Abouelseoud

5662c20

2018-09-24 13:30:09 +0100

[diff] [blame]

1694

IConnectableLayer* Network::AddPadLayer(const PadDescriptor& padDescriptor, const char* name)

1695

{

1696

return m_Graph->AddLayer<PadLayer>(padDescriptor,name);

1697

}

1698

Derek Lamberti

a9cca6a

2019-03-25 15:41:58 +0000

[diff] [blame]

1699

IConnectableLayer *Network::AddQuantizeLayer(const char *name)

1700

{

1701

return m_Graph->AddLayer<QuantizeLayer>(name);

1702

}

1703

Nattapat Chaimanowong

e4294fd

2019-03-28 09:56:53 +0000

[diff] [blame]

1704

IConnectableLayer* Network::AddDequantizeLayer(const char* name)

1705

{

1706

return m_Graph->AddLayer<DequantizeLayer>(name);

1707

}

1708

Conor Kennedy

430b5d8

2018-11-14 15:28:28 +0000

[diff] [blame]

1709

IConnectableLayer* Network::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

1710

const char* name)

1711

{

1712

return m_Graph->AddLayer<StridedSliceLayer>(stridedSliceDescriptor, name);

1713

}

1714

Matteo Martincigh

59a950c

2018-12-13 12:48:25 +0000

[diff] [blame]

1715

IConnectableLayer* Network::AddGreaterLayer(const char* name)

1716

{

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

1717

return AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Greater), name);

Matteo Martincigh

59a950c

2018-12-13 12:48:25 +0000

[diff] [blame]

1718

}

1719

FrancisMurtagh

2099595

2018-12-17 12:11:36 +0000

[diff] [blame]

1720

IConnectableLayer* Network::AddEqualLayer(const char* name)

1721

{

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

1722

return AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Equal), name);

FrancisMurtagh

2099595

2018-12-17 12:11:36 +0000

[diff] [blame]

1723

}

1724

Mohamed Nour Abouelseoud

a1d3c6a

2018-12-27 12:39:16 +0000

[diff] [blame]

1725

IConnectableLayer* Network::AddRsqrtLayer(const char * name)

1726

{

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

1727

return AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Rsqrt), name);

Mohamed Nour Abouelseoud

a1d3c6a

2018-12-27 12:39:16 +0000

[diff] [blame]

1728

}

1729

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

1730

IConnectableLayer* Network::AddGatherLayer(const char* name)

1731

{

Teresa Charlin

5266473

2020-06-29 16:27:03 +0100

[diff] [blame]

1732

GatherDescriptor gatherDescriptor{};

1733

return AddGatherLayer(gatherDescriptor, name);

1734

}

1735

1736

IConnectableLayer* Network::AddGatherLayer(const GatherDescriptor& gatherDescriptor,

1737

const char* name)

1738

{

1739

return m_Graph->AddLayer<GatherLayer>(gatherDescriptor, name);

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

1740

}

1741

Nattapat Chaimanowong

1f88630

2019-04-05 13:37:19 +0100

[diff] [blame]

1742

IConnectableLayer* Network::AddMergeLayer(const char* name)

1743

{

1744

return m_Graph->AddLayer<MergeLayer>(name);

1745

}

1746

Sadik Armagan

eff363d

2019-04-05 15:25:46 +0100

[diff] [blame]

1747

IConnectableLayer* Network::AddSwitchLayer(const char* name)

1748

{

1749

return m_Graph->AddLayer<SwitchLayer>(name);

1750

}

1751

Matteo Martincigh

0e406ee

2019-06-12 15:42:18 +0100

[diff] [blame]

1752

IConnectableLayer* Network::AddPreluLayer(const char* name)

1753

{

1754

return m_Graph->AddLayer<PreluLayer>(name);

1755

}

1756

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

1757

IConnectableLayer* Network::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

1758

const ConstTensor& weights,

1759

const Optional<ConstTensor>& biases,

1760

const char* name)

1761

{

1762

if (descriptor.m_BiasEnabled && !biases.has_value())

1763

{

1764

throw InvalidArgumentException("AddTransposeConvolution2dLayer: Biases cannot be empty");

1765

}

1766

1767

const auto layer = m_Graph->AddLayer<TransposeConvolution2dLayer>(descriptor, name);

1768

1769

layer->m_Weight = std::make_unique<ScopedCpuTensorHandle>(weights);

1770

1771

if (descriptor.m_BiasEnabled)

1772

{

1773

layer->m_Bias = std::make_unique<ScopedCpuTensorHandle>(biases.value());

}

return layer;

}

Mike Kelly

2020-02-28 18:11:58 +0000

[diff] [blame]

1779

IConnectableLayer* Network::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

1780

const char* name)

1781

{

1782

return m_Graph->AddLayer<TransposeLayer>(transposeDescriptor, name);

1783

}

1784

Matthew Jackson

2b8c1da

2019-07-04 14:59:16 +0100

[diff] [blame]

1785

IConnectableLayer* Network::AddStackLayer(const StackDescriptor& stackDescriptor,

1786

const char* name)

1787

{

1788

return m_Graph->AddLayer<StackLayer>(stackDescriptor, name);

1789

}

1790

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

1791

1792

IConnectableLayer* Network::AddStandInLayer(const StandInDescriptor& desc,

1793

const char* name)

1794

{

1795

return m_Graph->AddLayer<StandInLayer>(desc, name);

1796

}

1797

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1798

IConnectableLayer* Network::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

1799

const char* name)

1800

{

1801

const auto layer = m_Graph->AddLayer<QuantizedLstmLayer>(name);

1802

1803

// InputToX weights

1804

layer->m_QuantizedLstmParameters.m_InputToInputWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1805

std::make_unique<ScopedCpuTensorHandle>(params.GetInputToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1806

layer->m_QuantizedLstmParameters.m_InputToForgetWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1807

std::make_unique<ScopedCpuTensorHandle>(params.GetInputToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1808

layer->m_QuantizedLstmParameters.m_InputToCellWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1809

std::make_unique<ScopedCpuTensorHandle>(params.GetInputToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1810

layer->m_QuantizedLstmParameters.m_InputToOutputWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1811

std::make_unique<ScopedCpuTensorHandle>(params.GetInputToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1812

1813

// RecurrentToX weights

1814

layer->m_QuantizedLstmParameters.m_RecurrentToInputWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1815

std::make_unique<ScopedCpuTensorHandle>(params.GetRecurrentToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1816

layer->m_QuantizedLstmParameters.m_RecurrentToForgetWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1817

std::make_unique<ScopedCpuTensorHandle>(params.GetRecurrentToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1818

layer->m_QuantizedLstmParameters.m_RecurrentToCellWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1819

std::make_unique<ScopedCpuTensorHandle>(params.GetRecurrentToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1820

layer->m_QuantizedLstmParameters.m_RecurrentToOutputWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1821

std::make_unique<ScopedCpuTensorHandle>(params.GetRecurrentToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1822

1823

// Bias

1824

layer->m_QuantizedLstmParameters.m_InputGateBias =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1825

std::make_unique<ScopedCpuTensorHandle>(params.GetInputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1826

layer->m_QuantizedLstmParameters.m_ForgetGateBias =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1827

std::make_unique<ScopedCpuTensorHandle>(params.GetForgetGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1828

layer->m_QuantizedLstmParameters.m_CellBias =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1829

std::make_unique<ScopedCpuTensorHandle>(params.GetCellBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1830

layer->m_QuantizedLstmParameters.m_OutputGateBias =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1831

std::make_unique<ScopedCpuTensorHandle>(params.GetOutputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

return layer;

}

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame]

1836

IConnectableLayer* Network::AddQLstmLayer(const QLstmDescriptor& descriptor,

1837

const LstmInputParams& params,

1838

const char* name)

1839

{

1840

const auto layer = m_Graph->AddLayer<QLstmLayer>(descriptor, name);

1841

1842

// QLstm Basic Parameters

1843

layer->m_BasicParameters.m_InputToForgetWeights =

1844

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToForgetWeights));

1845

layer->m_BasicParameters.m_InputToCellWeights =

1846

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToCellWeights));

1847

layer->m_BasicParameters.m_InputToOutputWeights =

1848

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToOutputWeights));

1849

layer->m_BasicParameters.m_RecurrentToForgetWeights =

1850

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToForgetWeights));

1851

layer->m_BasicParameters.m_RecurrentToCellWeights =

1852

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToCellWeights));

1853

layer->m_BasicParameters.m_RecurrentToOutputWeights =

1854

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToOutputWeights));

1855

layer->m_BasicParameters.m_ForgetGateBias =

1856

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ForgetGateBias));

1857

layer->m_BasicParameters.m_CellBias =

1858

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellBias));

1859

layer->m_BasicParameters.m_OutputGateBias =

1860

std::make_unique<ScopedCpuTensorHandle>(*(params.m_OutputGateBias));

1861

1862

// QLstm Cifg parameters

1863

if(!descriptor.m_CifgEnabled)

1864

{

1865

if(params.m_InputToInputWeights == nullptr)

1866

{

1867

throw InvalidArgumentException("AddQLstmLayer: Input To Input Weights cannot be NULL");

1868

}

1869

1870

if(params.m_RecurrentToInputWeights == nullptr)

1871

{

1872

throw InvalidArgumentException(

1873

"AddQLstmLayer: Recurrent To Input Weights cannot be NULL");

1874

}

1875

1876

if(params.m_InputGateBias == nullptr)

1877

{

1878

throw InvalidArgumentException("AddQLstmLayer: Input Gate Bias cannot be NULL");

1879

}

1880

1881

layer->m_CifgParameters.m_InputToInputWeights =

1882

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToInputWeights));

1883

layer->m_CifgParameters.m_RecurrentToInputWeights =

1884

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToInputWeights));

1885

layer->m_CifgParameters.m_InputGateBias =

1886

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputGateBias));

1887

}

1888

1889

// QLstm Projection parameters

1890

if(descriptor.m_ProjectionEnabled)

1891

{

1892

if(params.m_ProjectionWeights == nullptr)

1893

{

1894

throw InvalidArgumentException("AddQLstmLayer: Projection Weights cannot be NULL");

1895

}

1896

James Conroy

586a9aa

2020-03-20 08:49:33 +0000

[diff] [blame]

1897

layer->m_ProjectionParameters.m_ProjectionWeights =

1898

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ProjectionWeights));

James Conroy

ed32405

2020-05-18 15:16:42 +0100

[diff] [blame]

1899

1900

// Projection bias is optional even if projection is enabled

1901

if(params.m_ProjectionWeights != nullptr)

1902

{

1903

layer->m_ProjectionParameters.m_ProjectionBias =

1904

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ProjectionBias));

1905

}

1906

James Conroy

586a9aa

2020-03-20 08:49:33 +0000

[diff] [blame]

1907

}

1908

1909

// QLstm Peephole params

1910

if(descriptor.m_PeepholeEnabled)

1911

{

1912

if(params.m_CellToForgetWeights == nullptr)

1913

{

1914

throw InvalidArgumentException("AddQLstmLayer: Cell To Forget Weights cannot be NULL");

1915

}

1916

1917

if(params.m_CellToOutputWeights == nullptr)

1918

{

1919

throw InvalidArgumentException("AddQLstmLayer: Cell To Output Weights cannot be NULL");

1920

}

1921

1922

if(!descriptor.m_CifgEnabled)

1923

{

1924

if(params.m_CellToInputWeights == nullptr)

1925

{

1926

throw InvalidArgumentException("AddQLstmLayer: Cell To Input Weights cannot be NULL");

1927

}

1928

1929

layer->m_PeepholeParameters.m_CellToInputWeights =

1930

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellToInputWeights));

1931

}

1932

1933

layer->m_PeepholeParameters.m_CellToForgetWeights =

1934

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellToForgetWeights));

1935

layer->m_PeepholeParameters.m_CellToOutputWeights =

1936

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellToOutputWeights));

1937

}

1938

1939

// QLstm Layer Normalization params

1940

if(descriptor.m_LayerNormEnabled)

1941

{

1942

if(params.m_ForgetLayerNormWeights == nullptr)

1943

{

1944

throw InvalidArgumentException("AddQLstmLayer: Forget layer normalization weights cannot be NULL");

1945

}

1946

1947

if(params.m_CellLayerNormWeights == nullptr)

1948

{

1949

throw InvalidArgumentException("AddQLstmLayer: Cell layer normalization weights cannot be NULL");

1950

}

1951

1952

if(params.m_OutputLayerNormWeights == nullptr)

1953

{

1954

throw InvalidArgumentException("AddQLstmLayer: Output layer normalization weights cannot be NULL");

1955

}

1956

1957

if(!descriptor.m_CifgEnabled)

1958

{

1959

if(params.m_InputLayerNormWeights == nullptr)

1960

{

1961

throw InvalidArgumentException("AddQLstmLayer: Input layer normalization weights cannot be NULL");

1962

}

1963

1964

layer->m_LayerNormParameters.m_InputLayerNormWeights =

1965

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputLayerNormWeights));

1966

}

1967

1968

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

1969

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ForgetLayerNormWeights));

1970

layer->m_LayerNormParameters.m_CellLayerNormWeights =

1971

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellLayerNormWeights));

1972

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

1973

std::make_unique<ScopedCpuTensorHandle>(*(params.m_OutputLayerNormWeights));

}

return layer;

}

Mike Kelly

2019-02-11 17:01:27 +0000

[diff] [blame]

1978

void Network::Accept(ILayerVisitor& visitor) const

1979

{

1980

for (auto layer : GetGraph())

1981

{

1982

layer->Accept(visitor);

};

}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1986

OptimizedNetwork::OptimizedNetwork(std::unique_ptr<Graph> graph)

Sadik Armagan

3184c90

2020-03-18 10:57:30 +0000

[diff] [blame]

1987

: m_Graph(std::move(graph)), m_Guid(profiling::ProfilingService::GetNextGuid())

telsoa01