Blame - src/armnn/Network.cpp - ml/armnn

2018-03-09 14:13:49 +0000

[diff] [blame]

1

//

2

David Beck

ecb56cd

2018-09-05 12:52:57 +0100

[diff] [blame]

3

// SPDX-License-Identifier: MIT

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

5

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

6

#include "Network.hpp"

7

#include "Graph.hpp"

8

#include "Layer.hpp"

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

9

#include "DeviceSpec.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

10

#include "Optimizer.hpp"

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

11

#include "SubgraphViewSelector.hpp"

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

12

#include "BackendSettings.hpp"

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

13

#include "optimizations/All.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

14

Aron Virginas-Tar

c9cc804

2018-11-01 16:15:57 +0000

[diff] [blame]

15

#include <backendsCommon/CpuTensorHandle.hpp>

16

#include <backendsCommon/WorkloadFactory.hpp>

Matteo Martincigh

e5b8eb9

2019-11-28 15:45:42 +0000

[diff] [blame]

17

#include <armnn/backends/IBackendInternal.hpp>

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

18

#include <backendsCommon/TensorHandleFactoryRegistry.hpp>

David Beck

ac42efd

2018-09-26 17:41:13 +0100

[diff] [blame]

19

20

#include <armnn/Exceptions.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

21

#include <armnn/Utils.hpp>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

22

#include <armnn/TypesUtils.hpp>

Matteo Martincigh

c601aa6

2019-10-29 15:03:22 +0000

[diff] [blame]

23

#include <armnn/BackendRegistry.hpp>

Matthew Bentham

f48afc6

2020-01-15 17:55:08 +0000

[diff] [blame]

24

#include <armnn/Logging.hpp>

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

25

#include <armnn/utility/IgnoreUnused.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

26

Jan Eilers

99d9d4a

2019-11-06 10:02:16 +0000

[diff] [blame]

27

#include <ProfilingService.hpp>

28

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

#include <fcntl.h>

#include <algorithm>

#include <fstream>

#include <memory>

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

33

#include <vector>

34

#include <algorithm>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

35

36

#include <boost/assert.hpp>

37

#include <boost/format.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

38

#include <boost/numeric/conversion/converter_policies.hpp>

39

#include <boost/cast.hpp>

namespace armnn

{

armnn::INetwork* INetwork::CreateRaw()

45

{

46

return new Network();

47

}

48

49

armnn::INetworkPtr INetwork::Create()

50

{

51

return INetworkPtr(CreateRaw(), &INetwork::Destroy);

52

}

53

54

void INetwork::Destroy(INetwork* network)

55

{

56

delete boost::polymorphic_downcast<Network*>(network);

57

}

58

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

59

void IOptimizedNetwork::Destroy(IOptimizedNetwork* network)

60

{

61

delete boost::polymorphic_downcast<OptimizedNetwork*>(network);

62

}

63

64

Status OptimizedNetwork::PrintGraph()

65

{

66

m_Graph->Print();

67

return Status::Success;

68

}

69

surmeh01

bceff2f

2018-03-29 16:29:27 +0100

[diff] [blame]

70

Status OptimizedNetwork::SerializeToDot(std::ostream& stream) const

71

{

72

return m_Graph->SerializeToDot(stream);

73

}

74

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

75

void ReportError(const std::string& errorMessage,

76

Optional<std::vector<std::string>&> errorMessages)

77

{

78

std::stringstream fullErrorMessage;

79

fullErrorMessage << "ERROR: " << errorMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

80

ARMNN_LOG(warning) << fullErrorMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

81

if (errorMessages)

82

{

83

errorMessages.value().push_back(fullErrorMessage.str());

}

}

void ReportWarning(const std::string& warningMessage,

88

Optional<std::vector<std::string>&> warningMessages)

89

{

90

std::stringstream fullWarningMessage;

91

fullWarningMessage << "WARNING: " << warningMessage;

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

92

ARMNN_LOG(warning) << fullWarningMessage.str();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

93

if (warningMessages)

94

{

95

warningMessages.value().push_back(fullWarningMessage.str());

}

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

99

OptimizationResult ReturnWithError(OptimizationResult res,

100

const Layer* layer,

101

const BackendSettings& backendSettings,

102

Optional<std::vector<std::string>&> errMessages)

103

{

104

std::stringstream failureMsg;

105

failureMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

106

<< " is not supported on any preferred backend " << backendSettings.m_PreferredBackends;

107

ReportError(failureMsg.str(), errMessages);

res.m_Error = true;

return res;

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

114

bool CheckScaleSetOnQuantizedType(Layer* layer, Optional<std::vector<std::string>&> errMessages)

115

{

116

bool noErrors = true;

117

unsigned int numOutputs = layer->GetNumOutputSlots();

118

for (unsigned int i = 0; i < numOutputs; i++) {

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

119

OutputSlot& outputSlot = layer->GetOutputSlot(i);

120

TensorInfo info = outputSlot.GetTensorInfo();

Derek Lamberti

f90c56d

2020-01-10 17:14:08 +0000

[diff] [blame]

121

if (DataType::QAsymmU8 == info.GetDataType()) {

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

122

if (0.f == info.GetQuantizationScale()) {

123

noErrors = false;

124

std::stringstream ss;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

125

ss << "output " << i << " of layer " << GetLayerTypeAsCString(layer->GetType())

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

126

<< " (" << layer->GetNameStr() << ") is of type"

127

<< " Quantized 8 bit but its scale parameter has not been set";

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

128

ReportError(ss.str(), errMessages);

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

129

}

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

130

// Softmax under QuantisedAsymm8 must always be scale (1.0f/256.0f) and offset 0

131

if ((info.GetQuantizationScale() != (1.0f / 256.0f) ||

132

info.GetQuantizationOffset() != 0) &&

133

layer->GetType() == armnn::LayerType::Softmax)

134

{

135

std::stringstream ss;

136

ss << "Quantization parameters for Softmax layer (Scale: " <<

137

info.GetQuantizationScale() << " and Offset: " << info.GetQuantizationOffset() <<

138

") are incorrect and have been updated to Scale: 0.00390625 and Offset: 0";

Derek Lamberti

0844697

2019-11-26 16:38:31 +0000

[diff] [blame]

139

ARMNN_LOG(warning) << ss.str();

David Monahan

b855470

2019-04-25 16:03:38 +0100

[diff] [blame]

140

info.SetQuantizationScale((1.0f /256.0f));

141

info.SetQuantizationOffset(0);

142

outputSlot.SetTensorInfo(info);

143

}

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

}

}

return noErrors;

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

149

OptimizationResult AttemptBackendAssignment(BackendSettings& backendSettings,

Graph& graph,

Layer* layer,

BackendId backend,

DataType dataTypeIn,

DataType dataTypeOut,

155

const std::vector<BackendId>& availablePreferredBackends,

156

std::string& reasonIfUnsupported,

157

Optional<std::vector<std::string>&> errMessages)

158

{

159

OptimizationResult result;

160

161

// Helper lambda to compose meaningful error message before returning with error

162

auto ReturnError = [&](const Layer* layer)

163

{

164

return ReturnWithError(result, layer, backendSettings, errMessages);

165

};

166

167

// need to set the compute device on the layer

168

// before we can check if it is supported

169

layer->SetBackendId(backend);

170

if (!IWorkloadFactory::IsLayerSupported(*layer, EmptyOptional(), reasonIfUnsupported))

171

{

172

if (dataTypeIn == DataType::Float16 || dataTypeOut == DataType::Float16)

173

{

174

if (IWorkloadFactory::IsLayerSupported(*layer, DataType::Float32, reasonIfUnsupported)

175

&& layer->GetType() != LayerType::ConvertFp32ToFp16

176

&& layer->GetType() != LayerType::ConvertFp16ToFp32)

177

{

178

// Insert FP16 -> FP32 conversion layer before current layer

179

std::vector<ConvertFp16ToFp32Layer*> convertFp16ToFp32Layers;

180

if (dataTypeIn == DataType::Float16)

181

{

182

convertFp16ToFp32Layers =

183

InsertConvertFp16ToFp32LayersBefore(graph, *layer);

184

}

185

186

// Insert FP32 -> FP16 conversion layer after current layer

187

std::vector<ConvertFp32ToFp16Layer*> convertFp32ToFp16Layers;

188

if (dataTypeOut == DataType::Float16)

189

{

190

convertFp32ToFp16Layers =

191

InsertConvertFp32ToFp16LayersAfter(graph, *layer);

192

}

193

194

// Assign a supported backend to the newly introduced conversion layers

195

auto AssignFirstSupportedBackend = [&](Layer* layer, BackendId preferredBackend)

196

{

197

bool supportedBackendFound = false;

198

std::string reasonIfUnsupported;

199

200

// Try preferred backend first

201

layer->SetBackendId(preferredBackend);

202

if (IWorkloadFactory::IsLayerSupported(*layer,

203

EmptyOptional(),

204

reasonIfUnsupported))

205

{

206

supportedBackendFound = true;

}

else

{

for (const auto& backend : availablePreferredBackends)

211

{

212

// Skip preferred backend (we already determined that it is not supported)

213

if (backend == preferredBackend)

{

continue;

}

layer->SetBackendId(backend);

219

if (IWorkloadFactory::IsLayerSupported(*layer,

220

EmptyOptional(),

221

reasonIfUnsupported))

222

{

223

supportedBackendFound = true;

break;

}

}

}

return supportedBackendFound;

230

};

231

232

for (ConvertFp16ToFp32Layer* convertLayer : convertFp16ToFp32Layers)

233

{

234

if (!AssignFirstSupportedBackend(convertLayer, backend))

235

{

236

return ReturnError(convertLayer);

}

}

for (ConvertFp32ToFp16Layer* convertLayer : convertFp32ToFp16Layers)

241

{

242

if (!AssignFirstSupportedBackend(convertLayer, backend))

243

{

244

return ReturnError(convertLayer);

}

}

return result;

}

}

std::stringstream warningMsg;

252

warningMsg << "Layer of type " << GetLayerTypeAsCString(layer->GetType())

253

<< " is not supported on requested backend " << layer->GetBackendId().Get()

254

<< " for input data type " << GetDataTypeName(dataTypeIn)

255

<< " and output data type " << GetDataTypeName(dataTypeOut)

256

<< " (reason: " << reasonIfUnsupported

257

<< "), falling back to the next backend.";

258

ReportWarning(warningMsg.str(), errMessages);

259

260

return OptimizationResult(true, false);

}

else

{

return result;

}

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

269

OptimizationResult AssignBackends(OptimizedNetwork* optNetObjPtr,

270

BackendSettings& backendSettings,

271

Graph::Iterator& firstLayer,

272

Graph::Iterator& lastLayer,

273

Optional<std::vector<std::string>&> errMessages)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

274

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

275

OptimizationResult result;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

276

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

277

// Helper lambda to compose meaningful error message before returning with error

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

278

auto ReturnError = [&](const Layer* layer)

279

{

280

return ReturnWithError(result, layer, backendSettings, errMessages);

281

};

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

282

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

283

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

284

auto availablePreferredBackends = backendSettings.GetAvailablePreferredBackends();

285

if (availablePreferredBackends.empty())

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

286

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

287

std::stringstream failureMsg;

288

failureMsg << "No preferred backends are available";

289

ReportError(failureMsg.str(), errMessages);

290

291

result.m_Error = true;

return result;

}

for (auto it = firstLayer; it != lastLayer; ++it)

296

{

297

auto layer = *it;

Aron Virginas-Tar

87972be

2019-11-13 15:16:28 +0000

[diff] [blame]

298

299

DataType dataTypeIn = layer->GetNumInputSlots() == 0 ? DataType::Float32 :

300

layer->GetInputSlot(0).GetConnectedOutputSlot()->GetTensorInfo().GetDataType();

301

DataType dataTypeOut = layer->GetNumOutputSlots() == 0 ? DataType::Float32 :

302

layer->GetOutputSlot(0).GetTensorInfo().GetDataType();

303

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

304

std::string reasonIfUnsupported;

305

bool found = false;

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

306

if (!CheckScaleSetOnQuantizedType(layer, errMessages))

307

{

308

// don't bomb immediately, find all the quantized outputs

309

// which haven't had a scale set and report them all back.

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

310

result.m_Error = true;

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

311

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

312

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

313

// First try assign layer to hint backend

314

if (layer->GetBackendHint().has_value() &&

315

backendSettings.IsBackendSupported(layer->GetBackendHint().value()) &&

316

AttemptBackendAssignment(backendSettings,

317

optNetObjPtr->GetGraph(),

318

layer,

319

layer->GetBackendHint().value(),

320

dataTypeIn,

321

dataTypeOut,

322

availablePreferredBackends,

323

reasonIfUnsupported,

324

errMessages).IsOk())

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

325

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

326

found = true;

327

backendSettings.m_SelectedBackends.insert(layer->GetBackendHint().value());

}

else

{

// Try assign layer to prefered list of backends

332

for (const auto& backend : availablePreferredBackends)

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

333

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

334

if (layer->GetBackendHint().has_value() &&

335

layer->GetBackendHint().value() == backend)

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

336

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

337

continue; //Don't re-test the backend hint

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

338

}

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

339

340

OptimizationResult res = AttemptBackendAssignment(backendSettings,

341

optNetObjPtr->GetGraph(),

layer,

backend,

dataTypeIn,

dataTypeOut,

availablePreferredBackends,

reasonIfUnsupported,

errMessages);

if (res.IsOk())

{

found = true;

backendSettings.m_SelectedBackends.insert(backend);

354

break;

355

}

356

else if (res.IsError())

357

{

358

return res; // Cannot continue.

359

// Note: we don't need to log the error as it would already

360

// be logged in AttemptBackendAssignment().

}

else

{

BOOST_ASSERT_MSG(res.IsWarningOnly(), "OptimizationResult in unexpected state.");

365

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

}

}

// If the layer is unsupported by any devices, log and return a null network.

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

370

if (!found)

371

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

372

// NOTE: if the layer is not an operation queue type AND we have not got CpuRef as a

373

// fallback we should set the compute device on the layer to CpuRef (these are not

374

// available as accelerated operations, or are only available under certain

375

// conditions, currently they comprise MemCopy, Constant, Permute)

376

armnn::LayerType layerType = layer->GetType();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

377

if (!backendSettings.IsCpuRefUsed() && (layerType == armnn::LayerType::MemCopy ||

378

layerType == armnn::LayerType::Constant ||

379

layerType == armnn::LayerType::Permute))

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

380

{

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

381

BackendId cpuBackendId(armnn::Compute::CpuRef);

382

layer->SetBackendId(cpuBackendId);

383

backendSettings.m_SelectedBackends.insert(cpuBackendId);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

384

}

385

else

386

{

Derek Lamberti

2020-01-03 16:53:38 +0000

[diff] [blame]

387

return ReturnError(layer);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

388

}

389

}

390

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

return result;

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

395

OptimizationResult AssignBackends(OptimizedNetwork* optNetObjPtr,

396

BackendSettings& backendSettings,

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

397

SubgraphView& subgraph,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

398

Optional<std::vector<std::string>&> errMessages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

399

{

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

400

Graph::Iterator firstLayer = subgraph.begin();

401

Graph::Iterator lastLayer = subgraph.end();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

402

return AssignBackends(optNetObjPtr,

backendSettings,

firstLayer,

lastLayer,

errMessages);

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

409

BackendsMap CreateSupportedBackends(TensorHandleFactoryRegistry& handleFactoryRegistry,

410

BackendSettings& backendSettings)

411

{

412

BackendsMap backends;

413

auto const& backendRegistry = BackendRegistryInstance();

414

for (auto&& selectedBackend : backendSettings.m_SupportedBackends)

415

{

416

auto backendFactory = backendRegistry.GetFactory(selectedBackend);

417

auto backendObjPtr = backendFactory();

418

BOOST_ASSERT(backendObjPtr);

419

420

backendObjPtr->RegisterTensorHandleFactories(handleFactoryRegistry);

421

422

backends[backendObjPtr->GetId()] = std::move(backendObjPtr);

}

return backends;

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

428

OptimizationResult ApplyBackendOptimizations(OptimizedNetwork* optNetObjPtr,

429

BackendSettings& backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

430

BackendsMap& backends,

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

431

Optional<std::vector<std::string>&> errMessages)

432

{

433

BOOST_ASSERT(optNetObjPtr);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

434

435

OptimizationResult result;

436

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

437

// Get the optimized graph

438

Graph& optGraph = optNetObjPtr->GetGraph();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

439

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

440

// Run backend specific optimizations

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

441

for (auto&& selectedBackend : backendSettings.m_SelectedBackends)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

442

{

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

443

auto backendObjPtr = backends.find(selectedBackend)->second.get();

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

444

BOOST_ASSERT(backendObjPtr);

445

446

// Select sub-graphs based on backend

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

447

SubgraphViewSelector::Subgraphs subgraphs =

Rob Hughes

65c3226

2019-07-23 15:33:39 +0100

[diff] [blame]

448

SubgraphViewSelector::SelectSubgraphs(optGraph,

Matteo Martincigh

602af09

2019-05-01 10:31:27 +0100

[diff] [blame]

449

// Select layers assigned to the requested backend

450

[&backendObjPtr](const Layer& layer)

451

{

452

return layer.GetType() != LayerType::Input &&

453

layer.GetType() != LayerType::Output &&

454

layer.GetBackendId() == backendObjPtr->GetId();

455

});

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

456

if (subgraphs.empty())

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

457

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

458

// No sub-graphs found, try with next selected backend

459

continue;

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

460

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

461

462

// Try to optimize each sub-graph

Derek Lamberti

2019-04-26 13:05:17 +0100

[diff] [blame]

463

for (auto& subgraph : subgraphs)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

464

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

465

// Try to optimize the current sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

466

OptimizationViews optimizationViews = backendObjPtr->OptimizeSubgraphView(*subgraph);

467

BOOST_ASSERT(optimizationViews.Validate(*subgraph));

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

468

469

// Optimization attempted, check the resulting optimized sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

470

for (auto& substitution : optimizationViews.GetSubstitutions())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

471

{

472

// Sub-graph optimized, substitute the sub-graph with the new optimized one in the main optimized graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

473

SubgraphView& replacementSubgraph = substitution.m_ReplacementSubgraph;

474

SubgraphView& substitutableSubgraph = substitution.m_SubstitutableSubgraph;

475

optGraph.SubstituteSubgraph(substitutableSubgraph, replacementSubgraph);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

476

477

// Assign the current backend to the optimized sub-graph

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

478

std::for_each(replacementSubgraph.begin(), replacementSubgraph.end(), [&selectedBackend](Layer* l)

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

479

{

480

BOOST_ASSERT(l);

481

l->SetBackendId(selectedBackend);

482

});

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

483

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

484

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

485

if (!optimizationViews.GetFailedSubgraphs().empty())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

486

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

487

std::stringstream warningMsg;

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

488

warningMsg << "Some sub-graph(s) failed to optimized on " << backendObjPtr->GetId() << " backend.";

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

489

ReportWarning(warningMsg.str(), errMessages);

490

491

// Failed to optimize the given sub-graph, re-assign the sub-graph layers to other available backends

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

492

BackendSettings settingsCopy(backendSettings);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

493

if (!backendObjPtr->GetId().IsCpuRef())

494

{

495

// Add the current backend to the list of backends to ignore

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

496

settingsCopy.m_IgnoredBackends.insert(backendObjPtr->GetId());

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

497

}

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

498

499

int count=0;

Matteo Martincigh

2019-05-09 12:46:16 +0100

[diff] [blame]

500

for (auto& failedSubgraph : optimizationViews.GetFailedSubgraphs())

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

501

{

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

502

// An error occurred: the optimization was attempted but not performed, try different backends

503

std::stringstream subgraphMsg;

504

subgraphMsg << "Re-assigning backends to " << failedSubgraph.GetLayers().size()

505

<< " layers inside sub-graph " << count++;

Matteo Martincigh

328d92b

2019-07-04 17:52:55 +0100

[diff] [blame]

506

ReportWarning(subgraphMsg.str(), errMessages);

Derek Lamberti

2019-05-08 10:23:08 +0100

[diff] [blame]

507

508

OptimizationResult reassignmentResult = AssignBackends(optNetObjPtr,

settingsCopy,

*subgraph,

errMessages);

if (reassignmentResult.m_Error)

513

{

514

// Failed to re-assign one of the remaining backends to each layer of the sub-graph

515

result.m_Error = true;

516

return result;

517

}

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

518

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

}

}

}

return result;

}

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

526

bool RequiresCopy(ITensorHandleFactory::FactoryId src,

527

ITensorHandleFactory::FactoryId dst,

528

TensorHandleFactoryRegistry& registry)

{

if (src != dst)

{

ITensorHandleFactory* srcFactory = registry.GetFactory(src);

533

ITensorHandleFactory* dstFactory = registry.GetFactory(dst);

534

Matteo Martincigh

a6539ed

2019-08-27 13:43:32 +0100

[diff] [blame]

535

if (srcFactory && dstFactory &&

536

(srcFactory->GetExportFlags() & dstFactory->GetImportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

{

return false;

}

return true;

}

return false;

}

// Find the handle factory for the input layer which results in fewest required copies.

546

ITensorHandleFactory::FactoryId CalculateSlotOptionForInput(BackendsMap& backends,

547

OutputSlot& slot,

548

TensorHandleFactoryRegistry& registry)

549

{

550

Layer& layer = slot.GetOwningLayer();

551

BOOST_ASSERT(layer.GetType() == LayerType::Input);

552

553

// Explicitly select the tensorhandle factory for InputLayer because the rules for it are slightly different. It

554

// doesn't matter which backend it is assigned to because they all use the same implementation, which

555

// requires Map/Unmap support. This means that, so long as the handle type supports map/unmap semantics, we can

556

// select a factory with maximum compatibility with the layers connected to the InputLayer.

557

558

// First ensure the from backends can support the TensorHandeAPI

559

auto frmBackend = backends.find(layer.GetBackendId());

560

if (frmBackend == backends.end() ||

561

!frmBackend->second->SupportsTensorAllocatorAPI())

562

{

563

return ITensorHandleFactory::LegacyFactoryId;

564

}

565

566

// Go through all connections to the output slot and determine the TensorHandleFactory which results in the

567

// fewest copies.

568

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

569

int topScore = 0;

570

ITensorHandleFactory::FactoryId topChoice = ITensorHandleFactory::LegacyFactoryId;

571

572

for (auto&& connection : slot.GetConnections())

573

{

574

const Layer& connectedLayer = connection->GetOwningLayer();

575

576

auto toBackend = backends.find(connectedLayer.GetBackendId());

577

BOOST_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

578

579

if (!toBackend->second.get()->SupportsTensorAllocatorAPI())

580

{

581

// The destination backend does not support the tensor allocator API, move to the next one

continue;

}

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

586

for (auto&& dst : dstPrefs)

587

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

588

// Input layers use the mem copy workload or import, so the selected factory must

589

// support either the map/unmap API or Import API

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

590

ITensorHandleFactory* factory = registry.GetFactory(dst);

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

591

if (!factory->SupportsMapUnmap() &&

592

!CheckFlag(factory->GetImportFlags(), MemorySource::Malloc)) // Just support cpu mem imports for now

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

593

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

594

// The current tensor handle factory does not support the map/unmap or import

595

// strategy, move to the next one

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

continue;

}

auto it = factoryScores.find(dst);

600

if (it == factoryScores.end())

601

{

602

// Add new score to the table

603

factoryScores[dst] = 0;

604

if (topChoice == ITensorHandleFactory::LegacyFactoryId)

{

topChoice = dst;

}

}

else

{

// Increase the score

612

factoryScores[dst]++;

613

614

// Track the best option

615

if (factoryScores[dst] > topScore)

616

{

617

topScore = factoryScores[dst];

topChoice = dst;

}

}

}

}

return topChoice;

}

// Find the handle factory for the output layer which results in fewest required copies.

628

ITensorHandleFactory::FactoryId CalculateSlotOptionForOutput(BackendsMap& backends,

629

OutputSlot& slot,

630

TensorHandleFactoryRegistry& registry)

631

{

Jan Eilers

8eb2560

2020-03-09 12:13:48 +0000

[diff] [blame]

632

IgnoreUnused(backends, slot, registry);

Derek Lamberti

94a88d2

2019-12-10 21:12:59 +0000

[diff] [blame]

633

return ITensorHandleFactory::DeferredFactoryId;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

634

}

635

636

// For all handle factories supported on the source backend, we wish to find the one which requires the fewest copies

637

// when considering all connections.

638

ITensorHandleFactory::FactoryId CalculateSlotOption(BackendsMap& backends,

639

OutputSlot& outputSlot,

640

TensorHandleFactoryRegistry& registry)

641

{

642

// First ensure the from backends can support the TensorHandeAPI

643

Layer& layer = outputSlot.GetOwningLayer();

644

auto frmBackend = backends.find(layer.GetBackendId());

645

if (frmBackend == backends.end() ||

646

!frmBackend->second->SupportsTensorAllocatorAPI())

647

{

648

return ITensorHandleFactory::LegacyFactoryId;

649

}

650

651

// Connections to Output Layers requires support for map/unmap on the TensorHandle.

652

bool requiresMapUnmap = false;

653

for (auto&& connection : outputSlot.GetConnections())

654

{

655

const Layer& connectedLayer = connection->GetOwningLayer();

656

if (connectedLayer.GetType() == LayerType::Output)

657

{

658

requiresMapUnmap = true;

}

}

IBackendInternal* srcBackend = frmBackend->second.get();

663

auto srcPrefs = srcBackend->GetHandleFactoryPreferences();

664

665

// Initialize the scores

666

std::map<ITensorHandleFactory::FactoryId, int> factoryScores;

667

for (auto&& pref : srcPrefs)

668

{

669

if (requiresMapUnmap) // Only consider factories that support map/unmap if required

670

{

671

ITensorHandleFactory* factory = registry.GetFactory(pref);

672

if (!factory->SupportsMapUnmap())

673

{

674

// The current tensor handle factory does not support the map/unmap strategy, move to the next one

continue;

}

}

auto it = factoryScores.find(pref);

680

if (it == factoryScores.end())

681

{

682

// Add new score to the table

683

factoryScores[pref] = 0;

}

}

// Score each handle factory based on how many times it requires copies on the slot connections

688

for (auto&& connection : outputSlot.GetConnections())

689

{

690

const Layer& connectedLayer = connection->GetOwningLayer();

691

692

auto toBackend = backends.find(connectedLayer.GetBackendId());

693

BOOST_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

694

695

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

696

for (auto&& src : srcPrefs)

697

{

698

if (factoryScores.find(src) == factoryScores.end()) // Don't consider excluded factories

{

continue;

}

for (auto&& dst : dstPrefs)

704

{

705

if (RequiresCopy(src, dst, registry))

706

{

707

// Copy avoided, increase the score

708

factoryScores[src]++;

break;

}

}

}

}

// Find the lowest score

716

int minScore = std::numeric_limits<int>::max();

717

for (auto it : factoryScores)

718

{

719

minScore = std::min(minScore, it.second);

720

}

721

722

// Collect factories matching the best(lowest) score

723

std::vector<ITensorHandleFactory::FactoryId> optimalFactories;

724

for (auto it : factoryScores)

725

{

726

if (it.second == minScore)

727

{

728

optimalFactories.push_back(it.first);

}

}

// For all compatible Factories matching the best score, find the preferred one for the current layer.

733

for (auto&& srcPref : srcPrefs)

734

{

735

for (auto&& comp : optimalFactories)

{

if (comp == srcPref)

{

return comp;

}

}

}

return ITensorHandleFactory::LegacyFactoryId;

745

}

746

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

747

EdgeStrategy CalculateEdgeStrategy(BackendsMap& backends,

748

ITensorHandleFactory::FactoryId srcFactoryId,

749

const Layer& layer,

750

const Layer& connectedLayer,

751

TensorHandleFactoryRegistry& registry)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

752

{

753

auto toBackend = backends.find(connectedLayer.GetBackendId());

754

BOOST_ASSERT_MSG(toBackend != backends.end(), "Backend id not found for the connected layer");

755

756

auto dstPrefs = toBackend->second.get()->GetHandleFactoryPreferences();

757

758

// Legacy API check for backward compatibility

759

if (srcFactoryId == ITensorHandleFactory::LegacyFactoryId || dstPrefs.empty())

760

{

761

if (layer.GetBackendId() != connectedLayer.GetBackendId())

762

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

763

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

764

}

765

else

766

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

767

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// TensorHandleFactory API present, so perform more sophisticated strategies.

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

772

// Dst Output layers don't require copy because they use import or map/unmap

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

773

if (connectedLayer.GetType() == LayerType::Output)

774

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

775

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

776

}

777

778

// Search for direct match in prefs

779

for (auto&& pref : dstPrefs)

780

{

781

if (pref == srcFactoryId)

782

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

783

return EdgeStrategy::DirectCompatibility;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

// Search for export/import options

788

ITensorHandleFactory* srcFactory = registry.GetFactory(srcFactoryId);

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

789

if (srcFactory->GetExportFlags() != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

790

{

791

for (auto&& pref : dstPrefs)

792

{

793

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

794

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

795

// Handles cases when a destPref is not listed in TensorHandleFactoryRegistry

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

796

if (!dstFactory) {

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

797

continue;

James Conroy

ffab16f

2019-11-07 14:37:09 +0000

[diff] [blame]

798

}

799

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

800

if ((dstFactory->GetImportFlags() & srcFactory->GetExportFlags()) != 0)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

801

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

802

return EdgeStrategy::ExportToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

// Search for copy options via map/unmap

808

if (srcFactory->SupportsMapUnmap())

809

{

810

for (auto&& pref : dstPrefs)

811

{

812

ITensorHandleFactory* dstFactory = registry.GetFactory(pref);

James Conroy

47e863d

2019-11-18 17:07:43 +0000

[diff] [blame]

813

if (dstFactory && dstFactory->SupportsMapUnmap())

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

814

{

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

815

return EdgeStrategy::CopyToTarget;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

}

}

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

820

return EdgeStrategy::Undefined;

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

821

}

822

823

// Select the TensorHandleFactories and the corresponding memory strategy

824

OptimizationResult SelectTensorHandleStrategy(Graph& optGraph,

825

BackendsMap& backends,

826

TensorHandleFactoryRegistry& registry,

827

Optional<std::vector<std::string>&> errMessages)

828

{

829

OptimizationResult result;

830

831

optGraph.ForEachLayer([&backends, &registry, &result, &errMessages](Layer* layer)

{

BOOST_ASSERT(layer);

// Lets make sure the backend is in our list of supported backends. Something went wrong during backend

836

// assignment if this check fails

837

BOOST_ASSERT(backends.find(layer->GetBackendId()) != backends.end());

838

839

// Check each output separately

840

for (unsigned int slotIdx = 0; slotIdx < layer->GetNumOutputSlots(); slotIdx++)

841

{

842

OutputSlot& outputSlot = layer->GetOutputSlot(slotIdx);

843

844

ITensorHandleFactory::FactoryId slotOption = ITensorHandleFactory::LegacyFactoryId;

845

846

// Calculate the factory to use which results in the fewest copies being made.

847

switch(layer->GetType())

848

{

849

case LayerType::Input:

850

slotOption = CalculateSlotOptionForInput(backends, outputSlot, registry);

851

break;

852

case LayerType::Output:

853

slotOption = CalculateSlotOptionForOutput(backends, outputSlot, registry);

854

break;

855

default:

856

slotOption = CalculateSlotOption(backends, outputSlot, registry);

857

break;

858

}

859

outputSlot.SetTensorHandleFactory(slotOption);

860

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

861

// Now determine the "best" edge strategy for each connection given the slotOption.

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

862

unsigned int connectionIdx = 0;

863

for (auto&& connection : outputSlot.GetConnections())

864

{

865

const Layer& connectedLayer = connection->GetOwningLayer();

866

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

867

EdgeStrategy strategy = CalculateEdgeStrategy(backends, slotOption, *layer, connectedLayer, registry);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

868

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

869

if (strategy == EdgeStrategy::Undefined)

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

870

{

871

result.m_Error = true;

872

if (errMessages)

873

{

874

errMessages.value().emplace_back("Could not find valid strategy required for compatibility"

875

" between backends.");

}

return;

}

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

880

outputSlot.SetEdgeStrategy(connectionIdx, strategy);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

connectionIdx++;

}

}

});

return result;

}

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

890

IOptimizedNetworkPtr Optimize(const INetwork& inNetwork,

891

const std::vector<BackendId>& backendPreferences,

892

const IDeviceSpec& deviceSpec,

893

const OptimizerOptions& options,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

894

Optional<std::vector<std::string>&> messages)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

895

{

896

if (backendPreferences.empty())

897

{

898

throw armnn::InvalidArgumentException("Invoked Optimize with no backends specified");

899

}

900

901

const Network& network = *boost::polymorphic_downcast<const Network*>(&inNetwork);

902

std::unique_ptr<Graph> graph = std::make_unique<Graph>(network.GetGraph());

903

904

auto optNet = IOptimizedNetworkPtr(new OptimizedNetwork(std::move(graph)), &IOptimizedNetwork::Destroy);

905

906

OptimizedNetwork* optNetObjPtr = boost::polymorphic_downcast<OptimizedNetwork*>(optNet.get());

907

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

908

// Get the optimized graph

909

Graph& optGraph = optNetObjPtr->GetGraph();

910

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

911

// Perform optimisation passes

912

using namespace optimizations;

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

913

Optimizer::Pass(optGraph, MakeOptimizations(SquashEqualPermuteSiblings(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

914

SquashEqualTransposeSiblings(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

915

SquashEqualReshapeSiblings(),

916

OptimizeInversePermutes(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

917

OptimizeInverseTransposes(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

918

MovePermuteUp(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

919

MoveTransposeUp(),

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

920

PermuteAsReshape(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

921

TransposeAsReshape(),

Nina Drozd

861985f

2019-04-18 14:48:51 +0100

[diff] [blame]

922

OptimizeConsecutiveReshapes(),

Rob Hughes

3a7d3a7

2019-09-24 16:59:56 +0100

[diff] [blame]

923

FoldPadIntoConvolution2d(),

Mike Kelly

2020-03-03 12:39:09 +0000

[diff] [blame]

924

PermuteAndBatchToSpaceAsDepthToSpace(),

925

TransposeAndBatchToSpaceAsDepthToSpace()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

926

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

927

// Infer the tensor infos for all output slots. Throws an exception on failure

928

optGraph.InferTensorInfos();

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

929

930

// If Fp32 to Fp16 optimization is set convert Fp32 network to Fp16

931

if (options.m_ReduceFp32ToFp16)

932

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

933

Optimizer::Pass(optGraph, MakeOptimizations(Fp32NetworkToFp16Converter()));

Derek Lamberti

dd6804b

2019-11-27 09:29:57 +0000

[diff] [blame]

934

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

935

}

936

937

// Initialize backend settings

938

BackendSettings backendSettings(backendPreferences, deviceSpec);

939

if (backendSettings.GetAvailablePreferredBackends().empty())

940

{

941

std::stringstream failureMsg;

942

failureMsg << "None of the preferred backends " << backendPreferences

943

<< " are supported. Current platform provides " << backendSettings.m_SupportedBackends;

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

944

ReportError(failureMsg.str(), messages);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

945

return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);

946

}

947

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

948

// Create a map to temporarily hold initialized backend objects

949

TensorHandleFactoryRegistry tensorHandleFactoryRegistry;

950

BackendsMap backends = CreateSupportedBackends(tensorHandleFactoryRegistry, backendSettings);

951

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

952

// Assign an available backend to each layer

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

953

Graph::Iterator firstLayer = optGraph.begin();

954

Graph::Iterator lastLayer = optGraph.end();

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

955

OptimizationResult assignBackendsResult = AssignBackends(optNetObjPtr,

956

backendSettings,

957

firstLayer,

958

lastLayer,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

959

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

960

if (assignBackendsResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

961

{

962

// Failed to assign a backend to each layer

jimfly01

2018-10-08 14:43:01 +0100

[diff] [blame]

963

return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);

964

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

965

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

966

Optimizer::Pass(optGraph, MakeOptimizations(OptimizeInverseConversionsFp16(),

967

OptimizeInverseConversionsFp32()));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

968

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

969

// Apply the backend-specific optimizations

970

OptimizationResult backendOptimizationResult = ApplyBackendOptimizations(optNetObjPtr,

971

backendSettings,

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

972

backends,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

973

messages);

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

974

if (backendOptimizationResult.m_Error)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

975

{

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

976

// Failed to apply the backend-specific optimizations

977

return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

978

}

979

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

980

// If the debug flag is set, then insert a DebugLayer after each layer

981

// Doing this after applying the backend optimizations as they might have changed some layers

982

if (options.m_Debug)

983

{

984

Optimizer::Pass(optGraph, MakeOptimizations(InsertDebugLayer()));

985

}

986

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

987

// Calculate the compatibility strategies for tensor handles

988

OptimizationResult strategyResult = SelectTensorHandleStrategy(optGraph,

989

backends,

990

tensorHandleFactoryRegistry,

Rob Hughes

2019-11-05 11:27:36 +0000

[diff] [blame]

991

messages);

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

992

if (strategyResult.m_Error)

993

{

994

// Failed to apply the backend-specific optimizations

995

return IOptimizedNetworkPtr(nullptr, &IOptimizedNetwork::Destroy);

996

}

997

998

// Based on the tensor handle strategy determined above, insert copy layers where required.

Derek Lamberti

2019-08-01 15:56:25 +0100

[diff] [blame]

999

optGraph.AddCompatibilityLayers(backends, tensorHandleFactoryRegistry);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1000

1001

// Convert constants

Matteo Martincigh

2019-01-24 14:06:23 +0000

[diff] [blame]

1002

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsFloatToHalf()));

1003

Optimizer::Pass(optGraph, MakeOptimizations(ConvertConstantsHalfToFloat()));

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1004

Derek Lamberti

2019-06-13 11:40:08 +0100

[diff] [blame]

1005

// Run backend specific optimizations (deprecated)

Matteo Martincigh

2019-01-11 13:25:59 +0000

[diff] [blame]

1006

for (auto&& chosenBackend : backendSettings.m_SelectedBackends)

David Beck

263e349

2018-11-09 14:46:40 +0000

[diff] [blame]

1007

{

1008

auto factoryFun = BackendRegistryInstance().GetFactory(chosenBackend);

1009

auto backendPtr = factoryFun();

1010

BOOST_ASSERT(backendPtr.get() != nullptr);

1011

Matteo Martincigh

ed73504

2019-05-22 09:42:43 +0100

[diff] [blame]

1012

ARMNN_NO_DEPRECATE_WARN_BEGIN

David Beck

263e349

2018-11-09 14:46:40 +0000

[diff] [blame]

1013

auto backendSpecificOptimizations = backendPtr->GetOptimizations();

Matteo Martincigh

ed73504

2019-05-22 09:42:43 +0100

[diff] [blame]

1014

ARMNN_NO_DEPRECATE_WARN_END

1015

David Beck

263e349

2018-11-09 14:46:40 +0000

[diff] [blame]

1016

if (!backendSpecificOptimizations.empty())

1017

{

1018

Optimizer::Pass(optNetObjPtr->GetGraph(), backendSpecificOptimizations);

}

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1022

return optNet;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1023

}

1024

1025

Network::Network()

Sadik Armagan

3184c90

2020-03-18 10:57:30 +0000

[diff] [blame]

1026

: m_Graph(std::make_unique<Graph>())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

{

}

Network::~Network()

{

}

Jan Eilers

2019-11-06 10:02:16 +0000

[diff] [blame]

1034

Status Network::PrintGraph()

1035

{

1036

m_Graph->Print();

1037

return Status::Success;

1038

}

1039

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1040

IConnectableLayer* Network::AddInputLayer(LayerBindingId id, const char* name)

1041

{

1042

return m_Graph->AddLayer<InputLayer>(id, name);

1043

}

1044

Éanna Ó Catháin

4e1e136

2018-11-12 11:36:34 +0000

[diff] [blame]

1045

IConnectableLayer* Network::AddBatchToSpaceNdLayer(const BatchToSpaceNdDescriptor& batchToSpaceNdDescriptor,

1046

const char* name)

1047

{

1048

return m_Graph->AddLayer<BatchToSpaceNdLayer>(batchToSpaceNdDescriptor, name);

1049

}

1050

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

1051

IConnectableLayer* Network::AddComparisonLayer(const ComparisonDescriptor& comparisonDescriptor,

1052

const char* name)

1053

{

1054

return m_Graph->AddLayer<ComparisonLayer>(comparisonDescriptor, name);

1055

}

1056

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

1057

IConnectableLayer* Network::AddElementwiseUnaryLayer(const ElementwiseUnaryDescriptor& elementwiseUnaryDescriptor,

1058

const char* name)

1059

{

1060

return m_Graph->AddLayer<ElementwiseUnaryLayer>(elementwiseUnaryDescriptor, name);

1061

}

1062

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1063

IConnectableLayer* Network::AddFullyConnectedLayerImpl(const FullyConnectedDescriptor& fullyConnectedDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1064

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1065

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1066

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1067

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1068

if (fullyConnectedDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1069

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1070

throw InvalidArgumentException("AddFullyConnectedLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1071

}

1072

1073

const auto layer = m_Graph->AddLayer<FullyConnectedLayer>(fullyConnectedDescriptor, name);

1074

1075

layer->m_Weight = std::make_unique<ScopedCpuTensorHandle>(weights);

1076

1077

if (fullyConnectedDescriptor.m_BiasEnabled)

1078

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1079

layer->m_Bias = std::make_unique<ScopedCpuTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

IConnectableLayer* Network::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1086

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1087

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1088

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1089

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1090

return AddFullyConnectedLayerImpl(fullyConnectedDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1091

}

1092

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1093

IConnectableLayer* Network::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

1094

const ConstTensor& weights,

1095

const char* name)

1096

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

1097

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1098

return AddFullyConnectedLayerImpl(fullyConnectedDescriptor, weights, biases, name);

1099

}

1100

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1101

IConnectableLayer* Network::AddFullyConnectedLayer(const FullyConnectedDescriptor& fullyConnectedDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1102

const ConstTensor& weights,

1103

const ConstTensor& biases,

1104

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1105

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1106

Optional<ConstTensor> optionalBiases(biases);

1107

return AddFullyConnectedLayerImpl(fullyConnectedDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1108

}

1109

Jim Flynn

2019-05-22 14:24:13 +0100

[diff] [blame]

1110

IConnectableLayer* Network::AddConcatLayer(const ConcatDescriptor& concatDescriptor,

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1111

const char* name)

1112

{

Jim Flynn

2019-05-22 14:24:13 +0100

[diff] [blame]

1113

return m_Graph->AddLayer<ConcatLayer>(concatDescriptor, name);

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1114

}

1115

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1116

IConnectableLayer* Network::AddConvolution2dLayerImpl(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1117

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1118

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1119

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1120

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1121

if (convolution2dDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1122

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1123

throw InvalidArgumentException("AddConvolution2dLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1124

}

1125

1126

const auto layer = m_Graph->AddLayer<Convolution2dLayer>(convolution2dDescriptor, name);

1127

1128

layer->m_Weight = std::make_unique<ScopedCpuTensorHandle>(weights);

1129

1130

if (convolution2dDescriptor.m_BiasEnabled)

1131

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1132

layer->m_Bias = std::make_unique<ScopedCpuTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

IConnectableLayer* Network::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1139

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1140

const Optional<ConstTensor>& biases,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1141

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1142

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1143

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1144

}

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1145

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1146

IConnectableLayer* Network::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

1147

const ConstTensor& weights,

1148

const char* name)

1149

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

1150

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1151

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

1152

}

1153

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1154

IConnectableLayer* Network::AddConvolution2dLayer(const Convolution2dDescriptor& convolution2dDescriptor,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1155

const ConstTensor& weights,

1156

const ConstTensor& biases,

1157

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1158

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1159

Optional<ConstTensor> optionalBiases(biases);

1160

return AddConvolution2dLayerImpl(convolution2dDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1161

}

1162

1163

IConnectableLayer* Network::AddDepthwiseConvolution2dLayerImpl(

1164

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1165

const ConstTensor& weights,

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1166

const Optional<ConstTensor>& biases,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1167

const char* name)

1168

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1169

if (convolution2dDescriptor.m_BiasEnabled && !biases.has_value())

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1170

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1171

throw InvalidArgumentException("AddDepthwiseConvolution2dLayer: biases cannot be empty");

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1172

}

1173

Matteo Martincigh

3d6898c

2019-01-15 16:11:44 +0000

[diff] [blame]

1174

const auto layer = m_Graph->AddLayer<DepthwiseConvolution2dLayer>(convolution2dDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1175

1176

layer->m_Weight = std::make_unique<ScopedCpuTensorHandle>(weights);

1177

1178

if (convolution2dDescriptor.m_BiasEnabled)

1179

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1180

layer->m_Bias = std::make_unique<ScopedCpuTensorHandle>(biases.value());

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return layer;

}

Aron Virginas-Tar

2019-09-19 14:31:17 +0100

[diff] [blame]

1186

IConnectableLayer* Network::AddDepthToSpaceLayer(const DepthToSpaceDescriptor& depthToSpaceDescriptor,

1187

const char* name)

1188

{

1189

return m_Graph->AddLayer<DepthToSpaceLayer>(depthToSpaceDescriptor, name);

1190

}

1191

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1192

IConnectableLayer* Network::AddDepthwiseConvolution2dLayer(

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1193

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1194

const ConstTensor& weights,

1195

const Optional<ConstTensor>& biases,

1196

const char* name)

1197

{

1198

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

1199

}

1200

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1201

IConnectableLayer* Network::AddDepthwiseConvolution2dLayer(

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1202

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1203

const ConstTensor& weights,

1204

const char* name)

1205

{

Matteo Martincigh

fc598e1

2019-05-14 10:36:13 +0100

[diff] [blame]

1206

Optional<ConstTensor> biases;

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1207

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, biases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1208

}

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1209

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1210

IConnectableLayer* Network::AddDepthwiseConvolution2dLayer(

1211

const DepthwiseConvolution2dDescriptor& convolution2dDescriptor,

1212

const ConstTensor& weights,

1213

const ConstTensor& biases,

1214

const char* name)

1215

{

Aron Virginas-Tar

2019-02-22 17:03:44 +0000

[diff] [blame]

1216

Optional<ConstTensor> optionalBiases(biases);

1217

return AddDepthwiseConvolution2dLayerImpl(convolution2dDescriptor, weights, optionalBiases, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1218

}

1219

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

1220

IConnectableLayer* Network::AddDetectionPostProcessLayer(const armnn::DetectionPostProcessDescriptor& descriptor,

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

1221

const ConstTensor& anchors, const char* name)

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

1222

{

Narumol Prangnawarat

6d302bf

2019-02-04 11:46:26 +0000

[diff] [blame]

1223

const auto layer = m_Graph->AddLayer<DetectionPostProcessLayer>(descriptor, name);

1224

1225

layer->m_Anchors = std::make_unique<ScopedCpuTensorHandle>(anchors);

1226

1227

return layer;

Narumol Prangnawarat

94dd5d8

2019-01-23 18:06:26 +0000

[diff] [blame]

1228

}

1229

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1230

IConnectableLayer* Network::AddPermuteLayer(const PermuteDescriptor& permuteDescriptor,

1231

const char* name)

1232

{

1233

return m_Graph->AddLayer<PermuteLayer>(permuteDescriptor, name);

1234

}

1235

1236

IConnectableLayer* Network::AddPooling2dLayer(const Pooling2dDescriptor& pooling2dDescriptor,

1237

const char* name)

1238

{

1239

return m_Graph->AddLayer<Pooling2dLayer>(pooling2dDescriptor, name);

1240

}

1241

1242

IConnectableLayer* Network::AddActivationLayer(const ActivationDescriptor& activationDescriptor,

1243

const char* name)

1244

{

1245

return m_Graph->AddLayer<ActivationLayer>(activationDescriptor, name);

1246

}

1247

Nikhil Raj

ee391d5

2019-09-05 17:50:44 +0100

[diff] [blame]

1248

IConnectableLayer* Network::AddArgMinMaxLayer(const ArgMinMaxDescriptor& argMinMaxDescriptor,

1249

const char* name)

1250

{

1251

return m_Graph->AddLayer<ArgMinMaxLayer>(argMinMaxDescriptor, name);

1252

}

1253

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1254

IConnectableLayer* Network::AddNormalizationLayer(const NormalizationDescriptor&

1255

normalizationDescriptor,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1256

const char* name)

1257

{

1258

return m_Graph->AddLayer<NormalizationLayer>(normalizationDescriptor, name);

1259

}

1260

Aron Virginas-Tar

636ab40

2019-09-16 14:27:45 +0100

[diff] [blame]

1261

IConnectableLayer* Network::AddSliceLayer(const SliceDescriptor& sliceDescriptor, const char* name)

1262

{

1263

return m_Graph->AddLayer<SliceLayer>(sliceDescriptor, name);

1264

}

1265

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1266

IConnectableLayer* Network::AddSoftmaxLayer(const SoftmaxDescriptor& softmaxDescriptor,

1267

const char* name)

1268

{

1269

return m_Graph->AddLayer<SoftmaxLayer>(softmaxDescriptor, name);

1270

}

1271

1272

IConnectableLayer* Network::AddSplitterLayer(const ViewsDescriptor& splitterDescriptor,

1273

const char* name)

1274

{

1275

return m_Graph->AddLayer<SplitterLayer>(splitterDescriptor, name);

1276

}

1277

Nattapat Chaimanowong

5a4304a

2018-11-28 10:44:37 +0000

[diff] [blame]

1278

IConnectableLayer* Network::AddMaximumLayer(const char* name)

1279

{

1280

return m_Graph->AddLayer<MaximumLayer>(name);

1281

}

1282

Éanna Ó Catháin

20e5880

2018-12-04 10:29:06 +0000

[diff] [blame]

1283

IConnectableLayer* Network::AddMinimumLayer(const char* name)

1284

{

1285

return m_Graph->AddLayer<MinimumLayer>(name);

1286

}

1287

Jim Flynn

2019-05-22 14:24:13 +0100

[diff] [blame]

1288

IConnectableLayer* Network::AddMergerLayer(const MergerDescriptor& mergerDescriptor,

Jim Flynn

906f946

2019-05-10 13:55:21 +0100

[diff] [blame]

1289

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1290

{

Jim Flynn

2019-05-22 14:24:13 +0100

[diff] [blame]

1291

return AddConcatLayer(mergerDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1292

}

1293

Kevin May

868eb14

2019-09-04 17:29:31 +0100

[diff] [blame]

1294

IConnectableLayer* Network::AddAbsLayer(const char * name)

1295

{

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

1296

return AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Abs), name);

Kevin May

868eb14

2019-09-04 17:29:31 +0100

[diff] [blame]

1297

}

1298

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1299

IConnectableLayer* Network::AddAdditionLayer(const char* name)

1300

{

1301

return m_Graph->AddLayer<AdditionLayer>(name);

1302

}

1303

1304

IConnectableLayer* Network::AddMultiplicationLayer(const char* name)

1305

{

1306

return m_Graph->AddLayer<MultiplicationLayer>(name);

1307

}

1308

1309

IConnectableLayer* Network::AddOutputLayer(LayerBindingId id, const char* name)

1310

{

1311

return m_Graph->AddLayer<OutputLayer>(id, name);

1312

}

1313

1314

IConnectableLayer* Network::AddBatchNormalizationLayer(const BatchNormalizationDescriptor& desc,

1315

const ConstTensor& mean,

1316

const ConstTensor& variance,

1317

const ConstTensor& beta,

1318

const ConstTensor& gamma,

1319

const char* name)

1320

{

1321

const auto layer = m_Graph->AddLayer<BatchNormalizationLayer>(desc, name);

1322

1323

layer->m_Mean = std::make_unique<ScopedCpuTensorHandle>(mean);

1324

layer->m_Variance = std::make_unique<ScopedCpuTensorHandle>(variance);

1325

layer->m_Beta = std::make_unique<ScopedCpuTensorHandle>(beta);

1326

layer->m_Gamma = std::make_unique<ScopedCpuTensorHandle>(gamma);

return layer;

}

Aron Virginas-Tar

2019-07-01 19:01:44 +0100

[diff] [blame]

1331

IConnectableLayer* Network::AddResizeBilinearLayer(const ResizeBilinearDescriptor& descriptor,

1332

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1333

{

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

1334

ResizeDescriptor resizeDescriptor;

1335

resizeDescriptor.m_Method = ResizeMethod::Bilinear;

1336

resizeDescriptor.m_DataLayout = descriptor.m_DataLayout;

1337

resizeDescriptor.m_TargetWidth = descriptor.m_TargetWidth;

1338

resizeDescriptor.m_TargetHeight = descriptor.m_TargetHeight;

1339

1340

return m_Graph->AddLayer<ResizeLayer>(resizeDescriptor, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1341

}

1342

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

1343

IConnectableLayer* Network::AddResizeLayer(const ResizeDescriptor&

1344

resizeDescriptor, const char* name)

1345

{

Aron Virginas-Tar

169d2f1

2019-07-01 19:01:44 +0100

[diff] [blame]

1346

return m_Graph->AddLayer<ResizeLayer>(resizeDescriptor, name);

Teresa Charlin

a9075df

2019-06-27 15:41:57 +0100

[diff] [blame]

1347

}

1348

Kevin May

ce5045a

2019-10-02 14:07:47 +0100

[diff] [blame]

1349

IConnectableLayer* Network::AddInstanceNormalizationLayer(const InstanceNormalizationDescriptor& desc,

1350

const char* name)

1351

{

1352

return m_Graph->AddLayer<InstanceNormalizationLayer>(desc, name);

1353

}

1354

Matteo Martincigh

bcd3c85

2018-09-28 14:14:12 +0100

[diff] [blame]

1355

IConnectableLayer* Network::AddL2NormalizationLayer(const L2NormalizationDescriptor& desc,

1356

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1357

{

Matteo Martincigh

bcd3c85

2018-09-28 14:14:12 +0100

[diff] [blame]

1358

return m_Graph->AddLayer<L2NormalizationLayer>(desc, name);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1359

}

1360

Aron Virginas-Tar

f982dea

2019-10-11 14:07:53 +0100

[diff] [blame]

1361

IConnectableLayer* Network::AddLogSoftmaxLayer(const LogSoftmaxDescriptor& desc,

1362

const char* name)

1363

{

1364

return m_Graph->AddLayer<LogSoftmaxLayer>(desc, name);

1365

}

1366

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1367

IConnectableLayer* Network::AddConstantLayer(const ConstTensor& input, const char* name)

1368

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1369

auto layer = m_Graph->AddLayer<ConstantLayer>(name);

1370

1371

layer->m_LayerOutput = std::make_unique<ScopedCpuTensorHandle>(input);

1372

1373

return layer;

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1374

}

1375

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1376

IConnectableLayer* Network::AddReshapeLayer(const ReshapeDescriptor& reshapeDescriptor,

1377

const char* name)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1378

{

1379

return m_Graph->AddLayer<ReshapeLayer>(reshapeDescriptor, name);

1380

}

1381

Nattapat Chaimanowong

207ef9a

2018-11-02 10:57:25 +0000

[diff] [blame]

1382

IConnectableLayer* Network::AddSpaceToBatchNdLayer(const SpaceToBatchNdDescriptor& spaceToBatchNdDescriptor,

1383

const char* name)

1384

{

1385

return m_Graph->AddLayer<SpaceToBatchNdLayer>(spaceToBatchNdDescriptor, name);

1386

}

1387

Aron Virginas-Tar

972af15

2019-06-11 14:14:03 +0100

[diff] [blame]

1388

IConnectableLayer* Network::AddSpaceToDepthLayer(const SpaceToDepthDescriptor& spaceToDepthDescriptor,

1389

const char* name)

1390

{

1391

return m_Graph->AddLayer<SpaceToDepthLayer>(spaceToDepthDescriptor, name);

1392

}

1393

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1394

IConnectableLayer* Network::AddFloorLayer(const char* name)

1395

{

1396

return m_Graph->AddLayer<FloorLayer>(name);

1397

}

1398

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

1399

IConnectableLayer* Network::AddLstmLayer(const LstmDescriptor& descriptor,

1400

const LstmInputParams& params,

1401

const char* name)

1402

{

1403

const auto layer = m_Graph->AddLayer<LstmLayer>(descriptor, name);

1404

1405

//Lstm Basic Parameters

1406

layer->m_BasicParameters.m_InputToForgetWeights =

1407

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToForgetWeights));

1408

layer->m_BasicParameters.m_InputToCellWeights =

1409

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToCellWeights));

1410

layer->m_BasicParameters.m_InputToOutputWeights =

1411

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToOutputWeights));

1412

layer->m_BasicParameters.m_RecurrentToForgetWeights =

1413

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToForgetWeights));

1414

layer->m_BasicParameters.m_RecurrentToCellWeights =

1415

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToCellWeights));

1416

layer->m_BasicParameters.m_RecurrentToOutputWeights =

1417

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToOutputWeights));

1418

layer->m_BasicParameters.m_ForgetGateBias =

1419

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ForgetGateBias));

1420

layer->m_BasicParameters.m_CellBias =

1421

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellBias));

1422

layer->m_BasicParameters.m_OutputGateBias =

1423

std::make_unique<ScopedCpuTensorHandle>(*(params.m_OutputGateBias));

1424

1425

//Lstm Cifg parameters

1426

if(!descriptor.m_CifgEnabled)

1427

{

1428

if(params.m_InputToInputWeights == nullptr)

1429

{

1430

throw InvalidArgumentException("AddLstmLayer: Input To Input Weights cannot be NULL");

1431

}

1432

if(params.m_RecurrentToInputWeights == nullptr)

1433

{

1434

throw InvalidArgumentException(

1435

"AddLstmLayer: Recurrent To Input Weights cannot be NULL");

1436

}

1437

if(params.m_InputGateBias == nullptr)

1438

{

1439

throw InvalidArgumentException("AddLstmLayer: Input Gate Bias cannot be NULL");

1440

}

1441

layer->m_CifgParameters.m_InputToInputWeights =

1442

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToInputWeights));

1443

layer->m_CifgParameters.m_RecurrentToInputWeights =

1444

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToInputWeights));

1445

// In the VTS tests, cell-to-input weights may be null, even if the other CIFG params are not.

1446

if(params.m_CellToInputWeights != nullptr)

1447

{

1448

layer->m_CifgParameters.m_CellToInputWeights =

1449

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellToInputWeights));

1450

}

1451

layer->m_CifgParameters.m_InputGateBias =

1452

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputGateBias));

1453

}

1454

1455

//Lstm projection parameters

1456

if(descriptor.m_ProjectionEnabled)

1457

{

1458

if(params.m_ProjectionWeights == nullptr)

1459

{

1460

throw InvalidArgumentException("AddLstmLayer: Projection Weights cannot be NULL");

1461

}

1462

layer->m_ProjectionParameters.m_ProjectionWeights =

1463

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ProjectionWeights));

1464

if(params.m_ProjectionBias != nullptr)

1465

{

1466

layer->m_ProjectionParameters.m_ProjectionBias =

1467

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ProjectionBias));

}

}

//Lstm Peephole params

1472

if(descriptor.m_PeepholeEnabled)

1473

{

1474

if(params.m_CellToForgetWeights == nullptr)

1475

{

1476

throw InvalidArgumentException("AddLstmLayer: Cell To Forget Weights cannot be NULL");

1477

}

1478

if(params.m_CellToOutputWeights == nullptr)

1479

{

1480

throw InvalidArgumentException("AddLstmLayer: Cell To Output Weights cannot be NULL");

1481

}

1482

layer->m_PeepholeParameters.m_CellToForgetWeights =

1483

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellToForgetWeights));

1484

layer->m_PeepholeParameters.m_CellToOutputWeights =

1485

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellToOutputWeights));

1486

}

Jan Eilers

f8c6297

2019-07-17 11:07:49 +0100

[diff] [blame]

1487

1488

//Lstm Layer Normalization params

1489

if(descriptor.m_LayerNormEnabled)

1490

{

1491

if(!descriptor.m_CifgEnabled)

1492

{

1493

if(params.m_InputLayerNormWeights == nullptr)

1494

{

1495

throw InvalidArgumentException("AddLstmLayer: Input layer normalization weights cannot be NULL");

1496

}

1497

layer->m_LayerNormParameters.m_InputLayerNormWeights =

1498

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputLayerNormWeights));

1499

}

1500

1501

if(params.m_ForgetLayerNormWeights == nullptr)

1502

{

1503

throw InvalidArgumentException("AddLstmLayer: Forget layer normalization weights cannot be NULL");

1504

}

1505

if(params.m_CellLayerNormWeights == nullptr)

1506

{

1507

throw InvalidArgumentException("AddLstmLayer: Cell layer normalization weights cannot be NULL");

1508

}

1509

if(params.m_OutputLayerNormWeights == nullptr)

1510

{

1511

throw InvalidArgumentException("AddLstmLayer: Output layer normalization weights cannot be NULL");

1512

}

1513

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

1514

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ForgetLayerNormWeights));

1515

layer->m_LayerNormParameters.m_CellLayerNormWeights =

1516

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellLayerNormWeights));

1517

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

1518

std::make_unique<ScopedCpuTensorHandle>(*(params.m_OutputLayerNormWeights));

1519

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

return layer;

}

Francis Murtagh

2018-08-29 12:42:10 +0100

[diff] [blame]

1523

IConnectableLayer* Network::AddDivisionLayer(const char* name)

1524

{

1525

return m_Graph->AddLayer<DivisionLayer>(name);

1526

}

1527

David Beck

1952622

2018-09-12 16:00:08 +0100

[diff] [blame]

1528

IConnectableLayer* Network::AddSubtractionLayer(const char* name)

1529

{

1530

return m_Graph->AddLayer<SubtractionLayer>(name);

1531

}

1532

narpra01

32b9046

2018-09-13 11:07:48 +0100

[diff] [blame]

1533

IConnectableLayer* Network::AddMeanLayer(const MeanDescriptor& meanDescriptor, const char* name)

1534

{

1535

return m_Graph->AddLayer<MeanLayer>(meanDescriptor,name);

1536

}

1537

Mohamed Nour Abouelseoud

5662c20

2018-09-24 13:30:09 +0100

[diff] [blame]

1538

IConnectableLayer* Network::AddPadLayer(const PadDescriptor& padDescriptor, const char* name)

1539

{

1540

return m_Graph->AddLayer<PadLayer>(padDescriptor,name);

1541

}

1542

Derek Lamberti

a9cca6a

2019-03-25 15:41:58 +0000

[diff] [blame]

1543

IConnectableLayer *Network::AddQuantizeLayer(const char *name)

1544

{

1545

return m_Graph->AddLayer<QuantizeLayer>(name);

1546

}

1547

Nattapat Chaimanowong

e4294fd

2019-03-28 09:56:53 +0000

[diff] [blame]

1548

IConnectableLayer* Network::AddDequantizeLayer(const char* name)

1549

{

1550

return m_Graph->AddLayer<DequantizeLayer>(name);

1551

}

1552

Conor Kennedy

430b5d8

2018-11-14 15:28:28 +0000

[diff] [blame]

1553

IConnectableLayer* Network::AddStridedSliceLayer(const StridedSliceDescriptor& stridedSliceDescriptor,

1554

const char* name)

1555

{

1556

return m_Graph->AddLayer<StridedSliceLayer>(stridedSliceDescriptor, name);

1557

}

1558

Matteo Martincigh

59a950c

2018-12-13 12:48:25 +0000

[diff] [blame]

1559

IConnectableLayer* Network::AddGreaterLayer(const char* name)

1560

{

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

1561

return AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Greater), name);

Matteo Martincigh

59a950c

2018-12-13 12:48:25 +0000

[diff] [blame]

1562

}

1563

FrancisMurtagh

2099595

2018-12-17 12:11:36 +0000

[diff] [blame]

1564

IConnectableLayer* Network::AddEqualLayer(const char* name)

1565

{

Aron Virginas-Tar

77bfb5e

2019-10-16 17:45:38 +0100

[diff] [blame]

1566

return AddComparisonLayer(ComparisonDescriptor(ComparisonOperation::Equal), name);

FrancisMurtagh

2099595

2018-12-17 12:11:36 +0000

[diff] [blame]

1567

}

1568

Mohamed Nour Abouelseoud

a1d3c6a

2018-12-27 12:39:16 +0000

[diff] [blame]

1569

IConnectableLayer* Network::AddRsqrtLayer(const char * name)

1570

{

josh minor

4a3c610

2020-01-06 16:40:46 -0600

[diff] [blame]

1571

return AddElementwiseUnaryLayer(ElementwiseUnaryDescriptor(UnaryOperation::Rsqrt), name);

Mohamed Nour Abouelseoud

a1d3c6a

2018-12-27 12:39:16 +0000

[diff] [blame]

1572

}

1573

narpra01

b89b05f

2019-01-16 09:53:09 +0000

[diff] [blame]

1574

IConnectableLayer* Network::AddGatherLayer(const char* name)

1575

{

1576

return m_Graph->AddLayer<GatherLayer>(name);

1577

}

1578

Nattapat Chaimanowong

1f88630

2019-04-05 13:37:19 +0100

[diff] [blame]

1579

IConnectableLayer* Network::AddMergeLayer(const char* name)

1580

{

1581

return m_Graph->AddLayer<MergeLayer>(name);

1582

}

1583

Sadik Armagan

eff363d

2019-04-05 15:25:46 +0100

[diff] [blame]

1584

IConnectableLayer* Network::AddSwitchLayer(const char* name)

1585

{

1586

return m_Graph->AddLayer<SwitchLayer>(name);

1587

}

1588

Matteo Martincigh

0e406ee

2019-06-12 15:42:18 +0100

[diff] [blame]

1589

IConnectableLayer* Network::AddPreluLayer(const char* name)

1590

{

1591

return m_Graph->AddLayer<PreluLayer>(name);

1592

}

1593

Aron Virginas-Tar

639fb04

2019-06-20 14:28:19 +0100

[diff] [blame]

1594

IConnectableLayer* Network::AddTransposeConvolution2dLayer(const TransposeConvolution2dDescriptor& descriptor,

1595

const ConstTensor& weights,

1596

const Optional<ConstTensor>& biases,

1597

const char* name)

1598

{

1599

if (descriptor.m_BiasEnabled && !biases.has_value())

1600

{

1601

throw InvalidArgumentException("AddTransposeConvolution2dLayer: Biases cannot be empty");

1602

}

1603

1604

const auto layer = m_Graph->AddLayer<TransposeConvolution2dLayer>(descriptor, name);

1605

1606

layer->m_Weight = std::make_unique<ScopedCpuTensorHandle>(weights);

1607

1608

if (descriptor.m_BiasEnabled)

1609

{

1610

layer->m_Bias = std::make_unique<ScopedCpuTensorHandle>(biases.value());

}

return layer;

}

Mike Kelly

2020-02-28 18:11:58 +0000

[diff] [blame]

1616

IConnectableLayer* Network::AddTransposeLayer(const TransposeDescriptor& transposeDescriptor,

1617

const char* name)

1618

{

1619

return m_Graph->AddLayer<TransposeLayer>(transposeDescriptor, name);

1620

}

1621

Matthew Jackson

2b8c1da

2019-07-04 14:59:16 +0100

[diff] [blame]

1622

IConnectableLayer* Network::AddStackLayer(const StackDescriptor& stackDescriptor,

1623

const char* name)

1624

{

1625

return m_Graph->AddLayer<StackLayer>(stackDescriptor, name);

1626

}

1627

Derek Lamberti

013c390

2019-10-21 10:46:16 +0100

[diff] [blame]

1628

1629

IConnectableLayer* Network::AddStandInLayer(const StandInDescriptor& desc,

1630

const char* name)

1631

{

1632

return m_Graph->AddLayer<StandInLayer>(desc, name);

1633

}

1634

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1635

IConnectableLayer* Network::AddQuantizedLstmLayer(const QuantizedLstmInputParams& params,

1636

const char* name)

1637

{

1638

const auto layer = m_Graph->AddLayer<QuantizedLstmLayer>(name);

1639

1640

// InputToX weights

1641

layer->m_QuantizedLstmParameters.m_InputToInputWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1642

std::make_unique<ScopedCpuTensorHandle>(params.GetInputToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1643

layer->m_QuantizedLstmParameters.m_InputToForgetWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1644

std::make_unique<ScopedCpuTensorHandle>(params.GetInputToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1645

layer->m_QuantizedLstmParameters.m_InputToCellWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1646

std::make_unique<ScopedCpuTensorHandle>(params.GetInputToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1647

layer->m_QuantizedLstmParameters.m_InputToOutputWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1648

std::make_unique<ScopedCpuTensorHandle>(params.GetInputToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1649

1650

// RecurrentToX weights

1651

layer->m_QuantizedLstmParameters.m_RecurrentToInputWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1652

std::make_unique<ScopedCpuTensorHandle>(params.GetRecurrentToInputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1653

layer->m_QuantizedLstmParameters.m_RecurrentToForgetWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1654

std::make_unique<ScopedCpuTensorHandle>(params.GetRecurrentToForgetWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1655

layer->m_QuantizedLstmParameters.m_RecurrentToCellWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1656

std::make_unique<ScopedCpuTensorHandle>(params.GetRecurrentToCellWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1657

layer->m_QuantizedLstmParameters.m_RecurrentToOutputWeights =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1658

std::make_unique<ScopedCpuTensorHandle>(params.GetRecurrentToOutputWeights());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1659

1660

// Bias

1661

layer->m_QuantizedLstmParameters.m_InputGateBias =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1662

std::make_unique<ScopedCpuTensorHandle>(params.GetInputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1663

layer->m_QuantizedLstmParameters.m_ForgetGateBias =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1664

std::make_unique<ScopedCpuTensorHandle>(params.GetForgetGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1665

layer->m_QuantizedLstmParameters.m_CellBias =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1666

std::make_unique<ScopedCpuTensorHandle>(params.GetCellBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

1667

layer->m_QuantizedLstmParameters.m_OutputGateBias =

Francis Murtagh

2019-08-14 09:51:36 +0100

[diff] [blame]

1668

std::make_unique<ScopedCpuTensorHandle>(params.GetOutputGateBias());

James Conroy

2019-07-17 11:27:46 +0100

[diff] [blame]

return layer;

}

James Conroy

2020-03-20 08:49:33 +0000

[diff] [blame^]

1673

IConnectableLayer* Network::AddQLstmLayer(const QLstmDescriptor& descriptor,

1674

const LstmInputParams& params,

1675

const char* name)

1676

{

1677

const auto layer = m_Graph->AddLayer<QLstmLayer>(descriptor, name);

1678

1679

// QLstm Basic Parameters

1680

layer->m_BasicParameters.m_InputToForgetWeights =

1681

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToForgetWeights));

1682

layer->m_BasicParameters.m_InputToCellWeights =

1683

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToCellWeights));

1684

layer->m_BasicParameters.m_InputToOutputWeights =

1685

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToOutputWeights));

1686

layer->m_BasicParameters.m_RecurrentToForgetWeights =

1687

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToForgetWeights));

1688

layer->m_BasicParameters.m_RecurrentToCellWeights =

1689

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToCellWeights));

1690

layer->m_BasicParameters.m_RecurrentToOutputWeights =

1691

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToOutputWeights));

1692

layer->m_BasicParameters.m_ForgetGateBias =

1693

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ForgetGateBias));

1694

layer->m_BasicParameters.m_CellBias =

1695

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellBias));

1696

layer->m_BasicParameters.m_OutputGateBias =

1697

std::make_unique<ScopedCpuTensorHandle>(*(params.m_OutputGateBias));

1698

1699

// QLstm Cifg parameters

1700

if(!descriptor.m_CifgEnabled)

1701

{

1702

if(params.m_InputToInputWeights == nullptr)

1703

{

1704

throw InvalidArgumentException("AddQLstmLayer: Input To Input Weights cannot be NULL");

1705

}

1706

1707

if(params.m_RecurrentToInputWeights == nullptr)

1708

{

1709

throw InvalidArgumentException(

1710

"AddQLstmLayer: Recurrent To Input Weights cannot be NULL");

1711

}

1712

1713

if(params.m_InputGateBias == nullptr)

1714

{

1715

throw InvalidArgumentException("AddQLstmLayer: Input Gate Bias cannot be NULL");

1716

}

1717

1718

layer->m_CifgParameters.m_InputToInputWeights =

1719

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputToInputWeights));

1720

layer->m_CifgParameters.m_RecurrentToInputWeights =

1721

std::make_unique<ScopedCpuTensorHandle>(*(params.m_RecurrentToInputWeights));

1722

layer->m_CifgParameters.m_InputGateBias =

1723

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputGateBias));

1724

}

1725

1726

// QLstm Projection parameters

1727

if(descriptor.m_ProjectionEnabled)

1728

{

1729

if(params.m_ProjectionWeights == nullptr)

1730

{

1731

throw InvalidArgumentException("AddQLstmLayer: Projection Weights cannot be NULL");

1732

}

1733

1734

if(params.m_ProjectionBias == nullptr)

1735

{

1736

throw InvalidArgumentException("AddQLstmLayer: Projection Biases cannot be NULL");

1737

}

1738

1739

layer->m_ProjectionParameters.m_ProjectionWeights =

1740

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ProjectionWeights));

1741

layer->m_ProjectionParameters.m_ProjectionBias =

1742

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ProjectionBias));

1743

}

1744

1745

// QLstm Peephole params

1746

if(descriptor.m_PeepholeEnabled)

1747

{

1748

if(params.m_CellToForgetWeights == nullptr)

1749

{

1750

throw InvalidArgumentException("AddQLstmLayer: Cell To Forget Weights cannot be NULL");

1751

}

1752

1753

if(params.m_CellToOutputWeights == nullptr)

1754

{

1755

throw InvalidArgumentException("AddQLstmLayer: Cell To Output Weights cannot be NULL");

1756

}

1757

1758

if(!descriptor.m_CifgEnabled)

1759

{

1760

if(params.m_CellToInputWeights == nullptr)

1761

{

1762

throw InvalidArgumentException("AddQLstmLayer: Cell To Input Weights cannot be NULL");

1763

}

1764

1765

layer->m_PeepholeParameters.m_CellToInputWeights =

1766

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellToInputWeights));

1767

}

1768

1769

layer->m_PeepholeParameters.m_CellToForgetWeights =

1770

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellToForgetWeights));

1771

layer->m_PeepholeParameters.m_CellToOutputWeights =

1772

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellToOutputWeights));

1773

}

1774

1775

// QLstm Layer Normalization params

1776

if(descriptor.m_LayerNormEnabled)

1777

{

1778

if(params.m_ForgetLayerNormWeights == nullptr)

1779

{

1780

throw InvalidArgumentException("AddQLstmLayer: Forget layer normalization weights cannot be NULL");

1781

}

1782

1783

if(params.m_CellLayerNormWeights == nullptr)

1784

{

1785

throw InvalidArgumentException("AddQLstmLayer: Cell layer normalization weights cannot be NULL");

1786

}

1787

1788

if(params.m_OutputLayerNormWeights == nullptr)

1789

{

1790

throw InvalidArgumentException("AddQLstmLayer: Output layer normalization weights cannot be NULL");

1791

}

1792

1793

if(!descriptor.m_CifgEnabled)

1794

{

1795

if(params.m_InputLayerNormWeights == nullptr)

1796

{

1797

throw InvalidArgumentException("AddQLstmLayer: Input layer normalization weights cannot be NULL");

1798

}

1799

1800

layer->m_LayerNormParameters.m_InputLayerNormWeights =

1801

std::make_unique<ScopedCpuTensorHandle>(*(params.m_InputLayerNormWeights));

1802

}

1803

1804

layer->m_LayerNormParameters.m_ForgetLayerNormWeights =

1805

std::make_unique<ScopedCpuTensorHandle>(*(params.m_ForgetLayerNormWeights));

1806

layer->m_LayerNormParameters.m_CellLayerNormWeights =

1807

std::make_unique<ScopedCpuTensorHandle>(*(params.m_CellLayerNormWeights));

1808

layer->m_LayerNormParameters.m_OutputLayerNormWeights =

1809

std::make_unique<ScopedCpuTensorHandle>(*(params.m_OutputLayerNormWeights));

}

return layer;

}

Mike Kelly

2019-02-11 17:01:27 +0000

[diff] [blame]

1814

void Network::Accept(ILayerVisitor& visitor) const

1815

{

1816

for (auto layer : GetGraph())

1817

{

1818

layer->Accept(visitor);

};

}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

1822

OptimizedNetwork::OptimizedNetwork(std::unique_ptr<Graph> graph)

Sadik Armagan

3184c90

2020-03-18 10:57:30 +0000

[diff] [blame]

1823

: m_Graph(std::move(graph)), m_Guid(profiling::ProfilingService::GetNextGuid())

telsoa01