Blame - tests/ExecuteNetwork/ExecuteNetwork.cpp - ml/armnn

2018-08-31 09:22:23 +0100

[diff] [blame]

5

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

6

#include "NetworkExecutionUtils/NetworkExecutionUtils.hpp"

7

#include "ExecuteNetworkProgramOptions.hpp"

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame^]

8

#include <armnn/IAsyncExecutionCallback.hpp>

9

#include <AsyncExecutionCallback.hpp>

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

10

11

#include <armnn/Logging.hpp>

12

#include <Filesystem.hpp>

13

#include <InferenceTest.hpp>

14

15

#if defined(ARMNN_SERIALIZER)

16

#include "armnnDeserializer/IDeserializer.hpp"

17

#endif

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

18

#if defined(ARMNN_TF_LITE_PARSER)

19

#include "armnnTfLiteParser/ITfLiteParser.hpp"

20

#endif

21

#if defined(ARMNN_ONNX_PARSER)

22

#include "armnnOnnxParser/IOnnxParser.hpp"

23

#endif

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

24

#if defined(ARMNN_TFLITE_DELEGATE)

25

#include <armnn_delegate.hpp>

26

#include <DelegateOptions.hpp>

27

28

#include <tensorflow/lite/builtin_ops.h>

29

#include <tensorflow/lite/c/builtin_op_data.h>

30

#include <tensorflow/lite/c/common.h>

31

#include <tensorflow/lite/optional_debug_tools.h>

32

#include <tensorflow/lite/kernels/builtin_op_kernels.h>

33

#include <tensorflow/lite/interpreter.h>

34

#include <tensorflow/lite/kernels/register.h>

35

#endif

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

36

37

#include <future>

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

38

#if defined(ARMNN_TFLITE_DELEGATE)

39

int TfLiteDelegateMainImpl(const ExecuteNetworkParams& params,

40

const std::shared_ptr<armnn::IRuntime>& runtime = nullptr)

41

{

42

using namespace tflite;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

43

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

44

std::unique_ptr<tflite::FlatBufferModel> model = tflite::FlatBufferModel::BuildFromFile(params.m_ModelPath.c_str());

45

46

auto tfLiteInterpreter = std::make_unique<Interpreter>();

47

tflite::ops::builtin::BuiltinOpResolver resolver;

48

49

tflite::InterpreterBuilder builder(*model, resolver);

50

builder(&tfLiteInterpreter);

51

tfLiteInterpreter->AllocateTensors();

52

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

53

int status = 0;

54

if (params.m_TfLiteExecutor == ExecuteNetworkParams::TfLiteExecutor::ArmNNTfLiteDelegate)

Sadik Armagan

19a1c03

2021-01-20 12:17:00 +0000

[diff] [blame]

55

{

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

56

// Create the Armnn Delegate

57

armnnDelegate::DelegateOptions delegateOptions(params.m_ComputeDevices);

58

std::unique_ptr<TfLiteDelegate, decltype(&armnnDelegate::TfLiteArmnnDelegateDelete)>

59

theArmnnDelegate(armnnDelegate::TfLiteArmnnDelegateCreate(delegateOptions),

60

armnnDelegate::TfLiteArmnnDelegateDelete);

61

// Register armnn_delegate to TfLiteInterpreter

62

status = tfLiteInterpreter->ModifyGraphWithDelegate(std::move(theArmnnDelegate));

63

if (status == kTfLiteError)

64

{

65

ARMNN_LOG(fatal) << "Could not register ArmNN TfLite Delegate to TfLiteInterpreter!";

66

return EXIT_FAILURE;

67

}

Sadik Armagan

19a1c03

2021-01-20 12:17:00 +0000

[diff] [blame]

68

}

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

69

else

70

{

71

std::cout << "Running on TfLite without ArmNN delegate\n";

72

}

73

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

74

75

std::vector<std::string> inputBindings;

76

for (const std::string& inputName: params.m_InputNames)

77

{

78

inputBindings.push_back(inputName);

79

}

80

81

armnn::Optional<std::string> dataFile = params.m_GenerateTensorData

82

? armnn::EmptyOptional()

83

: armnn::MakeOptional<std::string>(params.m_InputTensorDataFilePaths[0]);

84

85

const size_t numInputs = inputBindings.size();

86

87

for(unsigned int inputIndex = 0; inputIndex < numInputs; ++inputIndex)

88

{

89

int input = tfLiteInterpreter->inputs()[inputIndex];

Sadik Armagan

2020-11-18 09:37:03 +0000

[diff] [blame]

90

TfLiteIntArray* inputDims = tfLiteInterpreter->tensor(input)->dims;

91

92

long inputSize = 1;

93

for (unsigned int dim = 0; dim < static_cast<unsigned int>(inputDims->size); ++dim)

94

{

95

inputSize *= inputDims->data[dim];

96

}

97

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

98

if (params.m_InputTypes[inputIndex].compare("float") == 0)

99

{

100

auto inputData = tfLiteInterpreter->typed_tensor<float>(input);

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

101

Matthew Sloyan

2020-12-07 13:33:24 +0000

[diff] [blame]

102

if(inputData == NULL)

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

103

{

104

ARMNN_LOG(fatal) << "Input tensor is null, input type: "

105

"\"" << params.m_InputTypes[inputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

109

std::vector<float> tensorData;

110

PopulateTensorWithDataGeneric<float>(tensorData,

111

params.m_InputTensorShapes[inputIndex]->GetNumElements(),

112

dataFile,

113

[](const std::string& s)

114

{ return std::stof(s); });

Sadik Armagan

2020-11-18 09:37:03 +0000

[diff] [blame]

115

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

116

std::copy(tensorData.begin(), tensorData.end(), inputData);

117

}

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

118

else if (params.m_InputTypes[inputIndex].compare("qsymms8") == 0)

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

119

{

120

auto inputData = tfLiteInterpreter->typed_tensor<int8_t>(input);

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

121

Matthew Sloyan

2020-12-07 13:33:24 +0000

[diff] [blame]

122

if(inputData == NULL)

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

123

{

124

ARMNN_LOG(fatal) << "Input tensor is null, input type: "

125

"\"" << params.m_InputTypes[inputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

129

std::vector<int8_t> tensorData;

130

PopulateTensorWithDataGeneric<int8_t>(tensorData,

131

params.m_InputTensorShapes[inputIndex]->GetNumElements(),

132

dataFile,

133

[](const std::string& s)

134

{ return armnn::numeric_cast<int8_t>(std::stoi(s)); });

135

136

std::copy(tensorData.begin(), tensorData.end(), inputData);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

137

}

138

else if (params.m_InputTypes[inputIndex].compare("int") == 0)

139

{

140

auto inputData = tfLiteInterpreter->typed_tensor<int32_t>(input);

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

141

Matthew Sloyan

2020-12-07 13:33:24 +0000

[diff] [blame]

142

if(inputData == NULL)

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

143

{

144

ARMNN_LOG(fatal) << "Input tensor is null, input type: "

145

"\"" << params.m_InputTypes[inputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

149

std::vector<int32_t> tensorData;

150

PopulateTensorWithDataGeneric<int32_t>(tensorData,

151

params.m_InputTensorShapes[inputIndex]->GetNumElements(),

152

dataFile,

153

[](const std::string& s)

154

{ return std::stoi(s); });

155

156

std::copy(tensorData.begin(), tensorData.end(), inputData);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

157

}

158

else if (params.m_InputTypes[inputIndex].compare("qasymm8") == 0)

159

{

160

auto inputData = tfLiteInterpreter->typed_tensor<uint8_t>(input);

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

161

Matthew Sloyan

2020-12-07 13:33:24 +0000

[diff] [blame]

162

if(inputData == NULL)

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

163

{

164

ARMNN_LOG(fatal) << "Input tensor is null, input type: "

165

"\"" << params.m_InputTypes[inputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

169

std::vector<uint8_t> tensorData;

170

PopulateTensorWithDataGeneric<uint8_t>(tensorData,

171

params.m_InputTensorShapes[inputIndex]->GetNumElements(),

172

dataFile,

173

[](const std::string& s)

174

{ return armnn::numeric_cast<uint8_t>(std::stoi(s)); });

175

176

std::copy(tensorData.begin(), tensorData.end(), inputData);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

}

else

{

ARMNN_LOG(fatal) << "Unsupported input tensor data type \"" << params.m_InputTypes[inputIndex] << "\". ";

return EXIT_FAILURE;

}

}

for (size_t x = 0; x < params.m_Iterations; x++)

186

{

187

// Run the inference

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

188

status = tfLiteInterpreter->Invoke();

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

189

190

// Print out the output

191

for (unsigned int outputIndex = 0; outputIndex < params.m_OutputNames.size(); ++outputIndex)

192

{

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

193

auto tfLiteDelegateOutputId = tfLiteInterpreter->outputs()[outputIndex];

Sadik Armagan

2020-11-18 09:37:03 +0000

[diff] [blame]

194

TfLiteIntArray* outputDims = tfLiteInterpreter->tensor(tfLiteDelegateOutputId)->dims;

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

195

Sadik Armagan

2020-11-18 09:37:03 +0000

[diff] [blame]

196

long outputSize = 1;

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

197

for (unsigned int dim = 0; dim < static_cast<unsigned int>(outputDims->size); ++dim)

198

{

Sadik Armagan

2020-11-18 09:37:03 +0000

[diff] [blame]

199

outputSize *= outputDims->data[dim];

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

200

}

201

202

std::cout << params.m_OutputNames[outputIndex] << ": ";

203

if (params.m_OutputTypes[outputIndex].compare("float") == 0)

204

{

205

auto tfLiteDelageOutputData = tfLiteInterpreter->typed_tensor<float>(tfLiteDelegateOutputId);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

206

if(tfLiteDelageOutputData == NULL)

207

{

208

ARMNN_LOG(fatal) << "Output tensor is null, output type: "

209

"\"" << params.m_OutputTypes[outputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

for (int i = 0; i < outputSize; ++i)

214

{

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

215

printf("%f ", tfLiteDelageOutputData[i]);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

216

}

217

}

218

else if (params.m_OutputTypes[outputIndex].compare("int") == 0)

219

{

220

auto tfLiteDelageOutputData = tfLiteInterpreter->typed_tensor<int32_t>(tfLiteDelegateOutputId);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

221

if(tfLiteDelageOutputData == NULL)

222

{

223

ARMNN_LOG(fatal) << "Output tensor is null, output type: "

224

"\"" << params.m_OutputTypes[outputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

for (int i = 0; i < outputSize; ++i)

229

{

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

230

printf("%d ", tfLiteDelageOutputData[i]);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

231

}

232

}

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

233

else if (params.m_OutputTypes[outputIndex].compare("qsymms8") == 0)

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

234

{

235

auto tfLiteDelageOutputData = tfLiteInterpreter->typed_tensor<int8_t>(tfLiteDelegateOutputId);

236

if(tfLiteDelageOutputData == NULL)

237

{

238

ARMNN_LOG(fatal) << "Output tensor is null, output type: "

239

"\"" << params.m_OutputTypes[outputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

for (int i = 0; i < outputSize; ++i)

244

{

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

245

printf("%d ", tfLiteDelageOutputData[i]);

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

246

}

247

}

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

248

else if (params.m_OutputTypes[outputIndex].compare("qasymm8") == 0)

249

{

250

auto tfLiteDelageOutputData = tfLiteInterpreter->typed_tensor<uint8_t>(tfLiteDelegateOutputId);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

251

if(tfLiteDelageOutputData == NULL)

252

{

253

ARMNN_LOG(fatal) << "Output tensor is null, output type: "

254

"\"" << params.m_OutputTypes[outputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

for (int i = 0; i < outputSize; ++i)

259

{

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

260

printf("%u ", tfLiteDelageOutputData[i]);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

}

}

else

{

ARMNN_LOG(fatal) << "Output tensor is null, output type: "

266

"\"" << params.m_OutputTypes[outputIndex] <<

267

"\" may be incorrect. Output type can be specified with -z argument";

268

return EXIT_FAILURE;

269

}

270

std::cout << std::endl;

}

}

return status;

}

#endif

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

277

template<typename TParser, typename TDataType>

278

int MainImpl(const ExecuteNetworkParams& params,

279

const std::shared_ptr<armnn::IRuntime>& runtime = nullptr)

280

{

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame^]

281

using namespace std::chrono;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

282

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

283

std::vector<std::vector<TContainer>> inputs;

284

std::vector<std::vector<TContainer>> outputs;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

try

{

// Creates an InferenceModel, which will parse the model and load it into an IRuntime.

289

typename InferenceModel<TParser, TDataType>::Params inferenceModelParams;

290

inferenceModelParams.m_ModelPath = params.m_ModelPath;

291

inferenceModelParams.m_IsModelBinary = params.m_IsModelBinary;

292

inferenceModelParams.m_ComputeDevices = params.m_ComputeDevices;

293

inferenceModelParams.m_DynamicBackendsPath = params.m_DynamicBackendsPath;

294

inferenceModelParams.m_PrintIntermediateLayers = params.m_PrintIntermediate;

295

inferenceModelParams.m_VisualizePostOptimizationModel = params.m_EnableLayerDetails;

296

inferenceModelParams.m_ParseUnsupported = params.m_ParseUnsupported;

297

inferenceModelParams.m_InferOutputShape = params.m_InferOutputShape;

298

inferenceModelParams.m_EnableFastMath = params.m_EnableFastMath;

Matthew Sloyan

4243211

2021-01-08 10:30:51 +0000

[diff] [blame]

299

inferenceModelParams.m_SaveCachedNetwork = params.m_SaveCachedNetwork;

300

inferenceModelParams.m_CachedNetworkFilePath = params.m_CachedNetworkFilePath;

Matthew Sloyan

0a7dc6b

2021-02-10 16:50:53 +0000

[diff] [blame]

301

inferenceModelParams.m_NumberOfThreads = params.m_NumberOfThreads;

Finn Williams

4064632

2021-02-11 16:16:42 +0000

[diff] [blame]

302

inferenceModelParams.m_MLGOTuningFilePath = params.m_MLGOTuningFilePath;

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

303

inferenceModelParams.m_AsyncEnabled = params.m_Concurrent;

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame^]

304

inferenceModelParams.m_ThreadPoolSize = params.m_ThreadPoolSize;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

305

306

for(const std::string& inputName: params.m_InputNames)

307

{

308

inferenceModelParams.m_InputBindings.push_back(inputName);

309

}

310

311

for(unsigned int i = 0; i < params.m_InputTensorShapes.size(); ++i)

312

{

313

inferenceModelParams.m_InputShapes.push_back(*params.m_InputTensorShapes[i]);

314

}

315

316

for(const std::string& outputName: params.m_OutputNames)

317

{

318

inferenceModelParams.m_OutputBindings.push_back(outputName);

319

}

320

321

inferenceModelParams.m_SubgraphId = params.m_SubgraphId;

322

inferenceModelParams.m_EnableFp16TurboMode = params.m_EnableFp16TurboMode;

323

inferenceModelParams.m_EnableBf16TurboMode = params.m_EnableBf16TurboMode;

324

325

InferenceModel<TParser, TDataType> model(inferenceModelParams,

326

params.m_EnableProfiling,

327

params.m_DynamicBackendsPath,

328

runtime);

329

330

const size_t numInputs = inferenceModelParams.m_InputBindings.size();

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

331

332

armnn::Optional<QuantizationParams> qParams = params.m_QuantizeInput ?

333

armnn::MakeOptional<QuantizationParams>(

334

model.GetInputQuantizationParams()) :

335

armnn::EmptyOptional();

336

337

for(unsigned int j = 0; j < params.m_SimultaneousIterations ; ++j)

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

338

{

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

339

std::vector<TContainer> inputDataContainers;

340

for(unsigned int i = 0; i < numInputs; ++i)

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

341

{

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

342

armnn::Optional<std::string> dataFile = params.m_GenerateTensorData ?

343

armnn::EmptyOptional() :

344

armnn::MakeOptional<std::string>(

345

params.m_InputTensorDataFilePaths[(j * numInputs) + i]);

346

347

unsigned int numElements = model.GetInputSize(i);

348

if (params.m_InputTensorShapes.size() > i && params.m_InputTensorShapes[i])

349

{

350

// If the user has provided a tensor shape for the current input,

351

// override numElements

352

numElements = params.m_InputTensorShapes[i]->GetNumElements();

353

}

354

355

TContainer tensorData;

356

PopulateTensorWithData(tensorData,

357

numElements,

358

params.m_InputTypes[i],

qParams,

dataFile);

inputDataContainers.push_back(tensorData);

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

363

}

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

364

inputs.push_back(inputDataContainers);

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

365

}

366

367

const size_t numOutputs = inferenceModelParams.m_OutputBindings.size();

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

368

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

369

for (unsigned int j = 0; j < params.m_SimultaneousIterations; ++j)

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

370

{

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

371

std::vector <TContainer> outputDataContainers;

372

for (unsigned int i = 0; i < numOutputs; ++i)

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

373

{

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

374

if (params.m_OutputTypes[i].compare("float") == 0)

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

375

{

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

376

outputDataContainers.push_back(std::vector<float>(model.GetOutputSize(i)));

377

} else if (params.m_OutputTypes[i].compare("int") == 0)

378

{

379

outputDataContainers.push_back(std::vector<int>(model.GetOutputSize(i)));

380

} else if (params.m_OutputTypes[i].compare("qasymm8") == 0)

381

{

382

outputDataContainers.push_back(std::vector<uint8_t>(model.GetOutputSize(i)));

383

} else if (params.m_OutputTypes[i].compare("qsymms8") == 0)

384

{

385

outputDataContainers.push_back(std::vector<int8_t>(model.GetOutputSize(i)));

386

} else

387

{

388

ARMNN_LOG(fatal) << "Unsupported tensor data type \"" << params.m_OutputTypes[i] << "\". ";

389

return EXIT_FAILURE;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

390

}

391

}

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

392

outputs.push_back(outputDataContainers);

393

}

394

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame^]

395

// Synchronous execution

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

396

if (!params.m_Concurrent)

397

{

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

398

for (size_t x = 0; x < params.m_Iterations; x++)

399

{

400

// model.Run returns the inference time elapsed in EnqueueWorkload (in milliseconds)

401

auto inference_duration = model.Run(inputs[0], outputs[0]);

402

403

if (params.m_GenerateTensorData)

404

{

405

ARMNN_LOG(warning) << "The input data was generated, note that the output will not be useful";

406

}

407

408

// Print output tensors

409

const auto& infosOut = model.GetOutputBindingInfos();

410

for (size_t i = 0; i < numOutputs; i++)

411

{

412

const armnn::TensorInfo& infoOut = infosOut[i].second;

413

auto outputTensorFile = params.m_OutputTensorFiles.empty() ? "" : params.m_OutputTensorFiles[i];

414

415

TensorPrinter printer(inferenceModelParams.m_OutputBindings[i],

416

infoOut,

417

outputTensorFile,

418

params.m_DequantizeOutput);

419

mapbox::util::apply_visitor(printer, outputs[0][i]);

420

}

421

422

ARMNN_LOG(info) << "\nInference time: " << std::setprecision(2)

423

<< std::fixed << inference_duration.count() << " ms\n";

424

425

// If thresholdTime == 0.0 (default), then it hasn't been supplied at command line

426

if (params.m_ThresholdTime != 0.0)

427

{

428

ARMNN_LOG(info) << "Threshold time: " << std::setprecision(2)

429

<< std::fixed << params.m_ThresholdTime << " ms";

430

auto thresholdMinusInference = params.m_ThresholdTime - inference_duration.count();

431

ARMNN_LOG(info) << "Threshold time - Inference time: " << std::setprecision(2)

432

<< std::fixed << thresholdMinusInference << " ms" << "\n";

433

434

if (thresholdMinusInference < 0)

435

{

436

std::string errorMessage = "Elapsed inference time is greater than provided threshold time.";

437

ARMNN_LOG(fatal) << errorMessage;

}

}

}

}

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame^]

442

// Asynchronous execution using the Arm NN thread pool

443

else if (params.m_ThreadPoolSize >= 2)

{

try

{

ARMNN_LOG(info) << "Asynchronous execution with Arm NN thread pool... \n";

448

std::vector<armnn::experimental::IAsyncExecutionCallbackPtr> callbacks;

449

450

// Create callbacks that will be checked post scheduling

451

for (size_t i = 0; i < params.m_SimultaneousIterations; ++i)

452

{

453

// Point to ArmNN example implementation of AsyncExecutionCallback

454

callbacks.emplace_back(std::make_shared<armnn::experimental::AsyncExecutionCallback>());

455

}

456

457

// Declare the latest and earliest inference times here to be used when calculating overall time

458

std::chrono::high_resolution_clock::time_point earliestStartTime;

459

std::chrono::high_resolution_clock::time_point latestEndTime =

460

std::chrono::high_resolution_clock::now();

461

462

// For the asynchronous execution, we are adding a pool of working memory handles (1 per thread) in the

463

// LoadedNetwork with each scheduled inference having a specific priority

464

for (size_t i = 0; i < callbacks.size(); ++i)

465

{

466

model.RunAsync(inputs[i], outputs[i], callbacks[i]);

}

// Check the results

unsigned int j = 0;

for (armnn::experimental::IAsyncExecutionCallbackPtr cb : callbacks)

472

{

473

// Get the results

474

auto endTime = time_point_cast<std::chrono::milliseconds>(cb->GetEndTime());

475

auto startTime = time_point_cast<std::chrono::milliseconds>(cb->GetStartTime());

476

auto inferenceDuration = endTime - startTime;

477

478

if (latestEndTime < cb->GetEndTime())

479

{

480

latestEndTime = cb->GetEndTime();

481

}

482

483

if (earliestStartTime.time_since_epoch().count() == 0)

484

{

485

earliestStartTime = cb->GetStartTime();

486

}

487

else if (earliestStartTime > cb->GetStartTime())

488

{

489

earliestStartTime = cb->GetStartTime();

490

}

491

492

if (params.m_GenerateTensorData)

493

{

494

ARMNN_LOG(warning) << "The input data was generated, note that the output will not be useful";

495

}

496

497

// Print output tensors

498

const auto& infosOut = model.GetOutputBindingInfos();

499

for (size_t i = 0; i < numOutputs; i++)

500

{

501

const armnn::TensorInfo& infoOut = infosOut[i].second;

502

auto outputTensorFile = params.m_OutputTensorFiles.empty()

503

? ""

504

: params.m_OutputTensorFiles[(j * numOutputs) + i];

505

506

TensorPrinter printer(inferenceModelParams.m_OutputBindings[i],

507

infoOut,

508

outputTensorFile,

509

params.m_DequantizeOutput);

510

mapbox::util::apply_visitor(printer, outputs[j][i]);

511

}

512

513

ARMNN_LOG(info) << "\nInference time: " << std::setprecision(2)

514

<< std::fixed << inferenceDuration.count() << " ms\n";

515

516

// If thresholdTime == 0.0 (default), then it hasn't been supplied at command line

517

if (params.m_ThresholdTime != 0.0)

518

{

519

ARMNN_LOG(info) << "Threshold time: " << std::setprecision(2)

520

<< std::fixed << params.m_ThresholdTime << " ms";

521

auto thresholdMinusInference =

522

params.m_ThresholdTime - duration<double, std::milli>(inferenceDuration).count();

523

ARMNN_LOG(info) << "Threshold time - Inference time: " << std::setprecision(2)

524

<< std::fixed << thresholdMinusInference << " ms" << "\n";

525

526

if (thresholdMinusInference < 0)

527

{

528

ARMNN_LOG(fatal) << "Elapsed inference time is greater than provided threshold time. \n";

}

}

++j;

}

//print duration difference between overallStartTime and overallEndTime

534

auto overallEndTime = time_point_cast<std::chrono::milliseconds>(latestEndTime);

535

auto overallStartTime = time_point_cast<std::chrono::milliseconds>(earliestStartTime);

536

auto totalInferenceDuration = overallEndTime - overallStartTime;

537

ARMNN_LOG(info) << "\nOverall Inference time: " << std::setprecision(2)

538

<< std::fixed << totalInferenceDuration.count() << " ms\n";

539

}

540

catch (const armnn::Exception& e)

541

{

542

ARMNN_LOG(fatal) << "Armnn Error: " << e.what();

return EXIT_FAILURE;

}

}

// Asynchronous execution using std::launch::async

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

else

{

try

{

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame^]

551

ARMNN_LOG(info) << "Asynchronous Execution with std::launch:async... \n";

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

552

std::vector<std::future<std::tuple<armnn::profiling::ProfilingGuid,

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame^]

553

std::chrono::duration<double, std::milli>>>> inferenceResults;

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

554

inferenceResults.reserve(params.m_SimultaneousIterations);

555

556

// Create WorkingMemHandles for each inference

557

std::vector<std::unique_ptr<armnn::experimental::IWorkingMemHandle>> workingMemHandles;

558

workingMemHandles.reserve(params.m_SimultaneousIterations);

559

for (unsigned int i = 0; i < params.m_SimultaneousIterations; ++i)

560

{

561

workingMemHandles.push_back(model.CreateWorkingMemHandle());

562

}

563

564

// Run each inference in its own thread

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame^]

565

// start a timer

566

const auto start_time = armnn::GetTimeNow();

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

567

for (unsigned int i = 0; i < params.m_SimultaneousIterations; ++i)

568

{

569

armnn::experimental::IWorkingMemHandle& workingMemHandleRef = *workingMemHandles[i].get();

570

inferenceResults.push_back(std::async(

571

std::launch::async, [&model, &workingMemHandleRef, &inputs, &outputs, i]() {

572

return model.RunAsync(workingMemHandleRef, inputs[i], outputs[i]);

}

));

}

// Check the results

for (unsigned int j = 0; j < inferenceResults.size(); ++j)

579

{

580

// Get the results

581

auto inferenceResult = inferenceResults[j].get();

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame^]

582

auto inferenceDuration = std::get<1>(inferenceResult);

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

583

auto inferenceID = std::get<0>(inferenceResult);

584

585

if (params.m_GenerateTensorData)

586

{

587

ARMNN_LOG(warning) << "The input data was generated, note that the output will not be useful";

588

}

589

590

// Print output tensors

591

const auto& infosOut = model.GetOutputBindingInfos();

592

for (size_t i = 0; i < numOutputs; i++)

593

{

594

const armnn::TensorInfo& infoOut = infosOut[i].second;

595

auto outputTensorFile = params.m_OutputTensorFiles.empty()

596

? ""

597

: params.m_OutputTensorFiles[(j * numOutputs) + i];

598

599

TensorPrinter printer(inferenceModelParams.m_OutputBindings[i],

600

infoOut,

601

outputTensorFile,

602

params.m_DequantizeOutput);

603

mapbox::util::apply_visitor(printer, outputs[j][i]);

604

}

605

606

ARMNN_LOG(info) << "\nInference time: " << std::setprecision(2)

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame^]

607

<< std::fixed << inferenceDuration.count() << " ms\n";

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

608

609

// If thresholdTime == 0.0 (default), then it hasn't been supplied at command line

610

if (params.m_ThresholdTime != 0.0)

611

{

612

ARMNN_LOG(info) << "Threshold time: " << std::setprecision(2)

613

<< std::fixed << params.m_ThresholdTime << " ms";

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame^]

614

auto thresholdMinusInference = params.m_ThresholdTime - inferenceDuration.count();

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

615

ARMNN_LOG(info) << "Threshold time - Inference time: " << std::setprecision(2)

616

<< std::fixed << thresholdMinusInference << " ms" << "\n";

617

618

if (thresholdMinusInference < 0)

619

{

620

ARMNN_LOG(fatal) << "Elapsed inference time is greater than provided threshold time. \n";

621

}

622

}

623

ARMNN_LOG(info) << "Asynchronous Execution is finished for Inference ID: " << inferenceID << " \n";

624

625

}

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame^]

626

// finish timer

627

const auto duration = armnn::GetTimeDuration(start_time);

628

ARMNN_LOG(info) << "\nOverall Inference time: " << std::setprecision(2)

629

<< std::fixed << duration.count() << " ms\n";

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

630

}

631

catch (const armnn::Exception& e)

632

{

633

ARMNN_LOG(fatal) << "Armnn Error: " << e.what();

634

return EXIT_FAILURE;

635

}

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

636

}

637

}

638

catch (const armnn::Exception& e)

639

{

640

ARMNN_LOG(fatal) << "Armnn Error: " << e.what();

return EXIT_FAILURE;

}

return EXIT_SUCCESS;

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

647

James Conroy

7b4886f

2019-04-11 10:23:58 +0100

[diff] [blame]

648

// MAIN

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

649

int main(int argc, const char* argv[])

650

{

651

// Configures logging for both the ARMNN library and this test program.

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

652

#ifdef NDEBUG

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

653

armnn::LogSeverity level = armnn::LogSeverity::Info;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

654

#else

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

655

armnn::LogSeverity level = armnn::LogSeverity::Debug;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

656

#endif

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

657

armnn::ConfigureLogging(true, true, level);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

658

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

659

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

660

// Get ExecuteNetwork parameters and runtime options from command line

661

ProgramOptions ProgramOptions(argc, argv);

Narumol Prangnawarat

d8cc811

2020-03-24 13:54:05 +0000

[diff] [blame]

662

Finn Williams

2020-04-23 17:55:18 +0100

[diff] [blame]

663

// Create runtime

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

664

std::shared_ptr<armnn::IRuntime> runtime(armnn::IRuntime::Create(ProgramOptions.m_RuntimeOptions));

Finn Williams

2020-04-23 17:55:18 +0100

[diff] [blame]

665

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

666

std::string modelFormat = ProgramOptions.m_ExNetParams.m_ModelFormat;

667

668

// Forward to implementation based on the parser type

669

if (modelFormat.find("armnn") != std::string::npos)

Finn Williams

2020-04-23 17:55:18 +0100

[diff] [blame]

670

{

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

671

#if defined(ARMNN_SERIALIZER)

672

return MainImpl<armnnDeserializer::IDeserializer, float>(ProgramOptions.m_ExNetParams, runtime);

673

#else

674

ARMNN_LOG(fatal) << "Not built with serialization support.";

Finn Williams

2020-04-23 17:55:18 +0100

[diff] [blame]

675

return EXIT_FAILURE;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

676

#endif

Finn Williams

2020-04-23 17:55:18 +0100

[diff] [blame]

677

}

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

678

else if (modelFormat.find("onnx") != std::string::npos)

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

679

{

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

680

#if defined(ARMNN_ONNX_PARSER)

681

return MainImpl<armnnOnnxParser::IOnnxParser, float>(ProgramOptions.m_ExNetParams, runtime);

682

#else

683

ARMNN_LOG(fatal) << "Not built with Onnx parser support.";

684

return EXIT_FAILURE;

685

#endif

686

}

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

687

else if(modelFormat.find("tflite") != std::string::npos)

688

{

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

689

if (ProgramOptions.m_ExNetParams.m_TfLiteExecutor == ExecuteNetworkParams::TfLiteExecutor::ArmNNTfLiteParser)

690

{

691

#if defined(ARMNN_TF_LITE_PARSER)

692

return MainImpl<armnnTfLiteParser::ITfLiteParser, float>(ProgramOptions.m_ExNetParams, runtime);

693

#else

694

ARMNN_LOG(fatal) << "Not built with Tensorflow-Lite parser support.";

return EXIT_FAILURE;

#endif

}

else if (ProgramOptions.m_ExNetParams.m_TfLiteExecutor ==

699

ExecuteNetworkParams::TfLiteExecutor::ArmNNTfLiteDelegate ||

700

ProgramOptions.m_ExNetParams.m_TfLiteExecutor ==

701

ExecuteNetworkParams::TfLiteExecutor::TfliteInterpreter)

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

702

{

703

#if defined(ARMNN_TF_LITE_DELEGATE)

704

return TfLiteDelegateMainImpl(ProgramOptions.m_ExNetParams, runtime);

705

#else

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

706

ARMNN_LOG(fatal) << "Not built with Arm NN Tensorflow-Lite delegate support.";

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

707

return EXIT_FAILURE;

708

#endif

709

}

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

}

else

{

ARMNN_LOG(fatal) << "Unknown model format: '" << modelFormat

Nikhil Raj

5d955cf

2021-04-19 16:59:48 +0100

[diff] [blame]

714

<< "'. Please include 'tflite' or 'onnx'";

Jan Eilers