Blame - tests/ExecuteNetwork/ExecuteNetwork.cpp - ml/armnn

2018-08-31 09:22:23 +0100

[diff] [blame]

5

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

6

#include "NetworkExecutionUtils/NetworkExecutionUtils.hpp"

7

#include "ExecuteNetworkProgramOptions.hpp"

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

8

#include <armnn/IAsyncExecutionCallback.hpp>

9

#include <AsyncExecutionCallback.hpp>

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

10

11

#include <armnn/Logging.hpp>

12

#include <Filesystem.hpp>

13

#include <InferenceTest.hpp>

14

15

#if defined(ARMNN_SERIALIZER)

16

#include "armnnDeserializer/IDeserializer.hpp"

17

#endif

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

18

#if defined(ARMNN_TF_LITE_PARSER)

19

#include "armnnTfLiteParser/ITfLiteParser.hpp"

20

#endif

21

#if defined(ARMNN_ONNX_PARSER)

22

#include "armnnOnnxParser/IOnnxParser.hpp"

23

#endif

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

24

#if defined(ARMNN_TFLITE_DELEGATE)

25

#include <armnn_delegate.hpp>

26

#include <DelegateOptions.hpp>

27

28

#include <tensorflow/lite/builtin_ops.h>

29

#include <tensorflow/lite/c/builtin_op_data.h>

30

#include <tensorflow/lite/c/common.h>

31

#include <tensorflow/lite/optional_debug_tools.h>

32

#include <tensorflow/lite/kernels/builtin_op_kernels.h>

33

#include <tensorflow/lite/interpreter.h>

34

#include <tensorflow/lite/kernels/register.h>

35

#endif

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

36

37

#include <future>

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

38

#if defined(ARMNN_TFLITE_DELEGATE)

39

int TfLiteDelegateMainImpl(const ExecuteNetworkParams& params,

40

const std::shared_ptr<armnn::IRuntime>& runtime = nullptr)

41

{

42

using namespace tflite;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

43

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

44

std::unique_ptr<tflite::FlatBufferModel> model = tflite::FlatBufferModel::BuildFromFile(params.m_ModelPath.c_str());

45

46

auto tfLiteInterpreter = std::make_unique<Interpreter>();

47

tflite::ops::builtin::BuiltinOpResolver resolver;

48

49

tflite::InterpreterBuilder builder(*model, resolver);

50

builder(&tfLiteInterpreter);

51

tfLiteInterpreter->AllocateTensors();

52

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

53

int status = 0;

54

if (params.m_TfLiteExecutor == ExecuteNetworkParams::TfLiteExecutor::ArmNNTfLiteDelegate)

Sadik Armagan

19a1c03

2021-01-20 12:17:00 +0000

[diff] [blame]

55

{

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

56

// Create the Armnn Delegate

57

armnnDelegate::DelegateOptions delegateOptions(params.m_ComputeDevices);

58

std::unique_ptr<TfLiteDelegate, decltype(&armnnDelegate::TfLiteArmnnDelegateDelete)>

59

theArmnnDelegate(armnnDelegate::TfLiteArmnnDelegateCreate(delegateOptions),

60

armnnDelegate::TfLiteArmnnDelegateDelete);

61

// Register armnn_delegate to TfLiteInterpreter

62

status = tfLiteInterpreter->ModifyGraphWithDelegate(std::move(theArmnnDelegate));

63

if (status == kTfLiteError)

64

{

65

ARMNN_LOG(fatal) << "Could not register ArmNN TfLite Delegate to TfLiteInterpreter!";

66

return EXIT_FAILURE;

67

}

Sadik Armagan

19a1c03

2021-01-20 12:17:00 +0000

[diff] [blame]

68

}

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

69

else

70

{

71

std::cout << "Running on TfLite without ArmNN delegate\n";

72

}

73

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

74

75

std::vector<std::string> inputBindings;

76

for (const std::string& inputName: params.m_InputNames)

77

{

78

inputBindings.push_back(inputName);

79

}

80

81

armnn::Optional<std::string> dataFile = params.m_GenerateTensorData

82

? armnn::EmptyOptional()

83

: armnn::MakeOptional<std::string>(params.m_InputTensorDataFilePaths[0]);

84

85

const size_t numInputs = inputBindings.size();

86

87

for(unsigned int inputIndex = 0; inputIndex < numInputs; ++inputIndex)

88

{

89

int input = tfLiteInterpreter->inputs()[inputIndex];

Sadik Armagan

2020-11-18 09:37:03 +0000

[diff] [blame]

90

TfLiteIntArray* inputDims = tfLiteInterpreter->tensor(input)->dims;

91

92

long inputSize = 1;

93

for (unsigned int dim = 0; dim < static_cast<unsigned int>(inputDims->size); ++dim)

94

{

95

inputSize *= inputDims->data[dim];

96

}

97

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

98

if (params.m_InputTypes[inputIndex].compare("float") == 0)

99

{

100

auto inputData = tfLiteInterpreter->typed_tensor<float>(input);

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

101

Matthew Sloyan

2020-12-07 13:33:24 +0000

[diff] [blame]

102

if(inputData == NULL)

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

103

{

104

ARMNN_LOG(fatal) << "Input tensor is null, input type: "

105

"\"" << params.m_InputTypes[inputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

109

std::vector<float> tensorData;

110

PopulateTensorWithDataGeneric<float>(tensorData,

111

params.m_InputTensorShapes[inputIndex]->GetNumElements(),

112

dataFile,

113

[](const std::string& s)

114

{ return std::stof(s); });

Sadik Armagan

2020-11-18 09:37:03 +0000

[diff] [blame]

115

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

116

std::copy(tensorData.begin(), tensorData.end(), inputData);

117

}

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

118

else if (params.m_InputTypes[inputIndex].compare("qsymms8") == 0)

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

119

{

120

auto inputData = tfLiteInterpreter->typed_tensor<int8_t>(input);

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

121

Matthew Sloyan

2020-12-07 13:33:24 +0000

[diff] [blame]

122

if(inputData == NULL)

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

123

{

124

ARMNN_LOG(fatal) << "Input tensor is null, input type: "

125

"\"" << params.m_InputTypes[inputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

129

std::vector<int8_t> tensorData;

130

PopulateTensorWithDataGeneric<int8_t>(tensorData,

131

params.m_InputTensorShapes[inputIndex]->GetNumElements(),

132

dataFile,

133

[](const std::string& s)

134

{ return armnn::numeric_cast<int8_t>(std::stoi(s)); });

135

136

std::copy(tensorData.begin(), tensorData.end(), inputData);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

137

}

138

else if (params.m_InputTypes[inputIndex].compare("int") == 0)

139

{

140

auto inputData = tfLiteInterpreter->typed_tensor<int32_t>(input);

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

141

Matthew Sloyan

2020-12-07 13:33:24 +0000

[diff] [blame]

142

if(inputData == NULL)

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

143

{

144

ARMNN_LOG(fatal) << "Input tensor is null, input type: "

145

"\"" << params.m_InputTypes[inputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

149

std::vector<int32_t> tensorData;

150

PopulateTensorWithDataGeneric<int32_t>(tensorData,

151

params.m_InputTensorShapes[inputIndex]->GetNumElements(),

152

dataFile,

153

[](const std::string& s)

154

{ return std::stoi(s); });

155

156

std::copy(tensorData.begin(), tensorData.end(), inputData);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

157

}

158

else if (params.m_InputTypes[inputIndex].compare("qasymm8") == 0)

159

{

160

auto inputData = tfLiteInterpreter->typed_tensor<uint8_t>(input);

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

161

Matthew Sloyan

2020-12-07 13:33:24 +0000

[diff] [blame]

162

if(inputData == NULL)

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

163

{

164

ARMNN_LOG(fatal) << "Input tensor is null, input type: "

165

"\"" << params.m_InputTypes[inputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

169

std::vector<uint8_t> tensorData;

170

PopulateTensorWithDataGeneric<uint8_t>(tensorData,

171

params.m_InputTensorShapes[inputIndex]->GetNumElements(),

172

dataFile,

173

[](const std::string& s)

174

{ return armnn::numeric_cast<uint8_t>(std::stoi(s)); });

175

176

std::copy(tensorData.begin(), tensorData.end(), inputData);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

}

else

{

ARMNN_LOG(fatal) << "Unsupported input tensor data type \"" << params.m_InputTypes[inputIndex] << "\". ";

return EXIT_FAILURE;

}

}

for (size_t x = 0; x < params.m_Iterations; x++)

186

{

187

// Run the inference

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

188

status = tfLiteInterpreter->Invoke();

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

189

190

// Print out the output

191

for (unsigned int outputIndex = 0; outputIndex < params.m_OutputNames.size(); ++outputIndex)

192

{

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

193

auto tfLiteDelegateOutputId = tfLiteInterpreter->outputs()[outputIndex];

Sadik Armagan

2020-11-18 09:37:03 +0000

[diff] [blame]

194

TfLiteIntArray* outputDims = tfLiteInterpreter->tensor(tfLiteDelegateOutputId)->dims;

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

195

Sadik Armagan

2020-11-18 09:37:03 +0000

[diff] [blame]

196

long outputSize = 1;

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

197

for (unsigned int dim = 0; dim < static_cast<unsigned int>(outputDims->size); ++dim)

198

{

Sadik Armagan

2020-11-18 09:37:03 +0000

[diff] [blame]

199

outputSize *= outputDims->data[dim];

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

200

}

201

202

std::cout << params.m_OutputNames[outputIndex] << ": ";

203

if (params.m_OutputTypes[outputIndex].compare("float") == 0)

204

{

205

auto tfLiteDelageOutputData = tfLiteInterpreter->typed_tensor<float>(tfLiteDelegateOutputId);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

206

if(tfLiteDelageOutputData == NULL)

207

{

208

ARMNN_LOG(fatal) << "Output tensor is null, output type: "

209

"\"" << params.m_OutputTypes[outputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

for (int i = 0; i < outputSize; ++i)

214

{

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

215

printf("%f ", tfLiteDelageOutputData[i]);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

216

}

217

}

218

else if (params.m_OutputTypes[outputIndex].compare("int") == 0)

219

{

220

auto tfLiteDelageOutputData = tfLiteInterpreter->typed_tensor<int32_t>(tfLiteDelegateOutputId);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

221

if(tfLiteDelageOutputData == NULL)

222

{

223

ARMNN_LOG(fatal) << "Output tensor is null, output type: "

224

"\"" << params.m_OutputTypes[outputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

for (int i = 0; i < outputSize; ++i)

229

{

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

230

printf("%d ", tfLiteDelageOutputData[i]);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

231

}

232

}

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

233

else if (params.m_OutputTypes[outputIndex].compare("qsymms8") == 0)

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

234

{

235

auto tfLiteDelageOutputData = tfLiteInterpreter->typed_tensor<int8_t>(tfLiteDelegateOutputId);

236

if(tfLiteDelageOutputData == NULL)

237

{

238

ARMNN_LOG(fatal) << "Output tensor is null, output type: "

239

"\"" << params.m_OutputTypes[outputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

for (int i = 0; i < outputSize; ++i)

244

{

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

245

printf("%d ", tfLiteDelageOutputData[i]);

Finn Williams

2020-11-20 13:57:53 +0000

[diff] [blame]

246

}

247

}

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

248

else if (params.m_OutputTypes[outputIndex].compare("qasymm8") == 0)

249

{

250

auto tfLiteDelageOutputData = tfLiteInterpreter->typed_tensor<uint8_t>(tfLiteDelegateOutputId);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

251

if(tfLiteDelageOutputData == NULL)

252

{

253

ARMNN_LOG(fatal) << "Output tensor is null, output type: "

254

"\"" << params.m_OutputTypes[outputIndex] << "\" may be incorrect.";

return EXIT_FAILURE;

}

for (int i = 0; i < outputSize; ++i)

259

{

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

260

printf("%u ", tfLiteDelageOutputData[i]);

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

}

}

else

{

ARMNN_LOG(fatal) << "Output tensor is null, output type: "

266

"\"" << params.m_OutputTypes[outputIndex] <<

267

"\" may be incorrect. Output type can be specified with -z argument";

268

return EXIT_FAILURE;

269

}

270

std::cout << std::endl;

}

}

return status;

}

#endif

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

277

template<typename TParser, typename TDataType>

278

int MainImpl(const ExecuteNetworkParams& params,

279

const std::shared_ptr<armnn::IRuntime>& runtime = nullptr)

280

{

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

281

using namespace std::chrono;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

282

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

283

std::vector<std::vector<TContainer>> inputs;

284

std::vector<std::vector<TContainer>> outputs;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

try

{

// Creates an InferenceModel, which will parse the model and load it into an IRuntime.

289

typename InferenceModel<TParser, TDataType>::Params inferenceModelParams;

290

inferenceModelParams.m_ModelPath = params.m_ModelPath;

291

inferenceModelParams.m_IsModelBinary = params.m_IsModelBinary;

292

inferenceModelParams.m_ComputeDevices = params.m_ComputeDevices;

293

inferenceModelParams.m_DynamicBackendsPath = params.m_DynamicBackendsPath;

294

inferenceModelParams.m_PrintIntermediateLayers = params.m_PrintIntermediate;

295

inferenceModelParams.m_VisualizePostOptimizationModel = params.m_EnableLayerDetails;

296

inferenceModelParams.m_ParseUnsupported = params.m_ParseUnsupported;

297

inferenceModelParams.m_InferOutputShape = params.m_InferOutputShape;

298

inferenceModelParams.m_EnableFastMath = params.m_EnableFastMath;

Matthew Sloyan

4243211

2021-01-08 10:30:51 +0000

[diff] [blame]

299

inferenceModelParams.m_SaveCachedNetwork = params.m_SaveCachedNetwork;

300

inferenceModelParams.m_CachedNetworkFilePath = params.m_CachedNetworkFilePath;

Matthew Sloyan

0a7dc6b

2021-02-10 16:50:53 +0000

[diff] [blame]

301

inferenceModelParams.m_NumberOfThreads = params.m_NumberOfThreads;

Finn Williams

4064632

2021-02-11 16:16:42 +0000

[diff] [blame]

302

inferenceModelParams.m_MLGOTuningFilePath = params.m_MLGOTuningFilePath;

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

303

inferenceModelParams.m_AsyncEnabled = params.m_Concurrent;

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

304

inferenceModelParams.m_ThreadPoolSize = params.m_ThreadPoolSize;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

305

306

for(const std::string& inputName: params.m_InputNames)

307

{

308

inferenceModelParams.m_InputBindings.push_back(inputName);

309

}

310

311

for(unsigned int i = 0; i < params.m_InputTensorShapes.size(); ++i)

312

{

313

inferenceModelParams.m_InputShapes.push_back(*params.m_InputTensorShapes[i]);

314

}

315

316

for(const std::string& outputName: params.m_OutputNames)

317

{

318

inferenceModelParams.m_OutputBindings.push_back(outputName);

319

}

320

321

inferenceModelParams.m_SubgraphId = params.m_SubgraphId;

322

inferenceModelParams.m_EnableFp16TurboMode = params.m_EnableFp16TurboMode;

323

inferenceModelParams.m_EnableBf16TurboMode = params.m_EnableBf16TurboMode;

324

325

InferenceModel<TParser, TDataType> model(inferenceModelParams,

326

params.m_EnableProfiling,

327

params.m_DynamicBackendsPath,

328

runtime);

329

330

const size_t numInputs = inferenceModelParams.m_InputBindings.size();

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

331

332

armnn::Optional<QuantizationParams> qParams = params.m_QuantizeInput ?

333

armnn::MakeOptional<QuantizationParams>(

334

model.GetInputQuantizationParams()) :

335

armnn::EmptyOptional();

336

337

for(unsigned int j = 0; j < params.m_SimultaneousIterations ; ++j)

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

338

{

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

339

std::vector<TContainer> inputDataContainers;

340

for(unsigned int i = 0; i < numInputs; ++i)

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

341

{

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

342

armnn::Optional<std::string> dataFile = params.m_GenerateTensorData ?

343

armnn::EmptyOptional() :

344

armnn::MakeOptional<std::string>(

345

params.m_InputTensorDataFilePaths[(j * numInputs) + i]);

346

347

unsigned int numElements = model.GetInputSize(i);

348

if (params.m_InputTensorShapes.size() > i && params.m_InputTensorShapes[i])

349

{

350

// If the user has provided a tensor shape for the current input,

351

// override numElements

352

numElements = params.m_InputTensorShapes[i]->GetNumElements();

353

}

354

355

TContainer tensorData;

356

PopulateTensorWithData(tensorData,

357

numElements,

358

params.m_InputTypes[i],

qParams,

dataFile);

inputDataContainers.push_back(tensorData);

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

363

}

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

364

inputs.push_back(inputDataContainers);

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

365

}

366

367

const size_t numOutputs = inferenceModelParams.m_OutputBindings.size();

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

368

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

369

for (unsigned int j = 0; j < params.m_SimultaneousIterations; ++j)

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

370

{

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

371

std::vector <TContainer> outputDataContainers;

372

for (unsigned int i = 0; i < numOutputs; ++i)

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

373

{

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

374

if (params.m_OutputTypes[i].compare("float") == 0)

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

375

{

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

376

outputDataContainers.push_back(std::vector<float>(model.GetOutputSize(i)));

377

} else if (params.m_OutputTypes[i].compare("int") == 0)

378

{

379

outputDataContainers.push_back(std::vector<int>(model.GetOutputSize(i)));

380

} else if (params.m_OutputTypes[i].compare("qasymm8") == 0)

381

{

382

outputDataContainers.push_back(std::vector<uint8_t>(model.GetOutputSize(i)));

383

} else if (params.m_OutputTypes[i].compare("qsymms8") == 0)

384

{

385

outputDataContainers.push_back(std::vector<int8_t>(model.GetOutputSize(i)));

386

} else

387

{

388

ARMNN_LOG(fatal) << "Unsupported tensor data type \"" << params.m_OutputTypes[i] << "\". ";

389

return EXIT_FAILURE;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

390

}

391

}

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

392

outputs.push_back(outputDataContainers);

393

}

394

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

395

// Synchronous execution

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

396

if (!params.m_Concurrent)

397

{

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

398

for (size_t x = 0; x < params.m_Iterations; x++)

399

{

400

// model.Run returns the inference time elapsed in EnqueueWorkload (in milliseconds)

401

auto inference_duration = model.Run(inputs[0], outputs[0]);

402

403

if (params.m_GenerateTensorData)

404

{

405

ARMNN_LOG(warning) << "The input data was generated, note that the output will not be useful";

406

}

407

408

// Print output tensors

409

const auto& infosOut = model.GetOutputBindingInfos();

410

for (size_t i = 0; i < numOutputs; i++)

411

{

412

const armnn::TensorInfo& infoOut = infosOut[i].second;

413

auto outputTensorFile = params.m_OutputTensorFiles.empty() ? "" : params.m_OutputTensorFiles[i];

414

415

TensorPrinter printer(inferenceModelParams.m_OutputBindings[i],

416

infoOut,

417

outputTensorFile,

418

params.m_DequantizeOutput);

419

mapbox::util::apply_visitor(printer, outputs[0][i]);

420

}

421

422

ARMNN_LOG(info) << "\nInference time: " << std::setprecision(2)

423

<< std::fixed << inference_duration.count() << " ms\n";

424

425

// If thresholdTime == 0.0 (default), then it hasn't been supplied at command line

426

if (params.m_ThresholdTime != 0.0)

427

{

428

ARMNN_LOG(info) << "Threshold time: " << std::setprecision(2)

429

<< std::fixed << params.m_ThresholdTime << " ms";

430

auto thresholdMinusInference = params.m_ThresholdTime - inference_duration.count();

431

ARMNN_LOG(info) << "Threshold time - Inference time: " << std::setprecision(2)

432

<< std::fixed << thresholdMinusInference << " ms" << "\n";

433

434

if (thresholdMinusInference < 0)

435

{

436

std::string errorMessage = "Elapsed inference time is greater than provided threshold time.";

437

ARMNN_LOG(fatal) << errorMessage;

}

}

}

}

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

442

// Asynchronous execution using the Arm NN thread pool

Kevin May

94dd4db

2021-05-26 16:01:08 +0100

[diff] [blame]

443

else if (params.m_ThreadPoolSize >= 1)

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

{

try

{

ARMNN_LOG(info) << "Asynchronous execution with Arm NN thread pool... \n";

Finn Williams

2021-06-09 17:07:33 +0100

[diff] [blame^]

448

armnn::AsyncCallbackManager callbackManager;

449

std::unordered_map<armnn::InferenceId, std::vector<TContainer>&> inferenceOutputMap;

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

450

451

// Declare the latest and earliest inference times here to be used when calculating overall time

452

std::chrono::high_resolution_clock::time_point earliestStartTime;

453

std::chrono::high_resolution_clock::time_point latestEndTime =

454

std::chrono::high_resolution_clock::now();

455

456

// For the asynchronous execution, we are adding a pool of working memory handles (1 per thread) in the

457

// LoadedNetwork with each scheduled inference having a specific priority

Finn Williams

2021-06-09 17:07:33 +0100

[diff] [blame^]

458

for (size_t i = 0; i < params.m_SimultaneousIterations; ++i)

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

459

{

Finn Williams

2021-06-09 17:07:33 +0100

[diff] [blame^]

460

std::shared_ptr<armnn::AsyncExecutionCallback> cb = callbackManager.GetNewCallback();

461

inferenceOutputMap.insert({cb->GetInferenceId(), outputs[i]});

462

model.RunAsync(inputs[i], outputs[i], cb);

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

}

// Check the results

unsigned int j = 0;

Finn Williams

2021-06-09 17:07:33 +0100

[diff] [blame^]

467

for (size_t iteration = 0; iteration < params.m_SimultaneousIterations; ++iteration)

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

468

{

Finn Williams

2021-06-09 17:07:33 +0100

[diff] [blame^]

469

auto cb = callbackManager.GetNotifiedCallback();

470

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

471

// Get the results

472

auto endTime = time_point_cast<std::chrono::milliseconds>(cb->GetEndTime());

473

auto startTime = time_point_cast<std::chrono::milliseconds>(cb->GetStartTime());

474

auto inferenceDuration = endTime - startTime;

475

476

if (latestEndTime < cb->GetEndTime())

477

{

478

latestEndTime = cb->GetEndTime();

479

}

480

481

if (earliestStartTime.time_since_epoch().count() == 0)

482

{

483

earliestStartTime = cb->GetStartTime();

484

}

485

else if (earliestStartTime > cb->GetStartTime())

486

{

487

earliestStartTime = cb->GetStartTime();

488

}

489

490

if (params.m_GenerateTensorData)

491

{

492

ARMNN_LOG(warning) << "The input data was generated, note that the output will not be useful";

493

}

494

495

// Print output tensors

496

const auto& infosOut = model.GetOutputBindingInfos();

497

for (size_t i = 0; i < numOutputs; i++)

498

{

499

const armnn::TensorInfo& infoOut = infosOut[i].second;

500

auto outputTensorFile = params.m_OutputTensorFiles.empty()

501

? ""

502

: params.m_OutputTensorFiles[(j * numOutputs) + i];

503

504

TensorPrinter printer(inferenceModelParams.m_OutputBindings[i],

505

infoOut,

506

outputTensorFile,

507

params.m_DequantizeOutput);

Finn Williams

2021-06-09 17:07:33 +0100

[diff] [blame^]

508

mapbox::util::apply_visitor(printer, inferenceOutputMap.at(cb->GetInferenceId())[i]);

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

509

}

510

511

ARMNN_LOG(info) << "\nInference time: " << std::setprecision(2)

512

<< std::fixed << inferenceDuration.count() << " ms\n";

513

514

// If thresholdTime == 0.0 (default), then it hasn't been supplied at command line

515

if (params.m_ThresholdTime != 0.0)

516

{

517

ARMNN_LOG(info) << "Threshold time: " << std::setprecision(2)

518

<< std::fixed << params.m_ThresholdTime << " ms";

519

auto thresholdMinusInference =

520

params.m_ThresholdTime - duration<double, std::milli>(inferenceDuration).count();

521

ARMNN_LOG(info) << "Threshold time - Inference time: " << std::setprecision(2)

522

<< std::fixed << thresholdMinusInference << " ms" << "\n";

523

524

if (thresholdMinusInference < 0)

525

{

526

ARMNN_LOG(fatal) << "Elapsed inference time is greater than provided threshold time. \n";

}

}

++j;

}

//print duration difference between overallStartTime and overallEndTime

532

auto overallEndTime = time_point_cast<std::chrono::milliseconds>(latestEndTime);

533

auto overallStartTime = time_point_cast<std::chrono::milliseconds>(earliestStartTime);

534

auto totalInferenceDuration = overallEndTime - overallStartTime;

535

ARMNN_LOG(info) << "\nOverall Inference time: " << std::setprecision(2)

536

<< std::fixed << totalInferenceDuration.count() << " ms\n";

537

}

538

catch (const armnn::Exception& e)

539

{

540

ARMNN_LOG(fatal) << "Armnn Error: " << e.what();

return EXIT_FAILURE;

}

}

// Asynchronous execution using std::launch::async

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

else

{

try

{

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

549

ARMNN_LOG(info) << "Asynchronous Execution with std::launch:async... \n";

Finn Williams

2021-06-09 17:07:33 +0100

[diff] [blame^]

550

std::vector<std::future<std::tuple<unsigned int,

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

551

std::chrono::duration<double, std::milli>>>> inferenceResults;

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

552

inferenceResults.reserve(params.m_SimultaneousIterations);

553

554

// Create WorkingMemHandles for each inference

555

std::vector<std::unique_ptr<armnn::experimental::IWorkingMemHandle>> workingMemHandles;

556

workingMemHandles.reserve(params.m_SimultaneousIterations);

557

for (unsigned int i = 0; i < params.m_SimultaneousIterations; ++i)

558

{

559

workingMemHandles.push_back(model.CreateWorkingMemHandle());

560

}

561

562

// Run each inference in its own thread

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

563

// start a timer

564

const auto start_time = armnn::GetTimeNow();

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

565

for (unsigned int i = 0; i < params.m_SimultaneousIterations; ++i)

566

{

567

armnn::experimental::IWorkingMemHandle& workingMemHandleRef = *workingMemHandles[i].get();

Finn Williams

2021-06-09 17:07:33 +0100

[diff] [blame^]

568

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

569

inferenceResults.push_back(std::async(

570

std::launch::async, [&model, &workingMemHandleRef, &inputs, &outputs, i]() {

Finn Williams

2021-06-09 17:07:33 +0100

[diff] [blame^]

571

return model.RunAsync(workingMemHandleRef, inputs[i], outputs[i], i);

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

}

));

}

// Check the results

for (unsigned int j = 0; j < inferenceResults.size(); ++j)

578

{

579

// Get the results

580

auto inferenceResult = inferenceResults[j].get();

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

581

auto inferenceDuration = std::get<1>(inferenceResult);

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

582

auto inferenceID = std::get<0>(inferenceResult);

583

584

if (params.m_GenerateTensorData)

585

{

586

ARMNN_LOG(warning) << "The input data was generated, note that the output will not be useful";

587

}

588

589

// Print output tensors

590

const auto& infosOut = model.GetOutputBindingInfos();

591

for (size_t i = 0; i < numOutputs; i++)

592

{

593

const armnn::TensorInfo& infoOut = infosOut[i].second;

594

auto outputTensorFile = params.m_OutputTensorFiles.empty()

595

? ""

596

: params.m_OutputTensorFiles[(j * numOutputs) + i];

597

598

TensorPrinter printer(inferenceModelParams.m_OutputBindings[i],

599

infoOut,

600

outputTensorFile,

601

params.m_DequantizeOutput);

602

mapbox::util::apply_visitor(printer, outputs[j][i]);

603

}

604

605

ARMNN_LOG(info) << "\nInference time: " << std::setprecision(2)

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

606

<< std::fixed << inferenceDuration.count() << " ms\n";

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

607

608

// If thresholdTime == 0.0 (default), then it hasn't been supplied at command line

609

if (params.m_ThresholdTime != 0.0)

610

{

611

ARMNN_LOG(info) << "Threshold time: " << std::setprecision(2)

612

<< std::fixed << params.m_ThresholdTime << " ms";

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

613

auto thresholdMinusInference = params.m_ThresholdTime - inferenceDuration.count();

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

614

ARMNN_LOG(info) << "Threshold time - Inference time: " << std::setprecision(2)

615

<< std::fixed << thresholdMinusInference << " ms" << "\n";

616

617

if (thresholdMinusInference < 0)

618

{

619

ARMNN_LOG(fatal) << "Elapsed inference time is greater than provided threshold time. \n";

620

}

621

}

622

ARMNN_LOG(info) << "Asynchronous Execution is finished for Inference ID: " << inferenceID << " \n";

623

624

}

Kevin May

2021-05-21 16:42:21 +0100

[diff] [blame]

625

// finish timer

626

const auto duration = armnn::GetTimeDuration(start_time);

627

ARMNN_LOG(info) << "\nOverall Inference time: " << std::setprecision(2)

628

<< std::fixed << duration.count() << " ms\n";

Sadik Armagan

2021-04-27 10:02:10 +0100

[diff] [blame]

629

}

630

catch (const armnn::Exception& e)

631

{

632

ARMNN_LOG(fatal) << "Armnn Error: " << e.what();

633

return EXIT_FAILURE;

634

}

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

635

}

636

}

637

catch (const armnn::Exception& e)

638

{

639

ARMNN_LOG(fatal) << "Armnn Error: " << e.what();

return EXIT_FAILURE;

}

return EXIT_SUCCESS;

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

646

James Conroy

7b4886f

2019-04-11 10:23:58 +0100

[diff] [blame]

647

// MAIN

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

648

int main(int argc, const char* argv[])

649

{

650

// Configures logging for both the ARMNN library and this test program.

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

651

#ifdef NDEBUG

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

652

armnn::LogSeverity level = armnn::LogSeverity::Info;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

653

#else

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

654

armnn::LogSeverity level = armnn::LogSeverity::Debug;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

655

#endif

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

656

armnn::ConfigureLogging(true, true, level);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

657

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

658

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

659

// Get ExecuteNetwork parameters and runtime options from command line

660

ProgramOptions ProgramOptions(argc, argv);

Narumol Prangnawarat

d8cc811

2020-03-24 13:54:05 +0000

[diff] [blame]

661

Finn Williams

2020-04-23 17:55:18 +0100

[diff] [blame]

662

// Create runtime

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

663

std::shared_ptr<armnn::IRuntime> runtime(armnn::IRuntime::Create(ProgramOptions.m_RuntimeOptions));

Finn Williams

2020-04-23 17:55:18 +0100

[diff] [blame]

664

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

665

std::string modelFormat = ProgramOptions.m_ExNetParams.m_ModelFormat;

666

667

// Forward to implementation based on the parser type

668

if (modelFormat.find("armnn") != std::string::npos)

Finn Williams

2020-04-23 17:55:18 +0100

[diff] [blame]

669

{

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

670

#if defined(ARMNN_SERIALIZER)

671

return MainImpl<armnnDeserializer::IDeserializer, float>(ProgramOptions.m_ExNetParams, runtime);

672

#else

673

ARMNN_LOG(fatal) << "Not built with serialization support.";

Finn Williams

2020-04-23 17:55:18 +0100

[diff] [blame]

674

return EXIT_FAILURE;

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

675

#endif

Finn Williams

2020-04-23 17:55:18 +0100

[diff] [blame]

676

}

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

677

else if (modelFormat.find("onnx") != std::string::npos)

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

678

{

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

679

#if defined(ARMNN_ONNX_PARSER)

680

return MainImpl<armnnOnnxParser::IOnnxParser, float>(ProgramOptions.m_ExNetParams, runtime);

681

#else

682

ARMNN_LOG(fatal) << "Not built with Onnx parser support.";

683

return EXIT_FAILURE;

684

#endif

685

}

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

686

else if(modelFormat.find("tflite") != std::string::npos)

687

{

Finn Williams

2021-02-22 15:13:12 +0000

[diff] [blame]

688

if (ProgramOptions.m_ExNetParams.m_TfLiteExecutor == ExecuteNetworkParams::TfLiteExecutor::ArmNNTfLiteParser)

689

{

690

#if defined(ARMNN_TF_LITE_PARSER)

691

return MainImpl<armnnTfLiteParser::ITfLiteParser, float>(ProgramOptions.m_ExNetParams, runtime);

692

#else

693

ARMNN_LOG(fatal) << "Not built with Tensorflow-Lite parser support.";

return EXIT_FAILURE;

#endif

}

else if (ProgramOptions.m_ExNetParams.m_TfLiteExecutor ==

698

ExecuteNetworkParams::TfLiteExecutor::ArmNNTfLiteDelegate ||

699

ProgramOptions.m_ExNetParams.m_TfLiteExecutor ==

700

ExecuteNetworkParams::TfLiteExecutor::TfliteInterpreter)

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

701

{

702

#if defined(ARMNN_TF_LITE_DELEGATE)

703

return TfLiteDelegateMainImpl(ProgramOptions.m_ExNetParams, runtime);

704

#else

Finn Williams

2020-11-25 14:32:42 +0000

[diff] [blame]

705

ARMNN_LOG(fatal) << "Not built with Arm NN Tensorflow-Lite delegate support.";

Sadik Armagan

2020-11-17 16:43:56 +0000

[diff] [blame]

706

return EXIT_FAILURE;

707

#endif

708

}

Jan Eilers

2020-10-15 18:34:43 +0100

[diff] [blame]

}

else

{

ARMNN_LOG(fatal) << "Unknown model format: '" << modelFormat

Nikhil Raj

5d955cf

2021-04-19 16:59:48 +0100

[diff] [blame]

713

<< "'. Please include 'tflite' or 'onnx'";

Jan Eilers