Blame - ArmnnPreparedModel_1_2.cpp - ml/android-nn-driver

2019-06-11 16:35:25 +0100

[diff] [blame]

1

//

2

3

// SPDX-License-Identifier: MIT

4

//

5

6

#define LOG_TAG "ArmnnDriver"

7

8

#include "ArmnnPreparedModel_1_2.hpp"

9

#include "Utils.hpp"

10

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

11

#include <log/log.h>

12

#include <OperationsUtils.h>

13

#include <ExecutionBurstServer.h>

14

#include <ValidateHal.h>

#include <cassert>

#include <cinttypes>

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

19

#ifdef ARMNN_ANDROID_S

20

#include <LegacyUtils.h>

21

#endif

22

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

23

using namespace android;

24

using namespace android::hardware;

25

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

26

namespace {

27

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

28

static const V1_2::Timing g_NoTiming = {.timeOnDevice = UINT64_MAX, .timeInDriver = UINT64_MAX};

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

29

using namespace armnn_driver;

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

30

using TimePoint = std::chrono::steady_clock::time_point;

TimePoint Now()

{

return std::chrono::steady_clock::now();

35

}

36

37

unsigned long MicrosecondsDuration(TimePoint endPoint, TimePoint startPoint)

38

{

39

return static_cast<unsigned long>(std::chrono::duration_cast<std::chrono::microseconds>(

40

endPoint - startPoint).count());

41

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

42

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

43

void NotifyCallbackAndCheck(const ::android::sp<V1_0::IExecutionCallback>& callback,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

44

V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

45

std::vector<V1_2::OutputShape>,

46

const V1_2::Timing,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

47

std::string callingFunction)

48

{

49

Return<void> returned = callback->notify(errorStatus);

50

// This check is required, if the callback fails and it isn't checked it will bring down the service

51

if (!returned.isOk())

52

{

53

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

54

callingFunction.c_str(), returned.description().c_str());

}

}

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

58

void NotifyCallbackAndCheck(const ::android::sp<V1_2::IExecutionCallback>& callback,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

59

V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

60

std::vector<V1_2::OutputShape> outputShapes,

61

const V1_2::Timing timing,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

62

std::string callingFunction)

63

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

64

Return<void> returned = callback->notify_1_2(errorStatus, outputShapes, timing);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

65

// This check is required, if the callback fails and it isn't checked it will bring down the service

66

if (!returned.isOk())

67

{

68

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

69

callingFunction.c_str(), returned.description().c_str());

}

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

73

bool ValidateRequestArgument(const V1_0::RequestArgument& requestArg, const armnn::TensorInfo& tensorInfo)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

74

{

75

if (requestArg.dimensions.size() != 0)

76

{

77

if (requestArg.dimensions.size() != tensorInfo.GetNumDimensions())

78

{

79

ALOGE("Mismatched dimensions (request argument: %zu, expected: %u)",

80

requestArg.dimensions.size(), tensorInfo.GetNumDimensions());

return false;

}

for (unsigned int d = 0; d < tensorInfo.GetNumDimensions(); ++d)

85

{

Finn Williams

a4983ce

2020-07-23 12:55:12 +0100

[diff] [blame]

86

if (requestArg.dimensions[d] != 0 && requestArg.dimensions[d] != tensorInfo.GetShape()[d])

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

87

{

88

ALOGE("Mismatched size for dimension %d (request argument: %u, expected %u)",

89

d, requestArg.dimensions[d], tensorInfo.GetShape()[d]);

return false;

}

}

}

return true;

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

98

armnn::Tensor GetTensorForRequestArgument(const V1_0::RequestArgument& requestArg,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

99

const armnn::TensorInfo& tensorInfo,

100

const std::vector<::android::nn::RunTimePoolInfo>& requestPools)

101

{

102

if (!ValidateRequestArgument(requestArg, tensorInfo))

103

{

104

return armnn::Tensor();

105

}

106

107

return armnn::Tensor(tensorInfo, GetMemoryFromPool(requestArg.location, requestPools));

108

}

109

110

inline std::string BuildTensorName(const char* tensorNamePrefix, std::size_t index)

111

{

112

return tensorNamePrefix + std::to_string(index);

113

}

114

115

} // anonymous namespace

116

117

using namespace android::hardware;

118

119

namespace armnn_driver

120

{

121

122

template<typename HalVersion>

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

123

RequestThread<ArmnnPreparedModel_1_2, HalVersion, CallbackContext_1_2>

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

124

ArmnnPreparedModel_1_2<HalVersion>::m_RequestThread;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

125

126

template<typename HalVersion>

127

template<typename TensorBindingCollection>

128

void ArmnnPreparedModel_1_2<HalVersion>::DumpTensorsIfRequired(char const* tensorNamePrefix,

129

const TensorBindingCollection& tensorBindings)

130

{

131

if (!m_RequestInputsAndOutputsDumpDir.empty())

132

{

Colm Donelan

08d9a1c

2020-09-09 17:56:55 +0100

[diff] [blame]

133

const std::string requestName = std::to_string(m_NetworkId) + "_" + std::to_string(m_RequestCount) + ".dump";

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

134

for (std::size_t i = 0u; i < tensorBindings.size(); ++i)

135

{

136

DumpTensor(m_RequestInputsAndOutputsDumpDir,

137

requestName,

138

BuildTensorName(tensorNamePrefix, i),

139

tensorBindings[i].second);

}

}

}

template<typename HalVersion>

145

ArmnnPreparedModel_1_2<HalVersion>::ArmnnPreparedModel_1_2(armnn::NetworkId networkId,

146

armnn::IRuntime* runtime,

147

const V1_2::Model& model,

148

const std::string& requestInputsAndOutputsDumpDir,

149

const bool gpuProfilingEnabled)

150

: m_NetworkId(networkId)

, m_Runtime(runtime)

, m_Model(model)

, m_RequestCount(0)

, m_RequestInputsAndOutputsDumpDir(requestInputsAndOutputsDumpDir)

155

, m_GpuProfilingEnabled(gpuProfilingEnabled)

156

{

157

// Enable profiling if required.

158

m_Runtime->GetProfiler(m_NetworkId)->EnableProfiling(m_GpuProfilingEnabled);

159

}

160

161

template<typename HalVersion>

162

ArmnnPreparedModel_1_2<HalVersion>::~ArmnnPreparedModel_1_2()

163

{

164

// Get a hold of the profiler used by this model.

165

std::shared_ptr<armnn::IProfiler> profiler = m_Runtime->GetProfiler(m_NetworkId);

166

167

// Unload the network associated with this model.

168

m_Runtime->UnloadNetwork(m_NetworkId);

169

170

// Dump the profiling info to a file if required.

171

DumpJsonProfilingIfRequired(m_GpuProfilingEnabled, m_RequestInputsAndOutputsDumpDir, m_NetworkId, profiler.get());

172

}

173

174

template<typename HalVersion>

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

175

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::execute(const V1_0::Request& request,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

176

const ::android::sp<V1_0::IExecutionCallback>& callback)

177

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

178

if (callback.get() == nullptr)

179

{

180

ALOGE("ArmnnPreparedModel_1_2::execute invalid callback passed");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

181

return V1_0::ErrorStatus::INVALID_ARGUMENT;

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

182

}

183

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

184

auto cb = [callback](V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

185

std::vector<V1_2::OutputShape> outputShapes,

186

const V1_2::Timing& timing,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

187

std::string callingFunction)

188

{

189

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

190

};

191

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

192

return Execute(request, V1_2::MeasureTiming::NO, cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

193

}

194

195

template<typename HalVersion>

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

196

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::execute_1_2(

197

const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

198

V1_2::MeasureTiming measureTiming,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

199

const sp<V1_2::IExecutionCallback>& callback)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

200

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

201

if (callback.get() == nullptr)

202

{

203

ALOGE("ArmnnPreparedModel_1_2::execute_1_2 invalid callback passed");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

204

return V1_0::ErrorStatus::INVALID_ARGUMENT;

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

205

}

206

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

207

auto cb = [callback](V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

208

std::vector<V1_2::OutputShape> outputShapes,

209

const V1_2::Timing& timing,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

210

std::string callingFunction)

211

{

212

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

213

};

214

215

return Execute(request, measureTiming, cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

216

}

217

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

218

template<typename HalVersion>

219

Return<V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::PrepareMemoryForInputs(

220

armnn::InputTensors& inputs,

221

const V1_0::Request& request,

222

const std::vector<android::nn::RunTimePoolInfo>& memPools)

223

{

224

inputs.reserve(request.inputs.size());

225

for (unsigned int i = 0; i < request.inputs.size(); i++)

226

{

227

const auto& inputArg = request.inputs[i];

228

229

const armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

230

const armnn::Tensor inputTensor = GetTensorForRequestArgument(inputArg, inputTensorInfo, memPools);

231

232

if (inputTensor.GetMemoryArea() == nullptr)

233

{

234

ALOGE("Cannot execute request. Error converting request input %u to tensor", i);

235

return V1_0::ErrorStatus::GENERAL_FAILURE;

236

}

237

238

inputs.emplace_back(i, inputTensor);

239

}

240

241

return V1_0::ErrorStatus::NONE;

242

}

243

244

template<typename HalVersion>

245

Return<V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::PrepareMemoryForOutputs(

246

armnn::OutputTensors& outputs,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

247

std::vector<V1_2::OutputShape> &outputShapes,

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

248

const V1_0::Request& request,

249

const std::vector<android::nn::RunTimePoolInfo>& memPools)

250

{

251

outputs.reserve(request.outputs.size());

252

for (unsigned int i = 0; i < request.outputs.size(); i++)

253

{

254

const auto& outputArg = request.outputs[i];

255

256

const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

257

const armnn::Tensor outputTensor = GetTensorForRequestArgument(outputArg, outputTensorInfo, memPools);

258

if (outputTensor.GetMemoryArea() == nullptr)

259

{

260

ALOGE("Cannot execute request. Error converting request output %u to tensor", i);

261

return V1_0::ErrorStatus::GENERAL_FAILURE;

262

}

263

264

const size_t outputSize = outputTensorInfo.GetNumBytes();

Finn Williams

a4983ce

2020-07-23 12:55:12 +0100

[diff] [blame]

265

266

if (outputArg.location.length < outputSize)

267

{

268

ALOGW("ArmnnPreparedModel_1_2::Execute failed: outputArg.location.length < outputSize");

269

return V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

270

}

271

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

272

#if !defined(ARMNN_ANDROID_S)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

273

const size_t bufferSize = memPools.at(outputArg.location.poolIndex).getHidlMemory().size();

274

if (bufferSize < outputSize)

275

{

Finn Williams

a4983ce

2020-07-23 12:55:12 +0100

[diff] [blame]

276

ALOGW("ArmnnPreparedModel_1_2::Execute failed: bufferSize < outputSize");

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

277

return V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

278

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

279

#else

280

const size_t bufferSize = memPools.at(outputArg.location.poolIndex).getMemory().size;

281

if (bufferSize < outputSize)

282

{

283

ALOGW("ArmnnPreparedModel_1_2::Execute failed bufferSize (%s) < outputSize (%s)",

284

std::to_string(bufferSize).c_str(), std::to_string(outputSize).c_str());

285

outputShapes[i].isSufficient = false;

286

return V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

287

}

288

#endif

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

289

outputs.emplace_back(i, outputTensor);

290

outputShapes[i] = ComputeShape(outputTensorInfo);

291

}

292

293

return V1_0::ErrorStatus::NONE;

294

}

295

296

template<typename HalVersion>

297

Return<V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::PrepareMemoryForIO(

298

armnn::InputTensors& inputs,

299

armnn::OutputTensors& outputs,

300

std::vector<android::nn::RunTimePoolInfo>& memPools,

301

const V1_0::Request& request,

302

CallbackAsync_1_2 callback)

303

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

304

#if !defined(ARMNN_ANDROID_S)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

305

if (!setRunTimePoolInfosFromHidlMemories(&memPools, request.pools))

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

306

#else

307

if (!setRunTimePoolInfosFromCanonicalMemories(&memPools, uncheckedConvert(request.pools)))

308

#endif

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

309

{

310

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

311

return V1_0::ErrorStatus::GENERAL_FAILURE;

312

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

313

// add the inputs and outputs with their data

314

try

315

{

316

if (PrepareMemoryForInputs(inputs, request, memPools) != V1_0::ErrorStatus::NONE)

317

{

318

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

319

return V1_0::ErrorStatus::GENERAL_FAILURE;

320

}

321

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

322

std::vector<V1_2::OutputShape> outputShapes(request.outputs.size());

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

323

324

auto errorStatus = PrepareMemoryForOutputs(outputs, outputShapes, request, memPools);

325

if (errorStatus != V1_0::ErrorStatus::NONE)

326

{

327

callback(errorStatus,

328

outputShapes,

329

g_NoTiming,

330

"ArmnnPreparedModel_1_2::Execute");

return errorStatus;

}

}

catch (armnn::Exception& e)

335

{

336

ALOGW("armnn::Exception caught while preparing for EnqueueWorkload: %s", e.what());

337

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

338

return V1_0::ErrorStatus::GENERAL_FAILURE;

339

}

340

catch (std::exception& e)

341

{

342

ALOGE("std::exception caught while preparing for EnqueueWorkload: %s", e.what());

343

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

344

return V1_0::ErrorStatus::GENERAL_FAILURE;

345

}

346

347

return V1_0::ErrorStatus::NONE;

348

}

349

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

350

template<typename HalVersion>

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

351

Return<void> ArmnnPreparedModel_1_2<HalVersion>::executeSynchronously(const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

352

V1_2::MeasureTiming measureTiming,

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

353

executeSynchronously_cb cb)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

354

{

355

ALOGV("ArmnnPreparedModel_1_2::executeSynchronously(): %s", GetModelSummary(m_Model).c_str());

m_RequestCount++;

if (cb == nullptr)

{

ALOGE("ArmnnPreparedModel_1_2::executeSynchronously invalid callback passed");

return Void();

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

364

TimePoint driverStart;

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

365

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

366

if (measureTiming == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

{

driverStart = Now();

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

371

if (!android::nn::validateRequest(request, m_Model))

372

{

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

373

ALOGE("ArmnnPreparedModel_1_2::executeSynchronously invalid request model");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

374

cb(V1_0::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

return Void();

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

378

auto cbWrapper = [cb](V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

379

std::vector<V1_2::OutputShape> outputShapes,

380

const V1_2::Timing& timing,

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

381

std::string)

382

{

383

cb(errorStatus, outputShapes, timing);

384

};

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

385

386

// map the memory pool into shared pointers

387

// use a shared memory pools vector on the heap, as it is passed to the request thread

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

388

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

389

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

390

// allocate the tensors on the heap, as they are passed to the request thread

391

auto inputs = std::make_shared<armnn::InputTensors>();

392

auto outputs = std::make_shared<armnn::OutputTensors>();

393

394

auto prepareStatus = PrepareMemoryForIO(*inputs, *outputs, *memPools, request, cbWrapper);

395

if (prepareStatus != V1_0::ErrorStatus::NONE)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

396

{

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

return Void();

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

400

ALOGV("ArmnnPreparedModel_1_2::executeSynchronously() before Execution");

401

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

402

CallbackContext_1_2 cbCtx;

403

cbCtx.callback = cbWrapper;

404

cbCtx.ctx.measureTimings = measureTiming;

405

cbCtx.ctx.driverStart = driverStart;

406

ExecuteGraph(memPools, *inputs, *outputs, cbCtx);

return Void();

}

template<typename HalVersion>

412

template<typename CallbackContext>

413

bool ArmnnPreparedModel_1_2<HalVersion>::ExecuteGraph(

414

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

415

armnn::InputTensors& inputTensors,

416

armnn::OutputTensors& outputTensors,

417

CallbackContext cb)

418

{

419

ALOGV("ArmnnPreparedModel_1_2::ExecuteGraph(...)");

420

421

TimePoint driverEnd, deviceStart, deviceEnd;

422

423

DumpTensorsIfRequired("Input", inputTensors);

424

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

425

std::vector<V1_2::OutputShape> outputShapes(outputTensors.size());

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

426

for (unsigned int i = 0; i < outputTensors.size(); i++)

427

{

428

std::pair<int, armnn::Tensor> outputTensorPair = outputTensors[i];

429

const armnn::Tensor outputTensor = outputTensorPair.second;

430

const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();

431

432

outputShapes[i] = ComputeShape(outputTensorInfo);

433

}

434

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

435

// run it

436

try

437

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

438

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

{

deviceStart = Now();

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

443

armnn::Status status = m_Runtime->EnqueueWorkload(m_NetworkId, inputTensors, outputTensors);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

444

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

445

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

446

{

447

deviceEnd = Now();

448

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

449

if (status != armnn::Status::Success)

450

{

451

ALOGW("EnqueueWorkload failed");

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

452

cb.callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming,

453

"ArmnnPreparedModel_1_2::ExecuteGraph");

454

return false;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

455

}

456

}

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

457

catch (armnn::Exception& e)

458

{

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

459

ALOGW("armnn:Exception caught from EnqueueWorkload: %s", e.what());

460

cb.callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

461

return false;

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

462

}

Derek Lamberti

b9cb844

2019-11-28 13:34:48 +0000

[diff] [blame]

463

catch (std::exception& e)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

464

{

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

465

ALOGE("std::exception caught from EnqueueWorkload: %s", e.what());

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

466

cb.callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

467

return false;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

468

}

469

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

470

CommitPools(*pMemPools);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

471

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

472

DumpTensorsIfRequired("Output", outputTensors);

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

473

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

474

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

475

{

476

driverEnd = Now();

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

477

V1_2::Timing timing;

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

478

timing.timeOnDevice = MicrosecondsDuration(deviceEnd, deviceStart);

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

479

timing.timeInDriver = MicrosecondsDuration(driverEnd, cb.ctx.driverStart);

480

ALOGV("ArmnnPreparedModel_1_2::execute timing - Device = %lu Driver = %lu", timing.timeOnDevice,

481

timing.timeInDriver);

482

cb.callback(V1_0::ErrorStatus::NONE, outputShapes, timing, "ArmnnPreparedModel_1_2::ExecuteGraph");

483

} else {

484

cb.callback(V1_0::ErrorStatus::NONE, outputShapes, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

485

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

486

487

return true;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

488

}

489

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

490

template<typename HalVersion>

491

bool ArmnnPreparedModel_1_2<HalVersion>::ExecuteWithDummyInputs()

492

{

493

std::vector<std::vector<char>> storage;

494

armnn::InputTensors inputTensors;

Kevin May

42477c1

2020-03-26 13:34:14 +0000

[diff] [blame]

495

for (unsigned int i = 0; i < getMainModel(m_Model).inputIndexes.size(); i++)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

496

{

497

const armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

498

storage.emplace_back(inputTensorInfo.GetNumBytes());

499

const armnn::ConstTensor inputTensor(inputTensorInfo, storage.back().data());

500

501

inputTensors.emplace_back(i, inputTensor);

502

}

503

504

armnn::OutputTensors outputTensors;

Kevin May

42477c1

2020-03-26 13:34:14 +0000

[diff] [blame]

505

for (unsigned int i = 0; i < getMainModel(m_Model).outputIndexes.size(); i++)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

506

{

507

const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

508

storage.emplace_back(outputTensorInfo.GetNumBytes());

509

const armnn::Tensor outputTensor(outputTensorInfo, storage.back().data());

510

511

outputTensors.emplace_back(i, outputTensor);

512

}

513

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

514

auto nullCallback = [](V1_0::ErrorStatus, std::vector<V1_2::OutputShape>, const V1_2::Timing&, std::string) {};

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

515

CallbackContext_1_2 callbackContext;

516

callbackContext.callback = nullCallback;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

517

callbackContext.ctx.measureTimings = V1_2::MeasureTiming::NO;

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

518

auto memPools = std::make_shared<std::vector<::android::nn::RunTimePoolInfo>>();

519

return ExecuteGraph(memPools,

inputTensors,

outputTensors,

callbackContext);

}

template<typename HalVersion>

526

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::Execute(const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

527

V1_2::MeasureTiming measureTiming,

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

528

CallbackAsync_1_2 callback)

529

{

530

ExecutionContext_1_2 ctx;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

531

if (measureTiming == V1_2::MeasureTiming::YES)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

532

{

533

ctx.measureTimings = measureTiming;

534

ctx.driverStart = Now();

535

}

536

537

ALOGV("ArmnnPreparedModel_1_2::execute(): %s", GetModelSummary(m_Model).c_str());

538

m_RequestCount++;

539

540

if (!android::nn::validateRequest(request, m_Model))

541

{

542

callback(V1_0::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

543

return V1_0::ErrorStatus::INVALID_ARGUMENT;

544

}

545

546

if (!m_RequestInputsAndOutputsDumpDir.empty())

547

{

548

ALOGD("Dumping inputs and outputs for request %" PRIuPTR, reinterpret_cast<std::uintptr_t>(&callback));

549

}

550

551

// map the memory pool into shared pointers

552

// use a shared memory pools vector on the heap, as it is passed to the request thread

553

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

554

555

// allocate the tensors on the heap, as they are passed to the request thread

556

auto inputTensors = std::make_shared<armnn::InputTensors>();

557

auto outputTensors = std::make_shared<armnn::OutputTensors>();

558

559

auto prepareStatus = PrepareMemoryForIO(*inputTensors, *outputTensors, *memPools, request, callback);

560

switch(prepareStatus)

561

{

562

case V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE:

563

return V1_0::ErrorStatus::NONE;

564

case V1_0::ErrorStatus::GENERAL_FAILURE:

565

return V1_0::ErrorStatus::GENERAL_FAILURE;

default:

{}

}

ALOGV("ArmnnPreparedModel_1_2::execute(...) before PostMsg");

571

572

// post the request for asynchronous execution

573

CallbackContext_1_2 cb;

574

cb.callback = callback;

575

cb.ctx = ctx;

576

m_RequestThread.PostMsg(this, memPools, inputTensors, outputTensors, cb);

577

ALOGV("ArmnnPreparedModel_1_2::execute(...) after PostMsg");

578

return V1_0::ErrorStatus::NONE;

579

}

580

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

581

template<typename HalVersion>

582

Return<void> ArmnnPreparedModel_1_2<HalVersion>::configureExecutionBurst(

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

583

const sp<V1_2::IBurstCallback>& callback,

584

const MQDescriptorSync<V1_2::FmqRequestDatum>& requestChannel,

585

const MQDescriptorSync<V1_2::FmqResultDatum>& resultChannel,

586

V1_2::IPreparedModel::configureExecutionBurst_cb cb)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

587

{

588

ALOGV("ArmnnPreparedModel_1_2::configureExecutionBurst");

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

589

const sp<V1_2::IBurstContext> burst = ExecutionBurstServer::create(callback,

590

requestChannel,

591

resultChannel,

Kevin May

42477c1

2020-03-26 13:34:14 +0000

[diff] [blame]

592

this);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

593

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

594

if (burst == nullptr)

595

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

596

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {});

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

597

}

598

else

599

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

600

cb(V1_0::ErrorStatus::NONE, burst);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

}

return Void();

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

605

#if defined(ARMNN_ANDROID_NN_V1_2) || defined(ARMNN_ANDROID_NN_V1_3)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

606

template class ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>;

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

607

template bool ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>::ExecuteGraph<CallbackContext_1_2>(

608

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

609

armnn::InputTensors& pInputTensors,

610

armnn::OutputTensors& pOutputTensors,

611

CallbackContext_1_2 cb);

Mike Kelly