Blame - ArmnnPreparedModel_1_2.cpp - ml/android-nn-driver

2019-06-11 16:35:25 +0100

[diff] [blame]

1

//

2

3

// SPDX-License-Identifier: MIT

4

//

5

6

#define LOG_TAG "ArmnnDriver"

7

8

#include "ArmnnPreparedModel_1_2.hpp"

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

9

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

10

#include "Utils.hpp"

11

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

12

#include <log/log.h>

13

#include <OperationsUtils.h>

14

#include <ExecutionBurstServer.h>

15

#include <ValidateHal.h>

#include <cassert>

#include <cinttypes>

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

20

#ifdef ARMNN_ANDROID_S

21

#include <LegacyUtils.h>

22

#endif

23

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

24

using namespace android;

25

using namespace android::hardware;

26

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

27

namespace {

28

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

29

static const V1_2::Timing g_NoTiming = {.timeOnDevice = UINT64_MAX, .timeInDriver = UINT64_MAX};

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

30

using namespace armnn_driver;

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

31

using TimePoint = std::chrono::steady_clock::time_point;

TimePoint Now()

{

return std::chrono::steady_clock::now();

36

}

37

38

unsigned long MicrosecondsDuration(TimePoint endPoint, TimePoint startPoint)

39

{

40

return static_cast<unsigned long>(std::chrono::duration_cast<std::chrono::microseconds>(

41

endPoint - startPoint).count());

42

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

43

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

44

void NotifyCallbackAndCheck(const ::android::sp<V1_0::IExecutionCallback>& callback,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

45

V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

46

std::vector<V1_2::OutputShape>,

47

const V1_2::Timing,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

48

std::string callingFunction)

49

{

50

Return<void> returned = callback->notify(errorStatus);

51

// This check is required, if the callback fails and it isn't checked it will bring down the service

52

if (!returned.isOk())

53

{

54

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

55

callingFunction.c_str(), returned.description().c_str());

}

}

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

59

void NotifyCallbackAndCheck(const ::android::sp<V1_2::IExecutionCallback>& callback,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

60

V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

61

std::vector<V1_2::OutputShape> outputShapes,

62

const V1_2::Timing timing,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

63

std::string callingFunction)

64

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

65

Return<void> returned = callback->notify_1_2(errorStatus, outputShapes, timing);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

66

// This check is required, if the callback fails and it isn't checked it will bring down the service

67

if (!returned.isOk())

68

{

69

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

70

callingFunction.c_str(), returned.description().c_str());

}

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

74

bool ValidateRequestArgument(const V1_0::RequestArgument& requestArg, const armnn::TensorInfo& tensorInfo)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

75

{

76

if (requestArg.dimensions.size() != 0)

77

{

78

if (requestArg.dimensions.size() != tensorInfo.GetNumDimensions())

79

{

80

ALOGE("Mismatched dimensions (request argument: %zu, expected: %u)",

81

requestArg.dimensions.size(), tensorInfo.GetNumDimensions());

return false;

}

for (unsigned int d = 0; d < tensorInfo.GetNumDimensions(); ++d)

86

{

Finn Williams

a4983ce

2020-07-23 12:55:12 +0100

[diff] [blame]

87

if (requestArg.dimensions[d] != 0 && requestArg.dimensions[d] != tensorInfo.GetShape()[d])

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

88

{

89

ALOGE("Mismatched size for dimension %d (request argument: %u, expected %u)",

90

d, requestArg.dimensions[d], tensorInfo.GetShape()[d]);

return false;

}

}

}

return true;

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

99

armnn::Tensor GetTensorForRequestArgument(const V1_0::RequestArgument& requestArg,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

100

const armnn::TensorInfo& tensorInfo,

101

const std::vector<::android::nn::RunTimePoolInfo>& requestPools)

102

{

103

if (!ValidateRequestArgument(requestArg, tensorInfo))

104

{

105

return armnn::Tensor();

106

}

107

108

return armnn::Tensor(tensorInfo, GetMemoryFromPool(requestArg.location, requestPools));

109

}

110

111

inline std::string BuildTensorName(const char* tensorNamePrefix, std::size_t index)

112

{

113

return tensorNamePrefix + std::to_string(index);

114

}

115

116

} // anonymous namespace

117

118

using namespace android::hardware;

119

120

namespace armnn_driver

121

{

122

123

template<typename HalVersion>

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

124

RequestThread<ArmnnPreparedModel_1_2, HalVersion, CallbackContext_1_2>

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

125

ArmnnPreparedModel_1_2<HalVersion>::m_RequestThread;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

126

127

template<typename HalVersion>

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

128

std::unique_ptr<armnn::Threadpool> ArmnnPreparedModel_1_2<HalVersion>::m_Threadpool(nullptr);

129

130

template<typename HalVersion>

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

131

template<typename TensorBindingCollection>

132

void ArmnnPreparedModel_1_2<HalVersion>::DumpTensorsIfRequired(char const* tensorNamePrefix,

133

const TensorBindingCollection& tensorBindings)

134

{

135

if (!m_RequestInputsAndOutputsDumpDir.empty())

136

{

Colm Donelan

08d9a1c

2020-09-09 17:56:55 +0100

[diff] [blame]

137

const std::string requestName = std::to_string(m_NetworkId) + "_" + std::to_string(m_RequestCount) + ".dump";

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

138

for (std::size_t i = 0u; i < tensorBindings.size(); ++i)

139

{

140

DumpTensor(m_RequestInputsAndOutputsDumpDir,

141

requestName,

142

BuildTensorName(tensorNamePrefix, i),

143

tensorBindings[i].second);

}

}

}

template<typename HalVersion>

149

ArmnnPreparedModel_1_2<HalVersion>::ArmnnPreparedModel_1_2(armnn::NetworkId networkId,

150

armnn::IRuntime* runtime,

151

const V1_2::Model& model,

152

const std::string& requestInputsAndOutputsDumpDir,

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

153

const bool gpuProfilingEnabled,

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

154

const bool asyncModelExecutionEnabled,

155

const unsigned int numberOfThreads)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

156

: m_NetworkId(networkId)

, m_Runtime(runtime)

, m_Model(model)

, m_RequestCount(0)

, m_RequestInputsAndOutputsDumpDir(requestInputsAndOutputsDumpDir)

161

, m_GpuProfilingEnabled(gpuProfilingEnabled)

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

162

, m_AsyncModelExecutionEnabled(asyncModelExecutionEnabled)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

163

{

164

// Enable profiling if required.

165

m_Runtime->GetProfiler(m_NetworkId)->EnableProfiling(m_GpuProfilingEnabled);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

166

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

167

if (m_AsyncModelExecutionEnabled)

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

168

{

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

169

std::vector<std::shared_ptr<armnn::IWorkingMemHandle>> memHandles;

Finn Williams

d27c13b

2021-06-25 10:06:09 +0100

[diff] [blame]

170

for (unsigned int i=0; i < numberOfThreads; ++i)

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

171

{

172

memHandles.emplace_back(m_Runtime->CreateWorkingMemHandle(networkId));

173

}

174

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

175

if (!m_Threadpool)

176

{

177

m_Threadpool = std::make_unique<armnn::Threadpool>(numberOfThreads, runtime, memHandles);

}

else

{

m_Threadpool->LoadMemHandles(memHandles);

182

}

183

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

184

m_WorkingMemHandle = memHandles.back();

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

185

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

186

}

187

188

template<typename HalVersion>

189

ArmnnPreparedModel_1_2<HalVersion>::~ArmnnPreparedModel_1_2()

190

{

191

// Get a hold of the profiler used by this model.

192

std::shared_ptr<armnn::IProfiler> profiler = m_Runtime->GetProfiler(m_NetworkId);

193

194

// Unload the network associated with this model.

195

m_Runtime->UnloadNetwork(m_NetworkId);

196

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

197

// Unload the network memhandles from the threadpool

198

if (m_AsyncModelExecutionEnabled)

199

{

200

m_Threadpool->UnloadMemHandles(m_NetworkId);

201

}

202

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

203

// Dump the profiling info to a file if required.

204

DumpJsonProfilingIfRequired(m_GpuProfilingEnabled, m_RequestInputsAndOutputsDumpDir, m_NetworkId, profiler.get());

205

}

206

207

template<typename HalVersion>

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

208

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::execute(const V1_0::Request& request,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

209

const ::android::sp<V1_0::IExecutionCallback>& callback)

210

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

211

if (callback.get() == nullptr)

212

{

213

ALOGE("ArmnnPreparedModel_1_2::execute invalid callback passed");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

214

return V1_0::ErrorStatus::INVALID_ARGUMENT;

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

215

}

216

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

217

auto cb = [callback](V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

218

std::vector<V1_2::OutputShape> outputShapes,

219

const V1_2::Timing& timing,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

220

std::string callingFunction)

221

{

222

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

223

};

224

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

225

return Execute(request, V1_2::MeasureTiming::NO, cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

226

}

227

228

template<typename HalVersion>

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

229

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::execute_1_2(

230

const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

231

V1_2::MeasureTiming measureTiming,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

232

const sp<V1_2::IExecutionCallback>& callback)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

233

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

234

if (callback.get() == nullptr)

235

{

236

ALOGE("ArmnnPreparedModel_1_2::execute_1_2 invalid callback passed");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

237

return V1_0::ErrorStatus::INVALID_ARGUMENT;

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

238

}

239

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

240

auto cb = [callback](V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

241

std::vector<V1_2::OutputShape> outputShapes,

242

const V1_2::Timing& timing,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

243

std::string callingFunction)

244

{

245

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

246

};

247

248

return Execute(request, measureTiming, cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

249

}

250

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

251

template<typename HalVersion>

252

Return<V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::PrepareMemoryForInputs(

253

armnn::InputTensors& inputs,

254

const V1_0::Request& request,

255

const std::vector<android::nn::RunTimePoolInfo>& memPools)

256

{

257

inputs.reserve(request.inputs.size());

258

for (unsigned int i = 0; i < request.inputs.size(); i++)

259

{

260

const auto& inputArg = request.inputs[i];

261

262

const armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

263

const armnn::Tensor inputTensor = GetTensorForRequestArgument(inputArg, inputTensorInfo, memPools);

264

265

if (inputTensor.GetMemoryArea() == nullptr)

266

{

267

ALOGE("Cannot execute request. Error converting request input %u to tensor", i);

268

return V1_0::ErrorStatus::GENERAL_FAILURE;

269

}

270

271

inputs.emplace_back(i, inputTensor);

272

}

273

274

return V1_0::ErrorStatus::NONE;

275

}

276

277

template<typename HalVersion>

278

Return<V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::PrepareMemoryForOutputs(

279

armnn::OutputTensors& outputs,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

280

std::vector<V1_2::OutputShape> &outputShapes,

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

281

const V1_0::Request& request,

282

const std::vector<android::nn::RunTimePoolInfo>& memPools)

283

{

284

outputs.reserve(request.outputs.size());

285

for (unsigned int i = 0; i < request.outputs.size(); i++)

286

{

287

const auto& outputArg = request.outputs[i];

288

289

const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

290

const armnn::Tensor outputTensor = GetTensorForRequestArgument(outputArg, outputTensorInfo, memPools);

291

if (outputTensor.GetMemoryArea() == nullptr)

292

{

293

ALOGE("Cannot execute request. Error converting request output %u to tensor", i);

294

return V1_0::ErrorStatus::GENERAL_FAILURE;

295

}

296

297

const size_t outputSize = outputTensorInfo.GetNumBytes();

Finn Williams

a4983ce

2020-07-23 12:55:12 +0100

[diff] [blame]

298

299

if (outputArg.location.length < outputSize)

300

{

301

ALOGW("ArmnnPreparedModel_1_2::Execute failed: outputArg.location.length < outputSize");

302

return V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

303

}

304

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

305

#if !defined(ARMNN_ANDROID_S)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

306

const size_t bufferSize = memPools.at(outputArg.location.poolIndex).getHidlMemory().size();

307

if (bufferSize < outputSize)

308

{

Finn Williams

a4983ce

2020-07-23 12:55:12 +0100

[diff] [blame]

309

ALOGW("ArmnnPreparedModel_1_2::Execute failed: bufferSize < outputSize");

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

310

return V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

311

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

312

#else

Kevin May

dc873f6

2021-06-14 11:21:11 +0100

[diff] [blame]

313

const size_t bufferSize = memPools.at(outputArg.location.poolIndex).getSize();

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

314

if (bufferSize < outputSize)

315

{

316

ALOGW("ArmnnPreparedModel_1_2::Execute failed bufferSize (%s) < outputSize (%s)",

317

std::to_string(bufferSize).c_str(), std::to_string(outputSize).c_str());

318

outputShapes[i].isSufficient = false;

319

return V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

320

}

321

#endif

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

322

outputs.emplace_back(i, outputTensor);

323

outputShapes[i] = ComputeShape(outputTensorInfo);

324

}

325

326

return V1_0::ErrorStatus::NONE;

327

}

328

329

template<typename HalVersion>

330

Return<V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::PrepareMemoryForIO(

331

armnn::InputTensors& inputs,

332

armnn::OutputTensors& outputs,

333

std::vector<android::nn::RunTimePoolInfo>& memPools,

334

const V1_0::Request& request,

335

CallbackAsync_1_2 callback)

336

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

337

#if !defined(ARMNN_ANDROID_S)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

338

if (!setRunTimePoolInfosFromHidlMemories(&memPools, request.pools))

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

339

#else

340

if (!setRunTimePoolInfosFromCanonicalMemories(&memPools, uncheckedConvert(request.pools)))

341

#endif

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

342

{

343

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

344

return V1_0::ErrorStatus::GENERAL_FAILURE;

345

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

346

// add the inputs and outputs with their data

347

try

348

{

349

if (PrepareMemoryForInputs(inputs, request, memPools) != V1_0::ErrorStatus::NONE)

350

{

351

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

352

return V1_0::ErrorStatus::GENERAL_FAILURE;

353

}

354

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

355

std::vector<V1_2::OutputShape> outputShapes(request.outputs.size());

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

356

357

auto errorStatus = PrepareMemoryForOutputs(outputs, outputShapes, request, memPools);

358

if (errorStatus != V1_0::ErrorStatus::NONE)

359

{

360

callback(errorStatus,

361

outputShapes,

362

g_NoTiming,

363

"ArmnnPreparedModel_1_2::Execute");

return errorStatus;

}

}

catch (armnn::Exception& e)

368

{

369

ALOGW("armnn::Exception caught while preparing for EnqueueWorkload: %s", e.what());

370

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

371

return V1_0::ErrorStatus::GENERAL_FAILURE;

372

}

373

catch (std::exception& e)

374

{

375

ALOGE("std::exception caught while preparing for EnqueueWorkload: %s", e.what());

376

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

377

return V1_0::ErrorStatus::GENERAL_FAILURE;

378

}

379

380

return V1_0::ErrorStatus::NONE;

381

}

382

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

383

template<typename HalVersion>

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

384

Return<void> ArmnnPreparedModel_1_2<HalVersion>::executeSynchronously(const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

385

V1_2::MeasureTiming measureTiming,

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

386

executeSynchronously_cb cb)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

387

{

388

ALOGV("ArmnnPreparedModel_1_2::executeSynchronously(): %s", GetModelSummary(m_Model).c_str());

m_RequestCount++;

if (cb == nullptr)

{

ALOGE("ArmnnPreparedModel_1_2::executeSynchronously invalid callback passed");

return Void();

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

397

TimePoint driverStart;

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

398

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

399

if (measureTiming == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

{

driverStart = Now();

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

404

if (!android::nn::validateRequest(request, m_Model))

405

{

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

406

ALOGE("ArmnnPreparedModel_1_2::executeSynchronously invalid request model");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

407

cb(V1_0::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

return Void();

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

411

auto cbWrapper = [cb](V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

412

std::vector<V1_2::OutputShape> outputShapes,

413

const V1_2::Timing& timing,

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

414

std::string)

415

{

416

cb(errorStatus, outputShapes, timing);

417

};

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

418

419

// map the memory pool into shared pointers

420

// use a shared memory pools vector on the heap, as it is passed to the request thread

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

421

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

422

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

423

// allocate the tensors on the heap, as they are passed to the request thread

424

auto inputs = std::make_shared<armnn::InputTensors>();

425

auto outputs = std::make_shared<armnn::OutputTensors>();

426

427

auto prepareStatus = PrepareMemoryForIO(*inputs, *outputs, *memPools, request, cbWrapper);

428

if (prepareStatus != V1_0::ErrorStatus::NONE)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

429

{

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

return Void();

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

433

ALOGV("ArmnnPreparedModel_1_2::executeSynchronously() before Execution");

434

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

435

CallbackContext_1_2 cbCtx;

436

cbCtx.callback = cbWrapper;

437

cbCtx.ctx.measureTimings = measureTiming;

438

cbCtx.ctx.driverStart = driverStart;

439

ExecuteGraph(memPools, *inputs, *outputs, cbCtx);

return Void();

}

template<typename HalVersion>

445

template<typename CallbackContext>

446

bool ArmnnPreparedModel_1_2<HalVersion>::ExecuteGraph(

447

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

448

armnn::InputTensors& inputTensors,

449

armnn::OutputTensors& outputTensors,

450

CallbackContext cb)

451

{

452

ALOGV("ArmnnPreparedModel_1_2::ExecuteGraph(...)");

453

454

TimePoint driverEnd, deviceStart, deviceEnd;

455

456

DumpTensorsIfRequired("Input", inputTensors);

457

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

458

std::vector<V1_2::OutputShape> outputShapes(outputTensors.size());

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

459

for (unsigned int i = 0; i < outputTensors.size(); i++)

460

{

461

std::pair<int, armnn::Tensor> outputTensorPair = outputTensors[i];

462

const armnn::Tensor outputTensor = outputTensorPair.second;

463

const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();

464

465

outputShapes[i] = ComputeShape(outputTensorInfo);

466

}

467

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

468

// run it

469

try

470

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

471

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

{

deviceStart = Now();

}

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

476

armnn::Status status;

477

if (m_AsyncModelExecutionEnabled)

478

{

479

ALOGW("ArmnnPreparedModel_1_2::ExecuteGraph m_AsyncModelExecutionEnabled true");

480

status = m_Runtime->Execute(*m_WorkingMemHandle, inputTensors, outputTensors);

}

else

{

ALOGW("ArmnnPreparedModel_1_2::ExecuteGraph m_AsyncModelExecutionEnabled false");

485

status = m_Runtime->EnqueueWorkload(m_NetworkId, inputTensors, outputTensors);

486

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

487

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

488

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

489

{

490

deviceEnd = Now();

491

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

492

if (status != armnn::Status::Success)

493

{

494

ALOGW("EnqueueWorkload failed");

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

495

cb.callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming,

496

"ArmnnPreparedModel_1_2::ExecuteGraph");

497

return false;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

498

}

499

}

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

500

catch (armnn::Exception& e)

501

{

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

502

ALOGW("armnn:Exception caught from EnqueueWorkload: %s", e.what());

503

cb.callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

504

return false;

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

505

}

Derek Lamberti

b9cb844

2019-11-28 13:34:48 +0000

[diff] [blame]

506

catch (std::exception& e)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

507

{

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

508

ALOGE("std::exception caught from EnqueueWorkload: %s", e.what());

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

509

cb.callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

510

return false;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

511

}

512

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

513

CommitPools(*pMemPools);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

514

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

515

DumpTensorsIfRequired("Output", outputTensors);

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

516

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

517

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

518

{

519

driverEnd = Now();

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

520

V1_2::Timing timing;

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

521

timing.timeOnDevice = MicrosecondsDuration(deviceEnd, deviceStart);

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

522

timing.timeInDriver = MicrosecondsDuration(driverEnd, cb.ctx.driverStart);

523

ALOGV("ArmnnPreparedModel_1_2::execute timing - Device = %lu Driver = %lu", timing.timeOnDevice,

524

timing.timeInDriver);

525

cb.callback(V1_0::ErrorStatus::NONE, outputShapes, timing, "ArmnnPreparedModel_1_2::ExecuteGraph");

526

} else {

527

cb.callback(V1_0::ErrorStatus::NONE, outputShapes, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

528

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

529

530

return true;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

531

}

532

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

533

template<typename HalVersion>

534

bool ArmnnPreparedModel_1_2<HalVersion>::ExecuteWithDummyInputs()

535

{

536

std::vector<std::vector<char>> storage;

537

armnn::InputTensors inputTensors;

Kevin May

42477c1

2020-03-26 13:34:14 +0000

[diff] [blame]

538

for (unsigned int i = 0; i < getMainModel(m_Model).inputIndexes.size(); i++)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

539

{

540

const armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

541

storage.emplace_back(inputTensorInfo.GetNumBytes());

542

const armnn::ConstTensor inputTensor(inputTensorInfo, storage.back().data());

543

544

inputTensors.emplace_back(i, inputTensor);

545

}

546

547

armnn::OutputTensors outputTensors;

Kevin May

42477c1

2020-03-26 13:34:14 +0000

[diff] [blame]

548

for (unsigned int i = 0; i < getMainModel(m_Model).outputIndexes.size(); i++)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

549

{

550

const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

551

storage.emplace_back(outputTensorInfo.GetNumBytes());

552

const armnn::Tensor outputTensor(outputTensorInfo, storage.back().data());

553

554

outputTensors.emplace_back(i, outputTensor);

555

}

556

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

557

auto nullCallback = [](V1_0::ErrorStatus, std::vector<V1_2::OutputShape>, const V1_2::Timing&, std::string) {};

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

558

CallbackContext_1_2 callbackContext;

559

callbackContext.callback = nullCallback;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

560

callbackContext.ctx.measureTimings = V1_2::MeasureTiming::NO;

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

561

auto memPools = std::make_shared<std::vector<::android::nn::RunTimePoolInfo>>();

562

return ExecuteGraph(memPools,

inputTensors,

outputTensors,

callbackContext);

}

template<typename HalVersion>

569

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::Execute(const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

570

V1_2::MeasureTiming measureTiming,

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

571

CallbackAsync_1_2 callback)

572

{

573

ExecutionContext_1_2 ctx;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

574

if (measureTiming == V1_2::MeasureTiming::YES)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

575

{

576

ctx.measureTimings = measureTiming;

577

ctx.driverStart = Now();

578

}

579

580

ALOGV("ArmnnPreparedModel_1_2::execute(): %s", GetModelSummary(m_Model).c_str());

581

m_RequestCount++;

582

583

if (!android::nn::validateRequest(request, m_Model))

584

{

585

callback(V1_0::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

586

return V1_0::ErrorStatus::INVALID_ARGUMENT;

587

}

588

589

if (!m_RequestInputsAndOutputsDumpDir.empty())

590

{

591

ALOGD("Dumping inputs and outputs for request %" PRIuPTR, reinterpret_cast<std::uintptr_t>(&callback));

592

}

593

594

// map the memory pool into shared pointers

595

// use a shared memory pools vector on the heap, as it is passed to the request thread

596

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

597

598

// allocate the tensors on the heap, as they are passed to the request thread

599

auto inputTensors = std::make_shared<armnn::InputTensors>();

600

auto outputTensors = std::make_shared<armnn::OutputTensors>();

601

602

auto prepareStatus = PrepareMemoryForIO(*inputTensors, *outputTensors, *memPools, request, callback);

603

switch(prepareStatus)

604

{

605

case V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE:

606

return V1_0::ErrorStatus::NONE;

607

case V1_0::ErrorStatus::GENERAL_FAILURE:

608

return V1_0::ErrorStatus::GENERAL_FAILURE;

default:

{}

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

613

614

// post the request for asynchronous execution

615

CallbackContext_1_2 cb;

616

cb.callback = callback;

617

cb.ctx = ctx;

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

618

619

if (m_AsyncModelExecutionEnabled)

620

{

621

ALOGV("ArmnnPreparedModel_1_2::execute(...) before ScheduleGraphForExecution");

622

ScheduleGraphForExecution(memPools, inputTensors, outputTensors, cb);

623

ALOGV("ArmnnPreparedModel_1_2::execute(...) after ScheduleGraphForExecution");

624

return V1_0::ErrorStatus::NONE;

625

}

626

627

ALOGV("ArmnnPreparedModel_1_2::execute(...) before PostMsg");

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

628

m_RequestThread.PostMsg(this, memPools, inputTensors, outputTensors, cb);

629

ALOGV("ArmnnPreparedModel_1_2::execute(...) after PostMsg");

630

return V1_0::ErrorStatus::NONE;

631

}

632

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

633

template<typename HalVersion>

634

Return<void> ArmnnPreparedModel_1_2<HalVersion>::configureExecutionBurst(

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

635

const sp<V1_2::IBurstCallback>& callback,

636

const MQDescriptorSync<V1_2::FmqRequestDatum>& requestChannel,

637

const MQDescriptorSync<V1_2::FmqResultDatum>& resultChannel,

638

V1_2::IPreparedModel::configureExecutionBurst_cb cb)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

639

{

640

ALOGV("ArmnnPreparedModel_1_2::configureExecutionBurst");

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

641

const sp<V1_2::IBurstContext> burst = ExecutionBurstServer::create(callback,

642

requestChannel,

643

resultChannel,

Kevin May

42477c1

2020-03-26 13:34:14 +0000

[diff] [blame]

644

this);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

645

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

646

if (burst == nullptr)

647

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

648

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {});

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

649

}

650

else

651

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

652

cb(V1_0::ErrorStatus::NONE, burst);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

}

return Void();

}

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

657

/// Schedule the graph prepared from the request for execution

658

template<typename HalVersion>

659

template<typename CallbackContext>

660

void ArmnnPreparedModel_1_2<HalVersion>::ScheduleGraphForExecution(

661

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

662

std::shared_ptr<armnn::InputTensors>& inputTensors,

663

std::shared_ptr<armnn::OutputTensors>& outputTensors,

664

CallbackContext callbackContext)

665

{

666

ALOGV("ArmnnPreparedModel_1_2::ScheduleGraphForExecution(...)");

667

668

DumpTensorsIfRequired("Input", *inputTensors);

669

670

unsigned int outputTensorSize = outputTensors.get()->size();

671

std::vector<V1_2::OutputShape> outputShapes(outputTensorSize);

672

for (unsigned int i = 0; i < outputTensorSize; i++)

673

{

674

std::pair<int, armnn::Tensor> outputTensorPair = outputTensors.get()->at(i);

675

const armnn::Tensor outputTensor = outputTensorPair.second;

676

const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();

677

678

outputShapes[i] = ComputeShape(outputTensorInfo);

679

}

680

681

auto tpCb = std::make_shared<

682

ArmnnThreadPoolCallback_1_2<CallbackContext_1_2>>(this,

pMemPools,

outputShapes,

inputTensors,

outputTensors,

callbackContext);

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

689

m_Threadpool->Schedule(m_NetworkId,

690

*tpCb->m_InputTensors,

691

*tpCb->m_OutputTensors,

692

armnn::QosExecPriority::Medium,

693

tpCb);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

694

ALOGV("ArmnnPreparedModel_1_2::ScheduleGraphForExecution end");

695

}

696

697

template<typename HalVersion>

698

template <typename CallbackContext>

699

void ArmnnPreparedModel_1_2<HalVersion>::ArmnnThreadPoolCallback_1_2<CallbackContext>::Notify(

700

armnn::Status status, armnn::InferenceTimingPair timeTaken)

701

{

702

ALOGV("ArmnnPreparedModel_1_2::ArmnnThreadPoolCallback_1_2 Notify");

TimePoint driverEnd;

CommitPools(*m_MemPools);

707

708

m_Model->DumpTensorsIfRequired("Output", *m_OutputTensors);

709

710

if (status != armnn::Status::Success)

711

{

712

ALOGW("ArmnnThreadPoolCallback::Notify EnqueueWorkload failed");

713

m_CallbackContext.callback(

714

V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel::ExecuteGraph");

return;

}

if (m_CallbackContext.ctx.measureTimings == V1_2::MeasureTiming::YES)

719

{

720

driverEnd = std::chrono::steady_clock::now();

721

V1_2::Timing timing;

722

timing.timeOnDevice = MicrosecondsDuration(timeTaken.second, timeTaken.first);

723

timing.timeInDriver = MicrosecondsDuration(driverEnd, m_CallbackContext.ctx.driverStart);

724

ALOGV("ArmnnPreparedModel_1_2::execute timing - Device = %lu Driver = %lu", timing.timeOnDevice,

725

timing.timeInDriver);

726

m_CallbackContext.callback(

727

V1_0::ErrorStatus::NONE, m_OutputShapes, timing, "ArmnnPreparedModel_1_2::ExecuteGraph");

728

} else {

729

m_CallbackContext.callback(

730

V1_0::ErrorStatus::NONE, m_OutputShapes, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

}

return;

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

735

#if defined(ARMNN_ANDROID_NN_V1_2) || defined(ARMNN_ANDROID_NN_V1_3)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

736

template class ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>;

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

737

template bool ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>::ExecuteGraph<CallbackContext_1_2>(

738

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

739

armnn::InputTensors& pInputTensors,

740

armnn::OutputTensors& pOutputTensors,

741

CallbackContext_1_2 cb);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

742

743

template void ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>::ScheduleGraphForExecution<CallbackContext_1_2>(

744

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

745

std::shared_ptr<armnn::InputTensors>& inputTensors,

746

std::shared_ptr<armnn::OutputTensors>& outputTensors,

747

CallbackContext_1_2 callbackContext);

Mike Kelly