Blame - ArmnnPreparedModel_1_2.cpp - ml/android-nn-driver

2019-06-11 16:35:25 +0100

[diff] [blame]

1

//

Mike Kelly

e2d611e

2021-10-14 12:35:58 +0100

[diff] [blame^]

2

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

3

// SPDX-License-Identifier: MIT

4

//

5

6

#define LOG_TAG "ArmnnDriver"

7

8

#include "ArmnnPreparedModel_1_2.hpp"

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

9

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

10

#include "Utils.hpp"

11

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

12

#include <log/log.h>

13

#include <OperationsUtils.h>

14

#include <ExecutionBurstServer.h>

15

#include <ValidateHal.h>

16

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

17

#include <cinttypes>

18

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

19

#ifdef ARMNN_ANDROID_S

20

#include <LegacyUtils.h>

21

#endif

22

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

23

using namespace android;

24

using namespace android::hardware;

25

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

26

namespace {

27

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

28

static const V1_2::Timing g_NoTiming = {.timeOnDevice = UINT64_MAX, .timeInDriver = UINT64_MAX};

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

29

using namespace armnn_driver;

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

30

using TimePoint = std::chrono::steady_clock::time_point;

TimePoint Now()

{

return std::chrono::steady_clock::now();

35

}

36

37

unsigned long MicrosecondsDuration(TimePoint endPoint, TimePoint startPoint)

38

{

39

return static_cast<unsigned long>(std::chrono::duration_cast<std::chrono::microseconds>(

40

endPoint - startPoint).count());

41

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

42

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

43

void NotifyCallbackAndCheck(const ::android::sp<V1_0::IExecutionCallback>& callback,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

44

V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

45

std::vector<V1_2::OutputShape>,

46

const V1_2::Timing,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

47

std::string callingFunction)

48

{

49

Return<void> returned = callback->notify(errorStatus);

50

// This check is required, if the callback fails and it isn't checked it will bring down the service

51

if (!returned.isOk())

52

{

53

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

54

callingFunction.c_str(), returned.description().c_str());

}

}

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

58

void NotifyCallbackAndCheck(const ::android::sp<V1_2::IExecutionCallback>& callback,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

59

V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

60

std::vector<V1_2::OutputShape> outputShapes,

61

const V1_2::Timing timing,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

62

std::string callingFunction)

63

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

64

Return<void> returned = callback->notify_1_2(errorStatus, outputShapes, timing);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

65

// This check is required, if the callback fails and it isn't checked it will bring down the service

66

if (!returned.isOk())

67

{

68

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

69

callingFunction.c_str(), returned.description().c_str());

}

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

73

bool ValidateRequestArgument(const V1_0::RequestArgument& requestArg, const armnn::TensorInfo& tensorInfo)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

74

{

75

if (requestArg.dimensions.size() != 0)

76

{

77

if (requestArg.dimensions.size() != tensorInfo.GetNumDimensions())

78

{

79

ALOGE("Mismatched dimensions (request argument: %zu, expected: %u)",

80

requestArg.dimensions.size(), tensorInfo.GetNumDimensions());

return false;

}

for (unsigned int d = 0; d < tensorInfo.GetNumDimensions(); ++d)

85

{

Finn Williams

a4983ce

2020-07-23 12:55:12 +0100

[diff] [blame]

86

if (requestArg.dimensions[d] != 0 && requestArg.dimensions[d] != tensorInfo.GetShape()[d])

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

87

{

88

ALOGE("Mismatched size for dimension %d (request argument: %u, expected %u)",

89

d, requestArg.dimensions[d], tensorInfo.GetShape()[d]);

return false;

}

}

}

return true;

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

98

armnn::Tensor GetTensorForRequestArgument(const V1_0::RequestArgument& requestArg,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

99

const armnn::TensorInfo& tensorInfo,

100

const std::vector<::android::nn::RunTimePoolInfo>& requestPools)

101

{

102

if (!ValidateRequestArgument(requestArg, tensorInfo))

103

{

104

return armnn::Tensor();

105

}

106

107

return armnn::Tensor(tensorInfo, GetMemoryFromPool(requestArg.location, requestPools));

108

}

109

110

inline std::string BuildTensorName(const char* tensorNamePrefix, std::size_t index)

111

{

112

return tensorNamePrefix + std::to_string(index);

113

}

114

115

} // anonymous namespace

116

117

using namespace android::hardware;

118

119

namespace armnn_driver

120

{

121

122

template<typename HalVersion>

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

123

RequestThread<ArmnnPreparedModel_1_2, HalVersion, CallbackContext_1_2>

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

124

ArmnnPreparedModel_1_2<HalVersion>::m_RequestThread;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

125

126

template<typename HalVersion>

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

127

std::unique_ptr<armnn::Threadpool> ArmnnPreparedModel_1_2<HalVersion>::m_Threadpool(nullptr);

128

129

template<typename HalVersion>

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

130

template<typename TensorBindingCollection>

131

void ArmnnPreparedModel_1_2<HalVersion>::DumpTensorsIfRequired(char const* tensorNamePrefix,

132

const TensorBindingCollection& tensorBindings)

133

{

134

if (!m_RequestInputsAndOutputsDumpDir.empty())

135

{

Colm Donelan

08d9a1c

2020-09-09 17:56:55 +0100

[diff] [blame]

136

const std::string requestName = std::to_string(m_NetworkId) + "_" + std::to_string(m_RequestCount) + ".dump";

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

137

for (std::size_t i = 0u; i < tensorBindings.size(); ++i)

138

{

139

DumpTensor(m_RequestInputsAndOutputsDumpDir,

140

requestName,

141

BuildTensorName(tensorNamePrefix, i),

142

tensorBindings[i].second);

}

}

}

template<typename HalVersion>

148

ArmnnPreparedModel_1_2<HalVersion>::ArmnnPreparedModel_1_2(armnn::NetworkId networkId,

149

armnn::IRuntime* runtime,

150

const V1_2::Model& model,

151

const std::string& requestInputsAndOutputsDumpDir,

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

152

const bool gpuProfilingEnabled,

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

153

const bool asyncModelExecutionEnabled,

154

const unsigned int numberOfThreads)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

155

: m_NetworkId(networkId)

, m_Runtime(runtime)

, m_Model(model)

, m_RequestCount(0)

, m_RequestInputsAndOutputsDumpDir(requestInputsAndOutputsDumpDir)

160

, m_GpuProfilingEnabled(gpuProfilingEnabled)

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

161

, m_AsyncModelExecutionEnabled(asyncModelExecutionEnabled)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

162

{

163

// Enable profiling if required.

164

m_Runtime->GetProfiler(m_NetworkId)->EnableProfiling(m_GpuProfilingEnabled);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

165

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

166

if (m_AsyncModelExecutionEnabled)

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

167

{

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

168

std::vector<std::shared_ptr<armnn::IWorkingMemHandle>> memHandles;

Finn Williams

d27c13b

2021-06-25 10:06:09 +0100

[diff] [blame]

169

for (unsigned int i=0; i < numberOfThreads; ++i)

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

170

{

171

memHandles.emplace_back(m_Runtime->CreateWorkingMemHandle(networkId));

172

}

173

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

174

if (!m_Threadpool)

175

{

176

m_Threadpool = std::make_unique<armnn::Threadpool>(numberOfThreads, runtime, memHandles);

}

else

{

m_Threadpool->LoadMemHandles(memHandles);

181

}

182

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

183

m_WorkingMemHandle = memHandles.back();

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

184

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

185

}

186

187

template<typename HalVersion>

188

ArmnnPreparedModel_1_2<HalVersion>::~ArmnnPreparedModel_1_2()

189

{

190

// Get a hold of the profiler used by this model.

191

std::shared_ptr<armnn::IProfiler> profiler = m_Runtime->GetProfiler(m_NetworkId);

192

193

// Unload the network associated with this model.

194

m_Runtime->UnloadNetwork(m_NetworkId);

195

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

196

// Unload the network memhandles from the threadpool

197

if (m_AsyncModelExecutionEnabled)

198

{

199

m_Threadpool->UnloadMemHandles(m_NetworkId);

200

}

201

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

202

// Dump the profiling info to a file if required.

203

DumpJsonProfilingIfRequired(m_GpuProfilingEnabled, m_RequestInputsAndOutputsDumpDir, m_NetworkId, profiler.get());

204

}

205

206

template<typename HalVersion>

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

207

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::execute(const V1_0::Request& request,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

208

const ::android::sp<V1_0::IExecutionCallback>& callback)

209

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

210

if (callback.get() == nullptr)

211

{

212

ALOGE("ArmnnPreparedModel_1_2::execute invalid callback passed");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

213

return V1_0::ErrorStatus::INVALID_ARGUMENT;

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

214

}

215

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

216

auto cb = [callback](V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

217

std::vector<V1_2::OutputShape> outputShapes,

218

const V1_2::Timing& timing,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

219

std::string callingFunction)

220

{

221

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

222

};

223

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

224

return Execute(request, V1_2::MeasureTiming::NO, cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

225

}

226

227

template<typename HalVersion>

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

228

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::execute_1_2(

229

const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

230

V1_2::MeasureTiming measureTiming,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

231

const sp<V1_2::IExecutionCallback>& callback)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

232

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

233

if (callback.get() == nullptr)

234

{

235

ALOGE("ArmnnPreparedModel_1_2::execute_1_2 invalid callback passed");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

236

return V1_0::ErrorStatus::INVALID_ARGUMENT;

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

237

}

238

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

239

auto cb = [callback](V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

240

std::vector<V1_2::OutputShape> outputShapes,

241

const V1_2::Timing& timing,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

242

std::string callingFunction)

243

{

244

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

245

};

246

247

return Execute(request, measureTiming, cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

248

}

249

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

250

template<typename HalVersion>

251

Return<V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::PrepareMemoryForInputs(

252

armnn::InputTensors& inputs,

253

const V1_0::Request& request,

254

const std::vector<android::nn::RunTimePoolInfo>& memPools)

255

{

256

inputs.reserve(request.inputs.size());

257

for (unsigned int i = 0; i < request.inputs.size(); i++)

258

{

259

const auto& inputArg = request.inputs[i];

260

261

const armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

262

const armnn::Tensor inputTensor = GetTensorForRequestArgument(inputArg, inputTensorInfo, memPools);

263

264

if (inputTensor.GetMemoryArea() == nullptr)

265

{

266

ALOGE("Cannot execute request. Error converting request input %u to tensor", i);

267

return V1_0::ErrorStatus::GENERAL_FAILURE;

268

}

269

270

inputs.emplace_back(i, inputTensor);

271

}

272

273

return V1_0::ErrorStatus::NONE;

274

}

275

276

template<typename HalVersion>

277

Return<V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::PrepareMemoryForOutputs(

278

armnn::OutputTensors& outputs,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

279

std::vector<V1_2::OutputShape> &outputShapes,

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

280

const V1_0::Request& request,

281

const std::vector<android::nn::RunTimePoolInfo>& memPools)

282

{

283

outputs.reserve(request.outputs.size());

284

for (unsigned int i = 0; i < request.outputs.size(); i++)

285

{

286

const auto& outputArg = request.outputs[i];

287

288

const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

289

const armnn::Tensor outputTensor = GetTensorForRequestArgument(outputArg, outputTensorInfo, memPools);

290

if (outputTensor.GetMemoryArea() == nullptr)

291

{

292

ALOGE("Cannot execute request. Error converting request output %u to tensor", i);

293

return V1_0::ErrorStatus::GENERAL_FAILURE;

294

}

295

296

const size_t outputSize = outputTensorInfo.GetNumBytes();

Finn Williams

a4983ce

2020-07-23 12:55:12 +0100

[diff] [blame]

297

298

if (outputArg.location.length < outputSize)

299

{

300

ALOGW("ArmnnPreparedModel_1_2::Execute failed: outputArg.location.length < outputSize");

301

return V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

302

}

303

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

304

#if !defined(ARMNN_ANDROID_S)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

305

const size_t bufferSize = memPools.at(outputArg.location.poolIndex).getHidlMemory().size();

306

if (bufferSize < outputSize)

307

{

Finn Williams

a4983ce

2020-07-23 12:55:12 +0100

[diff] [blame]

308

ALOGW("ArmnnPreparedModel_1_2::Execute failed: bufferSize < outputSize");

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

309

return V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

310

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

311

#else

Kevin May

dc873f6

2021-06-14 11:21:11 +0100

[diff] [blame]

312

const size_t bufferSize = memPools.at(outputArg.location.poolIndex).getSize();

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

313

if (bufferSize < outputSize)

314

{

315

ALOGW("ArmnnPreparedModel_1_2::Execute failed bufferSize (%s) < outputSize (%s)",

316

std::to_string(bufferSize).c_str(), std::to_string(outputSize).c_str());

317

outputShapes[i].isSufficient = false;

318

return V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

319

}

320

#endif

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

321

outputs.emplace_back(i, outputTensor);

322

outputShapes[i] = ComputeShape(outputTensorInfo);

323

}

324

325

return V1_0::ErrorStatus::NONE;

326

}

327

328

template<typename HalVersion>

329

Return<V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::PrepareMemoryForIO(

330

armnn::InputTensors& inputs,

331

armnn::OutputTensors& outputs,

332

std::vector<android::nn::RunTimePoolInfo>& memPools,

333

const V1_0::Request& request,

334

CallbackAsync_1_2 callback)

335

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

336

#if !defined(ARMNN_ANDROID_S)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

337

if (!setRunTimePoolInfosFromHidlMemories(&memPools, request.pools))

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

338

#else

339

if (!setRunTimePoolInfosFromCanonicalMemories(&memPools, uncheckedConvert(request.pools)))

340

#endif

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

341

{

342

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

343

return V1_0::ErrorStatus::GENERAL_FAILURE;

344

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

345

// add the inputs and outputs with their data

346

try

347

{

348

if (PrepareMemoryForInputs(inputs, request, memPools) != V1_0::ErrorStatus::NONE)

349

{

350

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

351

return V1_0::ErrorStatus::GENERAL_FAILURE;

352

}

353

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

354

std::vector<V1_2::OutputShape> outputShapes(request.outputs.size());

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

355

356

auto errorStatus = PrepareMemoryForOutputs(outputs, outputShapes, request, memPools);

357

if (errorStatus != V1_0::ErrorStatus::NONE)

358

{

359

callback(errorStatus,

360

outputShapes,

361

g_NoTiming,

362

"ArmnnPreparedModel_1_2::Execute");

return errorStatus;

}

}

catch (armnn::Exception& e)

367

{

368

ALOGW("armnn::Exception caught while preparing for EnqueueWorkload: %s", e.what());

369

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

370

return V1_0::ErrorStatus::GENERAL_FAILURE;

371

}

372

catch (std::exception& e)

373

{

374

ALOGE("std::exception caught while preparing for EnqueueWorkload: %s", e.what());

375

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

376

return V1_0::ErrorStatus::GENERAL_FAILURE;

377

}

378

379

return V1_0::ErrorStatus::NONE;

380

}

381

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

382

template<typename HalVersion>

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

383

Return<void> ArmnnPreparedModel_1_2<HalVersion>::executeSynchronously(const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

384

V1_2::MeasureTiming measureTiming,

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

385

executeSynchronously_cb cb)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

386

{

387

ALOGV("ArmnnPreparedModel_1_2::executeSynchronously(): %s", GetModelSummary(m_Model).c_str());

m_RequestCount++;

if (cb == nullptr)

{

ALOGE("ArmnnPreparedModel_1_2::executeSynchronously invalid callback passed");

return Void();

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

396

TimePoint driverStart;

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

397

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

398

if (measureTiming == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

{

driverStart = Now();

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

403

if (!android::nn::validateRequest(request, m_Model))

404

{

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

405

ALOGE("ArmnnPreparedModel_1_2::executeSynchronously invalid request model");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

406

cb(V1_0::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

return Void();

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

410

auto cbWrapper = [cb](V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

411

std::vector<V1_2::OutputShape> outputShapes,

412

const V1_2::Timing& timing,

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

413

std::string)

414

{

415

cb(errorStatus, outputShapes, timing);

416

};

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

417

418

// map the memory pool into shared pointers

419

// use a shared memory pools vector on the heap, as it is passed to the request thread

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

420

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

421

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

422

// allocate the tensors on the heap, as they are passed to the request thread

423

auto inputs = std::make_shared<armnn::InputTensors>();

424

auto outputs = std::make_shared<armnn::OutputTensors>();

425

426

auto prepareStatus = PrepareMemoryForIO(*inputs, *outputs, *memPools, request, cbWrapper);

427

if (prepareStatus != V1_0::ErrorStatus::NONE)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

428

{

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

return Void();

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

432

ALOGV("ArmnnPreparedModel_1_2::executeSynchronously() before Execution");

433

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

434

CallbackContext_1_2 cbCtx;

435

cbCtx.callback = cbWrapper;

436

cbCtx.ctx.measureTimings = measureTiming;

437

cbCtx.ctx.driverStart = driverStart;

438

ExecuteGraph(memPools, *inputs, *outputs, cbCtx);

return Void();

}

template<typename HalVersion>

444

template<typename CallbackContext>

445

bool ArmnnPreparedModel_1_2<HalVersion>::ExecuteGraph(

446

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

447

armnn::InputTensors& inputTensors,

448

armnn::OutputTensors& outputTensors,

449

CallbackContext cb)

450

{

451

ALOGV("ArmnnPreparedModel_1_2::ExecuteGraph(...)");

452

453

TimePoint driverEnd, deviceStart, deviceEnd;

454

455

DumpTensorsIfRequired("Input", inputTensors);

456

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

457

std::vector<V1_2::OutputShape> outputShapes(outputTensors.size());

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

458

for (unsigned int i = 0; i < outputTensors.size(); i++)

459

{

460

std::pair<int, armnn::Tensor> outputTensorPair = outputTensors[i];

461

const armnn::Tensor outputTensor = outputTensorPair.second;

462

const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();

463

464

outputShapes[i] = ComputeShape(outputTensorInfo);

465

}

466

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

467

// run it

468

try

469

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

470

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

{

deviceStart = Now();

}

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

475

armnn::Status status;

476

if (m_AsyncModelExecutionEnabled)

477

{

478

ALOGW("ArmnnPreparedModel_1_2::ExecuteGraph m_AsyncModelExecutionEnabled true");

479

status = m_Runtime->Execute(*m_WorkingMemHandle, inputTensors, outputTensors);

}

else

{

ALOGW("ArmnnPreparedModel_1_2::ExecuteGraph m_AsyncModelExecutionEnabled false");

484

status = m_Runtime->EnqueueWorkload(m_NetworkId, inputTensors, outputTensors);

485

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

486

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

487

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

488

{

489

deviceEnd = Now();

490

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

491

if (status != armnn::Status::Success)

492

{

493

ALOGW("EnqueueWorkload failed");

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

494

cb.callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming,

495

"ArmnnPreparedModel_1_2::ExecuteGraph");

496

return false;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

497

}

498

}

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

499

catch (armnn::Exception& e)

500

{

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

501

ALOGW("armnn:Exception caught from EnqueueWorkload: %s", e.what());

502

cb.callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

503

return false;

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

504

}

Derek Lamberti

b9cb844

2019-11-28 13:34:48 +0000

[diff] [blame]

505

catch (std::exception& e)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

506

{

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

507

ALOGE("std::exception caught from EnqueueWorkload: %s", e.what());

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

508

cb.callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

509

return false;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

510

}

511

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

512

CommitPools(*pMemPools);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

513

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

514

DumpTensorsIfRequired("Output", outputTensors);

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

515

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

516

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

517

{

518

driverEnd = Now();

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

519

V1_2::Timing timing;

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

520

timing.timeOnDevice = MicrosecondsDuration(deviceEnd, deviceStart);

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

521

timing.timeInDriver = MicrosecondsDuration(driverEnd, cb.ctx.driverStart);

522

ALOGV("ArmnnPreparedModel_1_2::execute timing - Device = %lu Driver = %lu", timing.timeOnDevice,

523

timing.timeInDriver);

524

cb.callback(V1_0::ErrorStatus::NONE, outputShapes, timing, "ArmnnPreparedModel_1_2::ExecuteGraph");

525

} else {

526

cb.callback(V1_0::ErrorStatus::NONE, outputShapes, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

527

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

528

529

return true;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

530

}

531

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

532

template<typename HalVersion>

533

bool ArmnnPreparedModel_1_2<HalVersion>::ExecuteWithDummyInputs()

534

{

535

std::vector<std::vector<char>> storage;

536

armnn::InputTensors inputTensors;

Kevin May

42477c1

2020-03-26 13:34:14 +0000

[diff] [blame]

537

for (unsigned int i = 0; i < getMainModel(m_Model).inputIndexes.size(); i++)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

538

{

539

const armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

540

storage.emplace_back(inputTensorInfo.GetNumBytes());

541

const armnn::ConstTensor inputTensor(inputTensorInfo, storage.back().data());

542

543

inputTensors.emplace_back(i, inputTensor);

544

}

545

546

armnn::OutputTensors outputTensors;

Kevin May

42477c1

2020-03-26 13:34:14 +0000

[diff] [blame]

547

for (unsigned int i = 0; i < getMainModel(m_Model).outputIndexes.size(); i++)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

548

{

549

const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

550

storage.emplace_back(outputTensorInfo.GetNumBytes());

551

const armnn::Tensor outputTensor(outputTensorInfo, storage.back().data());

552

553

outputTensors.emplace_back(i, outputTensor);

554

}

555

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

556

auto nullCallback = [](V1_0::ErrorStatus, std::vector<V1_2::OutputShape>, const V1_2::Timing&, std::string) {};

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

557

CallbackContext_1_2 callbackContext;

558

callbackContext.callback = nullCallback;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

559

callbackContext.ctx.measureTimings = V1_2::MeasureTiming::NO;

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

560

auto memPools = std::make_shared<std::vector<::android::nn::RunTimePoolInfo>>();

561

return ExecuteGraph(memPools,

inputTensors,

outputTensors,

callbackContext);

}

template<typename HalVersion>

568

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::Execute(const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

569

V1_2::MeasureTiming measureTiming,

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

570

CallbackAsync_1_2 callback)

571

{

572

ExecutionContext_1_2 ctx;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

573

if (measureTiming == V1_2::MeasureTiming::YES)

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

574

{

575

ctx.measureTimings = measureTiming;

576

ctx.driverStart = Now();

577

}

578

579

ALOGV("ArmnnPreparedModel_1_2::execute(): %s", GetModelSummary(m_Model).c_str());

580

m_RequestCount++;

581

582

if (!android::nn::validateRequest(request, m_Model))

583

{

584

callback(V1_0::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

585

return V1_0::ErrorStatus::INVALID_ARGUMENT;

586

}

587

588

if (!m_RequestInputsAndOutputsDumpDir.empty())

589

{

590

ALOGD("Dumping inputs and outputs for request %" PRIuPTR, reinterpret_cast<std::uintptr_t>(&callback));

591

}

592

593

// map the memory pool into shared pointers

594

// use a shared memory pools vector on the heap, as it is passed to the request thread

595

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

596

597

// allocate the tensors on the heap, as they are passed to the request thread

598

auto inputTensors = std::make_shared<armnn::InputTensors>();

599

auto outputTensors = std::make_shared<armnn::OutputTensors>();

600

601

auto prepareStatus = PrepareMemoryForIO(*inputTensors, *outputTensors, *memPools, request, callback);

602

switch(prepareStatus)

603

{

604

case V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE:

605

return V1_0::ErrorStatus::NONE;

606

case V1_0::ErrorStatus::GENERAL_FAILURE:

607

return V1_0::ErrorStatus::GENERAL_FAILURE;

default:

{}

}

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

612

613

// post the request for asynchronous execution

614

CallbackContext_1_2 cb;

615

cb.callback = callback;

616

cb.ctx = ctx;

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

617

618

if (m_AsyncModelExecutionEnabled)

619

{

620

ALOGV("ArmnnPreparedModel_1_2::execute(...) before ScheduleGraphForExecution");

621

ScheduleGraphForExecution(memPools, inputTensors, outputTensors, cb);

622

ALOGV("ArmnnPreparedModel_1_2::execute(...) after ScheduleGraphForExecution");

623

return V1_0::ErrorStatus::NONE;

624

}

625

626

ALOGV("ArmnnPreparedModel_1_2::execute(...) before PostMsg");

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

627

m_RequestThread.PostMsg(this, memPools, inputTensors, outputTensors, cb);

628

ALOGV("ArmnnPreparedModel_1_2::execute(...) after PostMsg");

629

return V1_0::ErrorStatus::NONE;

630

}

631

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

632

template<typename HalVersion>

633

Return<void> ArmnnPreparedModel_1_2<HalVersion>::configureExecutionBurst(

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

634

const sp<V1_2::IBurstCallback>& callback,

635

const MQDescriptorSync<V1_2::FmqRequestDatum>& requestChannel,

636

const MQDescriptorSync<V1_2::FmqResultDatum>& resultChannel,

637

V1_2::IPreparedModel::configureExecutionBurst_cb cb)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

638

{

639

ALOGV("ArmnnPreparedModel_1_2::configureExecutionBurst");

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

640

const sp<V1_2::IBurstContext> burst = ExecutionBurstServer::create(callback,

641

requestChannel,

642

resultChannel,

Kevin May

42477c1

2020-03-26 13:34:14 +0000

[diff] [blame]

643

this);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

644

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

645

if (burst == nullptr)

646

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

647

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {});

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

648

}

649

else

650

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

651

cb(V1_0::ErrorStatus::NONE, burst);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

}

return Void();

}

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

656

/// Schedule the graph prepared from the request for execution

657

template<typename HalVersion>

658

template<typename CallbackContext>

659

void ArmnnPreparedModel_1_2<HalVersion>::ScheduleGraphForExecution(

660

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

661

std::shared_ptr<armnn::InputTensors>& inputTensors,

662

std::shared_ptr<armnn::OutputTensors>& outputTensors,

663

CallbackContext callbackContext)

664

{

665

ALOGV("ArmnnPreparedModel_1_2::ScheduleGraphForExecution(...)");

666

667

DumpTensorsIfRequired("Input", *inputTensors);

668

669

unsigned int outputTensorSize = outputTensors.get()->size();

670

std::vector<V1_2::OutputShape> outputShapes(outputTensorSize);

671

for (unsigned int i = 0; i < outputTensorSize; i++)

672

{

673

std::pair<int, armnn::Tensor> outputTensorPair = outputTensors.get()->at(i);

674

const armnn::Tensor outputTensor = outputTensorPair.second;

675

const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();

676

677

outputShapes[i] = ComputeShape(outputTensorInfo);

678

}

679

680

auto tpCb = std::make_shared<

681

ArmnnThreadPoolCallback_1_2<CallbackContext_1_2>>(this,

pMemPools,

outputShapes,

inputTensors,

outputTensors,

callbackContext);

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

688

m_Threadpool->Schedule(m_NetworkId,

689

*tpCb->m_InputTensors,

690

*tpCb->m_OutputTensors,

691

armnn::QosExecPriority::Medium,

692

tpCb);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

693

ALOGV("ArmnnPreparedModel_1_2::ScheduleGraphForExecution end");

694

}

695

696

template<typename HalVersion>

697

template <typename CallbackContext>

698

void ArmnnPreparedModel_1_2<HalVersion>::ArmnnThreadPoolCallback_1_2<CallbackContext>::Notify(

699

armnn::Status status, armnn::InferenceTimingPair timeTaken)

700

{

701

ALOGV("ArmnnPreparedModel_1_2::ArmnnThreadPoolCallback_1_2 Notify");

TimePoint driverEnd;

CommitPools(*m_MemPools);

706

707

m_Model->DumpTensorsIfRequired("Output", *m_OutputTensors);

708

709

if (status != armnn::Status::Success)

710

{

711

ALOGW("ArmnnThreadPoolCallback::Notify EnqueueWorkload failed");

712

m_CallbackContext.callback(

713

V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel::ExecuteGraph");

return;

}

if (m_CallbackContext.ctx.measureTimings == V1_2::MeasureTiming::YES)

718

{

719

driverEnd = std::chrono::steady_clock::now();

720

V1_2::Timing timing;

721

timing.timeOnDevice = MicrosecondsDuration(timeTaken.second, timeTaken.first);

722

timing.timeInDriver = MicrosecondsDuration(driverEnd, m_CallbackContext.ctx.driverStart);

723

ALOGV("ArmnnPreparedModel_1_2::execute timing - Device = %lu Driver = %lu", timing.timeOnDevice,

724

timing.timeInDriver);

725

m_CallbackContext.callback(

726

V1_0::ErrorStatus::NONE, m_OutputShapes, timing, "ArmnnPreparedModel_1_2::ExecuteGraph");

727

} else {

728

m_CallbackContext.callback(

729

V1_0::ErrorStatus::NONE, m_OutputShapes, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

}

return;

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

734

#if defined(ARMNN_ANDROID_NN_V1_2) || defined(ARMNN_ANDROID_NN_V1_3)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

735

template class ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>;

Derek Lamberti

2020-03-17 13:40:18 +0000

[diff] [blame]

736

template bool ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>::ExecuteGraph<CallbackContext_1_2>(

737

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

738

armnn::InputTensors& pInputTensors,

739

armnn::OutputTensors& pOutputTensors,

740

CallbackContext_1_2 cb);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

741

742

template void ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>::ScheduleGraphForExecution<CallbackContext_1_2>(

743

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

744

std::shared_ptr<armnn::InputTensors>& inputTensors,

745

std::shared_ptr<armnn::OutputTensors>& outputTensors,

746

CallbackContext_1_2 callbackContext);

Mike Kelly