Blame - ArmnnPreparedModel_1_3.cpp - ml/android-nn-driver

2020-03-26 13:34:14 +0000

[diff] [blame]

1

//

2

3

// SPDX-License-Identifier: MIT

4

//

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

5

// Note: the ArmnnFencedExecutionCallback and code snippet in the executeFenced() function

6

// in this file is based on Android code

7

// under the Apache 2.0 license. See comments below for details.

8

//

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

9

10

#define LOG_TAG "ArmnnDriver"

11

12

#include "ArmnnPreparedModel_1_3.hpp"

13

#include "Utils.hpp"

14

15

#include <Utils.h>

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

16

#include <android/sync.h>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

17

#include <log/log.h>

18

#include <OperationsUtils.h>

19

#include <ExecutionBurstServer.h>

20

#include <ValidateHal.h>

#include <cassert>

#include <cinttypes>

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

25

#ifdef ARMNN_ANDROID_S

26

#include <LegacyUtils.h>

27

#endif

28

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

29

using namespace android;

30

using namespace android::hardware;

namespace {

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

34

static const V1_2::Timing g_NoTiming = {.timeOnDevice = UINT64_MAX, .timeInDriver = UINT64_MAX};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

35

using namespace armnn_driver;

36

using TimePoint = std::chrono::steady_clock::time_point;

TimePoint Now()

{

return std::chrono::steady_clock::now();

41

}

42

43

unsigned long MicrosecondsDuration(TimePoint endPoint, TimePoint startPoint)

44

{

45

return static_cast<unsigned long>(std::chrono::duration_cast<std::chrono::microseconds>(

46

endPoint - startPoint).count());

47

}

48

49

void NotifyCallbackAndCheck(const ::android::sp<V1_0::IExecutionCallback>& callback,

50

V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

51

std::vector<V1_2::OutputShape>,

52

const V1_2::Timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

53

std::string callingFunction)

54

{

55

Return<void> returned = callback->notify(convertToV1_0(errorStatus));

56

// This check is required, if the callback fails and it isn't checked it will bring down the service

57

if (!returned.isOk())

58

{

59

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

60

callingFunction.c_str(), returned.description().c_str());

}

}

void NotifyCallbackAndCheck(const ::android::sp<V1_2::IExecutionCallback>& callback,

65

V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

66

std::vector<V1_2::OutputShape> outputShapes,

67

const V1_2::Timing timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

68

std::string callingFunction)

69

{

70

Return<void> returned = callback->notify_1_2(convertToV1_0(errorStatus), outputShapes, timing);

71

// This check is required, if the callback fails and it isn't checked it will bring down the service

72

if (!returned.isOk())

73

{

74

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

75

callingFunction.c_str(), returned.description().c_str());

}

}

void NotifyCallbackAndCheck(const ::android::sp<V1_3::IExecutionCallback>& callback,

80

V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

81

std::vector<V1_2::OutputShape> outputShapes,

82

const V1_2::Timing timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

83

std::string callingFunction)

84

{

85

Return<void> returned = callback->notify_1_3(errorStatus, outputShapes, timing);

86

// This check is required, if the callback fails and it isn't checked it will bring down the service

87

if (!returned.isOk())

88

{

89

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

90

callingFunction.c_str(), returned.description().c_str());

}

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

94

bool ValidateRequestArgument(const V1_0::RequestArgument& requestArg, const armnn::TensorInfo& tensorInfo)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

95

{

96

if (requestArg.dimensions.size() != 0)

97

{

98

if (requestArg.dimensions.size() != tensorInfo.GetNumDimensions())

99

{

100

ALOGE("Mismatched dimensions (request argument: %zu, expected: %u)",

101

requestArg.dimensions.size(), tensorInfo.GetNumDimensions());

return false;

}

for (unsigned int d = 0; d < tensorInfo.GetNumDimensions(); ++d)

106

{

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

107

if (requestArg.dimensions[d] != 0 && requestArg.dimensions[d] != tensorInfo.GetShape()[d])

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

108

{

109

ALOGE("Mismatched size for dimension %d (request argument: %u, expected %u)",

110

d, requestArg.dimensions[d], tensorInfo.GetShape()[d]);

return false;

}

}

}

return true;

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

119

armnn::Tensor GetTensorForRequestArgument(const V1_0::RequestArgument& requestArg,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

120

const armnn::TensorInfo& tensorInfo,

121

const std::vector<::android::nn::RunTimePoolInfo>& requestPools)

122

{

123

if (!ValidateRequestArgument(requestArg, tensorInfo))

124

{

125

return armnn::Tensor();

126

}

127

128

return armnn::Tensor(tensorInfo, GetMemoryFromPool(requestArg.location, requestPools));

129

}

130

131

inline std::string BuildTensorName(const char* tensorNamePrefix, std::size_t index)

132

{

133

return tensorNamePrefix + std::to_string(index);

134

}

135

136

} // anonymous namespace

137

138

using namespace android::hardware;

139

140

namespace armnn_driver

141

{

142

143

template<typename HalVersion>

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

144

RequestThread_1_3<ArmnnPreparedModel_1_3, HalVersion, CallbackContext_1_3>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

145

ArmnnPreparedModel_1_3<HalVersion>::m_RequestThread;

146

147

template<typename HalVersion>

148

template<typename TensorBindingCollection>

149

void ArmnnPreparedModel_1_3<HalVersion>::DumpTensorsIfRequired(char const* tensorNamePrefix,

150

const TensorBindingCollection& tensorBindings)

151

{

152

if (!m_RequestInputsAndOutputsDumpDir.empty())

153

{

Colm Donelan

08d9a1c

2020-09-09 17:56:55 +0100

[diff] [blame]

154

const std::string requestName = std::to_string(m_NetworkId) + "_" + std::to_string(m_RequestCount) + ".dump";

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

155

for (std::size_t i = 0u; i < tensorBindings.size(); ++i)

156

{

157

DumpTensor(m_RequestInputsAndOutputsDumpDir,

158

requestName,

159

BuildTensorName(tensorNamePrefix, i),

160

tensorBindings[i].second);

}

}

}

template<typename HalVersion>

166

ArmnnPreparedModel_1_3<HalVersion>::ArmnnPreparedModel_1_3(armnn::NetworkId networkId,

167

armnn::IRuntime* runtime,

168

const V1_3::Model& model,

169

const std::string& requestInputsAndOutputsDumpDir,

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

170

const bool gpuProfilingEnabled,

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

171

V1_3::Priority priority,

172

const bool asyncModelExecutionEnabled)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

173

: m_NetworkId(networkId)

, m_Runtime(runtime)

, m_Model(model)

, m_RequestCount(0)

, m_RequestInputsAndOutputsDumpDir(requestInputsAndOutputsDumpDir)

178

, m_GpuProfilingEnabled(gpuProfilingEnabled)

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

179

, m_ModelPriority(priority)

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

180

, m_AsyncModelExecutionEnabled(asyncModelExecutionEnabled)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

181

{

182

// Enable profiling if required.

183

m_Runtime->GetProfiler(m_NetworkId)->EnableProfiling(m_GpuProfilingEnabled);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

184

185

if (asyncModelExecutionEnabled)

186

{

187

m_WorkingMemHandle = m_Runtime->CreateWorkingMemHandle(networkId);

188

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

189

}

190

191

template<typename HalVersion>

192

ArmnnPreparedModel_1_3<HalVersion>::~ArmnnPreparedModel_1_3()

193

{

194

// Get a hold of the profiler used by this model.

195

std::shared_ptr<armnn::IProfiler> profiler = m_Runtime->GetProfiler(m_NetworkId);

196

197

// Unload the network associated with this model.

198

m_Runtime->UnloadNetwork(m_NetworkId);

199

200

// Dump the profiling info to a file if required.

201

DumpJsonProfilingIfRequired(m_GpuProfilingEnabled, m_RequestInputsAndOutputsDumpDir, m_NetworkId, profiler.get());

202

}

203

204

template<typename HalVersion>

205

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::execute(const V1_0::Request& request,

206

const ::android::sp<V1_0::IExecutionCallback>& callback)

207

{

208

if (callback.get() == nullptr)

209

{

210

ALOGE("ArmnnPreparedModel_1_3::execute invalid callback passed");

211

return V1_0::ErrorStatus::INVALID_ARGUMENT;

212

}

213

214

auto cb = [callback](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

215

std::vector<V1_2::OutputShape> outputShapes,

216

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

217

std::string callingFunction)

218

{

219

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

};

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

223

return convertToV1_0(Execute(convertToV1_3(request), V1_2::MeasureTiming::NO, cb));

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

224

}

225

226

template<typename HalVersion>

227

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::execute_1_2(

228

const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

229

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

230

const sp<V1_2::IExecutionCallback>& callback)

231

{

232

if (callback.get() == nullptr)

233

{

234

ALOGE("ArmnnPreparedModel_1_3::execute_1_2 invalid callback passed");

235

return V1_0::ErrorStatus::INVALID_ARGUMENT;

236

}

237

238

auto cb = [callback](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

239

std::vector<V1_2::OutputShape> outputShapes,

240

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

241

std::string callingFunction)

242

{

243

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

244

};

245

246

return convertToV1_0(Execute(convertToV1_3(request), measureTiming, cb));

247

}

248

249

template<typename HalVersion>

250

Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::execute_1_3(

251

const V1_3::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

252

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

253

const V1_3::OptionalTimePoint&,

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

254

const V1_3::OptionalTimeoutDuration&,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

255

const sp<V1_3::IExecutionCallback>& callback)

256

{

257

if (callback.get() == nullptr)

258

{

259

ALOGE("ArmnnPreparedModel_1_3::execute_1_3 invalid callback passed");

260

return V1_3::ErrorStatus::INVALID_ARGUMENT;

261

}

262

263

auto cb = [callback](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

264

std::vector<V1_2::OutputShape> outputShapes,

265

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

266

std::string callingFunction)

267

{

268

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

269

};

270

271

return Execute(request, measureTiming, cb);

272

}

273

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

274

/// This class is inspired by the sample implementation in Android named SampleFencedExecutionCallback.

275

/// The original code is licensed under Apache-2.0 and can be found at the following link:

276

/// https://android.googlesource.com/platform/frameworks/ml/+/master/nn/driver/sample/SampleDriver.h

277

class ArmnnFencedExecutionCallback : public V1_3::IFencedExecutionCallback

278

{

279

public:

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

280

ArmnnFencedExecutionCallback(V1_3::ErrorStatus errorStatus, V1_2::Timing timing, V1_2::Timing fenceTiming)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

281

: m_ErrorStatus(errorStatus), m_Timing(timing), m_FenceTiming(fenceTiming) {}

282

~ArmnnFencedExecutionCallback() {}

283

284

Return<void> getExecutionInfo(getExecutionInfo_cb callback) override

285

{

286

callback(m_ErrorStatus, m_Timing, m_FenceTiming);

return Void();

}

private:

V1_3::ErrorStatus m_ErrorStatus;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

291

V1_2::Timing m_Timing;

292

V1_2::Timing m_FenceTiming;

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

293

};

294

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

295

template<typename HalVersion>

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

296

Return<void> ArmnnPreparedModel_1_3<HalVersion>::executeFenced(const V1_3::Request& request,

297

const hidl_vec<hidl_handle>& fenceWaitFor,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

298

V1_2::MeasureTiming measureTiming,

299

const V1_3::OptionalTimePoint& deadline,

300

const V1_3::OptionalTimeoutDuration& loopTimeoutDuration,

301

const V1_3::OptionalTimeoutDuration&,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

302

executeFenced_cb cb)

303

{

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

304

ALOGV("ArmnnPreparedModel_1_3::executeFenced(...)");

305

if (cb == nullptr)

306

{

307

ALOGE("ArmnnPreparedModel_1_3::executeFenced invalid callback passed");

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

308

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

return Void();

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

312

if (deadline.getDiscriminator() != V1_3::OptionalTimePoint::hidl_discriminator::none)

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

313

{

314

ALOGW("ArmnnPreparedModel_1_3::executeFenced parameter deadline is set but not supported.");

315

}

316

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

317

if (loopTimeoutDuration.getDiscriminator() != V1_3::OptionalTimeoutDuration::hidl_discriminator::none)

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

318

{

319

ALOGW("ArmnnPreparedModel_1_3::executeFenced parameter loopTimeoutDuration is set but not supported.");

320

}

321

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

322

if (!android::nn::validateRequest(request, m_Model, /*allowUnspecifiedOutput=*/false))

323

{

324

ALOGV("ArmnnPreparedModel_1_3::executeFenced outputs must be specified for fenced execution ");

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

325

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

return Void();

}

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

329

ExecutionContext_1_3 ctx;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

330

if (measureTiming == V1_2::MeasureTiming::YES)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

331

{

332

ctx.measureTimings = measureTiming;

333

ctx.driverStart = Now();

334

}

335

336

ALOGV("ArmnnPreparedModel_1_3::executeFenced(): %s", GetModelSummary(m_Model).c_str());

337

m_RequestCount++;

338

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

339

if (!m_RequestInputsAndOutputsDumpDir.empty())

340

{

341

ALOGD("Dumping inputs and outputs for request %" PRIuPTR, reinterpret_cast<std::uintptr_t>(&cb));

342

}

343

344

// This code snippet is inspired by the sample implementation in Android named SampleDriver::executeFenced()

345

// function. The original code is licensed under Apache-2.0 and can be found at the following link:

346

// https://android.googlesource.com/platform/frameworks/ml/+/master/nn/driver/sample/SampleDriver.cpp

347

const auto fenceSize = fenceWaitFor.size();

348

for (unsigned int index = 0; index < fenceSize; ++index)

349

{

350

auto fenceNativeHandle = fenceWaitFor[index].getNativeHandle();

351

if (!fenceNativeHandle)

352

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

353

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

return Void();

}

if (sync_wait(fenceNativeHandle->data[0], -1) < 0)

358

{

359

ALOGE("ArmnnPreparedModel_1_3::executeFenced sync fence failed.");

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

360

cb(V1_3::ErrorStatus::GENERAL_FAILURE, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

return Void();

}

}

TimePoint fenceExecutionStart;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

366

if (measureTiming == V1_2::MeasureTiming::YES)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

367

{

368

fenceExecutionStart = Now();

369

}

370

371

// map the memory pool into shared pointers

372

// use a shared memory pools vector on the heap, as it is passed to the request thread

373

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

374

375

// allocate the tensors on the heap, as they are passed to the request thread

376

auto inputs = std::make_shared<armnn::InputTensors>();

377

auto outputs = std::make_shared<armnn::OutputTensors>();

378

379

auto [status, outShapes, timings, message] = PrepareMemoryForIO(*inputs, *outputs, *memPools, request);

380

if (status != V1_3::ErrorStatus::NONE)

381

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

382

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

return Void();

}

ALOGV("ArmnnPreparedModel_1_3::executeFenced(...) before ExecuteGraph");

387

388

// call it with nullCallback for now as we will report the error status from here..

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

389

auto nullCallback = [](V1_3::ErrorStatus, std::vector<V1_2::OutputShape>, const V1_2::Timing&, std::string) {};

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

390

CallbackContext_1_3 cbCtx;

391

cbCtx.callback = nullCallback;

392

cbCtx.ctx = ctx;

393

394

auto errorStatus = ExecuteGraph(memPools, *inputs, *outputs, cbCtx);

395

if (errorStatus != V1_3::ErrorStatus::NONE)

396

{

397

cb(errorStatus, hidl_handle(nullptr), nullptr);

398

return Void();

399

}

400

ALOGV("ArmnnPreparedModel_1_3::executeFenced(...) after ExecuteGraph");

401

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

402

V1_2::Timing timing = g_NoTiming;

403

V1_2::Timing fenceTiming = g_NoTiming;

404

if (measureTiming == V1_2::MeasureTiming::YES)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

405

{

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

406

fenceTiming.timeOnDevice = MicrosecondsDuration(ctx.deviceEnd, ctx.deviceStart);

Kevin May

949a69e

2020-04-24 10:21:40 +0100

[diff] [blame]

407

fenceTiming.timeInDriver = MicrosecondsDuration(ctx.driverEnd, fenceExecutionStart);

408

ALOGV("ArmnnPreparedModel_1_3::fenceFinishExecutionTiming - Device = %lu Driver = %lu",

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

409

fenceTiming.timeOnDevice, fenceTiming.timeInDriver);

410

}

411

412

sp<ArmnnFencedExecutionCallback> armnnFencedExecutionCallback =

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

413

new ArmnnFencedExecutionCallback(V1_3::ErrorStatus::NONE, timing, fenceTiming);

414

cb(V1_3::ErrorStatus::NONE, hidl_handle(nullptr), armnnFencedExecutionCallback);

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

return Void();

}

template<typename HalVersion>

419

Return<V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::PrepareMemoryForInputs(

420

armnn::InputTensors& inputs,

421

const V1_3::Request& request,

422

const std::vector<android::nn::RunTimePoolInfo>& memPools)

423

{

424

inputs.reserve(request.inputs.size());

425

for (unsigned int i = 0; i < request.inputs.size(); i++)

426

{

427

const auto& inputArg = request.inputs[i];

428

429

const armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

430

const armnn::Tensor inputTensor = GetTensorForRequestArgument(inputArg, inputTensorInfo, memPools);

431

432

if (inputTensor.GetMemoryArea() == nullptr)

433

{

434

ALOGE("Cannot execute request. Error converting request input %u to tensor", i);

435

return V1_3::ErrorStatus::GENERAL_FAILURE;

436

}

437

438

inputs.emplace_back(i, inputTensor);

439

}

440

441

return V1_3::ErrorStatus::NONE;

442

}

443

444

template<typename HalVersion>

445

Return<V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::PrepareMemoryForOutputs(

446

armnn::OutputTensors& outputs,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

447

std::vector<V1_2::OutputShape> &outputShapes,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

448

const V1_3::Request& request,

449

const std::vector<android::nn::RunTimePoolInfo>& memPools)

450

{

451

outputs.reserve(request.outputs.size());

452

for (unsigned int i = 0; i < request.outputs.size(); i++)

453

{

454

const auto& outputArg = request.outputs[i];

455

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

456

armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

457

const armnn::Tensor outputTensor = GetTensorForRequestArgument(outputArg, outputTensorInfo, memPools);

458

if (outputTensor.GetMemoryArea() == nullptr)

459

{

460

ALOGE("Cannot execute request. Error converting request output %u to tensor", i);

461

return V1_3::ErrorStatus::GENERAL_FAILURE;

462

}

463

Teresa Charlin

4bd9a74

2020-08-12 12:58:50 +0100

[diff] [blame]

464

const size_t outputSize = outputTensorInfo.GetNumBytes();

465

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

466

unsigned int count = 0;

467

std::for_each(outputArg.dimensions.begin(), outputArg.dimensions.end(), [&](auto dim)

{

if (dim != 0)

{

outputTensorInfo.GetShape()[count] = dim;

}

else

{

outputTensorInfo.GetShape()[count] = outputArg.dimensions.size();

}

count++;

});

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

481

outputs.emplace_back(i, outputTensor);

482

outputShapes[i] = ComputeShape(outputTensorInfo);

483

484

if (outputArg.location.length < outputSize)

485

{

Teresa Charlin

4bd9a74

2020-08-12 12:58:50 +0100

[diff] [blame]

486

ALOGW("ArmnnPreparedModel_1_3::Execute failed outputArg.location.length (%s) < outputSize (%s)",

487

std::to_string(outputArg.location.length).c_str(), std::to_string(outputSize).c_str());

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

488

outputShapes[i].isSufficient = false;

489

return V1_3::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

490

}

491

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

492

size_t bufferSize = 0;

493

#if !defined(ARMNN_ANDROID_S)

494

bufferSize = memPools.at(outputArg.location.poolIndex).getHidlMemory().size();

495

if (bufferSize < outputSize)

496

#else

497

bufferSize = memPools.at(outputArg.location.poolIndex).getMemory().size;

498

#endif

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

499

if (bufferSize < outputSize)

500

{

Teresa Charlin

4bd9a74

2020-08-12 12:58:50 +0100

[diff] [blame]

501

ALOGW("ArmnnPreparedModel_1_3::Execute failed bufferSize (%s) < outputSize (%s)",

502

std::to_string(bufferSize).c_str(), std::to_string(outputSize).c_str());

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

503

outputShapes[i].isSufficient = false;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

504

return V1_3::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

505

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

506

}

507

508

return V1_3::ErrorStatus::NONE;

509

}

510

511

template<typename HalVersion>

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

512

std::tuple<V1_3::ErrorStatus, hidl_vec<V1_2::OutputShape>, V1_2::Timing, std::string>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

513

ArmnnPreparedModel_1_3<HalVersion>::PrepareMemoryForIO(armnn::InputTensors& inputs,

514

armnn::OutputTensors& outputs,

515

std::vector<android::nn::RunTimePoolInfo>& memPools,

516

const V1_3::Request& request)

517

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

518

#if !defined(ARMNN_ANDROID_S)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

519

if (!setRunTimePoolInfosFromMemoryPools(&memPools, request.pools))

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

520

#else

521

if (!setRunTimePoolInfosFromMemoryPools(&memPools, uncheckedConvert(request.pools)))

522

#endif

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

523

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

524

return {V1_3::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

525

}

526

527

// add the inputs and outputs with their data

528

try

529

{

530

if (PrepareMemoryForInputs(inputs, request, memPools) != V1_3::ErrorStatus::NONE)

531

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

532

return {V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

533

}

534

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

535

std::vector<V1_2::OutputShape> outputShapes(request.outputs.size());

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

536

537

auto errorStatus = PrepareMemoryForOutputs(outputs, outputShapes, request, memPools);

538

if (errorStatus != V1_3::ErrorStatus::NONE)

539

{

540

return {errorStatus, outputShapes, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

541

}

542

}

543

catch (armnn::Exception& e)

544

{

545

ALOGW("armnn::Exception caught while preparing for EnqueueWorkload: %s", e.what());

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

546

return {V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

547

}

548

catch (std::exception& e)

549

{

550

ALOGE("std::exception caught while preparing for EnqueueWorkload: %s", e.what());

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

551

return {V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

552

}

553

554

return {V1_3::ErrorStatus::NONE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

555

}

556

557

template<typename HalVersion>

558

template<typename CallbackContext>

559

Return<void> ArmnnPreparedModel_1_3<HalVersion>::ExecuteSynchronously(const V1_3::Request& request,

560

CallbackContext cbCtx)

561

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

562

if (cbCtx.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

563

{

564

cbCtx.ctx.driverStart = Now();

565

}

566

567

if (!android::nn::validateRequest(convertToV1_3(request), m_Model))

568

{

569

ALOGE("ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

570

cbCtx.callback(V1_3::ErrorStatus::INVALID_ARGUMENT,

571

{},

572

g_NoTiming,

573

"ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

return Void();

}

if (!android::nn::validateRequest(request, m_Model))

578

{

579

ALOGE("ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

580

cbCtx.callback(V1_3::ErrorStatus::INVALID_ARGUMENT,

581

{},

582

g_NoTiming,

583

"ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

Sadik Armagan

ef8a393

2020-04-09 17:21:50 +0100

[diff] [blame]

584

return Void();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

}

// map the memory pool into shared pointers

589

// use a shared memory pools vector on the heap, as it is passed to the request thread

590

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

591

592

// allocate the tensors on the heap, as they are passed to the request thread

593

auto inputs = std::make_shared<armnn::InputTensors>();

594

auto outputs = std::make_shared<armnn::OutputTensors>();

595

596

auto [status, outputShapes, timing, message] = PrepareMemoryForIO(*inputs, *outputs, *memPools, request);

597

if (status != V1_3::ErrorStatus::NONE)

598

{

599

cbCtx.callback(status, outputShapes, timing, message);

Sadik Armagan

ef8a393

2020-04-09 17:21:50 +0100

[diff] [blame]

600

return Void();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

601

}

602

603

ALOGV("ArmnnPreparedModel_1_3::ExecuteSynchronously() before Execution");

604

605

ExecuteGraph(memPools, *inputs, *outputs, cbCtx);

return Void();

}

template<typename HalVersion>

610

Return<void> ArmnnPreparedModel_1_3<HalVersion>::executeSynchronously(const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

611

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

612

executeSynchronously_cb cb)

613

{

614

ALOGV("ArmnnPreparedModel_1_3::executeSynchronously(): %s", GetModelSummary(m_Model).c_str());

m_RequestCount++;

if (cb == nullptr)

{

ALOGE("ArmnnPreparedModel_1_3::executeSynchronously invalid callback passed");

return Void();

}

auto cbWrapper = [cb](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

624

std::vector<V1_2::OutputShape> outputShapes,

625

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

626

std::string)

627

{

628

cb(convertToV1_0(errorStatus), outputShapes, timing);

629

};

630

631

CallbackContext_1_3 cbCtx;

632

cbCtx.callback = cbWrapper;

633

cbCtx.ctx.measureTimings = measureTiming;

634

635

ExecuteSynchronously(convertToV1_3(request), cbCtx);

return Void();

}

template<typename HalVersion>

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

640

Return<void> ArmnnPreparedModel_1_3<HalVersion>::executeSynchronously_1_3(

641

const V1_3::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

642

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

643

const V1_3::OptionalTimePoint& deadline,

644

const V1_3::OptionalTimeoutDuration& loopTimeoutDuration,

645

executeSynchronously_1_3_cb cb)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

646

{

647

ALOGV("ArmnnPreparedModel_1_3::executeSynchronously_1_3(): %s", GetModelSummary(m_Model).c_str());

m_RequestCount++;

if (cb == nullptr)

{

ALOGE("ArmnnPreparedModel_1_3::executeSynchronously_1_3 invalid callback passed");

return Void();

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

656

if (deadline.getDiscriminator() != V1_3::OptionalTimePoint::hidl_discriminator::none)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

657

{

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

658

ALOGW("ArmnnPreparedModel_1_3::executeSynchronously_1_3 parameter deadline is set but not supported.");

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

659

}

660

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

661

if (loopTimeoutDuration.getDiscriminator() != V1_3::OptionalTimeoutDuration::hidl_discriminator::none)

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

662

{

663

ALOGW(

664

"ArmnnPreparedModel_1_3::executeSynchronously_1_3 parameter loopTimeoutDuration is set but not supported.");

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

665

}

666

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

667

auto cbWrapper = [cb](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

668

std::vector<V1_2::OutputShape> outputShapes,

669

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

670

std::string)

671

{

672

cb(errorStatus, outputShapes, timing);

673

};

674

675

CallbackContext_1_3 cbCtx;

676

cbCtx.callback = cbWrapper;

677

cbCtx.ctx.measureTimings = measureTiming;

678

679

ExecuteSynchronously(request, cbCtx);

return Void();

}

template<typename HalVersion>

684

Return<void> ArmnnPreparedModel_1_3<HalVersion>::configureExecutionBurst(

685

const sp<V1_2::IBurstCallback>& callback,

686

const MQDescriptorSync<V1_2::FmqRequestDatum>& requestChannel,

687

const MQDescriptorSync<V1_2::FmqResultDatum>& resultChannel,

688

V1_3::IPreparedModel::configureExecutionBurst_cb cb)

689

{

690

ALOGV("ArmnnPreparedModel_1_3::configureExecutionBurst");

691

const sp<V1_2::IBurstContext> burst = ExecutionBurstServer::create(callback,

requestChannel,

resultChannel,

this);

if (burst == nullptr)

697

{

698

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {});

}

else

{

cb(V1_0::ErrorStatus::NONE, burst);

}

return Void();

}

template<typename HalVersion>

708

template<typename CallbackContext>

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

709

Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::ExecuteGraph(

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

710

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

711

armnn::InputTensors& inputTensors,

712

armnn::OutputTensors& outputTensors,

713

CallbackContext cb)

714

{

715

ALOGV("ArmnnPreparedModel_1_3::ExecuteGraph(...)");

716

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

717

DumpTensorsIfRequired("Input", inputTensors);

718

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

719

std::vector<V1_2::OutputShape> outputShapes(outputTensors.size());

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

720

for (unsigned int i = 0; i < outputTensors.size(); i++)

721

{

722

std::pair<int, armnn::Tensor> outputTensorPair = outputTensors[i];

723

const armnn::Tensor outputTensor = outputTensorPair.second;

724

const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();

725

726

outputShapes[i] = ComputeShape(outputTensorInfo);

}

// run it

try

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

732

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

733

{

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

734

cb.ctx.deviceStart = Now();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

735

}

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

736

armnn::Status status;

737

if (m_AsyncModelExecutionEnabled)

738

{

739

ALOGW("ArmnnPreparedModel_1_3::ExecuteGraph m_AsyncModelExecutionEnabled true");

740

status = m_Runtime->Execute(*m_WorkingMemHandle, inputTensors, outputTensors);

}

else

{

ALOGW("ArmnnPreparedModel_1_3::ExecuteGraph m_AsyncModelExecutionEnabled false");

745

status = m_Runtime->EnqueueWorkload(m_NetworkId, inputTensors, outputTensors);

746

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

747

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

748

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

749

{

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

750

cb.ctx.deviceEnd = Now();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

751

}

752

if (status != armnn::Status::Success)

753

{

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

754

ALOGW("ArmnnPreparedModel_1_3::ExecuteGraph EnqueueWorkload failed");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

755

cb.callback(V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

756

return V1_3::ErrorStatus::GENERAL_FAILURE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

757

}

758

}

759

catch (armnn::Exception& e)

760

{

761

ALOGW("armnn:Exception caught from EnqueueWorkload: %s", e.what());

762

cb.callback(V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

763

return V1_3::ErrorStatus::GENERAL_FAILURE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

764

}

765

catch (std::exception& e)

766

{

767

ALOGE("std::exception caught from EnqueueWorkload: %s", e.what());

768

cb.callback(V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

769

return V1_3::ErrorStatus::GENERAL_FAILURE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

770

}

771

772

CommitPools(*pMemPools);

773

774

DumpTensorsIfRequired("Output", outputTensors);

775

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

776

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

777

{

Kevin May

949a69e

2020-04-24 10:21:40 +0100

[diff] [blame]

778

cb.ctx.driverEnd = Now();

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

779

V1_2::Timing timing;

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

780

timing.timeOnDevice = MicrosecondsDuration(cb.ctx.deviceEnd, cb.ctx.deviceStart);

Kevin May

949a69e

2020-04-24 10:21:40 +0100

[diff] [blame]

781

timing.timeInDriver = MicrosecondsDuration(cb.ctx.driverEnd, cb.ctx.driverStart);

782

ALOGV("ArmnnPreparedModel_1_3::execute timing - Device = %lu Driver = %lu", timing.timeOnDevice,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

783

timing.timeInDriver);

784

cb.callback(V1_3::ErrorStatus::NONE, outputShapes, timing, "ArmnnPreparedModel_1_3::ExecuteGraph");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

785

} else

786

{

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

787

cb.callback(V1_3::ErrorStatus::NONE, outputShapes, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

788

}

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

789

return V1_3::ErrorStatus::NONE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

790

}

791

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

792

/// Schedule the graph prepared from the request for execution

793

template<typename HalVersion>

794

template<typename CallbackContext>

795

void ArmnnPreparedModel_1_3<HalVersion>::ScheduleGraphForExecution(

796

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

797

std::shared_ptr<armnn::InputTensors>& inputTensors,

798

std::shared_ptr<armnn::OutputTensors>& outputTensors,

799

CallbackContext callbackContext,

800

armnn::QosExecPriority priority)

801

{

802

ALOGV("ArmnnPreparedModel_1_3::ScheduleGraphForExecution(...)");

803

804

DumpTensorsIfRequired("Input", *inputTensors);

805

806

unsigned int outputTensorSize = outputTensors.get()->size();

807

std::vector<V1_2::OutputShape> outputShapes(outputTensorSize);

808

for (unsigned int i = 0; i < outputTensorSize; i++)

809

{

810

std::pair<int, armnn::Tensor> outputTensorPair = outputTensors.get()->at(i);

811

const armnn::Tensor outputTensor = outputTensorPair.second;

812

const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();

813

814

outputShapes[i] = ComputeShape(outputTensorInfo);

815

}

816

817

auto tpCb = std::make_shared<

818

ArmnnThreadPoolCallback_1_3<CallbackContext_1_3>>(this,

pMemPools,

outputShapes,

inputTensors,

outputTensors,

callbackContext);

m_Runtime->Schedule(m_NetworkId,

826

*tpCb->m_InputTensors,

827

*tpCb->m_OutputTensors,

828

priority,

829

tpCb);

830

ALOGV("ArmnnPreparedModel_1_3::ScheduleGraphForExecution end");

831

}

832

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

833

template<typename HalVersion>

834

bool ArmnnPreparedModel_1_3<HalVersion>::ExecuteWithDummyInputs()

835

{

836

std::vector<std::vector<char>> storage;

837

armnn::InputTensors inputTensors;

838

for (unsigned int i = 0; i < getMainModel(m_Model).inputIndexes.size(); i++)

839

{

840

const armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

841

storage.emplace_back(inputTensorInfo.GetNumBytes());

842

const armnn::ConstTensor inputTensor(inputTensorInfo, storage.back().data());

843

844

inputTensors.emplace_back(i, inputTensor);

845

}

846

847

armnn::OutputTensors outputTensors;

848

for (unsigned int i = 0; i < getMainModel(m_Model).outputIndexes.size(); i++)

849

{

850

const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

851

storage.emplace_back(outputTensorInfo.GetNumBytes());

852

const armnn::Tensor outputTensor(outputTensorInfo, storage.back().data());

853

854

outputTensors.emplace_back(i, outputTensor);

855

}

856

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

857

auto nullCallback = [](V1_3::ErrorStatus, std::vector<V1_2::OutputShape>, const V1_2::Timing&, std::string) {};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

858

CallbackContext_1_3 callbackContext;

859

callbackContext.callback = nullCallback;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

860

callbackContext.ctx.measureTimings = V1_2::MeasureTiming::NO;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

861

auto memPools = std::make_shared<std::vector<::android::nn::RunTimePoolInfo>>();

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

862

863

auto errorStatus = ExecuteGraph(memPools,

inputTensors,

outputTensors,

callbackContext);

return errorStatus == V1_3::ErrorStatus::NONE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

868

}

869

870

template<typename HalVersion>

871

Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::Execute(const V1_3::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

872

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

873

CallbackAsync_1_3 callback)

874

{

875

ExecutionContext_1_3 ctx;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

876

if (measureTiming == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

877

{

878

ctx.measureTimings = measureTiming;

879

ctx.driverStart = Now();

880

}

881

882

ALOGV("ArmnnPreparedModel_1_3::execute(): %s", GetModelSummary(m_Model).c_str());

883

m_RequestCount++;

884

885

if (!android::nn::validateRequest(request, m_Model))

886

{

887

callback(V1_3::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute");

888

return V1_3::ErrorStatus::INVALID_ARGUMENT;

889

}

890

891

if (!m_RequestInputsAndOutputsDumpDir.empty())

892

{

893

ALOGD("Dumping inputs and outputs for request %" PRIuPTR, reinterpret_cast<std::uintptr_t>(&callback));

894

}

895

896

// map the memory pool into shared pointers

897

// use a shared memory pools vector on the heap, as it is passed to the request thread

898

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

899

900

// allocate the tensors on the heap, as they are passed to the request thread

901

auto inputTensors = std::make_shared<armnn::InputTensors>();

902

auto outputTensors = std::make_shared<armnn::OutputTensors>();

903

904

auto [status, outShapes, timing, message] = PrepareMemoryForIO(*inputTensors, *outputTensors,

905

*memPools, request);

906

if (status != V1_3::ErrorStatus::NONE)

907

{

908

callback(status, outShapes, timing, message);

}

switch(status)

{

case V1_3::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE:

914

return V1_3::ErrorStatus::NONE;

915

case V1_3::ErrorStatus::GENERAL_FAILURE:

916

return V1_3::ErrorStatus::GENERAL_FAILURE;

Sadik Armagan

a07d275

2021-05-12 20:33:58 +0100

[diff] [blame]

917

case V1_3::ErrorStatus::INVALID_ARGUMENT:

918

return V1_3::ErrorStatus::INVALID_ARGUMENT;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

919

default:

920

{}

921

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

922

CallbackContext_1_3 cb;

923

cb.callback = callback;

924

cb.ctx = ctx;

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

925

926

927

enum class QosExecPriority

{

Low = 0,

Medium = 1,

High = 2

};

if (m_AsyncModelExecutionEnabled)

936

{

937

armnn::QosExecPriority priority;

938

939

switch (GetModelPriority()) {

940

case V1_3::Priority::LOW:

941

priority = armnn::QosExecPriority::Low;

942

break;

943

case V1_3::Priority::MEDIUM:

944

priority = armnn::QosExecPriority::Medium;

945

break;

946

case V1_3::Priority::HIGH:

947

priority = armnn::QosExecPriority::High;

948

break;

949

default:

950

priority = armnn::QosExecPriority::Medium;

}

ALOGV("ArmnnPreparedModel_1_3::execute(...) before ScheduleGraphForExecution");

955

ScheduleGraphForExecution(memPools, inputTensors, outputTensors, cb, priority);

956

ALOGV("ArmnnPreparedModel_1_3::execute(...) after ScheduleGraphForExecution");

957

return V1_3::ErrorStatus::NONE;

958

}

959

960

ALOGV("ArmnnPreparedModel_1_3::execute(...) before PostMsg");

961

// post the request for asynchronous execution

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

962

m_RequestThread.PostMsg(this, memPools, inputTensors, outputTensors, cb);

963

ALOGV("ArmnnPreparedModel_1_3::execute(...) after PostMsg");

964

return V1_3::ErrorStatus::NONE;

965

}

966

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

967

template<typename HalVersion>

968

V1_3::Priority ArmnnPreparedModel_1_3<HalVersion>::GetModelPriority()

969

{

970

return m_ModelPriority;

971

}

972

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

973

template<typename HalVersion>

974

template <typename CallbackContext>

975

void ArmnnPreparedModel_1_3<HalVersion>::ArmnnThreadPoolCallback_1_3<CallbackContext>::Notify(

976

armnn::Status status, armnn::InferenceTimingPair timeTaken)

977

{

978

ALOGV("ArmnnPreparedModel_1_3::ArmnnThreadPoolCallback_1_3<CallbackContext>::Notify");

979

CommitPools(*m_MemPools);

980

981

m_Model->DumpTensorsIfRequired("Output", *m_OutputTensors);

982

983

if (status != armnn::Status::Success)

984

{

985

ALOGW("ArmnnThreadPoolCallback_1_3::Notify EnqueueWorkload failed");

986

m_CallbackContext.callback(V1_3::ErrorStatus::GENERAL_FAILURE,

987

{},

988

g_NoTiming,

989

"ArmnnPreparedModel_1_3::ArmnnThreadPoolCallback_1_3");

return;

}

if (m_CallbackContext.ctx.measureTimings == V1_2::MeasureTiming::YES)

994

{

995

m_CallbackContext.ctx.deviceStart = timeTaken.first;

996

m_CallbackContext.ctx.deviceEnd = timeTaken.second;

997

m_CallbackContext.ctx.driverEnd = std::chrono::steady_clock::now();

998

V1_2::Timing timing;

999

timing.timeOnDevice = MicrosecondsDuration(m_CallbackContext.ctx.deviceEnd, m_CallbackContext.ctx.deviceStart);

1000

timing.timeInDriver = MicrosecondsDuration(m_CallbackContext.ctx.driverEnd, m_CallbackContext.ctx.driverStart);

1001

ALOGV("ArmnnPreparedModel_1_3::execute timing - Device = %lu Driver = %lu", timing.timeOnDevice,

1002

timing.timeInDriver);

1003

m_CallbackContext.callback(

1004

V1_3::ErrorStatus::NONE, m_OutputShapes, timing, "ArmnnPreparedModel_1_3::ExecuteGraph");

1005

} else

1006

{

1007

m_CallbackContext.callback(

1008

V1_3::ErrorStatus::NONE, m_OutputShapes, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

}

return;

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1013

#ifdef ARMNN_ANDROID_NN_V1_3

1014

template class ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>;

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

1015

template Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>::ExecuteGraph<CallbackContext_1_3>(

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1016

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

1017

armnn::InputTensors& pInputTensors,

1018

armnn::OutputTensors& pOutputTensors,

1019

CallbackContext_1_3 cb);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

1020

1021

template void ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>::ScheduleGraphForExecution<CallbackContext_1_3>(

1022

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

1023

std::shared_ptr<armnn::InputTensors>& inputTensors,

1024

std::shared_ptr<armnn::OutputTensors>& outputTensors,

1025

CallbackContext_1_3 callbackContext,

1026

armnn::QosExecPriority priority);

Kevin May