Blame - ArmnnPreparedModel_1_3.cpp - ml/android-nn-driver

2020-03-26 13:34:14 +0000

[diff] [blame]

1

//

Mike Kelly

e2d611e

2021-10-14 12:35:58 +0100

[diff] [blame]

2

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

3

// SPDX-License-Identifier: MIT

4

//

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

5

// Note: the ArmnnFencedExecutionCallback and code snippet in the executeFenced() function

6

// in this file is based on Android code

7

// under the Apache 2.0 license. See comments below for details.

8

//

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

9

10

#define LOG_TAG "ArmnnDriver"

11

12

#include "ArmnnPreparedModel_1_3.hpp"

13

#include "Utils.hpp"

14

Narumol Prangnawarat

2022-02-07 13:12:24 +0000

[diff] [blame^]

15

#include <armnn/Types.hpp>

16

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

17

#include <Utils.h>

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

18

#include <android/sync.h>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

19

#include <log/log.h>

20

#include <OperationsUtils.h>

21

#include <ExecutionBurstServer.h>

22

#include <ValidateHal.h>

23

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

24

#include <cinttypes>

25

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

26

#ifdef ARMNN_ANDROID_S

27

#include <LegacyUtils.h>

28

#endif

29

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

30

using namespace android;

31

using namespace android::hardware;

namespace {

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

35

static const V1_2::Timing g_NoTiming = {.timeOnDevice = UINT64_MAX, .timeInDriver = UINT64_MAX};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

36

using namespace armnn_driver;

37

using TimePoint = std::chrono::steady_clock::time_point;

TimePoint Now()

{

return std::chrono::steady_clock::now();

42

}

43

44

unsigned long MicrosecondsDuration(TimePoint endPoint, TimePoint startPoint)

45

{

46

return static_cast<unsigned long>(std::chrono::duration_cast<std::chrono::microseconds>(

47

endPoint - startPoint).count());

48

}

49

50

void NotifyCallbackAndCheck(const ::android::sp<V1_0::IExecutionCallback>& callback,

51

V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

52

std::vector<V1_2::OutputShape>,

53

const V1_2::Timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

54

std::string callingFunction)

55

{

56

Return<void> returned = callback->notify(convertToV1_0(errorStatus));

57

// This check is required, if the callback fails and it isn't checked it will bring down the service

58

if (!returned.isOk())

59

{

60

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

61

callingFunction.c_str(), returned.description().c_str());

}

}

void NotifyCallbackAndCheck(const ::android::sp<V1_2::IExecutionCallback>& callback,

66

V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

67

std::vector<V1_2::OutputShape> outputShapes,

68

const V1_2::Timing timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

69

std::string callingFunction)

70

{

71

Return<void> returned = callback->notify_1_2(convertToV1_0(errorStatus), outputShapes, timing);

72

// This check is required, if the callback fails and it isn't checked it will bring down the service

73

if (!returned.isOk())

74

{

75

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

76

callingFunction.c_str(), returned.description().c_str());

}

}

void NotifyCallbackAndCheck(const ::android::sp<V1_3::IExecutionCallback>& callback,

81

V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

82

std::vector<V1_2::OutputShape> outputShapes,

83

const V1_2::Timing timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

84

std::string callingFunction)

85

{

86

Return<void> returned = callback->notify_1_3(errorStatus, outputShapes, timing);

87

// This check is required, if the callback fails and it isn't checked it will bring down the service

88

if (!returned.isOk())

89

{

90

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

91

callingFunction.c_str(), returned.description().c_str());

}

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

95

bool ValidateRequestArgument(const V1_0::RequestArgument& requestArg, const armnn::TensorInfo& tensorInfo)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

96

{

97

if (requestArg.dimensions.size() != 0)

98

{

99

if (requestArg.dimensions.size() != tensorInfo.GetNumDimensions())

100

{

101

ALOGE("Mismatched dimensions (request argument: %zu, expected: %u)",

102

requestArg.dimensions.size(), tensorInfo.GetNumDimensions());

return false;

}

for (unsigned int d = 0; d < tensorInfo.GetNumDimensions(); ++d)

107

{

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

108

if (requestArg.dimensions[d] != 0 && requestArg.dimensions[d] != tensorInfo.GetShape()[d])

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

109

{

110

ALOGE("Mismatched size for dimension %d (request argument: %u, expected %u)",

111

d, requestArg.dimensions[d], tensorInfo.GetShape()[d]);

return false;

}

}

}

return true;

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

120

armnn::Tensor GetTensorForRequestArgument(const V1_0::RequestArgument& requestArg,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

121

const armnn::TensorInfo& tensorInfo,

122

const std::vector<::android::nn::RunTimePoolInfo>& requestPools)

123

{

124

if (!ValidateRequestArgument(requestArg, tensorInfo))

125

{

126

return armnn::Tensor();

127

}

128

129

return armnn::Tensor(tensorInfo, GetMemoryFromPool(requestArg.location, requestPools));

130

}

131

132

inline std::string BuildTensorName(const char* tensorNamePrefix, std::size_t index)

133

{

134

return tensorNamePrefix + std::to_string(index);

135

}

136

137

} // anonymous namespace

138

139

using namespace android::hardware;

140

141

namespace armnn_driver

142

{

143

144

template<typename HalVersion>

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

145

RequestThread_1_3<ArmnnPreparedModel_1_3, HalVersion, CallbackContext_1_3>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

146

ArmnnPreparedModel_1_3<HalVersion>::m_RequestThread;

147

148

template<typename HalVersion>

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

149

std::unique_ptr<armnn::Threadpool> ArmnnPreparedModel_1_3<HalVersion>::m_Threadpool(nullptr);

150

151

template<typename HalVersion>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

152

template<typename TensorBindingCollection>

153

void ArmnnPreparedModel_1_3<HalVersion>::DumpTensorsIfRequired(char const* tensorNamePrefix,

154

const TensorBindingCollection& tensorBindings)

155

{

156

if (!m_RequestInputsAndOutputsDumpDir.empty())

157

{

Colm Donelan

08d9a1c

2020-09-09 17:56:55 +0100

[diff] [blame]

158

const std::string requestName = std::to_string(m_NetworkId) + "_" + std::to_string(m_RequestCount) + ".dump";

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

159

for (std::size_t i = 0u; i < tensorBindings.size(); ++i)

160

{

161

DumpTensor(m_RequestInputsAndOutputsDumpDir,

162

requestName,

163

BuildTensorName(tensorNamePrefix, i),

164

tensorBindings[i].second);

}

}

}

template<typename HalVersion>

170

ArmnnPreparedModel_1_3<HalVersion>::ArmnnPreparedModel_1_3(armnn::NetworkId networkId,

171

armnn::IRuntime* runtime,

172

const V1_3::Model& model,

173

const std::string& requestInputsAndOutputsDumpDir,

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

174

const bool gpuProfilingEnabled,

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

175

V1_3::Priority priority,

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

176

const bool asyncModelExecutionEnabled,

Narumol Prangnawarat

2022-02-07 13:12:24 +0000

[diff] [blame^]

177

const unsigned int numberOfThreads,

178

const bool importEnabled,

179

const bool exportEnabled)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

180

: m_NetworkId(networkId)

, m_Runtime(runtime)

, m_Model(model)

, m_RequestCount(0)

, m_RequestInputsAndOutputsDumpDir(requestInputsAndOutputsDumpDir)

185

, m_GpuProfilingEnabled(gpuProfilingEnabled)

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

186

, m_ModelPriority(priority)

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

187

, m_AsyncModelExecutionEnabled(asyncModelExecutionEnabled)

Narumol Prangnawarat

2022-02-07 13:12:24 +0000

[diff] [blame^]

188

, m_EnableImport(importEnabled)

189

, m_EnableExport(exportEnabled)

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

190

, m_PreparedFromCache(false)

191

{

192

// Enable profiling if required.

193

m_Runtime->GetProfiler(m_NetworkId)->EnableProfiling(m_GpuProfilingEnabled);

194

195

if (m_AsyncModelExecutionEnabled)

196

{

197

std::vector<std::shared_ptr<armnn::IWorkingMemHandle>> memHandles;

198

for (unsigned int i=0; i < numberOfThreads; ++i)

199

{

200

memHandles.emplace_back(m_Runtime->CreateWorkingMemHandle(networkId));

}

if (!m_Threadpool)

{

m_Threadpool = std::make_unique<armnn::Threadpool>(numberOfThreads, runtime, memHandles);

}

else

{

m_Threadpool->LoadMemHandles(memHandles);

210

}

211

212

m_WorkingMemHandle = memHandles.back();

}

}

template<typename HalVersion>

217

ArmnnPreparedModel_1_3<HalVersion>::ArmnnPreparedModel_1_3(armnn::NetworkId networkId,

218

armnn::IRuntime* runtime,

219

const std::string& requestInputsAndOutputsDumpDir,

220

const bool gpuProfilingEnabled,

221

V1_3::Priority priority,

222

const bool asyncModelExecutionEnabled,

223

const unsigned int numberOfThreads,

Narumol Prangnawarat

2022-02-07 13:12:24 +0000

[diff] [blame^]

224

const bool importEnabled,

225

const bool exportEnabled,

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

226

const bool preparedFromCache)

227

: m_NetworkId(networkId)

228

, m_Runtime(runtime)

229

, m_RequestCount(0)

230

, m_RequestInputsAndOutputsDumpDir(requestInputsAndOutputsDumpDir)

231

, m_GpuProfilingEnabled(gpuProfilingEnabled)

232

, m_ModelPriority(priority)

233

, m_AsyncModelExecutionEnabled(asyncModelExecutionEnabled)

Narumol Prangnawarat

2022-02-07 13:12:24 +0000

[diff] [blame^]

234

, m_EnableImport(importEnabled)

235

, m_EnableExport(exportEnabled)

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

236

, m_PreparedFromCache(preparedFromCache)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

237

{

238

// Enable profiling if required.

239

m_Runtime->GetProfiler(m_NetworkId)->EnableProfiling(m_GpuProfilingEnabled);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

240

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

241

if (m_AsyncModelExecutionEnabled)

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

242

{

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

243

std::vector<std::shared_ptr<armnn::IWorkingMemHandle>> memHandles;

Finn Williams

d27c13b

2021-06-25 10:06:09 +0100

[diff] [blame]

244

for (unsigned int i=0; i < numberOfThreads; ++i)

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

245

{

246

memHandles.emplace_back(m_Runtime->CreateWorkingMemHandle(networkId));

247

}

248

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

249

if (!m_Threadpool)

250

{

251

m_Threadpool = std::make_unique<armnn::Threadpool>(numberOfThreads, runtime, memHandles);

}

else

{

m_Threadpool->LoadMemHandles(memHandles);

256

}

257

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

258

m_WorkingMemHandle = memHandles.back();

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

259

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

260

}

261

262

template<typename HalVersion>

263

ArmnnPreparedModel_1_3<HalVersion>::~ArmnnPreparedModel_1_3()

264

{

265

// Get a hold of the profiler used by this model.

266

std::shared_ptr<armnn::IProfiler> profiler = m_Runtime->GetProfiler(m_NetworkId);

Colm Donelan

12396f7

2022-02-15 14:59:08 +0000

[diff] [blame]

267

if (profiler && m_GpuProfilingEnabled)

268

{

269

// Dump the profiling info to a file if required.

270

DumpJsonProfilingIfRequired(m_GpuProfilingEnabled, m_RequestInputsAndOutputsDumpDir, m_NetworkId,

271

profiler.get());

272

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

273

274

// Unload the network associated with this model.

275

m_Runtime->UnloadNetwork(m_NetworkId);

276

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

277

// Unload the network memhandles from the threadpool

278

if (m_AsyncModelExecutionEnabled)

279

{

280

m_Threadpool->UnloadMemHandles(m_NetworkId);

281

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

282

}

283

284

template<typename HalVersion>

285

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::execute(const V1_0::Request& request,

286

const ::android::sp<V1_0::IExecutionCallback>& callback)

287

{

288

if (callback.get() == nullptr)

289

{

290

ALOGE("ArmnnPreparedModel_1_3::execute invalid callback passed");

291

return V1_0::ErrorStatus::INVALID_ARGUMENT;

292

}

293

294

auto cb = [callback](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

295

std::vector<V1_2::OutputShape> outputShapes,

296

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

297

std::string callingFunction)

298

{

299

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

};

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

303

return convertToV1_0(Execute(convertToV1_3(request), V1_2::MeasureTiming::NO, cb));

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

304

}

305

306

template<typename HalVersion>

307

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::execute_1_2(

308

const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

309

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

310

const sp<V1_2::IExecutionCallback>& callback)

311

{

312

if (callback.get() == nullptr)

313

{

314

ALOGE("ArmnnPreparedModel_1_3::execute_1_2 invalid callback passed");

315

return V1_0::ErrorStatus::INVALID_ARGUMENT;

316

}

317

318

auto cb = [callback](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

319

std::vector<V1_2::OutputShape> outputShapes,

320

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

321

std::string callingFunction)

322

{

323

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

324

};

325

326

return convertToV1_0(Execute(convertToV1_3(request), measureTiming, cb));

327

}

328

329

template<typename HalVersion>

330

Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::execute_1_3(

331

const V1_3::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

332

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

333

const V1_3::OptionalTimePoint&,

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

334

const V1_3::OptionalTimeoutDuration&,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

335

const sp<V1_3::IExecutionCallback>& callback)

336

{

337

if (callback.get() == nullptr)

338

{

339

ALOGE("ArmnnPreparedModel_1_3::execute_1_3 invalid callback passed");

340

return V1_3::ErrorStatus::INVALID_ARGUMENT;

341

}

342

343

auto cb = [callback](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

344

std::vector<V1_2::OutputShape> outputShapes,

345

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

346

std::string callingFunction)

347

{

348

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

349

};

350

351

return Execute(request, measureTiming, cb);

352

}

353

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

354

/// This class is inspired by the sample implementation in Android named SampleFencedExecutionCallback.

355

/// The original code is licensed under Apache-2.0 and can be found at the following link:

356

/// https://android.googlesource.com/platform/frameworks/ml/+/master/nn/driver/sample/SampleDriver.h

357

class ArmnnFencedExecutionCallback : public V1_3::IFencedExecutionCallback

358

{

359

public:

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

360

ArmnnFencedExecutionCallback(V1_3::ErrorStatus errorStatus, V1_2::Timing timing, V1_2::Timing fenceTiming)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

361

: m_ErrorStatus(errorStatus), m_Timing(timing), m_FenceTiming(fenceTiming) {}

362

~ArmnnFencedExecutionCallback() {}

363

364

Return<void> getExecutionInfo(getExecutionInfo_cb callback) override

365

{

366

callback(m_ErrorStatus, m_Timing, m_FenceTiming);

return Void();

}

private:

V1_3::ErrorStatus m_ErrorStatus;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

371

V1_2::Timing m_Timing;

372

V1_2::Timing m_FenceTiming;

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

373

};

374

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

375

template<typename HalVersion>

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

376

Return<void> ArmnnPreparedModel_1_3<HalVersion>::executeFenced(const V1_3::Request& request,

377

const hidl_vec<hidl_handle>& fenceWaitFor,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

378

V1_2::MeasureTiming measureTiming,

379

const V1_3::OptionalTimePoint& deadline,

380

const V1_3::OptionalTimeoutDuration& loopTimeoutDuration,

381

const V1_3::OptionalTimeoutDuration&,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

382

executeFenced_cb cb)

383

{

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

384

ALOGV("ArmnnPreparedModel_1_3::executeFenced(...)");

385

if (cb == nullptr)

386

{

387

ALOGE("ArmnnPreparedModel_1_3::executeFenced invalid callback passed");

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

388

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

return Void();

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

392

if (deadline.getDiscriminator() != V1_3::OptionalTimePoint::hidl_discriminator::none)

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

393

{

394

ALOGW("ArmnnPreparedModel_1_3::executeFenced parameter deadline is set but not supported.");

395

}

396

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

397

if (loopTimeoutDuration.getDiscriminator() != V1_3::OptionalTimeoutDuration::hidl_discriminator::none)

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

398

{

399

ALOGW("ArmnnPreparedModel_1_3::executeFenced parameter loopTimeoutDuration is set but not supported.");

400

}

401

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

402

if (!m_PreparedFromCache && !android::nn::validateRequest(request, m_Model, /*allowUnspecifiedOutput=*/false))

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

403

{

404

ALOGV("ArmnnPreparedModel_1_3::executeFenced outputs must be specified for fenced execution ");

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

405

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

return Void();

}

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

409

ExecutionContext_1_3 ctx;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

410

if (measureTiming == V1_2::MeasureTiming::YES)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

411

{

412

ctx.measureTimings = measureTiming;

413

ctx.driverStart = Now();

414

}

415

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

416

if (!m_PreparedFromCache)

417

{

418

ALOGV("ArmnnPreparedModel_1_3::executeFenced(): %s", GetModelSummary(m_Model).c_str());

419

}

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

420

m_RequestCount++;

421

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

422

if (!m_RequestInputsAndOutputsDumpDir.empty())

423

{

424

ALOGD("Dumping inputs and outputs for request %" PRIuPTR, reinterpret_cast<std::uintptr_t>(&cb));

425

}

426

427

// This code snippet is inspired by the sample implementation in Android named SampleDriver::executeFenced()

428

// function. The original code is licensed under Apache-2.0 and can be found at the following link:

429

// https://android.googlesource.com/platform/frameworks/ml/+/master/nn/driver/sample/SampleDriver.cpp

430

const auto fenceSize = fenceWaitFor.size();

431

for (unsigned int index = 0; index < fenceSize; ++index)

432

{

433

auto fenceNativeHandle = fenceWaitFor[index].getNativeHandle();

434

if (!fenceNativeHandle)

435

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

436

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

return Void();

}

if (sync_wait(fenceNativeHandle->data[0], -1) < 0)

441

{

442

ALOGE("ArmnnPreparedModel_1_3::executeFenced sync fence failed.");

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

443

cb(V1_3::ErrorStatus::GENERAL_FAILURE, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

return Void();

}

}

TimePoint fenceExecutionStart;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

449

if (measureTiming == V1_2::MeasureTiming::YES)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

450

{

451

fenceExecutionStart = Now();

452

}

453

454

// map the memory pool into shared pointers

455

// use a shared memory pools vector on the heap, as it is passed to the request thread

456

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

457

458

// allocate the tensors on the heap, as they are passed to the request thread

459

auto inputs = std::make_shared<armnn::InputTensors>();

460

auto outputs = std::make_shared<armnn::OutputTensors>();

461

462

auto [status, outShapes, timings, message] = PrepareMemoryForIO(*inputs, *outputs, *memPools, request);

463

if (status != V1_3::ErrorStatus::NONE)

464

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

465

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

return Void();

}

ALOGV("ArmnnPreparedModel_1_3::executeFenced(...) before ExecuteGraph");

470

471

// call it with nullCallback for now as we will report the error status from here..

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

472

auto nullCallback = [](V1_3::ErrorStatus, std::vector<V1_2::OutputShape>, const V1_2::Timing&, std::string) {};

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

473

CallbackContext_1_3 cbCtx;

474

cbCtx.callback = nullCallback;

475

cbCtx.ctx = ctx;

476

477

auto errorStatus = ExecuteGraph(memPools, *inputs, *outputs, cbCtx);

478

if (errorStatus != V1_3::ErrorStatus::NONE)

479

{

480

cb(errorStatus, hidl_handle(nullptr), nullptr);

481

return Void();

482

}

483

ALOGV("ArmnnPreparedModel_1_3::executeFenced(...) after ExecuteGraph");

484

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

485

V1_2::Timing timing = g_NoTiming;

486

V1_2::Timing fenceTiming = g_NoTiming;

487

if (measureTiming == V1_2::MeasureTiming::YES)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

488

{

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

489

fenceTiming.timeOnDevice = MicrosecondsDuration(ctx.deviceEnd, ctx.deviceStart);

Kevin May

949a69e

2020-04-24 10:21:40 +0100

[diff] [blame]

490

fenceTiming.timeInDriver = MicrosecondsDuration(ctx.driverEnd, fenceExecutionStart);

491

ALOGV("ArmnnPreparedModel_1_3::fenceFinishExecutionTiming - Device = %lu Driver = %lu",

Zingo Andersen

7c56149

2022-01-25 11:09:41 +0100

[diff] [blame]

492

static_cast<unsigned long>(fenceTiming.timeOnDevice),

493

static_cast<unsigned long>(fenceTiming.timeInDriver));

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

494

}

495

496

sp<ArmnnFencedExecutionCallback> armnnFencedExecutionCallback =

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

497

new ArmnnFencedExecutionCallback(V1_3::ErrorStatus::NONE, timing, fenceTiming);

498

cb(V1_3::ErrorStatus::NONE, hidl_handle(nullptr), armnnFencedExecutionCallback);

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

return Void();

}

template<typename HalVersion>

503

Return<V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::PrepareMemoryForInputs(

504

armnn::InputTensors& inputs,

505

const V1_3::Request& request,

506

const std::vector<android::nn::RunTimePoolInfo>& memPools)

507

{

508

inputs.reserve(request.inputs.size());

509

for (unsigned int i = 0; i < request.inputs.size(); i++)

510

{

511

const auto& inputArg = request.inputs[i];

512

Cathal Corbett

e27d4e8

2021-10-28 12:28:35 +0100

[diff] [blame]

513

armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

514

// inputs (of type InputTensors) is composed of a vector of ConstTensors.

515

// Therefore, set all TensorInfo isConstant parameters of input Tensors to true.

516

inputTensorInfo.SetConstant();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

517

const armnn::Tensor inputTensor = GetTensorForRequestArgument(inputArg, inputTensorInfo, memPools);

518

519

if (inputTensor.GetMemoryArea() == nullptr)

520

{

521

ALOGE("Cannot execute request. Error converting request input %u to tensor", i);

522

return V1_3::ErrorStatus::GENERAL_FAILURE;

523

}

524

525

inputs.emplace_back(i, inputTensor);

526

}

527

528

return V1_3::ErrorStatus::NONE;

529

}

530

531

template<typename HalVersion>

532

Return<V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::PrepareMemoryForOutputs(

533

armnn::OutputTensors& outputs,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

534

std::vector<V1_2::OutputShape> &outputShapes,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

535

const V1_3::Request& request,

536

const std::vector<android::nn::RunTimePoolInfo>& memPools)

537

{

538

outputs.reserve(request.outputs.size());

539

for (unsigned int i = 0; i < request.outputs.size(); i++)

540

{

541

const auto& outputArg = request.outputs[i];

542

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

543

armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

544

const armnn::Tensor outputTensor = GetTensorForRequestArgument(outputArg, outputTensorInfo, memPools);

545

if (outputTensor.GetMemoryArea() == nullptr)

546

{

547

ALOGE("Cannot execute request. Error converting request output %u to tensor", i);

548

return V1_3::ErrorStatus::GENERAL_FAILURE;

549

}

550

Teresa Charlin

4bd9a74

2020-08-12 12:58:50 +0100

[diff] [blame]

551

const size_t outputSize = outputTensorInfo.GetNumBytes();

552

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

553

unsigned int count = 0;

554

std::for_each(outputArg.dimensions.begin(), outputArg.dimensions.end(), [&](auto dim)

{

if (dim != 0)

{

outputTensorInfo.GetShape()[count] = dim;

}

else

{

outputTensorInfo.GetShape()[count] = outputArg.dimensions.size();

}

count++;

});

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

568

outputs.emplace_back(i, outputTensor);

569

outputShapes[i] = ComputeShape(outputTensorInfo);

570

571

if (outputArg.location.length < outputSize)

572

{

Teresa Charlin

4bd9a74

2020-08-12 12:58:50 +0100

[diff] [blame]

573

ALOGW("ArmnnPreparedModel_1_3::Execute failed outputArg.location.length (%s) < outputSize (%s)",

574

std::to_string(outputArg.location.length).c_str(), std::to_string(outputSize).c_str());

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

575

outputShapes[i].isSufficient = false;

576

return V1_3::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

577

}

578

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

579

size_t bufferSize = 0;

580

#if !defined(ARMNN_ANDROID_S)

581

bufferSize = memPools.at(outputArg.location.poolIndex).getHidlMemory().size();

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

582

#else

Kevin May

dc873f6

2021-06-14 11:21:11 +0100

[diff] [blame]

583

bufferSize = memPools.at(outputArg.location.poolIndex).getSize();

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

584

#endif

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

585

if (bufferSize < outputSize)

586

{

Teresa Charlin

4bd9a74

2020-08-12 12:58:50 +0100

[diff] [blame]

587

ALOGW("ArmnnPreparedModel_1_3::Execute failed bufferSize (%s) < outputSize (%s)",

588

std::to_string(bufferSize).c_str(), std::to_string(outputSize).c_str());

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

589

outputShapes[i].isSufficient = false;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

590

return V1_3::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

591

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

592

}

593

594

return V1_3::ErrorStatus::NONE;

595

}

596

597

template<typename HalVersion>

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

598

std::tuple<V1_3::ErrorStatus, hidl_vec<V1_2::OutputShape>, V1_2::Timing, std::string>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

599

ArmnnPreparedModel_1_3<HalVersion>::PrepareMemoryForIO(armnn::InputTensors& inputs,

600

armnn::OutputTensors& outputs,

601

std::vector<android::nn::RunTimePoolInfo>& memPools,

602

const V1_3::Request& request)

603

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

604

#if !defined(ARMNN_ANDROID_S)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

605

if (!setRunTimePoolInfosFromMemoryPools(&memPools, request.pools))

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

606

#else

607

if (!setRunTimePoolInfosFromMemoryPools(&memPools, uncheckedConvert(request.pools)))

608

#endif

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

609

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

610

return {V1_3::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

611

}

612

613

// add the inputs and outputs with their data

614

try

615

{

616

if (PrepareMemoryForInputs(inputs, request, memPools) != V1_3::ErrorStatus::NONE)

617

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

618

return {V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

619

}

620

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

621

std::vector<V1_2::OutputShape> outputShapes(request.outputs.size());

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

622

623

auto errorStatus = PrepareMemoryForOutputs(outputs, outputShapes, request, memPools);

624

if (errorStatus != V1_3::ErrorStatus::NONE)

625

{

626

return {errorStatus, outputShapes, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

627

}

628

}

629

catch (armnn::Exception& e)

630

{

631

ALOGW("armnn::Exception caught while preparing for EnqueueWorkload: %s", e.what());

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

632

return {V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

633

}

634

catch (std::exception& e)

635

{

636

ALOGE("std::exception caught while preparing for EnqueueWorkload: %s", e.what());

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

637

return {V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

638

}

639

640

return {V1_3::ErrorStatus::NONE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

641

}

642

643

template<typename HalVersion>

644

template<typename CallbackContext>

645

Return<void> ArmnnPreparedModel_1_3<HalVersion>::ExecuteSynchronously(const V1_3::Request& request,

646

CallbackContext cbCtx)

647

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

648

if (cbCtx.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

649

{

650

cbCtx.ctx.driverStart = Now();

651

}

652

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

653

if (!m_PreparedFromCache && !android::nn::validateRequest(convertToV1_3(request), m_Model))

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

654

{

655

ALOGE("ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

656

cbCtx.callback(V1_3::ErrorStatus::INVALID_ARGUMENT,

657

{},

658

g_NoTiming,

659

"ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

return Void();

}

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

663

if (!m_PreparedFromCache && !android::nn::validateRequest(request, m_Model))

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

664

{

665

ALOGE("ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

666

cbCtx.callback(V1_3::ErrorStatus::INVALID_ARGUMENT,

667

{},

668

g_NoTiming,

669

"ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

Sadik Armagan

ef8a393

2020-04-09 17:21:50 +0100

[diff] [blame]

670

return Void();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

}

// map the memory pool into shared pointers

675

// use a shared memory pools vector on the heap, as it is passed to the request thread

676

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

677

678

// allocate the tensors on the heap, as they are passed to the request thread

679

auto inputs = std::make_shared<armnn::InputTensors>();

680

auto outputs = std::make_shared<armnn::OutputTensors>();

681

682

auto [status, outputShapes, timing, message] = PrepareMemoryForIO(*inputs, *outputs, *memPools, request);

683

if (status != V1_3::ErrorStatus::NONE)

684

{

685

cbCtx.callback(status, outputShapes, timing, message);

Sadik Armagan

ef8a393

2020-04-09 17:21:50 +0100

[diff] [blame]

686

return Void();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

687

}

688

689

ALOGV("ArmnnPreparedModel_1_3::ExecuteSynchronously() before Execution");

690

691

ExecuteGraph(memPools, *inputs, *outputs, cbCtx);

return Void();

}

template<typename HalVersion>

696

Return<void> ArmnnPreparedModel_1_3<HalVersion>::executeSynchronously(const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

697

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

698

executeSynchronously_cb cb)

699

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

700

if (!m_PreparedFromCache)

701

{

702

ALOGV("ArmnnPreparedModel_1_3::executeSynchronously(): %s", GetModelSummary(m_Model).c_str());

703

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

m_RequestCount++;

if (cb == nullptr)

{

ALOGE("ArmnnPreparedModel_1_3::executeSynchronously invalid callback passed");

return Void();

}

auto cbWrapper = [cb](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

713

std::vector<V1_2::OutputShape> outputShapes,

714

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

715

std::string)

716

{

717

cb(convertToV1_0(errorStatus), outputShapes, timing);

718

};

719

720

CallbackContext_1_3 cbCtx;

721

cbCtx.callback = cbWrapper;

722

cbCtx.ctx.measureTimings = measureTiming;

723

724

ExecuteSynchronously(convertToV1_3(request), cbCtx);

return Void();

}

template<typename HalVersion>

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

729

Return<void> ArmnnPreparedModel_1_3<HalVersion>::executeSynchronously_1_3(

730

const V1_3::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

731

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

732

const V1_3::OptionalTimePoint& deadline,

733

const V1_3::OptionalTimeoutDuration& loopTimeoutDuration,

734

executeSynchronously_1_3_cb cb)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

735

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

736

if (!m_PreparedFromCache)

737

{

738

ALOGV("ArmnnPreparedModel_1_3::executeSynchronously_1_3(): %s", GetModelSummary(m_Model).c_str());

739

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

m_RequestCount++;

if (cb == nullptr)

{

ALOGE("ArmnnPreparedModel_1_3::executeSynchronously_1_3 invalid callback passed");

return Void();

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

748

if (deadline.getDiscriminator() != V1_3::OptionalTimePoint::hidl_discriminator::none)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

749

{

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

750

ALOGW("ArmnnPreparedModel_1_3::executeSynchronously_1_3 parameter deadline is set but not supported.");

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

751

}

752

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

753

if (loopTimeoutDuration.getDiscriminator() != V1_3::OptionalTimeoutDuration::hidl_discriminator::none)

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

754

{

755

ALOGW(

756

"ArmnnPreparedModel_1_3::executeSynchronously_1_3 parameter loopTimeoutDuration is set but not supported.");

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

757

}

758

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

759

auto cbWrapper = [cb](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

760

std::vector<V1_2::OutputShape> outputShapes,

761

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

762

std::string)

763

{

764

cb(errorStatus, outputShapes, timing);

765

};

766

767

CallbackContext_1_3 cbCtx;

768

cbCtx.callback = cbWrapper;

769

cbCtx.ctx.measureTimings = measureTiming;

770

771

ExecuteSynchronously(request, cbCtx);

return Void();

}

template<typename HalVersion>

776

Return<void> ArmnnPreparedModel_1_3<HalVersion>::configureExecutionBurst(

777

const sp<V1_2::IBurstCallback>& callback,

778

const MQDescriptorSync<V1_2::FmqRequestDatum>& requestChannel,

779

const MQDescriptorSync<V1_2::FmqResultDatum>& resultChannel,

780

V1_3::IPreparedModel::configureExecutionBurst_cb cb)

781

{

782

ALOGV("ArmnnPreparedModel_1_3::configureExecutionBurst");

783

const sp<V1_2::IBurstContext> burst = ExecutionBurstServer::create(callback,

requestChannel,

resultChannel,

this);

if (burst == nullptr)

789

{

790

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {});

}

else

{

cb(V1_0::ErrorStatus::NONE, burst);

}

return Void();

}

template<typename HalVersion>

800

template<typename CallbackContext>

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

801

Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::ExecuteGraph(

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

802

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

803

armnn::InputTensors& inputTensors,

804

armnn::OutputTensors& outputTensors,

805

CallbackContext cb)

806

{

807

ALOGV("ArmnnPreparedModel_1_3::ExecuteGraph(...)");

808

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

809

DumpTensorsIfRequired("Input", inputTensors);

810

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

811

std::vector<V1_2::OutputShape> outputShapes(outputTensors.size());

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

812

for (unsigned int i = 0; i < outputTensors.size(); i++)

813

{

814

std::pair<int, armnn::Tensor> outputTensorPair = outputTensors[i];

815

const armnn::Tensor outputTensor = outputTensorPair.second;

816

const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();

817

818

outputShapes[i] = ComputeShape(outputTensorInfo);

}

// run it

try

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

824

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

825

{

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

826

cb.ctx.deviceStart = Now();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

827

}

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

828

armnn::Status status;

829

if (m_AsyncModelExecutionEnabled)

830

{

831

ALOGW("ArmnnPreparedModel_1_3::ExecuteGraph m_AsyncModelExecutionEnabled true");

832

status = m_Runtime->Execute(*m_WorkingMemHandle, inputTensors, outputTensors);

}

else

{

ALOGW("ArmnnPreparedModel_1_3::ExecuteGraph m_AsyncModelExecutionEnabled false");

Narumol Prangnawarat

2022-02-07 13:12:24 +0000

[diff] [blame^]

837

// Create a vector of Input and Output Ids which can be imported. An empty vector means all will be copied.

838

std::vector<armnn::ImportedInputId> importedInputIds;

839

if (m_EnableImport)

840

{

841

importedInputIds = m_Runtime->ImportInputs(m_NetworkId, inputTensors, armnn::MemorySource::Malloc);

842

}

843

std::vector<armnn::ImportedOutputId> importedOutputIds;

844

if (m_EnableExport)

845

{

846

importedOutputIds = m_Runtime->ImportOutputs(m_NetworkId, outputTensors, armnn::MemorySource::Malloc);

847

}

848

status = m_Runtime->EnqueueWorkload(m_NetworkId, inputTensors, outputTensors,

849

importedInputIds, importedOutputIds);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

850

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

851

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

852

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

853

{

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

854

cb.ctx.deviceEnd = Now();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

855

}

856

if (status != armnn::Status::Success)

857

{

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

858

ALOGW("ArmnnPreparedModel_1_3::ExecuteGraph EnqueueWorkload failed");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

859

cb.callback(V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

860

return V1_3::ErrorStatus::GENERAL_FAILURE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

861

}

862

}

863

catch (armnn::Exception& e)

864

{

865

ALOGW("armnn:Exception caught from EnqueueWorkload: %s", e.what());

866

cb.callback(V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

867

return V1_3::ErrorStatus::GENERAL_FAILURE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

868

}

869

catch (std::exception& e)

870

{

871

ALOGE("std::exception caught from EnqueueWorkload: %s", e.what());

872

cb.callback(V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

873

return V1_3::ErrorStatus::GENERAL_FAILURE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

874

}

875

876

CommitPools(*pMemPools);

877

878

DumpTensorsIfRequired("Output", outputTensors);

879

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

880

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

881

{

Kevin May

949a69e

2020-04-24 10:21:40 +0100

[diff] [blame]

882

cb.ctx.driverEnd = Now();

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

883

V1_2::Timing timing;

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

884

timing.timeOnDevice = MicrosecondsDuration(cb.ctx.deviceEnd, cb.ctx.deviceStart);

Kevin May

949a69e

2020-04-24 10:21:40 +0100

[diff] [blame]

885

timing.timeInDriver = MicrosecondsDuration(cb.ctx.driverEnd, cb.ctx.driverStart);

Zingo Andersen

7c56149

2022-01-25 11:09:41 +0100

[diff] [blame]

886

ALOGV("ArmnnPreparedModel_1_3::execute timing - Device = %lu Driver = %lu",

887

static_cast<unsigned long>(timing.timeOnDevice), static_cast<unsigned long>(timing.timeInDriver));

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

888

cb.callback(V1_3::ErrorStatus::NONE, outputShapes, timing, "ArmnnPreparedModel_1_3::ExecuteGraph");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

889

} else

890

{

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

891

cb.callback(V1_3::ErrorStatus::NONE, outputShapes, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

892

}

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

893

return V1_3::ErrorStatus::NONE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

894

}

895

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

896

/// Schedule the graph prepared from the request for execution

897

template<typename HalVersion>

898

template<typename CallbackContext>

899

void ArmnnPreparedModel_1_3<HalVersion>::ScheduleGraphForExecution(

900

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

901

std::shared_ptr<armnn::InputTensors>& inputTensors,

902

std::shared_ptr<armnn::OutputTensors>& outputTensors,

903

CallbackContext callbackContext,

904

armnn::QosExecPriority priority)

905

{

906

ALOGV("ArmnnPreparedModel_1_3::ScheduleGraphForExecution(...)");

907

908

DumpTensorsIfRequired("Input", *inputTensors);

909

910

unsigned int outputTensorSize = outputTensors.get()->size();

911

std::vector<V1_2::OutputShape> outputShapes(outputTensorSize);

912

for (unsigned int i = 0; i < outputTensorSize; i++)

913

{

914

std::pair<int, armnn::Tensor> outputTensorPair = outputTensors.get()->at(i);

915

const armnn::Tensor outputTensor = outputTensorPair.second;

916

const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();

917

918

outputShapes[i] = ComputeShape(outputTensorInfo);

919

}

920

921

auto tpCb = std::make_shared<

922

ArmnnThreadPoolCallback_1_3<CallbackContext_1_3>>(this,

pMemPools,

outputShapes,

inputTensors,

outputTensors,

callbackContext);

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

929

m_Threadpool->Schedule(m_NetworkId,

930

*tpCb->m_InputTensors,

931

*tpCb->m_OutputTensors,

932

priority,

933

tpCb);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

934

ALOGV("ArmnnPreparedModel_1_3::ScheduleGraphForExecution end");

935

}

936

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

937

template<typename HalVersion>

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

938

bool ArmnnPreparedModel_1_3<HalVersion>::ExecuteWithDummyInputs(unsigned int numInputs, unsigned int numOutputs)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

939

{

940

std::vector<std::vector<char>> storage;

941

armnn::InputTensors inputTensors;

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

942

for (unsigned int i = 0; i < numInputs; i++)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

943

{

Cathal Corbett

e27d4e8

2021-10-28 12:28:35 +0100

[diff] [blame]

944

armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

945

// pInputTensors (of type InputTensors) is composed of a vector of ConstTensors.

946

// Therefore, set all TensorInfo isConstant parameters of input Tensors to true.

947

inputTensorInfo.SetConstant();

948

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

949

storage.emplace_back(inputTensorInfo.GetNumBytes());

950

const armnn::ConstTensor inputTensor(inputTensorInfo, storage.back().data());

951

952

inputTensors.emplace_back(i, inputTensor);

953

}

954

955

armnn::OutputTensors outputTensors;

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

956

for (unsigned int i = 0; i < numOutputs; i++)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

957

{

958

const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

959

storage.emplace_back(outputTensorInfo.GetNumBytes());

960

const armnn::Tensor outputTensor(outputTensorInfo, storage.back().data());

961

962

outputTensors.emplace_back(i, outputTensor);

963

}

964

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

965

auto nullCallback = [](V1_3::ErrorStatus, std::vector<V1_2::OutputShape>, const V1_2::Timing&, std::string) {};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

966

CallbackContext_1_3 callbackContext;

967

callbackContext.callback = nullCallback;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

968

callbackContext.ctx.measureTimings = V1_2::MeasureTiming::NO;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

969

auto memPools = std::make_shared<std::vector<::android::nn::RunTimePoolInfo>>();

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

970

971

auto errorStatus = ExecuteGraph(memPools,

inputTensors,

outputTensors,

callbackContext);

return errorStatus == V1_3::ErrorStatus::NONE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

976

}

977

978

template<typename HalVersion>

979

Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::Execute(const V1_3::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

980

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

981

CallbackAsync_1_3 callback)

982

{

983

ExecutionContext_1_3 ctx;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

984

if (measureTiming == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

985

{

986

ctx.measureTimings = measureTiming;

987

ctx.driverStart = Now();

988

}

989

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

990

if (!m_PreparedFromCache)

991

{

992

ALOGV("ArmnnPreparedModel_1_3::execute(): %s", GetModelSummary(m_Model).c_str());

993

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

994

m_RequestCount++;

995

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

996

if (!m_PreparedFromCache && !android::nn::validateRequest(request, m_Model))

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

997

{

998

callback(V1_3::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute");

999

return V1_3::ErrorStatus::INVALID_ARGUMENT;

1000

}

1001

1002

if (!m_RequestInputsAndOutputsDumpDir.empty())

1003

{

1004

ALOGD("Dumping inputs and outputs for request %" PRIuPTR, reinterpret_cast<std::uintptr_t>(&callback));

1005

}

1006

1007

// map the memory pool into shared pointers

1008

// use a shared memory pools vector on the heap, as it is passed to the request thread

1009

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

1010

1011

// allocate the tensors on the heap, as they are passed to the request thread

1012

auto inputTensors = std::make_shared<armnn::InputTensors>();

1013

auto outputTensors = std::make_shared<armnn::OutputTensors>();

1014

1015

auto [status, outShapes, timing, message] = PrepareMemoryForIO(*inputTensors, *outputTensors,

1016

*memPools, request);

1017

if (status != V1_3::ErrorStatus::NONE)

1018

{

1019

callback(status, outShapes, timing, message);

}

switch(status)

{

case V1_3::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE:

1025

return V1_3::ErrorStatus::NONE;

1026

case V1_3::ErrorStatus::GENERAL_FAILURE:

1027

return V1_3::ErrorStatus::GENERAL_FAILURE;

Sadik Armagan

a07d275

2021-05-12 20:33:58 +0100

[diff] [blame]

1028

case V1_3::ErrorStatus::INVALID_ARGUMENT:

1029

return V1_3::ErrorStatus::INVALID_ARGUMENT;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1030

default:

1031

{}

1032

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1033

CallbackContext_1_3 cb;

1034

cb.callback = callback;

1035

cb.ctx = ctx;

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

1036

1037

1038

enum class QosExecPriority

{

Low = 0,

Medium = 1,

High = 2

};

if (m_AsyncModelExecutionEnabled)

1047

{

1048

armnn::QosExecPriority priority;

1049

1050

switch (GetModelPriority()) {

1051

case V1_3::Priority::LOW:

1052

priority = armnn::QosExecPriority::Low;

1053

break;

1054

case V1_3::Priority::MEDIUM:

1055

priority = armnn::QosExecPriority::Medium;

1056

break;

1057

case V1_3::Priority::HIGH:

1058

priority = armnn::QosExecPriority::High;

1059

break;

1060

default:

1061

priority = armnn::QosExecPriority::Medium;

}

ALOGV("ArmnnPreparedModel_1_3::execute(...) before ScheduleGraphForExecution");

1066

ScheduleGraphForExecution(memPools, inputTensors, outputTensors, cb, priority);

1067

ALOGV("ArmnnPreparedModel_1_3::execute(...) after ScheduleGraphForExecution");

1068

return V1_3::ErrorStatus::NONE;

1069

}

1070

1071

ALOGV("ArmnnPreparedModel_1_3::execute(...) before PostMsg");

1072

// post the request for asynchronous execution

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1073

m_RequestThread.PostMsg(this, memPools, inputTensors, outputTensors, cb);

1074

ALOGV("ArmnnPreparedModel_1_3::execute(...) after PostMsg");

1075

return V1_3::ErrorStatus::NONE;

1076

}

1077

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

1078

template<typename HalVersion>

1079

V1_3::Priority ArmnnPreparedModel_1_3<HalVersion>::GetModelPriority()

1080

{

1081

return m_ModelPriority;

1082

}

1083

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

1084

template<typename HalVersion>

1085

template <typename CallbackContext>

1086

void ArmnnPreparedModel_1_3<HalVersion>::ArmnnThreadPoolCallback_1_3<CallbackContext>::Notify(

1087

armnn::Status status, armnn::InferenceTimingPair timeTaken)

1088

{

1089

ALOGV("ArmnnPreparedModel_1_3::ArmnnThreadPoolCallback_1_3<CallbackContext>::Notify");

1090

CommitPools(*m_MemPools);

1091

1092

m_Model->DumpTensorsIfRequired("Output", *m_OutputTensors);

1093

1094

if (status != armnn::Status::Success)

1095

{

1096

ALOGW("ArmnnThreadPoolCallback_1_3::Notify EnqueueWorkload failed");

1097

m_CallbackContext.callback(V1_3::ErrorStatus::GENERAL_FAILURE,

1098

{},

1099

g_NoTiming,

1100

"ArmnnPreparedModel_1_3::ArmnnThreadPoolCallback_1_3");

return;

}

if (m_CallbackContext.ctx.measureTimings == V1_2::MeasureTiming::YES)

1105

{

1106

m_CallbackContext.ctx.deviceStart = timeTaken.first;

1107

m_CallbackContext.ctx.deviceEnd = timeTaken.second;

1108

m_CallbackContext.ctx.driverEnd = std::chrono::steady_clock::now();

1109

V1_2::Timing timing;

1110

timing.timeOnDevice = MicrosecondsDuration(m_CallbackContext.ctx.deviceEnd, m_CallbackContext.ctx.deviceStart);

1111

timing.timeInDriver = MicrosecondsDuration(m_CallbackContext.ctx.driverEnd, m_CallbackContext.ctx.driverStart);

Zingo Andersen

7c56149

2022-01-25 11:09:41 +0100

[diff] [blame]

1112

ALOGV("ArmnnPreparedModel_1_3::execute timing - Device = %lu Driver = %lu",

1113

static_cast<unsigned long>(timing.timeOnDevice), static_cast<unsigned long>(timing.timeInDriver));

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

1114

m_CallbackContext.callback(

1115

V1_3::ErrorStatus::NONE, m_OutputShapes, timing, "ArmnnPreparedModel_1_3::ExecuteGraph");

1116

} else

1117

{

1118

m_CallbackContext.callback(

1119

V1_3::ErrorStatus::NONE, m_OutputShapes, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

}

return;

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1124

#ifdef ARMNN_ANDROID_NN_V1_3

1125

template class ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>;

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

1126

template Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>::ExecuteGraph<CallbackContext_1_3>(

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1127

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

1128

armnn::InputTensors& pInputTensors,

1129

armnn::OutputTensors& pOutputTensors,

1130

CallbackContext_1_3 cb);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

1131

1132

template void ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>::ScheduleGraphForExecution<CallbackContext_1_3>(

1133

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

1134

std::shared_ptr<armnn::InputTensors>& inputTensors,

1135

std::shared_ptr<armnn::OutputTensors>& outputTensors,

1136

CallbackContext_1_3 callbackContext,

1137

armnn::QosExecPriority priority);

Kevin May