Blame - ArmnnPreparedModel_1_3.cpp - ml/android-nn-driver

2020-03-26 13:34:14 +0000

[diff] [blame]

1

//

Mike Kelly

2023-03-08 10:08:20 +0000

[diff] [blame]

2

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

3

// SPDX-License-Identifier: MIT

4

//

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

5

// Note: the ArmnnFencedExecutionCallback and code snippet in the executeFenced() function

6

// in this file is based on Android code

7

// under the Apache 2.0 license. See comments below for details.

8

//

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

9

10

#define LOG_TAG "ArmnnDriver"

11

12

#include "ArmnnPreparedModel_1_3.hpp"

13

#include "Utils.hpp"

14

Narumol Prangnawarat

2022-02-07 13:12:24 +0000

[diff] [blame]

15

#include <armnn/Types.hpp>

16

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

17

#include <Utils.h>

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

18

#include <android/sync.h>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

19

#include <log/log.h>

20

#include <OperationsUtils.h>

21

#include <ExecutionBurstServer.h>

22

#include <ValidateHal.h>

23

Colm Donelan

0fc16c6

2022-03-16 11:54:13 +0000

[diff] [blame]

24

#include <chrono>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

25

#include <cinttypes>

26

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

27

#ifdef ARMNN_ANDROID_S

28

#include <LegacyUtils.h>

29

#endif

30

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

31

using namespace android;

32

using namespace android::hardware;

namespace {

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

36

static const V1_2::Timing g_NoTiming = {.timeOnDevice = UINT64_MAX, .timeInDriver = UINT64_MAX};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

37

using namespace armnn_driver;

38

using TimePoint = std::chrono::steady_clock::time_point;

TimePoint Now()

{

return std::chrono::steady_clock::now();

43

}

44

45

unsigned long MicrosecondsDuration(TimePoint endPoint, TimePoint startPoint)

46

{

47

return static_cast<unsigned long>(std::chrono::duration_cast<std::chrono::microseconds>(

48

endPoint - startPoint).count());

49

}

50

51

void NotifyCallbackAndCheck(const ::android::sp<V1_0::IExecutionCallback>& callback,

52

V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

53

std::vector<V1_2::OutputShape>,

54

const V1_2::Timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

55

std::string callingFunction)

56

{

57

Return<void> returned = callback->notify(convertToV1_0(errorStatus));

58

// This check is required, if the callback fails and it isn't checked it will bring down the service

59

if (!returned.isOk())

60

{

61

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

62

callingFunction.c_str(), returned.description().c_str());

}

}

void NotifyCallbackAndCheck(const ::android::sp<V1_2::IExecutionCallback>& callback,

67

V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

68

std::vector<V1_2::OutputShape> outputShapes,

69

const V1_2::Timing timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

70

std::string callingFunction)

71

{

72

Return<void> returned = callback->notify_1_2(convertToV1_0(errorStatus), outputShapes, timing);

73

// This check is required, if the callback fails and it isn't checked it will bring down the service

74

if (!returned.isOk())

75

{

76

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

77

callingFunction.c_str(), returned.description().c_str());

}

}

void NotifyCallbackAndCheck(const ::android::sp<V1_3::IExecutionCallback>& callback,

82

V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

83

std::vector<V1_2::OutputShape> outputShapes,

84

const V1_2::Timing timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

85

std::string callingFunction)

86

{

87

Return<void> returned = callback->notify_1_3(errorStatus, outputShapes, timing);

88

// This check is required, if the callback fails and it isn't checked it will bring down the service

89

if (!returned.isOk())

90

{

91

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

92

callingFunction.c_str(), returned.description().c_str());

}

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

96

bool ValidateRequestArgument(const V1_0::RequestArgument& requestArg, const armnn::TensorInfo& tensorInfo)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

97

{

98

if (requestArg.dimensions.size() != 0)

99

{

100

if (requestArg.dimensions.size() != tensorInfo.GetNumDimensions())

101

{

102

ALOGE("Mismatched dimensions (request argument: %zu, expected: %u)",

103

requestArg.dimensions.size(), tensorInfo.GetNumDimensions());

return false;

}

for (unsigned int d = 0; d < tensorInfo.GetNumDimensions(); ++d)

108

{

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

109

if (requestArg.dimensions[d] != 0 && requestArg.dimensions[d] != tensorInfo.GetShape()[d])

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

110

{

111

ALOGE("Mismatched size for dimension %d (request argument: %u, expected %u)",

112

d, requestArg.dimensions[d], tensorInfo.GetShape()[d]);

return false;

}

}

}

return true;

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

121

armnn::Tensor GetTensorForRequestArgument(const V1_0::RequestArgument& requestArg,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

122

const armnn::TensorInfo& tensorInfo,

123

const std::vector<::android::nn::RunTimePoolInfo>& requestPools)

124

{

125

if (!ValidateRequestArgument(requestArg, tensorInfo))

126

{

127

return armnn::Tensor();

128

}

129

130

return armnn::Tensor(tensorInfo, GetMemoryFromPool(requestArg.location, requestPools));

131

}

132

133

inline std::string BuildTensorName(const char* tensorNamePrefix, std::size_t index)

134

{

135

return tensorNamePrefix + std::to_string(index);

136

}

137

138

} // anonymous namespace

139

140

using namespace android::hardware;

141

142

namespace armnn_driver

143

{

144

145

template<typename HalVersion>

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

146

RequestThread_1_3<ArmnnPreparedModel_1_3, HalVersion, CallbackContext_1_3>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

147

ArmnnPreparedModel_1_3<HalVersion>::m_RequestThread;

148

149

template<typename HalVersion>

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

150

std::unique_ptr<armnn::Threadpool> ArmnnPreparedModel_1_3<HalVersion>::m_Threadpool(nullptr);

151

152

template<typename HalVersion>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

153

template<typename TensorBindingCollection>

154

void ArmnnPreparedModel_1_3<HalVersion>::DumpTensorsIfRequired(char const* tensorNamePrefix,

155

const TensorBindingCollection& tensorBindings)

156

{

157

if (!m_RequestInputsAndOutputsDumpDir.empty())

158

{

Colm Donelan

08d9a1c

2020-09-09 17:56:55 +0100

[diff] [blame]

159

const std::string requestName = std::to_string(m_NetworkId) + "_" + std::to_string(m_RequestCount) + ".dump";

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

160

for (std::size_t i = 0u; i < tensorBindings.size(); ++i)

161

{

162

DumpTensor(m_RequestInputsAndOutputsDumpDir,

163

requestName,

164

BuildTensorName(tensorNamePrefix, i),

165

tensorBindings[i].second);

}

}

}

template<typename HalVersion>

171

ArmnnPreparedModel_1_3<HalVersion>::ArmnnPreparedModel_1_3(armnn::NetworkId networkId,

172

armnn::IRuntime* runtime,

173

const V1_3::Model& model,

174

const std::string& requestInputsAndOutputsDumpDir,

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

175

const bool gpuProfilingEnabled,

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

176

V1_3::Priority priority,

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

177

const bool asyncModelExecutionEnabled,

Narumol Prangnawarat

2022-02-07 13:12:24 +0000

[diff] [blame]

178

const unsigned int numberOfThreads,

179

const bool importEnabled,

180

const bool exportEnabled)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

181

: m_NetworkId(networkId)

, m_Runtime(runtime)

, m_Model(model)

, m_RequestCount(0)

, m_RequestInputsAndOutputsDumpDir(requestInputsAndOutputsDumpDir)

186

, m_GpuProfilingEnabled(gpuProfilingEnabled)

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

187

, m_ModelPriority(priority)

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

188

, m_AsyncModelExecutionEnabled(asyncModelExecutionEnabled)

Narumol Prangnawarat

2022-02-07 13:12:24 +0000

[diff] [blame]

189

, m_EnableImport(importEnabled)

190

, m_EnableExport(exportEnabled)

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

191

, m_PreparedFromCache(false)

192

{

193

// Enable profiling if required.

194

m_Runtime->GetProfiler(m_NetworkId)->EnableProfiling(m_GpuProfilingEnabled);

195

196

if (m_AsyncModelExecutionEnabled)

197

{

198

std::vector<std::shared_ptr<armnn::IWorkingMemHandle>> memHandles;

199

for (unsigned int i=0; i < numberOfThreads; ++i)

200

{

201

memHandles.emplace_back(m_Runtime->CreateWorkingMemHandle(networkId));

}

if (!m_Threadpool)

{

m_Threadpool = std::make_unique<armnn::Threadpool>(numberOfThreads, runtime, memHandles);

}

else

{

m_Threadpool->LoadMemHandles(memHandles);

211

}

212

213

m_WorkingMemHandle = memHandles.back();

}

}

template<typename HalVersion>

218

ArmnnPreparedModel_1_3<HalVersion>::ArmnnPreparedModel_1_3(armnn::NetworkId networkId,

219

armnn::IRuntime* runtime,

220

const std::string& requestInputsAndOutputsDumpDir,

221

const bool gpuProfilingEnabled,

222

V1_3::Priority priority,

223

const bool asyncModelExecutionEnabled,

224

const unsigned int numberOfThreads,

Narumol Prangnawarat

2022-02-07 13:12:24 +0000

[diff] [blame]

225

const bool importEnabled,

226

const bool exportEnabled,

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

227

const bool preparedFromCache)

228

: m_NetworkId(networkId)

229

, m_Runtime(runtime)

230

, m_RequestCount(0)

231

, m_RequestInputsAndOutputsDumpDir(requestInputsAndOutputsDumpDir)

232

, m_GpuProfilingEnabled(gpuProfilingEnabled)

233

, m_ModelPriority(priority)

234

, m_AsyncModelExecutionEnabled(asyncModelExecutionEnabled)

Narumol Prangnawarat

2022-02-07 13:12:24 +0000

[diff] [blame]

235

, m_EnableImport(importEnabled)

236

, m_EnableExport(exportEnabled)

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

237

, m_PreparedFromCache(preparedFromCache)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

238

{

239

// Enable profiling if required.

240

m_Runtime->GetProfiler(m_NetworkId)->EnableProfiling(m_GpuProfilingEnabled);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

241

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

242

if (m_AsyncModelExecutionEnabled)

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

243

{

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

244

std::vector<std::shared_ptr<armnn::IWorkingMemHandle>> memHandles;

Finn Williams

d27c13b

2021-06-25 10:06:09 +0100

[diff] [blame]

245

for (unsigned int i=0; i < numberOfThreads; ++i)

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

246

{

247

memHandles.emplace_back(m_Runtime->CreateWorkingMemHandle(networkId));

248

}

249

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

250

if (!m_Threadpool)

251

{

252

m_Threadpool = std::make_unique<armnn::Threadpool>(numberOfThreads, runtime, memHandles);

}

else

{

m_Threadpool->LoadMemHandles(memHandles);

257

}

258

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

259

m_WorkingMemHandle = memHandles.back();

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

260

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

261

}

262

263

template<typename HalVersion>

264

ArmnnPreparedModel_1_3<HalVersion>::~ArmnnPreparedModel_1_3()

265

{

266

// Get a hold of the profiler used by this model.

267

std::shared_ptr<armnn::IProfiler> profiler = m_Runtime->GetProfiler(m_NetworkId);

Colm Donelan

2048b68

2022-02-15 14:59:08 +0000

[diff] [blame]

268

if (profiler && m_GpuProfilingEnabled)

269

{

270

// Dump the profiling info to a file if required.

271

DumpJsonProfilingIfRequired(m_GpuProfilingEnabled, m_RequestInputsAndOutputsDumpDir, m_NetworkId,

272

profiler.get());

273

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

274

275

// Unload the network associated with this model.

276

m_Runtime->UnloadNetwork(m_NetworkId);

277

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

278

// Unload the network memhandles from the threadpool

279

if (m_AsyncModelExecutionEnabled)

280

{

281

m_Threadpool->UnloadMemHandles(m_NetworkId);

282

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

283

}

284

285

template<typename HalVersion>

286

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::execute(const V1_0::Request& request,

287

const ::android::sp<V1_0::IExecutionCallback>& callback)

288

{

289

if (callback.get() == nullptr)

290

{

291

ALOGE("ArmnnPreparedModel_1_3::execute invalid callback passed");

292

return V1_0::ErrorStatus::INVALID_ARGUMENT;

293

}

294

295

auto cb = [callback](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

296

std::vector<V1_2::OutputShape> outputShapes,

297

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

298

std::string callingFunction)

299

{

300

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

};

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

304

return convertToV1_0(Execute(convertToV1_3(request), V1_2::MeasureTiming::NO, cb));

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

305

}

306

307

template<typename HalVersion>

308

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::execute_1_2(

309

const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

310

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

311

const sp<V1_2::IExecutionCallback>& callback)

312

{

313

if (callback.get() == nullptr)

314

{

315

ALOGE("ArmnnPreparedModel_1_3::execute_1_2 invalid callback passed");

316

return V1_0::ErrorStatus::INVALID_ARGUMENT;

317

}

318

319

auto cb = [callback](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

320

std::vector<V1_2::OutputShape> outputShapes,

321

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

322

std::string callingFunction)

323

{

324

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

325

};

326

327

return convertToV1_0(Execute(convertToV1_3(request), measureTiming, cb));

328

}

329

330

template<typename HalVersion>

331

Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::execute_1_3(

332

const V1_3::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

333

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

334

const V1_3::OptionalTimePoint&,

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

335

const V1_3::OptionalTimeoutDuration&,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

336

const sp<V1_3::IExecutionCallback>& callback)

337

{

338

if (callback.get() == nullptr)

339

{

340

ALOGE("ArmnnPreparedModel_1_3::execute_1_3 invalid callback passed");

341

return V1_3::ErrorStatus::INVALID_ARGUMENT;

342

}

343

344

auto cb = [callback](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

345

std::vector<V1_2::OutputShape> outputShapes,

346

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

347

std::string callingFunction)

348

{

349

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

350

};

351

352

return Execute(request, measureTiming, cb);

353

}

354

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

355

/// This class is inspired by the sample implementation in Android named SampleFencedExecutionCallback.

356

/// The original code is licensed under Apache-2.0 and can be found at the following link:

357

/// https://android.googlesource.com/platform/frameworks/ml/+/master/nn/driver/sample/SampleDriver.h

358

class ArmnnFencedExecutionCallback : public V1_3::IFencedExecutionCallback

359

{

360

public:

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

361

ArmnnFencedExecutionCallback(V1_3::ErrorStatus errorStatus, V1_2::Timing timing, V1_2::Timing fenceTiming)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

362

: m_ErrorStatus(errorStatus), m_Timing(timing), m_FenceTiming(fenceTiming) {}

363

~ArmnnFencedExecutionCallback() {}

364

365

Return<void> getExecutionInfo(getExecutionInfo_cb callback) override

366

{

367

callback(m_ErrorStatus, m_Timing, m_FenceTiming);

return Void();

}

private:

V1_3::ErrorStatus m_ErrorStatus;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

372

V1_2::Timing m_Timing;

373

V1_2::Timing m_FenceTiming;

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

374

};

375

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

376

template<typename HalVersion>

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

377

Return<void> ArmnnPreparedModel_1_3<HalVersion>::executeFenced(const V1_3::Request& request,

378

const hidl_vec<hidl_handle>& fenceWaitFor,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

379

V1_2::MeasureTiming measureTiming,

380

const V1_3::OptionalTimePoint& deadline,

381

const V1_3::OptionalTimeoutDuration& loopTimeoutDuration,

382

const V1_3::OptionalTimeoutDuration&,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

383

executeFenced_cb cb)

384

{

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

385

ALOGV("ArmnnPreparedModel_1_3::executeFenced(...)");

386

if (cb == nullptr)

387

{

388

ALOGE("ArmnnPreparedModel_1_3::executeFenced invalid callback passed");

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

389

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

return Void();

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

393

if (deadline.getDiscriminator() != V1_3::OptionalTimePoint::hidl_discriminator::none)

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

394

{

395

ALOGW("ArmnnPreparedModel_1_3::executeFenced parameter deadline is set but not supported.");

396

}

397

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

398

if (loopTimeoutDuration.getDiscriminator() != V1_3::OptionalTimeoutDuration::hidl_discriminator::none)

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

399

{

400

ALOGW("ArmnnPreparedModel_1_3::executeFenced parameter loopTimeoutDuration is set but not supported.");

401

}

402

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

403

if (!m_PreparedFromCache && !android::nn::validateRequest(request, m_Model, /*allowUnspecifiedOutput=*/false))

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

404

{

405

ALOGV("ArmnnPreparedModel_1_3::executeFenced outputs must be specified for fenced execution ");

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

406

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

return Void();

}

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

410

ExecutionContext_1_3 ctx;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

411

if (measureTiming == V1_2::MeasureTiming::YES)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

412

{

413

ctx.measureTimings = measureTiming;

414

ctx.driverStart = Now();

415

}

416

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

417

if (!m_PreparedFromCache)

418

{

419

ALOGV("ArmnnPreparedModel_1_3::executeFenced(): %s", GetModelSummary(m_Model).c_str());

420

}

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

421

m_RequestCount++;

422

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

423

if (!m_RequestInputsAndOutputsDumpDir.empty())

424

{

425

ALOGD("Dumping inputs and outputs for request %" PRIuPTR, reinterpret_cast<std::uintptr_t>(&cb));

426

}

427

428

// This code snippet is inspired by the sample implementation in Android named SampleDriver::executeFenced()

429

// function. The original code is licensed under Apache-2.0 and can be found at the following link:

430

// https://android.googlesource.com/platform/frameworks/ml/+/master/nn/driver/sample/SampleDriver.cpp

431

const auto fenceSize = fenceWaitFor.size();

432

for (unsigned int index = 0; index < fenceSize; ++index)

433

{

434

auto fenceNativeHandle = fenceWaitFor[index].getNativeHandle();

435

if (!fenceNativeHandle)

436

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

437

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

return Void();

}

if (sync_wait(fenceNativeHandle->data[0], -1) < 0)

442

{

443

ALOGE("ArmnnPreparedModel_1_3::executeFenced sync fence failed.");

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

444

cb(V1_3::ErrorStatus::GENERAL_FAILURE, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

return Void();

}

}

TimePoint fenceExecutionStart;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

450

if (measureTiming == V1_2::MeasureTiming::YES)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

451

{

452

fenceExecutionStart = Now();

453

}

454

455

// map the memory pool into shared pointers

456

// use a shared memory pools vector on the heap, as it is passed to the request thread

457

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

458

459

// allocate the tensors on the heap, as they are passed to the request thread

460

auto inputs = std::make_shared<armnn::InputTensors>();

461

auto outputs = std::make_shared<armnn::OutputTensors>();

462

463

auto [status, outShapes, timings, message] = PrepareMemoryForIO(*inputs, *outputs, *memPools, request);

464

if (status != V1_3::ErrorStatus::NONE)

465

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

466

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

return Void();

}

ALOGV("ArmnnPreparedModel_1_3::executeFenced(...) before ExecuteGraph");

471

472

// call it with nullCallback for now as we will report the error status from here..

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

473

auto nullCallback = [](V1_3::ErrorStatus, std::vector<V1_2::OutputShape>, const V1_2::Timing&, std::string) {};

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

474

CallbackContext_1_3 cbCtx;

475

cbCtx.callback = nullCallback;

476

cbCtx.ctx = ctx;

477

478

auto errorStatus = ExecuteGraph(memPools, *inputs, *outputs, cbCtx);

479

if (errorStatus != V1_3::ErrorStatus::NONE)

480

{

481

cb(errorStatus, hidl_handle(nullptr), nullptr);

482

return Void();

483

}

484

ALOGV("ArmnnPreparedModel_1_3::executeFenced(...) after ExecuteGraph");

485

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

486

V1_2::Timing timing = g_NoTiming;

487

V1_2::Timing fenceTiming = g_NoTiming;

488

if (measureTiming == V1_2::MeasureTiming::YES)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

489

{

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

490

fenceTiming.timeOnDevice = MicrosecondsDuration(ctx.deviceEnd, ctx.deviceStart);

Kevin May

949a69e

2020-04-24 10:21:40 +0100

[diff] [blame]

491

fenceTiming.timeInDriver = MicrosecondsDuration(ctx.driverEnd, fenceExecutionStart);

492

ALOGV("ArmnnPreparedModel_1_3::fenceFinishExecutionTiming - Device = %lu Driver = %lu",

Zingo Andersen

7c56149

2022-01-25 11:09:41 +0100

[diff] [blame]

493

static_cast<unsigned long>(fenceTiming.timeOnDevice),

494

static_cast<unsigned long>(fenceTiming.timeInDriver));

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

495

}

496

497

sp<ArmnnFencedExecutionCallback> armnnFencedExecutionCallback =

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

498

new ArmnnFencedExecutionCallback(V1_3::ErrorStatus::NONE, timing, fenceTiming);

499

cb(V1_3::ErrorStatus::NONE, hidl_handle(nullptr), armnnFencedExecutionCallback);

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

return Void();

}

template<typename HalVersion>

504

Return<V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::PrepareMemoryForInputs(

505

armnn::InputTensors& inputs,

506

const V1_3::Request& request,

507

const std::vector<android::nn::RunTimePoolInfo>& memPools)

508

{

509

inputs.reserve(request.inputs.size());

510

for (unsigned int i = 0; i < request.inputs.size(); i++)

511

{

512

const auto& inputArg = request.inputs[i];

Cathal Corbett

e27d4e8

2021-10-28 12:28:35 +0100

[diff] [blame]

513

armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

514

// inputs (of type InputTensors) is composed of a vector of ConstTensors.

515

// Therefore, set all TensorInfo isConstant parameters of input Tensors to true.

516

inputTensorInfo.SetConstant();

Mike Kelly

2023-03-08 10:08:20 +0000

[diff] [blame]

517

auto result = ValidateRequestArgument<V1_3::ErrorStatus, V1_3::Request>(request,

inputTensorInfo,

inputArg,

"input");

if (result != V1_3::ErrorStatus::NONE)

{

return result;

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

527

const armnn::Tensor inputTensor = GetTensorForRequestArgument(inputArg, inputTensorInfo, memPools);

528

529

if (inputTensor.GetMemoryArea() == nullptr)

530

{

531

ALOGE("Cannot execute request. Error converting request input %u to tensor", i);

532

return V1_3::ErrorStatus::GENERAL_FAILURE;

533

}

534

535

inputs.emplace_back(i, inputTensor);

536

}

537

538

return V1_3::ErrorStatus::NONE;

539

}

540

541

template<typename HalVersion>

542

Return<V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::PrepareMemoryForOutputs(

543

armnn::OutputTensors& outputs,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

544

std::vector<V1_2::OutputShape> &outputShapes,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

545

const V1_3::Request& request,

546

const std::vector<android::nn::RunTimePoolInfo>& memPools)

547

{

548

outputs.reserve(request.outputs.size());

549

for (unsigned int i = 0; i < request.outputs.size(); i++)

550

{

551

const auto& outputArg = request.outputs[i];

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

552

armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

Mike Kelly

2023-03-08 10:08:20 +0000

[diff] [blame]

553

auto result = ValidateRequestArgument<V1_3::ErrorStatus, V1_3::Request>(request,

outputTensorInfo,

outputArg,

"output");

if (result != V1_3::ErrorStatus::NONE)

{

return result;

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

563

const armnn::Tensor outputTensor = GetTensorForRequestArgument(outputArg, outputTensorInfo, memPools);

Mike Kelly

2023-03-08 10:08:20 +0000

[diff] [blame]

564

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

565

if (outputTensor.GetMemoryArea() == nullptr)

566

{

567

ALOGE("Cannot execute request. Error converting request output %u to tensor", i);

568

return V1_3::ErrorStatus::GENERAL_FAILURE;

569

}

Teresa Charlin

4bd9a74

2020-08-12 12:58:50 +0100

[diff] [blame]

570

const size_t outputSize = outputTensorInfo.GetNumBytes();

571

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

572

unsigned int count = 0;

573

std::for_each(outputArg.dimensions.begin(), outputArg.dimensions.end(), [&](auto dim)

{

if (dim != 0)

{

outputTensorInfo.GetShape()[count] = dim;

}

else

{

outputTensorInfo.GetShape()[count] = outputArg.dimensions.size();

}

count++;

});

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

587

outputs.emplace_back(i, outputTensor);

588

outputShapes[i] = ComputeShape(outputTensorInfo);

589

590

if (outputArg.location.length < outputSize)

591

{

Teresa Charlin

4bd9a74

2020-08-12 12:58:50 +0100

[diff] [blame]

592

ALOGW("ArmnnPreparedModel_1_3::Execute failed outputArg.location.length (%s) < outputSize (%s)",

593

std::to_string(outputArg.location.length).c_str(), std::to_string(outputSize).c_str());

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

594

outputShapes[i].isSufficient = false;

595

return V1_3::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

596

}

597

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

598

size_t bufferSize = 0;

599

#if !defined(ARMNN_ANDROID_S)

600

bufferSize = memPools.at(outputArg.location.poolIndex).getHidlMemory().size();

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

601

#else

Kevin May

dc873f6

2021-06-14 11:21:11 +0100

[diff] [blame]

602

bufferSize = memPools.at(outputArg.location.poolIndex).getSize();

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

603

#endif

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

604

if (bufferSize < outputSize)

605

{

Teresa Charlin

4bd9a74

2020-08-12 12:58:50 +0100

[diff] [blame]

606

ALOGW("ArmnnPreparedModel_1_3::Execute failed bufferSize (%s) < outputSize (%s)",

607

std::to_string(bufferSize).c_str(), std::to_string(outputSize).c_str());

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

608

outputShapes[i].isSufficient = false;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

609

return V1_3::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

610

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

611

}

612

613

return V1_3::ErrorStatus::NONE;

614

}

615

616

template<typename HalVersion>

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

617

std::tuple<V1_3::ErrorStatus, hidl_vec<V1_2::OutputShape>, V1_2::Timing, std::string>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

618

ArmnnPreparedModel_1_3<HalVersion>::PrepareMemoryForIO(armnn::InputTensors& inputs,

619

armnn::OutputTensors& outputs,

620

std::vector<android::nn::RunTimePoolInfo>& memPools,

621

const V1_3::Request& request)

622

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

623

#if !defined(ARMNN_ANDROID_S)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

624

if (!setRunTimePoolInfosFromMemoryPools(&memPools, request.pools))

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

625

#else

626

if (!setRunTimePoolInfosFromMemoryPools(&memPools, uncheckedConvert(request.pools)))

627

#endif

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

628

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

629

return {V1_3::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

630

}

631

632

// add the inputs and outputs with their data

633

try

634

{

635

if (PrepareMemoryForInputs(inputs, request, memPools) != V1_3::ErrorStatus::NONE)

636

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

637

return {V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

638

}

639

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

640

std::vector<V1_2::OutputShape> outputShapes(request.outputs.size());

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

641

642

auto errorStatus = PrepareMemoryForOutputs(outputs, outputShapes, request, memPools);

643

if (errorStatus != V1_3::ErrorStatus::NONE)

644

{

645

return {errorStatus, outputShapes, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

646

}

647

}

648

catch (armnn::Exception& e)

649

{

650

ALOGW("armnn::Exception caught while preparing for EnqueueWorkload: %s", e.what());

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

651

return {V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

652

}

653

catch (std::exception& e)

654

{

655

ALOGE("std::exception caught while preparing for EnqueueWorkload: %s", e.what());

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

656

return {V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

657

}

658

659

return {V1_3::ErrorStatus::NONE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

660

}

661

662

template<typename HalVersion>

663

template<typename CallbackContext>

664

Return<void> ArmnnPreparedModel_1_3<HalVersion>::ExecuteSynchronously(const V1_3::Request& request,

665

CallbackContext cbCtx)

666

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

667

if (cbCtx.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

668

{

669

cbCtx.ctx.driverStart = Now();

670

}

671

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

672

if (!m_PreparedFromCache && !android::nn::validateRequest(convertToV1_3(request), m_Model))

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

673

{

674

ALOGE("ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

675

cbCtx.callback(V1_3::ErrorStatus::INVALID_ARGUMENT,

676

{},

677

g_NoTiming,

678

"ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

return Void();

}

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

682

if (!m_PreparedFromCache && !android::nn::validateRequest(request, m_Model))

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

683

{

684

ALOGE("ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

685

cbCtx.callback(V1_3::ErrorStatus::INVALID_ARGUMENT,

686

{},

687

g_NoTiming,

688

"ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

Sadik Armagan

ef8a393

2020-04-09 17:21:50 +0100

[diff] [blame]

689

return Void();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

}

// map the memory pool into shared pointers

694

// use a shared memory pools vector on the heap, as it is passed to the request thread

695

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

696

697

// allocate the tensors on the heap, as they are passed to the request thread

698

auto inputs = std::make_shared<armnn::InputTensors>();

699

auto outputs = std::make_shared<armnn::OutputTensors>();

700

701

auto [status, outputShapes, timing, message] = PrepareMemoryForIO(*inputs, *outputs, *memPools, request);

702

if (status != V1_3::ErrorStatus::NONE)

703

{

704

cbCtx.callback(status, outputShapes, timing, message);

Sadik Armagan

ef8a393

2020-04-09 17:21:50 +0100

[diff] [blame]

705

return Void();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

706

}

707

708

ALOGV("ArmnnPreparedModel_1_3::ExecuteSynchronously() before Execution");

709

710

ExecuteGraph(memPools, *inputs, *outputs, cbCtx);

return Void();

}

template<typename HalVersion>

715

Return<void> ArmnnPreparedModel_1_3<HalVersion>::executeSynchronously(const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

716

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

717

executeSynchronously_cb cb)

718

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

719

if (!m_PreparedFromCache)

720

{

721

ALOGV("ArmnnPreparedModel_1_3::executeSynchronously(): %s", GetModelSummary(m_Model).c_str());

722

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

m_RequestCount++;

if (cb == nullptr)

{

ALOGE("ArmnnPreparedModel_1_3::executeSynchronously invalid callback passed");

return Void();

}

auto cbWrapper = [cb](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

732

std::vector<V1_2::OutputShape> outputShapes,

733

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

734

std::string)

735

{

736

cb(convertToV1_0(errorStatus), outputShapes, timing);

737

};

738

739

CallbackContext_1_3 cbCtx;

740

cbCtx.callback = cbWrapper;

741

cbCtx.ctx.measureTimings = measureTiming;

742

743

ExecuteSynchronously(convertToV1_3(request), cbCtx);

return Void();

}

template<typename HalVersion>

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

748

Return<void> ArmnnPreparedModel_1_3<HalVersion>::executeSynchronously_1_3(

749

const V1_3::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

750

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

751

const V1_3::OptionalTimePoint& deadline,

752

const V1_3::OptionalTimeoutDuration& loopTimeoutDuration,

753

executeSynchronously_1_3_cb cb)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

754

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

755

if (!m_PreparedFromCache)

756

{

757

ALOGV("ArmnnPreparedModel_1_3::executeSynchronously_1_3(): %s", GetModelSummary(m_Model).c_str());

758

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

m_RequestCount++;

if (cb == nullptr)

{

ALOGE("ArmnnPreparedModel_1_3::executeSynchronously_1_3 invalid callback passed");

return Void();

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

767

if (deadline.getDiscriminator() != V1_3::OptionalTimePoint::hidl_discriminator::none)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

768

{

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

769

ALOGW("ArmnnPreparedModel_1_3::executeSynchronously_1_3 parameter deadline is set but not supported.");

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

770

}

771

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

772

if (loopTimeoutDuration.getDiscriminator() != V1_3::OptionalTimeoutDuration::hidl_discriminator::none)

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

773

{

774

ALOGW(

775

"ArmnnPreparedModel_1_3::executeSynchronously_1_3 parameter loopTimeoutDuration is set but not supported.");

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

776

}

777

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

778

auto cbWrapper = [cb](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

779

std::vector<V1_2::OutputShape> outputShapes,

780

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

781

std::string)

782

{

783

cb(errorStatus, outputShapes, timing);

784

};

785

786

CallbackContext_1_3 cbCtx;

787

cbCtx.callback = cbWrapper;

788

cbCtx.ctx.measureTimings = measureTiming;

789

790

ExecuteSynchronously(request, cbCtx);

return Void();

}

template<typename HalVersion>

795

Return<void> ArmnnPreparedModel_1_3<HalVersion>::configureExecutionBurst(

796

const sp<V1_2::IBurstCallback>& callback,

797

const MQDescriptorSync<V1_2::FmqRequestDatum>& requestChannel,

798

const MQDescriptorSync<V1_2::FmqResultDatum>& resultChannel,

799

V1_3::IPreparedModel::configureExecutionBurst_cb cb)

800

{

801

ALOGV("ArmnnPreparedModel_1_3::configureExecutionBurst");

802

const sp<V1_2::IBurstContext> burst = ExecutionBurstServer::create(callback,

requestChannel,

resultChannel,

this);

if (burst == nullptr)

808

{

809

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {});

}

else

{

cb(V1_0::ErrorStatus::NONE, burst);

}

return Void();

}

template<typename HalVersion>

819

template<typename CallbackContext>

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

820

Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::ExecuteGraph(

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

821

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

822

armnn::InputTensors& inputTensors,

823

armnn::OutputTensors& outputTensors,

824

CallbackContext cb)

825

{

826

ALOGV("ArmnnPreparedModel_1_3::ExecuteGraph(...)");

Colm Donelan

0fc16c6

2022-03-16 11:54:13 +0000

[diff] [blame]

827

// Capture the graph execution start time.

828

std::chrono::time_point<std::chrono::system_clock> graphExecutionStart = std::chrono::system_clock::now();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

829

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

830

DumpTensorsIfRequired("Input", inputTensors);

831

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

832

std::vector<V1_2::OutputShape> outputShapes(outputTensors.size());

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

833

for (unsigned int i = 0; i < outputTensors.size(); i++)

834

{

835

std::pair<int, armnn::Tensor> outputTensorPair = outputTensors[i];

836

const armnn::Tensor outputTensor = outputTensorPair.second;

837

const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();

838

839

outputShapes[i] = ComputeShape(outputTensorInfo);

}

// run it

try

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

845

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

846

{

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

847

cb.ctx.deviceStart = Now();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

848

}

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

849

armnn::Status status;

850

if (m_AsyncModelExecutionEnabled)

851

{

852

ALOGW("ArmnnPreparedModel_1_3::ExecuteGraph m_AsyncModelExecutionEnabled true");

853

status = m_Runtime->Execute(*m_WorkingMemHandle, inputTensors, outputTensors);

}

else

{

ALOGW("ArmnnPreparedModel_1_3::ExecuteGraph m_AsyncModelExecutionEnabled false");

Narumol Prangnawarat

2022-02-07 13:12:24 +0000

[diff] [blame]

858

// Create a vector of Input and Output Ids which can be imported. An empty vector means all will be copied.

859

std::vector<armnn::ImportedInputId> importedInputIds;

860

if (m_EnableImport)

861

{

862

importedInputIds = m_Runtime->ImportInputs(m_NetworkId, inputTensors, armnn::MemorySource::Malloc);

863

}

864

std::vector<armnn::ImportedOutputId> importedOutputIds;

865

if (m_EnableExport)

866

{

867

importedOutputIds = m_Runtime->ImportOutputs(m_NetworkId, outputTensors, armnn::MemorySource::Malloc);

868

}

869

status = m_Runtime->EnqueueWorkload(m_NetworkId, inputTensors, outputTensors,

870

importedInputIds, importedOutputIds);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

871

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

872

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

873

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

874

{

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

875

cb.ctx.deviceEnd = Now();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

876

}

877

if (status != armnn::Status::Success)

878

{

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

879

ALOGW("ArmnnPreparedModel_1_3::ExecuteGraph EnqueueWorkload failed");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

880

cb.callback(V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

881

return V1_3::ErrorStatus::GENERAL_FAILURE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

882

}

883

}

884

catch (armnn::Exception& e)

885

{

886

ALOGW("armnn:Exception caught from EnqueueWorkload: %s", e.what());

887

cb.callback(V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

888

return V1_3::ErrorStatus::GENERAL_FAILURE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

889

}

890

catch (std::exception& e)

891

{

892

ALOGE("std::exception caught from EnqueueWorkload: %s", e.what());

893

cb.callback(V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

894

return V1_3::ErrorStatus::GENERAL_FAILURE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

895

}

896

897

CommitPools(*pMemPools);

898

899

DumpTensorsIfRequired("Output", outputTensors);

900

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

901

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

902

{

Kevin May

949a69e

2020-04-24 10:21:40 +0100

[diff] [blame]

903

cb.ctx.driverEnd = Now();

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

904

V1_2::Timing timing;

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

905

timing.timeOnDevice = MicrosecondsDuration(cb.ctx.deviceEnd, cb.ctx.deviceStart);

Kevin May

949a69e

2020-04-24 10:21:40 +0100

[diff] [blame]

906

timing.timeInDriver = MicrosecondsDuration(cb.ctx.driverEnd, cb.ctx.driverStart);

Zingo Andersen

7c56149

2022-01-25 11:09:41 +0100

[diff] [blame]

907

ALOGV("ArmnnPreparedModel_1_3::execute timing - Device = %lu Driver = %lu",

908

static_cast<unsigned long>(timing.timeOnDevice), static_cast<unsigned long>(timing.timeInDriver));

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

909

cb.callback(V1_3::ErrorStatus::NONE, outputShapes, timing, "ArmnnPreparedModel_1_3::ExecuteGraph");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

910

} else

911

{

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

912

cb.callback(V1_3::ErrorStatus::NONE, outputShapes, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

913

}

Colm Donelan

0fc16c6

2022-03-16 11:54:13 +0000

[diff] [blame]

914

// Log the total time in this call. This is a good number to compare to that printed out by

915

// RuntimeImpl::EnqueueWorkload. The difference should be the execution overhead of the driver.

916

ALOGI("ArmnnPreparedModel_1_3::ExecuteGraph Execution time = %lld µs",

917

std::chrono::duration_cast<std::chrono::microseconds>

918

(std::chrono::system_clock::now() - graphExecutionStart).count());

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

919

return V1_3::ErrorStatus::NONE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

920

}

921

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

922

/// Schedule the graph prepared from the request for execution

923

template<typename HalVersion>

924

template<typename CallbackContext>

925

void ArmnnPreparedModel_1_3<HalVersion>::ScheduleGraphForExecution(

926

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

927

std::shared_ptr<armnn::InputTensors>& inputTensors,

928

std::shared_ptr<armnn::OutputTensors>& outputTensors,

929

CallbackContext callbackContext,

930

armnn::QosExecPriority priority)

931

{

932

ALOGV("ArmnnPreparedModel_1_3::ScheduleGraphForExecution(...)");

933

934

DumpTensorsIfRequired("Input", *inputTensors);

935

936

unsigned int outputTensorSize = outputTensors.get()->size();

937

std::vector<V1_2::OutputShape> outputShapes(outputTensorSize);

938

for (unsigned int i = 0; i < outputTensorSize; i++)

939

{

940

std::pair<int, armnn::Tensor> outputTensorPair = outputTensors.get()->at(i);

941

const armnn::Tensor outputTensor = outputTensorPair.second;

942

const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();

943

944

outputShapes[i] = ComputeShape(outputTensorInfo);

945

}

946

947

auto tpCb = std::make_shared<

948

ArmnnThreadPoolCallback_1_3<CallbackContext_1_3>>(this,

pMemPools,

outputShapes,

inputTensors,

outputTensors,

callbackContext);

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

955

m_Threadpool->Schedule(m_NetworkId,

956

*tpCb->m_InputTensors,

957

*tpCb->m_OutputTensors,

958

priority,

959

tpCb);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

960

ALOGV("ArmnnPreparedModel_1_3::ScheduleGraphForExecution end");

961

}

962

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

963

template<typename HalVersion>

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

964

bool ArmnnPreparedModel_1_3<HalVersion>::ExecuteWithDummyInputs(unsigned int numInputs, unsigned int numOutputs)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

965

{

966

std::vector<std::vector<char>> storage;

967

armnn::InputTensors inputTensors;

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

968

for (unsigned int i = 0; i < numInputs; i++)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

969

{

Cathal Corbett

e27d4e8

2021-10-28 12:28:35 +0100

[diff] [blame]

970

armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

971

// pInputTensors (of type InputTensors) is composed of a vector of ConstTensors.

972

// Therefore, set all TensorInfo isConstant parameters of input Tensors to true.

973

inputTensorInfo.SetConstant();

974

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

975

storage.emplace_back(inputTensorInfo.GetNumBytes());

976

const armnn::ConstTensor inputTensor(inputTensorInfo, storage.back().data());

977

978

inputTensors.emplace_back(i, inputTensor);

979

}

980

981

armnn::OutputTensors outputTensors;

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

982

for (unsigned int i = 0; i < numOutputs; i++)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

983

{

984

const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

985

storage.emplace_back(outputTensorInfo.GetNumBytes());

986

const armnn::Tensor outputTensor(outputTensorInfo, storage.back().data());

987

988

outputTensors.emplace_back(i, outputTensor);

989

}

990

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

991

auto nullCallback = [](V1_3::ErrorStatus, std::vector<V1_2::OutputShape>, const V1_2::Timing&, std::string) {};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

992

CallbackContext_1_3 callbackContext;

993

callbackContext.callback = nullCallback;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

994

callbackContext.ctx.measureTimings = V1_2::MeasureTiming::NO;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

995

auto memPools = std::make_shared<std::vector<::android::nn::RunTimePoolInfo>>();

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

996

997

auto errorStatus = ExecuteGraph(memPools,

inputTensors,

outputTensors,

callbackContext);

return errorStatus == V1_3::ErrorStatus::NONE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1002

}

1003

1004

template<typename HalVersion>

1005

Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::Execute(const V1_3::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

1006

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1007

CallbackAsync_1_3 callback)

1008

{

1009

ExecutionContext_1_3 ctx;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

1010

if (measureTiming == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1011

{

1012

ctx.measureTimings = measureTiming;

1013

ctx.driverStart = Now();

1014

}

1015

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

1016

if (!m_PreparedFromCache)

1017

{

1018

ALOGV("ArmnnPreparedModel_1_3::execute(): %s", GetModelSummary(m_Model).c_str());

1019

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1020

m_RequestCount++;

1021

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

1022

if (!m_PreparedFromCache && !android::nn::validateRequest(request, m_Model))

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1023

{

1024

callback(V1_3::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute");

1025

return V1_3::ErrorStatus::INVALID_ARGUMENT;

1026

}

1027

1028

if (!m_RequestInputsAndOutputsDumpDir.empty())

1029

{

1030

ALOGD("Dumping inputs and outputs for request %" PRIuPTR, reinterpret_cast<std::uintptr_t>(&callback));

1031

}

1032

1033

// map the memory pool into shared pointers

1034

// use a shared memory pools vector on the heap, as it is passed to the request thread

1035

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

1036

1037

// allocate the tensors on the heap, as they are passed to the request thread

1038

auto inputTensors = std::make_shared<armnn::InputTensors>();

1039

auto outputTensors = std::make_shared<armnn::OutputTensors>();

1040

1041

auto [status, outShapes, timing, message] = PrepareMemoryForIO(*inputTensors, *outputTensors,

1042

*memPools, request);

1043

if (status != V1_3::ErrorStatus::NONE)

1044

{

1045

callback(status, outShapes, timing, message);

}

switch(status)

{

case V1_3::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE:

1051

return V1_3::ErrorStatus::NONE;

1052

case V1_3::ErrorStatus::GENERAL_FAILURE:

1053

return V1_3::ErrorStatus::GENERAL_FAILURE;

Sadik Armagan

a07d275

2021-05-12 20:33:58 +0100

[diff] [blame]

1054

case V1_3::ErrorStatus::INVALID_ARGUMENT:

1055

return V1_3::ErrorStatus::INVALID_ARGUMENT;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1056

default:

1057

{}

1058

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1059

CallbackContext_1_3 cb;

1060

cb.callback = callback;

1061

cb.ctx = ctx;

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

1062

1063

1064

enum class QosExecPriority

{

Low = 0,

Medium = 1,

High = 2

};

if (m_AsyncModelExecutionEnabled)

1073

{

1074

armnn::QosExecPriority priority;

1075

1076

switch (GetModelPriority()) {

1077

case V1_3::Priority::LOW:

1078

priority = armnn::QosExecPriority::Low;

1079

break;

1080

case V1_3::Priority::MEDIUM:

1081

priority = armnn::QosExecPriority::Medium;

1082

break;

1083

case V1_3::Priority::HIGH:

1084

priority = armnn::QosExecPriority::High;

1085

break;

1086

default:

1087

priority = armnn::QosExecPriority::Medium;

}

ALOGV("ArmnnPreparedModel_1_3::execute(...) before ScheduleGraphForExecution");

1092

ScheduleGraphForExecution(memPools, inputTensors, outputTensors, cb, priority);

1093

ALOGV("ArmnnPreparedModel_1_3::execute(...) after ScheduleGraphForExecution");

1094

return V1_3::ErrorStatus::NONE;

1095

}

1096

1097

ALOGV("ArmnnPreparedModel_1_3::execute(...) before PostMsg");

1098

// post the request for asynchronous execution

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1099

m_RequestThread.PostMsg(this, memPools, inputTensors, outputTensors, cb);

1100

ALOGV("ArmnnPreparedModel_1_3::execute(...) after PostMsg");

1101

return V1_3::ErrorStatus::NONE;

1102

}

1103

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

1104

template<typename HalVersion>

1105

V1_3::Priority ArmnnPreparedModel_1_3<HalVersion>::GetModelPriority()

1106

{

1107

return m_ModelPriority;

1108

}

1109

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

1110

template<typename HalVersion>

1111

template <typename CallbackContext>

1112

void ArmnnPreparedModel_1_3<HalVersion>::ArmnnThreadPoolCallback_1_3<CallbackContext>::Notify(

1113

armnn::Status status, armnn::InferenceTimingPair timeTaken)

1114

{

1115

ALOGV("ArmnnPreparedModel_1_3::ArmnnThreadPoolCallback_1_3<CallbackContext>::Notify");

1116

CommitPools(*m_MemPools);

1117

1118

m_Model->DumpTensorsIfRequired("Output", *m_OutputTensors);

1119

1120

if (status != armnn::Status::Success)

1121

{

1122

ALOGW("ArmnnThreadPoolCallback_1_3::Notify EnqueueWorkload failed");

1123

m_CallbackContext.callback(V1_3::ErrorStatus::GENERAL_FAILURE,

1124

{},

1125

g_NoTiming,

1126

"ArmnnPreparedModel_1_3::ArmnnThreadPoolCallback_1_3");

return;

}

if (m_CallbackContext.ctx.measureTimings == V1_2::MeasureTiming::YES)

1131

{

1132

m_CallbackContext.ctx.deviceStart = timeTaken.first;

1133

m_CallbackContext.ctx.deviceEnd = timeTaken.second;

1134

m_CallbackContext.ctx.driverEnd = std::chrono::steady_clock::now();

1135

V1_2::Timing timing;

1136

timing.timeOnDevice = MicrosecondsDuration(m_CallbackContext.ctx.deviceEnd, m_CallbackContext.ctx.deviceStart);

1137

timing.timeInDriver = MicrosecondsDuration(m_CallbackContext.ctx.driverEnd, m_CallbackContext.ctx.driverStart);

Zingo Andersen

7c56149

2022-01-25 11:09:41 +0100

[diff] [blame]

1138

ALOGV("ArmnnPreparedModel_1_3::execute timing - Device = %lu Driver = %lu",

1139

static_cast<unsigned long>(timing.timeOnDevice), static_cast<unsigned long>(timing.timeInDriver));

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

1140

m_CallbackContext.callback(

1141

V1_3::ErrorStatus::NONE, m_OutputShapes, timing, "ArmnnPreparedModel_1_3::ExecuteGraph");

1142

} else

1143

{

1144

m_CallbackContext.callback(

1145

V1_3::ErrorStatus::NONE, m_OutputShapes, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

}

return;

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1150

#ifdef ARMNN_ANDROID_NN_V1_3

1151

template class ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>;

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

1152

template Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>::ExecuteGraph<CallbackContext_1_3>(

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1153

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

1154

armnn::InputTensors& pInputTensors,

1155

armnn::OutputTensors& pOutputTensors,

1156

CallbackContext_1_3 cb);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

1157

1158

template void ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>::ScheduleGraphForExecution<CallbackContext_1_3>(

1159

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

1160

std::shared_ptr<armnn::InputTensors>& inputTensors,

1161

std::shared_ptr<armnn::OutputTensors>& outputTensors,

1162

CallbackContext_1_3 callbackContext,

1163

armnn::QosExecPriority priority);

Kevin May