Blame - ArmnnPreparedModel_1_3.cpp - ml/android-nn-driver

2020-03-26 13:34:14 +0000

[diff] [blame]

1

//

Mike Kelly

e2d611e

2021-10-14 12:35:58 +0100

[diff] [blame]

2

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

3

// SPDX-License-Identifier: MIT

4

//

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

5

// Note: the ArmnnFencedExecutionCallback and code snippet in the executeFenced() function

6

// in this file is based on Android code

7

// under the Apache 2.0 license. See comments below for details.

8

//

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

9

10

#define LOG_TAG "ArmnnDriver"

11

12

#include "ArmnnPreparedModel_1_3.hpp"

13

#include "Utils.hpp"

14

15

#include <Utils.h>

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

16

#include <android/sync.h>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

17

#include <log/log.h>

18

#include <OperationsUtils.h>

19

#include <ExecutionBurstServer.h>

20

#include <ValidateHal.h>

21

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

22

#include <cinttypes>

23

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

24

#ifdef ARMNN_ANDROID_S

25

#include <LegacyUtils.h>

26

#endif

27

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

28

using namespace android;

29

using namespace android::hardware;

namespace {

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

33

static const V1_2::Timing g_NoTiming = {.timeOnDevice = UINT64_MAX, .timeInDriver = UINT64_MAX};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

34

using namespace armnn_driver;

35

using TimePoint = std::chrono::steady_clock::time_point;

TimePoint Now()

{

return std::chrono::steady_clock::now();

40

}

41

42

unsigned long MicrosecondsDuration(TimePoint endPoint, TimePoint startPoint)

43

{

44

return static_cast<unsigned long>(std::chrono::duration_cast<std::chrono::microseconds>(

45

endPoint - startPoint).count());

46

}

47

48

void NotifyCallbackAndCheck(const ::android::sp<V1_0::IExecutionCallback>& callback,

49

V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

50

std::vector<V1_2::OutputShape>,

51

const V1_2::Timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

52

std::string callingFunction)

53

{

54

Return<void> returned = callback->notify(convertToV1_0(errorStatus));

55

// This check is required, if the callback fails and it isn't checked it will bring down the service

56

if (!returned.isOk())

57

{

58

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

59

callingFunction.c_str(), returned.description().c_str());

}

}

void NotifyCallbackAndCheck(const ::android::sp<V1_2::IExecutionCallback>& callback,

64

V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

65

std::vector<V1_2::OutputShape> outputShapes,

66

const V1_2::Timing timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

67

std::string callingFunction)

68

{

69

Return<void> returned = callback->notify_1_2(convertToV1_0(errorStatus), outputShapes, timing);

70

// This check is required, if the callback fails and it isn't checked it will bring down the service

71

if (!returned.isOk())

72

{

73

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

74

callingFunction.c_str(), returned.description().c_str());

}

}

void NotifyCallbackAndCheck(const ::android::sp<V1_3::IExecutionCallback>& callback,

79

V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

80

std::vector<V1_2::OutputShape> outputShapes,

81

const V1_2::Timing timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

82

std::string callingFunction)

83

{

84

Return<void> returned = callback->notify_1_3(errorStatus, outputShapes, timing);

85

// This check is required, if the callback fails and it isn't checked it will bring down the service

86

if (!returned.isOk())

87

{

88

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

89

callingFunction.c_str(), returned.description().c_str());

}

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

93

bool ValidateRequestArgument(const V1_0::RequestArgument& requestArg, const armnn::TensorInfo& tensorInfo)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

94

{

95

if (requestArg.dimensions.size() != 0)

96

{

97

if (requestArg.dimensions.size() != tensorInfo.GetNumDimensions())

98

{

99

ALOGE("Mismatched dimensions (request argument: %zu, expected: %u)",

100

requestArg.dimensions.size(), tensorInfo.GetNumDimensions());

return false;

}

for (unsigned int d = 0; d < tensorInfo.GetNumDimensions(); ++d)

105

{

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

106

if (requestArg.dimensions[d] != 0 && requestArg.dimensions[d] != tensorInfo.GetShape()[d])

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

107

{

108

ALOGE("Mismatched size for dimension %d (request argument: %u, expected %u)",

109

d, requestArg.dimensions[d], tensorInfo.GetShape()[d]);

return false;

}

}

}

return true;

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

118

armnn::Tensor GetTensorForRequestArgument(const V1_0::RequestArgument& requestArg,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

119

const armnn::TensorInfo& tensorInfo,

120

const std::vector<::android::nn::RunTimePoolInfo>& requestPools)

121

{

122

if (!ValidateRequestArgument(requestArg, tensorInfo))

123

{

124

return armnn::Tensor();

125

}

126

127

return armnn::Tensor(tensorInfo, GetMemoryFromPool(requestArg.location, requestPools));

128

}

129

130

inline std::string BuildTensorName(const char* tensorNamePrefix, std::size_t index)

131

{

132

return tensorNamePrefix + std::to_string(index);

133

}

134

135

} // anonymous namespace

136

137

using namespace android::hardware;

138

139

namespace armnn_driver

140

{

141

142

template<typename HalVersion>

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

143

RequestThread_1_3<ArmnnPreparedModel_1_3, HalVersion, CallbackContext_1_3>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

144

ArmnnPreparedModel_1_3<HalVersion>::m_RequestThread;

145

146

template<typename HalVersion>

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

147

std::unique_ptr<armnn::Threadpool> ArmnnPreparedModel_1_3<HalVersion>::m_Threadpool(nullptr);

148

149

template<typename HalVersion>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

150

template<typename TensorBindingCollection>

151

void ArmnnPreparedModel_1_3<HalVersion>::DumpTensorsIfRequired(char const* tensorNamePrefix,

152

const TensorBindingCollection& tensorBindings)

153

{

154

if (!m_RequestInputsAndOutputsDumpDir.empty())

155

{

Colm Donelan

08d9a1c

2020-09-09 17:56:55 +0100

[diff] [blame]

156

const std::string requestName = std::to_string(m_NetworkId) + "_" + std::to_string(m_RequestCount) + ".dump";

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

157

for (std::size_t i = 0u; i < tensorBindings.size(); ++i)

158

{

159

DumpTensor(m_RequestInputsAndOutputsDumpDir,

160

requestName,

161

BuildTensorName(tensorNamePrefix, i),

162

tensorBindings[i].second);

}

}

}

template<typename HalVersion>

168

ArmnnPreparedModel_1_3<HalVersion>::ArmnnPreparedModel_1_3(armnn::NetworkId networkId,

169

armnn::IRuntime* runtime,

170

const V1_3::Model& model,

171

const std::string& requestInputsAndOutputsDumpDir,

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

172

const bool gpuProfilingEnabled,

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

173

V1_3::Priority priority,

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

174

const bool asyncModelExecutionEnabled,

175

const unsigned int numberOfThreads)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

176

: m_NetworkId(networkId)

, m_Runtime(runtime)

, m_Model(model)

, m_RequestCount(0)

, m_RequestInputsAndOutputsDumpDir(requestInputsAndOutputsDumpDir)

181

, m_GpuProfilingEnabled(gpuProfilingEnabled)

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

182

, m_ModelPriority(priority)

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

183

, m_AsyncModelExecutionEnabled(asyncModelExecutionEnabled)

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

184

, m_PreparedFromCache(false)

185

{

186

// Enable profiling if required.

187

m_Runtime->GetProfiler(m_NetworkId)->EnableProfiling(m_GpuProfilingEnabled);

188

189

if (m_AsyncModelExecutionEnabled)

190

{

191

std::vector<std::shared_ptr<armnn::IWorkingMemHandle>> memHandles;

192

for (unsigned int i=0; i < numberOfThreads; ++i)

193

{

194

memHandles.emplace_back(m_Runtime->CreateWorkingMemHandle(networkId));

}

if (!m_Threadpool)

{

m_Threadpool = std::make_unique<armnn::Threadpool>(numberOfThreads, runtime, memHandles);

}

else

{

m_Threadpool->LoadMemHandles(memHandles);

204

}

205

206

m_WorkingMemHandle = memHandles.back();

}

}

template<typename HalVersion>

211

ArmnnPreparedModel_1_3<HalVersion>::ArmnnPreparedModel_1_3(armnn::NetworkId networkId,

212

armnn::IRuntime* runtime,

213

const std::string& requestInputsAndOutputsDumpDir,

214

const bool gpuProfilingEnabled,

215

V1_3::Priority priority,

216

const bool asyncModelExecutionEnabled,

217

const unsigned int numberOfThreads,

218

const bool preparedFromCache)

219

: m_NetworkId(networkId)

220

, m_Runtime(runtime)

221

, m_RequestCount(0)

222

, m_RequestInputsAndOutputsDumpDir(requestInputsAndOutputsDumpDir)

223

, m_GpuProfilingEnabled(gpuProfilingEnabled)

224

, m_ModelPriority(priority)

225

, m_AsyncModelExecutionEnabled(asyncModelExecutionEnabled)

226

, m_PreparedFromCache(preparedFromCache)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

227

{

228

// Enable profiling if required.

229

m_Runtime->GetProfiler(m_NetworkId)->EnableProfiling(m_GpuProfilingEnabled);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

230

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

231

if (m_AsyncModelExecutionEnabled)

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

232

{

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

233

std::vector<std::shared_ptr<armnn::IWorkingMemHandle>> memHandles;

Finn Williams

d27c13b

2021-06-25 10:06:09 +0100

[diff] [blame]

234

for (unsigned int i=0; i < numberOfThreads; ++i)

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

235

{

236

memHandles.emplace_back(m_Runtime->CreateWorkingMemHandle(networkId));

237

}

238

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

239

if (!m_Threadpool)

240

{

241

m_Threadpool = std::make_unique<armnn::Threadpool>(numberOfThreads, runtime, memHandles);

}

else

{

m_Threadpool->LoadMemHandles(memHandles);

246

}

247

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

248

m_WorkingMemHandle = memHandles.back();

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

249

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

250

}

251

252

template<typename HalVersion>

253

ArmnnPreparedModel_1_3<HalVersion>::~ArmnnPreparedModel_1_3()

254

{

255

// Get a hold of the profiler used by this model.

256

std::shared_ptr<armnn::IProfiler> profiler = m_Runtime->GetProfiler(m_NetworkId);

Colm Donelan

2048b68

2022-02-15 14:59:08 +0000

[diff] [blame]

257

if (profiler && m_GpuProfilingEnabled)

258

{

259

// Dump the profiling info to a file if required.

260

DumpJsonProfilingIfRequired(m_GpuProfilingEnabled, m_RequestInputsAndOutputsDumpDir, m_NetworkId,

261

profiler.get());

262

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

263

264

// Unload the network associated with this model.

265

m_Runtime->UnloadNetwork(m_NetworkId);

266

Finn Williams

2021-07-08 13:07:19 +0100

[diff] [blame]

267

// Unload the network memhandles from the threadpool

268

if (m_AsyncModelExecutionEnabled)

269

{

270

m_Threadpool->UnloadMemHandles(m_NetworkId);

271

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

272

}

273

274

template<typename HalVersion>

275

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::execute(const V1_0::Request& request,

276

const ::android::sp<V1_0::IExecutionCallback>& callback)

277

{

278

if (callback.get() == nullptr)

279

{

280

ALOGE("ArmnnPreparedModel_1_3::execute invalid callback passed");

281

return V1_0::ErrorStatus::INVALID_ARGUMENT;

282

}

283

284

auto cb = [callback](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

285

std::vector<V1_2::OutputShape> outputShapes,

286

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

287

std::string callingFunction)

288

{

289

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

};

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

293

return convertToV1_0(Execute(convertToV1_3(request), V1_2::MeasureTiming::NO, cb));

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

294

}

295

296

template<typename HalVersion>

297

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::execute_1_2(

298

const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

299

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

300

const sp<V1_2::IExecutionCallback>& callback)

301

{

302

if (callback.get() == nullptr)

303

{

304

ALOGE("ArmnnPreparedModel_1_3::execute_1_2 invalid callback passed");

305

return V1_0::ErrorStatus::INVALID_ARGUMENT;

306

}

307

308

auto cb = [callback](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

309

std::vector<V1_2::OutputShape> outputShapes,

310

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

311

std::string callingFunction)

312

{

313

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

314

};

315

316

return convertToV1_0(Execute(convertToV1_3(request), measureTiming, cb));

317

}

318

319

template<typename HalVersion>

320

Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::execute_1_3(

321

const V1_3::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

322

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

323

const V1_3::OptionalTimePoint&,

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

324

const V1_3::OptionalTimeoutDuration&,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

325

const sp<V1_3::IExecutionCallback>& callback)

326

{

327

if (callback.get() == nullptr)

328

{

329

ALOGE("ArmnnPreparedModel_1_3::execute_1_3 invalid callback passed");

330

return V1_3::ErrorStatus::INVALID_ARGUMENT;

331

}

332

333

auto cb = [callback](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

334

std::vector<V1_2::OutputShape> outputShapes,

335

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

336

std::string callingFunction)

337

{

338

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

339

};

340

341

return Execute(request, measureTiming, cb);

342

}

343

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

344

/// This class is inspired by the sample implementation in Android named SampleFencedExecutionCallback.

345

/// The original code is licensed under Apache-2.0 and can be found at the following link:

346

/// https://android.googlesource.com/platform/frameworks/ml/+/master/nn/driver/sample/SampleDriver.h

347

class ArmnnFencedExecutionCallback : public V1_3::IFencedExecutionCallback

348

{

349

public:

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

350

ArmnnFencedExecutionCallback(V1_3::ErrorStatus errorStatus, V1_2::Timing timing, V1_2::Timing fenceTiming)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

351

: m_ErrorStatus(errorStatus), m_Timing(timing), m_FenceTiming(fenceTiming) {}

352

~ArmnnFencedExecutionCallback() {}

353

354

Return<void> getExecutionInfo(getExecutionInfo_cb callback) override

355

{

356

callback(m_ErrorStatus, m_Timing, m_FenceTiming);

return Void();

}

private:

V1_3::ErrorStatus m_ErrorStatus;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

361

V1_2::Timing m_Timing;

362

V1_2::Timing m_FenceTiming;

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

363

};

364

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

365

template<typename HalVersion>

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

366

Return<void> ArmnnPreparedModel_1_3<HalVersion>::executeFenced(const V1_3::Request& request,

367

const hidl_vec<hidl_handle>& fenceWaitFor,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

368

V1_2::MeasureTiming measureTiming,

369

const V1_3::OptionalTimePoint& deadline,

370

const V1_3::OptionalTimeoutDuration& loopTimeoutDuration,

371

const V1_3::OptionalTimeoutDuration&,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

372

executeFenced_cb cb)

373

{

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

374

ALOGV("ArmnnPreparedModel_1_3::executeFenced(...)");

375

if (cb == nullptr)

376

{

377

ALOGE("ArmnnPreparedModel_1_3::executeFenced invalid callback passed");

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

378

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

return Void();

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

382

if (deadline.getDiscriminator() != V1_3::OptionalTimePoint::hidl_discriminator::none)

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

383

{

384

ALOGW("ArmnnPreparedModel_1_3::executeFenced parameter deadline is set but not supported.");

385

}

386

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

387

if (loopTimeoutDuration.getDiscriminator() != V1_3::OptionalTimeoutDuration::hidl_discriminator::none)

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

388

{

389

ALOGW("ArmnnPreparedModel_1_3::executeFenced parameter loopTimeoutDuration is set but not supported.");

390

}

391

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

392

if (!m_PreparedFromCache && !android::nn::validateRequest(request, m_Model, /*allowUnspecifiedOutput=*/false))

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

393

{

394

ALOGV("ArmnnPreparedModel_1_3::executeFenced outputs must be specified for fenced execution ");

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

395

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

return Void();

}

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

399

ExecutionContext_1_3 ctx;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

400

if (measureTiming == V1_2::MeasureTiming::YES)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

401

{

402

ctx.measureTimings = measureTiming;

403

ctx.driverStart = Now();

404

}

405

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

406

if (!m_PreparedFromCache)

407

{

408

ALOGV("ArmnnPreparedModel_1_3::executeFenced(): %s", GetModelSummary(m_Model).c_str());

409

}

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

410

m_RequestCount++;

411

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

412

if (!m_RequestInputsAndOutputsDumpDir.empty())

413

{

414

ALOGD("Dumping inputs and outputs for request %" PRIuPTR, reinterpret_cast<std::uintptr_t>(&cb));

415

}

416

417

// This code snippet is inspired by the sample implementation in Android named SampleDriver::executeFenced()

418

// function. The original code is licensed under Apache-2.0 and can be found at the following link:

419

// https://android.googlesource.com/platform/frameworks/ml/+/master/nn/driver/sample/SampleDriver.cpp

420

const auto fenceSize = fenceWaitFor.size();

421

for (unsigned int index = 0; index < fenceSize; ++index)

422

{

423

auto fenceNativeHandle = fenceWaitFor[index].getNativeHandle();

424

if (!fenceNativeHandle)

425

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

426

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

return Void();

}

if (sync_wait(fenceNativeHandle->data[0], -1) < 0)

431

{

432

ALOGE("ArmnnPreparedModel_1_3::executeFenced sync fence failed.");

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

433

cb(V1_3::ErrorStatus::GENERAL_FAILURE, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

return Void();

}

}

TimePoint fenceExecutionStart;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

439

if (measureTiming == V1_2::MeasureTiming::YES)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

440

{

441

fenceExecutionStart = Now();

442

}

443

444

// map the memory pool into shared pointers

445

// use a shared memory pools vector on the heap, as it is passed to the request thread

446

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

447

448

// allocate the tensors on the heap, as they are passed to the request thread

449

auto inputs = std::make_shared<armnn::InputTensors>();

450

auto outputs = std::make_shared<armnn::OutputTensors>();

451

452

auto [status, outShapes, timings, message] = PrepareMemoryForIO(*inputs, *outputs, *memPools, request);

453

if (status != V1_3::ErrorStatus::NONE)

454

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

455

cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

return Void();

}

ALOGV("ArmnnPreparedModel_1_3::executeFenced(...) before ExecuteGraph");

460

461

// call it with nullCallback for now as we will report the error status from here..

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

462

auto nullCallback = [](V1_3::ErrorStatus, std::vector<V1_2::OutputShape>, const V1_2::Timing&, std::string) {};

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

463

CallbackContext_1_3 cbCtx;

464

cbCtx.callback = nullCallback;

465

cbCtx.ctx = ctx;

466

467

auto errorStatus = ExecuteGraph(memPools, *inputs, *outputs, cbCtx);

468

if (errorStatus != V1_3::ErrorStatus::NONE)

469

{

470

cb(errorStatus, hidl_handle(nullptr), nullptr);

471

return Void();

472

}

473

ALOGV("ArmnnPreparedModel_1_3::executeFenced(...) after ExecuteGraph");

474

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

475

V1_2::Timing timing = g_NoTiming;

476

V1_2::Timing fenceTiming = g_NoTiming;

477

if (measureTiming == V1_2::MeasureTiming::YES)

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

478

{

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

479

fenceTiming.timeOnDevice = MicrosecondsDuration(ctx.deviceEnd, ctx.deviceStart);

Kevin May

949a69e

2020-04-24 10:21:40 +0100

[diff] [blame]

480

fenceTiming.timeInDriver = MicrosecondsDuration(ctx.driverEnd, fenceExecutionStart);

481

ALOGV("ArmnnPreparedModel_1_3::fenceFinishExecutionTiming - Device = %lu Driver = %lu",

Zingo Andersen

7c56149

2022-01-25 11:09:41 +0100

[diff] [blame]

482

static_cast<unsigned long>(fenceTiming.timeOnDevice),

483

static_cast<unsigned long>(fenceTiming.timeInDriver));

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

484

}

485

486

sp<ArmnnFencedExecutionCallback> armnnFencedExecutionCallback =

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

487

new ArmnnFencedExecutionCallback(V1_3::ErrorStatus::NONE, timing, fenceTiming);

488

cb(V1_3::ErrorStatus::NONE, hidl_handle(nullptr), armnnFencedExecutionCallback);

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

return Void();

}

template<typename HalVersion>

493

Return<V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::PrepareMemoryForInputs(

494

armnn::InputTensors& inputs,

495

const V1_3::Request& request,

496

const std::vector<android::nn::RunTimePoolInfo>& memPools)

497

{

498

inputs.reserve(request.inputs.size());

499

for (unsigned int i = 0; i < request.inputs.size(); i++)

500

{

501

const auto& inputArg = request.inputs[i];

502

Cathal Corbett

e27d4e8

2021-10-28 12:28:35 +0100

[diff] [blame]

503

armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

504

// inputs (of type InputTensors) is composed of a vector of ConstTensors.

505

// Therefore, set all TensorInfo isConstant parameters of input Tensors to true.

506

inputTensorInfo.SetConstant();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

507

const armnn::Tensor inputTensor = GetTensorForRequestArgument(inputArg, inputTensorInfo, memPools);

508

509

if (inputTensor.GetMemoryArea() == nullptr)

510

{

511

ALOGE("Cannot execute request. Error converting request input %u to tensor", i);

512

return V1_3::ErrorStatus::GENERAL_FAILURE;

513

}

514

515

inputs.emplace_back(i, inputTensor);

516

}

517

518

return V1_3::ErrorStatus::NONE;

519

}

520

521

template<typename HalVersion>

522

Return<V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::PrepareMemoryForOutputs(

523

armnn::OutputTensors& outputs,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

524

std::vector<V1_2::OutputShape> &outputShapes,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

525

const V1_3::Request& request,

526

const std::vector<android::nn::RunTimePoolInfo>& memPools)

527

{

528

outputs.reserve(request.outputs.size());

529

for (unsigned int i = 0; i < request.outputs.size(); i++)

530

{

531

const auto& outputArg = request.outputs[i];

532

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

533

armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

534

const armnn::Tensor outputTensor = GetTensorForRequestArgument(outputArg, outputTensorInfo, memPools);

535

if (outputTensor.GetMemoryArea() == nullptr)

536

{

537

ALOGE("Cannot execute request. Error converting request output %u to tensor", i);

538

return V1_3::ErrorStatus::GENERAL_FAILURE;

539

}

540

Teresa Charlin

4bd9a74

2020-08-12 12:58:50 +0100

[diff] [blame]

541

const size_t outputSize = outputTensorInfo.GetNumBytes();

542

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

543

unsigned int count = 0;

544

std::for_each(outputArg.dimensions.begin(), outputArg.dimensions.end(), [&](auto dim)

{

if (dim != 0)

{

outputTensorInfo.GetShape()[count] = dim;

}

else

{

outputTensorInfo.GetShape()[count] = outputArg.dimensions.size();

}

count++;

});

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

558

outputs.emplace_back(i, outputTensor);

559

outputShapes[i] = ComputeShape(outputTensorInfo);

560

561

if (outputArg.location.length < outputSize)

562

{

Teresa Charlin

4bd9a74

2020-08-12 12:58:50 +0100

[diff] [blame]

563

ALOGW("ArmnnPreparedModel_1_3::Execute failed outputArg.location.length (%s) < outputSize (%s)",

564

std::to_string(outputArg.location.length).c_str(), std::to_string(outputSize).c_str());

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

565

outputShapes[i].isSufficient = false;

566

return V1_3::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

567

}

568

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

569

size_t bufferSize = 0;

570

#if !defined(ARMNN_ANDROID_S)

571

bufferSize = memPools.at(outputArg.location.poolIndex).getHidlMemory().size();

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

572

#else

Kevin May

dc873f6

2021-06-14 11:21:11 +0100

[diff] [blame]

573

bufferSize = memPools.at(outputArg.location.poolIndex).getSize();

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

574

#endif

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

575

if (bufferSize < outputSize)

576

{

Teresa Charlin

4bd9a74

2020-08-12 12:58:50 +0100

[diff] [blame]

577

ALOGW("ArmnnPreparedModel_1_3::Execute failed bufferSize (%s) < outputSize (%s)",

578

std::to_string(bufferSize).c_str(), std::to_string(outputSize).c_str());

Finn Williams

2020-07-23 12:55:12 +0100

[diff] [blame]

579

outputShapes[i].isSufficient = false;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

580

return V1_3::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;

581

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

582

}

583

584

return V1_3::ErrorStatus::NONE;

585

}

586

587

template<typename HalVersion>

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

588

std::tuple<V1_3::ErrorStatus, hidl_vec<V1_2::OutputShape>, V1_2::Timing, std::string>

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

589

ArmnnPreparedModel_1_3<HalVersion>::PrepareMemoryForIO(armnn::InputTensors& inputs,

590

armnn::OutputTensors& outputs,

591

std::vector<android::nn::RunTimePoolInfo>& memPools,

592

const V1_3::Request& request)

593

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

594

#if !defined(ARMNN_ANDROID_S)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

595

if (!setRunTimePoolInfosFromMemoryPools(&memPools, request.pools))

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

596

#else

597

if (!setRunTimePoolInfosFromMemoryPools(&memPools, uncheckedConvert(request.pools)))

598

#endif

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

599

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

600

return {V1_3::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

601

}

602

603

// add the inputs and outputs with their data

604

try

605

{

606

if (PrepareMemoryForInputs(inputs, request, memPools) != V1_3::ErrorStatus::NONE)

607

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

608

return {V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

609

}

610

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

611

std::vector<V1_2::OutputShape> outputShapes(request.outputs.size());

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

612

613

auto errorStatus = PrepareMemoryForOutputs(outputs, outputShapes, request, memPools);

614

if (errorStatus != V1_3::ErrorStatus::NONE)

615

{

616

return {errorStatus, outputShapes, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

617

}

618

}

619

catch (armnn::Exception& e)

620

{

621

ALOGW("armnn::Exception caught while preparing for EnqueueWorkload: %s", e.what());

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

622

return {V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

623

}

624

catch (std::exception& e)

625

{

626

ALOGE("std::exception caught while preparing for EnqueueWorkload: %s", e.what());

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

627

return {V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

628

}

629

630

return {V1_3::ErrorStatus::NONE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};

631

}

632

633

template<typename HalVersion>

634

template<typename CallbackContext>

635

Return<void> ArmnnPreparedModel_1_3<HalVersion>::ExecuteSynchronously(const V1_3::Request& request,

636

CallbackContext cbCtx)

637

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

638

if (cbCtx.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

639

{

640

cbCtx.ctx.driverStart = Now();

641

}

642

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

643

if (!m_PreparedFromCache && !android::nn::validateRequest(convertToV1_3(request), m_Model))

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

644

{

645

ALOGE("ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

646

cbCtx.callback(V1_3::ErrorStatus::INVALID_ARGUMENT,

647

{},

648

g_NoTiming,

649

"ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

return Void();

}

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

653

if (!m_PreparedFromCache && !android::nn::validateRequest(request, m_Model))

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

654

{

655

ALOGE("ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

656

cbCtx.callback(V1_3::ErrorStatus::INVALID_ARGUMENT,

657

{},

658

g_NoTiming,

659

"ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");

Sadik Armagan

ef8a393

2020-04-09 17:21:50 +0100

[diff] [blame]

660

return Void();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

}

// map the memory pool into shared pointers

665

// use a shared memory pools vector on the heap, as it is passed to the request thread

666

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

667

668

// allocate the tensors on the heap, as they are passed to the request thread

669

auto inputs = std::make_shared<armnn::InputTensors>();

670

auto outputs = std::make_shared<armnn::OutputTensors>();

671

672

auto [status, outputShapes, timing, message] = PrepareMemoryForIO(*inputs, *outputs, *memPools, request);

673

if (status != V1_3::ErrorStatus::NONE)

674

{

675

cbCtx.callback(status, outputShapes, timing, message);

Sadik Armagan

ef8a393

2020-04-09 17:21:50 +0100

[diff] [blame]

676

return Void();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

677

}

678

679

ALOGV("ArmnnPreparedModel_1_3::ExecuteSynchronously() before Execution");

680

681

ExecuteGraph(memPools, *inputs, *outputs, cbCtx);

return Void();

}

template<typename HalVersion>

686

Return<void> ArmnnPreparedModel_1_3<HalVersion>::executeSynchronously(const V1_0::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

687

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

688

executeSynchronously_cb cb)

689

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

690

if (!m_PreparedFromCache)

691

{

692

ALOGV("ArmnnPreparedModel_1_3::executeSynchronously(): %s", GetModelSummary(m_Model).c_str());

693

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

m_RequestCount++;

if (cb == nullptr)

{

ALOGE("ArmnnPreparedModel_1_3::executeSynchronously invalid callback passed");

return Void();

}

auto cbWrapper = [cb](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

703

std::vector<V1_2::OutputShape> outputShapes,

704

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

705

std::string)

706

{

707

cb(convertToV1_0(errorStatus), outputShapes, timing);

708

};

709

710

CallbackContext_1_3 cbCtx;

711

cbCtx.callback = cbWrapper;

712

cbCtx.ctx.measureTimings = measureTiming;

713

714

ExecuteSynchronously(convertToV1_3(request), cbCtx);

return Void();

}

template<typename HalVersion>

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

719

Return<void> ArmnnPreparedModel_1_3<HalVersion>::executeSynchronously_1_3(

720

const V1_3::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

721

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

722

const V1_3::OptionalTimePoint& deadline,

723

const V1_3::OptionalTimeoutDuration& loopTimeoutDuration,

724

executeSynchronously_1_3_cb cb)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

725

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

726

if (!m_PreparedFromCache)

727

{

728

ALOGV("ArmnnPreparedModel_1_3::executeSynchronously_1_3(): %s", GetModelSummary(m_Model).c_str());

729

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

m_RequestCount++;

if (cb == nullptr)

{

ALOGE("ArmnnPreparedModel_1_3::executeSynchronously_1_3 invalid callback passed");

return Void();

}

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

738

if (deadline.getDiscriminator() != V1_3::OptionalTimePoint::hidl_discriminator::none)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

739

{

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

740

ALOGW("ArmnnPreparedModel_1_3::executeSynchronously_1_3 parameter deadline is set but not supported.");

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

741

}

742

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

743

if (loopTimeoutDuration.getDiscriminator() != V1_3::OptionalTimeoutDuration::hidl_discriminator::none)

Sadik Armagan

2020-04-21 10:39:28 +0100

[diff] [blame]

744

{

745

ALOGW(

746

"ArmnnPreparedModel_1_3::executeSynchronously_1_3 parameter loopTimeoutDuration is set but not supported.");

Kevin May

2020-03-31 15:03:42 +0100

[diff] [blame]

747

}

748

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

749

auto cbWrapper = [cb](V1_3::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

750

std::vector<V1_2::OutputShape> outputShapes,

751

const V1_2::Timing& timing,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

752

std::string)

753

{

754

cb(errorStatus, outputShapes, timing);

755

};

756

757

CallbackContext_1_3 cbCtx;

758

cbCtx.callback = cbWrapper;

759

cbCtx.ctx.measureTimings = measureTiming;

760

761

ExecuteSynchronously(request, cbCtx);

return Void();

}

template<typename HalVersion>

766

Return<void> ArmnnPreparedModel_1_3<HalVersion>::configureExecutionBurst(

767

const sp<V1_2::IBurstCallback>& callback,

768

const MQDescriptorSync<V1_2::FmqRequestDatum>& requestChannel,

769

const MQDescriptorSync<V1_2::FmqResultDatum>& resultChannel,

770

V1_3::IPreparedModel::configureExecutionBurst_cb cb)

771

{

772

ALOGV("ArmnnPreparedModel_1_3::configureExecutionBurst");

773

const sp<V1_2::IBurstContext> burst = ExecutionBurstServer::create(callback,

requestChannel,

resultChannel,

this);

if (burst == nullptr)

779

{

780

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {});

}

else

{

cb(V1_0::ErrorStatus::NONE, burst);

}

return Void();

}

template<typename HalVersion>

790

template<typename CallbackContext>

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

791

Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::ExecuteGraph(

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

792

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

793

armnn::InputTensors& inputTensors,

794

armnn::OutputTensors& outputTensors,

795

CallbackContext cb)

796

{

797

ALOGV("ArmnnPreparedModel_1_3::ExecuteGraph(...)");

798

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

799

DumpTensorsIfRequired("Input", inputTensors);

800

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

801

std::vector<V1_2::OutputShape> outputShapes(outputTensors.size());

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

802

for (unsigned int i = 0; i < outputTensors.size(); i++)

803

{

804

std::pair<int, armnn::Tensor> outputTensorPair = outputTensors[i];

805

const armnn::Tensor outputTensor = outputTensorPair.second;

806

const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();

807

808

outputShapes[i] = ComputeShape(outputTensorInfo);

}

// run it

try

{

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

814

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

815

{

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

816

cb.ctx.deviceStart = Now();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

817

}

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

818

armnn::Status status;

819

if (m_AsyncModelExecutionEnabled)

820

{

821

ALOGW("ArmnnPreparedModel_1_3::ExecuteGraph m_AsyncModelExecutionEnabled true");

822

status = m_Runtime->Execute(*m_WorkingMemHandle, inputTensors, outputTensors);

}

else

{

ALOGW("ArmnnPreparedModel_1_3::ExecuteGraph m_AsyncModelExecutionEnabled false");

David Monahan

8069603

2022-02-02 12:17:46 +0000

[diff] [blame]

827

status = m_Runtime->EnqueueWorkload(m_NetworkId, inputTensors, outputTensors);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

828

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

829

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

830

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

831

{

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

832

cb.ctx.deviceEnd = Now();

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

833

}

834

if (status != armnn::Status::Success)

835

{

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

836

ALOGW("ArmnnPreparedModel_1_3::ExecuteGraph EnqueueWorkload failed");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

837

cb.callback(V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

838

return V1_3::ErrorStatus::GENERAL_FAILURE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

839

}

840

}

841

catch (armnn::Exception& e)

842

{

843

ALOGW("armnn:Exception caught from EnqueueWorkload: %s", e.what());

844

cb.callback(V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

845

return V1_3::ErrorStatus::GENERAL_FAILURE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

846

}

847

catch (std::exception& e)

848

{

849

ALOGE("std::exception caught from EnqueueWorkload: %s", e.what());

850

cb.callback(V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

851

return V1_3::ErrorStatus::GENERAL_FAILURE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

852

}

853

854

CommitPools(*pMemPools);

855

856

DumpTensorsIfRequired("Output", outputTensors);

857

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

858

if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

859

{

Kevin May

949a69e

2020-04-24 10:21:40 +0100

[diff] [blame]

860

cb.ctx.driverEnd = Now();

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

861

V1_2::Timing timing;

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

862

timing.timeOnDevice = MicrosecondsDuration(cb.ctx.deviceEnd, cb.ctx.deviceStart);

Kevin May

949a69e

2020-04-24 10:21:40 +0100

[diff] [blame]

863

timing.timeInDriver = MicrosecondsDuration(cb.ctx.driverEnd, cb.ctx.driverStart);

Zingo Andersen

7c56149

2022-01-25 11:09:41 +0100

[diff] [blame]

864

ALOGV("ArmnnPreparedModel_1_3::execute timing - Device = %lu Driver = %lu",

865

static_cast<unsigned long>(timing.timeOnDevice), static_cast<unsigned long>(timing.timeInDriver));

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

866

cb.callback(V1_3::ErrorStatus::NONE, outputShapes, timing, "ArmnnPreparedModel_1_3::ExecuteGraph");

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

867

} else

868

{

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

869

cb.callback(V1_3::ErrorStatus::NONE, outputShapes, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

870

}

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

871

return V1_3::ErrorStatus::NONE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

872

}

873

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

874

/// Schedule the graph prepared from the request for execution

875

template<typename HalVersion>

876

template<typename CallbackContext>

877

void ArmnnPreparedModel_1_3<HalVersion>::ScheduleGraphForExecution(

878

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

879

std::shared_ptr<armnn::InputTensors>& inputTensors,

880

std::shared_ptr<armnn::OutputTensors>& outputTensors,

881

CallbackContext callbackContext,

882

armnn::QosExecPriority priority)

883

{

884

ALOGV("ArmnnPreparedModel_1_3::ScheduleGraphForExecution(...)");

885

886

DumpTensorsIfRequired("Input", *inputTensors);

887

888

unsigned int outputTensorSize = outputTensors.get()->size();

889

std::vector<V1_2::OutputShape> outputShapes(outputTensorSize);

890

for (unsigned int i = 0; i < outputTensorSize; i++)

891

{

892

std::pair<int, armnn::Tensor> outputTensorPair = outputTensors.get()->at(i);

893

const armnn::Tensor outputTensor = outputTensorPair.second;

894

const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();

895

896

outputShapes[i] = ComputeShape(outputTensorInfo);

897

}

898

899

auto tpCb = std::make_shared<

900

ArmnnThreadPoolCallback_1_3<CallbackContext_1_3>>(this,

pMemPools,

outputShapes,

inputTensors,

outputTensors,

callbackContext);

Finn Williams

2021-06-11 15:04:02 +0100

[diff] [blame]

907

m_Threadpool->Schedule(m_NetworkId,

908

*tpCb->m_InputTensors,

909

*tpCb->m_OutputTensors,

910

priority,

911

tpCb);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

912

ALOGV("ArmnnPreparedModel_1_3::ScheduleGraphForExecution end");

913

}

914

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

915

template<typename HalVersion>

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

916

bool ArmnnPreparedModel_1_3<HalVersion>::ExecuteWithDummyInputs(unsigned int numInputs, unsigned int numOutputs)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

917

{

918

std::vector<std::vector<char>> storage;

919

armnn::InputTensors inputTensors;

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

920

for (unsigned int i = 0; i < numInputs; i++)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

921

{

Cathal Corbett

e27d4e8

2021-10-28 12:28:35 +0100

[diff] [blame]

922

armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

923

// pInputTensors (of type InputTensors) is composed of a vector of ConstTensors.

924

// Therefore, set all TensorInfo isConstant parameters of input Tensors to true.

925

inputTensorInfo.SetConstant();

926

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

927

storage.emplace_back(inputTensorInfo.GetNumBytes());

928

const armnn::ConstTensor inputTensor(inputTensorInfo, storage.back().data());

929

930

inputTensors.emplace_back(i, inputTensor);

931

}

932

933

armnn::OutputTensors outputTensors;

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

934

for (unsigned int i = 0; i < numOutputs; i++)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

935

{

936

const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

937

storage.emplace_back(outputTensorInfo.GetNumBytes());

938

const armnn::Tensor outputTensor(outputTensorInfo, storage.back().data());

939

940

outputTensors.emplace_back(i, outputTensor);

941

}

942

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

943

auto nullCallback = [](V1_3::ErrorStatus, std::vector<V1_2::OutputShape>, const V1_2::Timing&, std::string) {};

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

944

CallbackContext_1_3 callbackContext;

945

callbackContext.callback = nullCallback;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

946

callbackContext.ctx.measureTimings = V1_2::MeasureTiming::NO;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

947

auto memPools = std::make_shared<std::vector<::android::nn::RunTimePoolInfo>>();

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

948

949

auto errorStatus = ExecuteGraph(memPools,

inputTensors,

outputTensors,

callbackContext);

return errorStatus == V1_3::ErrorStatus::NONE;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

954

}

955

956

template<typename HalVersion>

957

Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::Execute(const V1_3::Request& request,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

958

V1_2::MeasureTiming measureTiming,

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

959

CallbackAsync_1_3 callback)

960

{

961

ExecutionContext_1_3 ctx;

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

962

if (measureTiming == V1_2::MeasureTiming::YES)

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

963

{

964

ctx.measureTimings = measureTiming;

965

ctx.driverStart = Now();

966

}

967

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

968

if (!m_PreparedFromCache)

969

{

970

ALOGV("ArmnnPreparedModel_1_3::execute(): %s", GetModelSummary(m_Model).c_str());

971

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

972

m_RequestCount++;

973

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

974

if (!m_PreparedFromCache && !android::nn::validateRequest(request, m_Model))

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

975

{

976

callback(V1_3::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute");

977

return V1_3::ErrorStatus::INVALID_ARGUMENT;

978

}

979

980

if (!m_RequestInputsAndOutputsDumpDir.empty())

981

{

982

ALOGD("Dumping inputs and outputs for request %" PRIuPTR, reinterpret_cast<std::uintptr_t>(&callback));

983

}

984

985

// map the memory pool into shared pointers

986

// use a shared memory pools vector on the heap, as it is passed to the request thread

987

auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

988

989

// allocate the tensors on the heap, as they are passed to the request thread

990

auto inputTensors = std::make_shared<armnn::InputTensors>();

991

auto outputTensors = std::make_shared<armnn::OutputTensors>();

992

993

auto [status, outShapes, timing, message] = PrepareMemoryForIO(*inputTensors, *outputTensors,

994

*memPools, request);

995

if (status != V1_3::ErrorStatus::NONE)

996

{

997

callback(status, outShapes, timing, message);

}

switch(status)

{

case V1_3::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE:

1003

return V1_3::ErrorStatus::NONE;

1004

case V1_3::ErrorStatus::GENERAL_FAILURE:

1005

return V1_3::ErrorStatus::GENERAL_FAILURE;

Sadik Armagan

a07d275

2021-05-12 20:33:58 +0100

[diff] [blame]

1006

case V1_3::ErrorStatus::INVALID_ARGUMENT:

1007

return V1_3::ErrorStatus::INVALID_ARGUMENT;

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1008

default:

1009

{}

1010

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1011

CallbackContext_1_3 cb;

1012

cb.callback = callback;

1013

cb.ctx = ctx;

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

1014

1015

1016

enum class QosExecPriority

{

Low = 0,

Medium = 1,

High = 2

};

if (m_AsyncModelExecutionEnabled)

1025

{

1026

armnn::QosExecPriority priority;

1027

1028

switch (GetModelPriority()) {

1029

case V1_3::Priority::LOW:

1030

priority = armnn::QosExecPriority::Low;

1031

break;

1032

case V1_3::Priority::MEDIUM:

1033

priority = armnn::QosExecPriority::Medium;

1034

break;

1035

case V1_3::Priority::HIGH:

1036

priority = armnn::QosExecPriority::High;

1037

break;

1038

default:

1039

priority = armnn::QosExecPriority::Medium;

}

ALOGV("ArmnnPreparedModel_1_3::execute(...) before ScheduleGraphForExecution");

1044

ScheduleGraphForExecution(memPools, inputTensors, outputTensors, cb, priority);

1045

ALOGV("ArmnnPreparedModel_1_3::execute(...) after ScheduleGraphForExecution");

1046

return V1_3::ErrorStatus::NONE;

1047

}

1048

1049

ALOGV("ArmnnPreparedModel_1_3::execute(...) before PostMsg");

1050

// post the request for asynchronous execution

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1051

m_RequestThread.PostMsg(this, memPools, inputTensors, outputTensors, cb);

1052

ALOGV("ArmnnPreparedModel_1_3::execute(...) after PostMsg");

1053

return V1_3::ErrorStatus::NONE;

1054

}

1055

Narumol Prangnawarat

2020-06-02 12:07:43 +0100

[diff] [blame]

1056

template<typename HalVersion>

1057

V1_3::Priority ArmnnPreparedModel_1_3<HalVersion>::GetModelPriority()

1058

{

1059

return m_ModelPriority;

1060

}

1061

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

1062

template<typename HalVersion>

1063

template <typename CallbackContext>

1064

void ArmnnPreparedModel_1_3<HalVersion>::ArmnnThreadPoolCallback_1_3<CallbackContext>::Notify(

1065

armnn::Status status, armnn::InferenceTimingPair timeTaken)

1066

{

1067

ALOGV("ArmnnPreparedModel_1_3::ArmnnThreadPoolCallback_1_3<CallbackContext>::Notify");

1068

CommitPools(*m_MemPools);

1069

1070

m_Model->DumpTensorsIfRequired("Output", *m_OutputTensors);

1071

1072

if (status != armnn::Status::Success)

1073

{

1074

ALOGW("ArmnnThreadPoolCallback_1_3::Notify EnqueueWorkload failed");

1075

m_CallbackContext.callback(V1_3::ErrorStatus::GENERAL_FAILURE,

1076

{},

1077

g_NoTiming,

1078

"ArmnnPreparedModel_1_3::ArmnnThreadPoolCallback_1_3");

return;

}

if (m_CallbackContext.ctx.measureTimings == V1_2::MeasureTiming::YES)

1083

{

1084

m_CallbackContext.ctx.deviceStart = timeTaken.first;

1085

m_CallbackContext.ctx.deviceEnd = timeTaken.second;

1086

m_CallbackContext.ctx.driverEnd = std::chrono::steady_clock::now();

1087

V1_2::Timing timing;

1088

timing.timeOnDevice = MicrosecondsDuration(m_CallbackContext.ctx.deviceEnd, m_CallbackContext.ctx.deviceStart);

1089

timing.timeInDriver = MicrosecondsDuration(m_CallbackContext.ctx.driverEnd, m_CallbackContext.ctx.driverStart);

Zingo Andersen

7c56149

2022-01-25 11:09:41 +0100

[diff] [blame]

1090

ALOGV("ArmnnPreparedModel_1_3::execute timing - Device = %lu Driver = %lu",

1091

static_cast<unsigned long>(timing.timeOnDevice), static_cast<unsigned long>(timing.timeInDriver));

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

1092

m_CallbackContext.callback(

1093

V1_3::ErrorStatus::NONE, m_OutputShapes, timing, "ArmnnPreparedModel_1_3::ExecuteGraph");

1094

} else

1095

{

1096

m_CallbackContext.callback(

1097

V1_3::ErrorStatus::NONE, m_OutputShapes, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");

}

return;

}

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1102

#ifdef ARMNN_ANDROID_NN_V1_3

1103

template class ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>;

Sadik Armagan

2020-04-23 12:56:05 +0100

[diff] [blame]

1104

template Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>::ExecuteGraph<CallbackContext_1_3>(

Kevin May

2020-03-26 13:34:14 +0000

[diff] [blame]

1105

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

1106

armnn::InputTensors& pInputTensors,

1107

armnn::OutputTensors& pOutputTensors,

1108

CallbackContext_1_3 cb);

Finn Williams

2021-05-19 20:52:00 +0100

[diff] [blame]

1109

1110

template void ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>::ScheduleGraphForExecution<CallbackContext_1_3>(

1111

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

1112

std::shared_ptr<armnn::InputTensors>& inputTensors,

1113

std::shared_ptr<armnn::OutputTensors>& outputTensors,

1114

CallbackContext_1_3 callbackContext,

1115

armnn::QosExecPriority priority);

Kevin May