Blame - ArmnnPreparedModel_1_2.cpp - ml/android-nn-driver

2019-06-11 16:35:25 +0100

[diff] [blame]

1

//

2

3

// SPDX-License-Identifier: MIT

4

//

Jan Eilers

43a430d

2020-02-28 15:40:44 +0000

[diff] [blame]

5

// Note: the ArmnnBurstExecutorWithCache in this file is based on Android code

6

// under the Apache 2.0 license. See comment below for details.

7

//

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

8

9

#define LOG_TAG "ArmnnDriver"

10

11

#include "ArmnnPreparedModel_1_2.hpp"

12

#include "Utils.hpp"

13

14

#include <boost/format.hpp>

15

#include <log/log.h>

16

#include <OperationsUtils.h>

17

#include <ExecutionBurstServer.h>

18

#include <ValidateHal.h>

#include <cassert>

#include <cinttypes>

using namespace android;

24

using namespace android::hardware;

25

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

26

namespace {

27

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

28

static const Timing g_NoTiming = {.timeOnDevice = UINT64_MAX, .timeInDriver = UINT64_MAX};

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

29

using namespace armnn_driver;

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

30

using TimePoint = std::chrono::steady_clock::time_point;

TimePoint Now()

{

return std::chrono::steady_clock::now();

35

}

36

37

unsigned long MicrosecondsDuration(TimePoint endPoint, TimePoint startPoint)

38

{

39

return static_cast<unsigned long>(std::chrono::duration_cast<std::chrono::microseconds>(

40

endPoint - startPoint).count());

41

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

42

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

43

void NotifyCallbackAndCheck(const ::android::sp<V1_0::IExecutionCallback>& callback,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

44

V1_0::ErrorStatus errorStatus,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

45

std::vector<OutputShape>,

46

const Timing,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

47

std::string callingFunction)

48

{

49

Return<void> returned = callback->notify(errorStatus);

50

// This check is required, if the callback fails and it isn't checked it will bring down the service

51

if (!returned.isOk())

52

{

53

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

54

callingFunction.c_str(), returned.description().c_str());

}

}

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

58

void NotifyCallbackAndCheck(const ::android::sp<V1_2::IExecutionCallback>& callback,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

59

V1_0::ErrorStatus errorStatus,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

60

std::vector<OutputShape> outputShapes,

61

const Timing timing,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

62

std::string callingFunction)

63

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

64

Return<void> returned = callback->notify_1_2(errorStatus, outputShapes, timing);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

65

// This check is required, if the callback fails and it isn't checked it will bring down the service

66

if (!returned.isOk())

67

{

68

ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",

69

callingFunction.c_str(), returned.description().c_str());

}

}

bool ValidateRequestArgument(const RequestArgument& requestArg, const armnn::TensorInfo& tensorInfo)

74

{

75

if (requestArg.dimensions.size() != 0)

76

{

77

if (requestArg.dimensions.size() != tensorInfo.GetNumDimensions())

78

{

79

ALOGE("Mismatched dimensions (request argument: %zu, expected: %u)",

80

requestArg.dimensions.size(), tensorInfo.GetNumDimensions());

return false;

}

for (unsigned int d = 0; d < tensorInfo.GetNumDimensions(); ++d)

85

{

86

if (requestArg.dimensions[d] != tensorInfo.GetShape()[d])

87

{

88

ALOGE("Mismatched size for dimension %d (request argument: %u, expected %u)",

89

d, requestArg.dimensions[d], tensorInfo.GetShape()[d]);

return false;

}

}

}

return true;

}

armnn::Tensor GetTensorForRequestArgument(const RequestArgument& requestArg,

99

const armnn::TensorInfo& tensorInfo,

100

const std::vector<::android::nn::RunTimePoolInfo>& requestPools)

101

{

102

if (!ValidateRequestArgument(requestArg, tensorInfo))

103

{

104

return armnn::Tensor();

105

}

106

107

return armnn::Tensor(tensorInfo, GetMemoryFromPool(requestArg.location, requestPools));

108

}

109

110

inline std::string BuildTensorName(const char* tensorNamePrefix, std::size_t index)

111

{

112

return tensorNamePrefix + std::to_string(index);

113

}

114

115

} // anonymous namespace

116

117

using namespace android::hardware;

118

119

namespace armnn_driver

120

{

121

122

template<typename HalVersion>

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

123

RequestThread<ArmnnPreparedModel_1_2, HalVersion, ArmnnCallback_1_2>

124

ArmnnPreparedModel_1_2<HalVersion>::m_RequestThread;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

125

126

template<typename HalVersion>

127

template<typename TensorBindingCollection>

128

void ArmnnPreparedModel_1_2<HalVersion>::DumpTensorsIfRequired(char const* tensorNamePrefix,

129

const TensorBindingCollection& tensorBindings)

130

{

131

if (!m_RequestInputsAndOutputsDumpDir.empty())

132

{

133

const std::string requestName = boost::str(boost::format("%1%_%2%.dump") % m_NetworkId % m_RequestCount);

134

for (std::size_t i = 0u; i < tensorBindings.size(); ++i)

135

{

136

DumpTensor(m_RequestInputsAndOutputsDumpDir,

137

requestName,

138

BuildTensorName(tensorNamePrefix, i),

139

tensorBindings[i].second);

}

}

}

template<typename HalVersion>

145

ArmnnPreparedModel_1_2<HalVersion>::ArmnnPreparedModel_1_2(armnn::NetworkId networkId,

146

armnn::IRuntime* runtime,

147

const V1_2::Model& model,

148

const std::string& requestInputsAndOutputsDumpDir,

149

const bool gpuProfilingEnabled)

150

: m_NetworkId(networkId)

, m_Runtime(runtime)

, m_Model(model)

, m_RequestCount(0)

, m_RequestInputsAndOutputsDumpDir(requestInputsAndOutputsDumpDir)

155

, m_GpuProfilingEnabled(gpuProfilingEnabled)

156

{

157

// Enable profiling if required.

158

m_Runtime->GetProfiler(m_NetworkId)->EnableProfiling(m_GpuProfilingEnabled);

159

}

160

161

template<typename HalVersion>

162

ArmnnPreparedModel_1_2<HalVersion>::~ArmnnPreparedModel_1_2()

163

{

164

// Get a hold of the profiler used by this model.

165

std::shared_ptr<armnn::IProfiler> profiler = m_Runtime->GetProfiler(m_NetworkId);

166

167

// Unload the network associated with this model.

168

m_Runtime->UnloadNetwork(m_NetworkId);

169

170

// Dump the profiling info to a file if required.

171

DumpJsonProfilingIfRequired(m_GpuProfilingEnabled, m_RequestInputsAndOutputsDumpDir, m_NetworkId, profiler.get());

172

}

173

174

template<typename HalVersion>

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

175

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::execute(const V1_0::Request& request,

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

176

const ::android::sp<V1_0::IExecutionCallback>& callback)

177

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

178

if (callback.get() == nullptr)

179

{

180

ALOGE("ArmnnPreparedModel_1_2::execute invalid callback passed");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

181

return V1_0::ErrorStatus::INVALID_ARGUMENT;

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

182

}

183

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

184

auto cb = [callback](V1_0::ErrorStatus errorStatus,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

185

std::vector<OutputShape> outputShapes,

186

const Timing& timing,

187

std::string callingFunction)

188

{

189

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

190

};

191

192

return Execute(request, MeasureTiming::NO, cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

193

}

194

195

template<typename HalVersion>

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

196

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::execute_1_2(

197

const V1_0::Request& request,

198

MeasureTiming measureTiming,

199

const sp<V1_2::IExecutionCallback>& callback)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

200

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

201

if (callback.get() == nullptr)

202

{

203

ALOGE("ArmnnPreparedModel_1_2::execute_1_2 invalid callback passed");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

204

return V1_0::ErrorStatus::INVALID_ARGUMENT;

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

205

}

206

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

207

auto cb = [callback](V1_0::ErrorStatus errorStatus,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

208

std::vector<OutputShape> outputShapes,

209

const Timing& timing,

210

std::string callingFunction)

211

{

212

NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);

213

};

214

215

return Execute(request, measureTiming, cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

216

}

217

218

template<typename HalVersion>

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

219

Return<void> ArmnnPreparedModel_1_2<HalVersion>::executeSynchronously(const V1_0::Request& request,

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

220

MeasureTiming measureTiming,

221

executeSynchronously_cb cb)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

222

{

223

ALOGV("ArmnnPreparedModel_1_2::executeSynchronously(): %s", GetModelSummary(m_Model).c_str());

m_RequestCount++;

if (cb == nullptr)

{

ALOGE("ArmnnPreparedModel_1_2::executeSynchronously invalid callback passed");

return Void();

}

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

232

TimePoint driverStart, driverEnd, deviceStart, deviceEnd;

233

234

if (measureTiming == MeasureTiming::YES)

{

driverStart = Now();

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

239

if (!android::nn::validateRequest(request, m_Model))

240

{

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

241

ALOGE("ArmnnPreparedModel_1_2::executeSynchronously invalid request model");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

242

cb(V1_0::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

return Void();

}

// allocate the tensors on the heap, as they are passed to the request thread

247

auto pInputTensors = std::make_shared<armnn::InputTensors>();

248

auto pOutputTensors = std::make_shared<armnn::OutputTensors>();

249

250

// map the memory pool into shared pointers

251

// use a shared memory pools vector on the heap, as it is passed to the request thread

252

auto pMemPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

253

254

if (!setRunTimePoolInfosFromHidlMemories(pMemPools.get(), request.pools))

255

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

256

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

257

return Void();

258

}

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

259

std::vector<OutputShape> outputShapes(request.outputs.size());

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

260

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

261

try

262

{

263

pInputTensors->reserve(request.inputs.size());

264

for (unsigned int i = 0; i < request.inputs.size(); i++)

265

{

266

const auto& inputArg = request.inputs[i];

267

268

const armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

269

const armnn::Tensor inputTensor = GetTensorForRequestArgument(inputArg, inputTensorInfo, *pMemPools);

270

271

if (inputTensor.GetMemoryArea() == nullptr)

272

{

273

ALOGE("Cannot execute request. Error converting request input %u to tensor", i);

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

274

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

return Void();

}

pInputTensors->emplace_back(i, inputTensor);

279

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

280

pOutputTensors->reserve(request.outputs.size());

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

281

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

282

for (unsigned int i = 0; i < request.outputs.size(); i++)

283

{

284

const auto& outputArg = request.outputs[i];

285

286

const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

287

const armnn::Tensor outputTensor = GetTensorForRequestArgument(outputArg, outputTensorInfo, *pMemPools);

288

289

if (outputTensor.GetMemoryArea() == nullptr)

290

{

291

ALOGE("Cannot execute request. Error converting request output %u to tensor", i);

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

292

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

293

return Void();

294

}

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

295

const size_t outputSize = outputTensorInfo.GetNumBytes();

296

const size_t bufferSize = pMemPools->at(outputArg.location.poolIndex).getHidlMemory().size();

297

298

hidl_vec<uint32_t> dimensions;

299

300

armnn::TensorShape tensorShape = outputTensorInfo.GetShape();

301

const unsigned int numDims = tensorShape.GetNumDimensions();

302

dimensions.resize(numDims);

303

304

for (unsigned int outputIdx = 0u; outputIdx < numDims; ++outputIdx)

305

{

306

dimensions[outputIdx] = tensorShape[outputIdx];

307

}

308

outputShapes[i].dimensions = dimensions;

309

outputShapes[i].isSufficient = bufferSize >= outputSize;

310

311

if (bufferSize < outputSize)

312

{

313

ALOGW("ArmnnPreparedModel_1_2::Execute failed");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

314

cb(V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE, outputShapes, g_NoTiming);

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

315

return Void();

316

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

317

318

pOutputTensors->emplace_back(i, outputTensor);

319

}

320

}

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

321

catch (armnn::Exception& e)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

322

{

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

323

ALOGW("armnn::Exception caught while preparing for EnqueueWorkload: %s", e.what());

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

324

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

325

return Void();

326

}

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

327

catch (std::exception& e)

328

{

329

ALOGE("std::exception caught while preparing for EnqueueWorkload: %s", e.what());

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

330

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming);

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

return Void();

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

334

ALOGV("ArmnnPreparedModel_1_2::executeSynchronously() before Execution");

335

336

DumpTensorsIfRequired("Input", *pInputTensors);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

337

// run it

338

try

339

{

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

340

if (measureTiming == MeasureTiming::YES)

{

deviceStart = Now();

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

345

armnn::Status status = m_Runtime->EnqueueWorkload(m_NetworkId, *pInputTensors, *pOutputTensors);

346

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

347

if (measureTiming == MeasureTiming::YES)

{

deviceEnd = Now();

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

352

if (status != armnn::Status::Success)

353

{

354

ALOGW("EnqueueWorkload failed");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

355

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

356

return Void();

357

}

358

}

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

359

catch (armnn::Exception& e)

360

{

361

ALOGW("armnn::Exception caught from EnqueueWorkload: %s", e.what());

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

362

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming);

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

363

return Void();

364

}

Derek Lamberti

2019-11-28 13:34:48 +0000

[diff] [blame]

365

catch (std::exception& e)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

366

{

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

367

ALOGE("std::exception caught from EnqueueWorkload: %s", e.what());

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

368

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

return Void();

}

DumpTensorsIfRequired("Output", *pOutputTensors);

373

374

// Commit output buffers.

375

// Note that we update *all* pools, even if they aren't actually used as outputs -

376

// this is simpler and is what the CpuExecutor does.

377

for (android::nn::RunTimePoolInfo& pool : *pMemPools)

378

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

379

// Type android::nn::RunTimePoolInfo has changed between Android P & Q and Android R, where

380

// update() has been removed and flush() added.

381

#if defined(ARMNN_ANDROID_R) // Use the new Android implementation.

pool.flush();

#else

pool.update();

#endif

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

386

}

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

387

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

388

ALOGV("ArmnnPreparedModel_1_2::executeSynchronously() after Execution");

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

389

390

if (measureTiming == MeasureTiming::YES)

{

driverEnd = Now();

Timing timing;

timing.timeOnDevice = MicrosecondsDuration(deviceEnd, deviceStart);

395

timing.timeInDriver = MicrosecondsDuration(driverEnd, driverStart);

396

ALOGV("ArmnnPreparedModel_1_2::executeSynchronously timing Device = %lu Driver = %lu", timing.timeOnDevice,

397

timing.timeInDriver);

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

398

cb(V1_0::ErrorStatus::NONE, outputShapes, timing);

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

399

}

400

else

401

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

402

cb(V1_0::ErrorStatus::NONE, outputShapes, g_NoTiming);

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

403

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

return Void();

}

Jan Eilers

2020-02-28 15:40:44 +0000

[diff] [blame]

407

/// This class is strongly inspired by the default implementation in Android named DefaultBurstExecutorWithCache.

408

/// The original code is licensed under Apache-2.0 and can be found at the following link:

409

/// https://android.googlesource.com/platform/frameworks/

410

/// ml/+/refs/tags/android-10.0.0_r20/nn/common/ExecutionBurstServer.cpp

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

411

class ArmnnBurstExecutorWithCache : public ExecutionBurstServer::IBurstExecutorWithCache {

412

public:

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

413

ArmnnBurstExecutorWithCache(V1_2::IPreparedModel* preparedModel)

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

414

: m_PreparedModel(preparedModel)

415

{}

416

417

bool isCacheEntryPresent(int32_t slot) const override

418

{

419

const auto it = m_MemoryCache.find(slot);

420

return (it != m_MemoryCache.end()) && it->second.valid();

421

}

422

423

void addCacheEntry(const hidl_memory& memory, int32_t slot) override

424

{

425

m_MemoryCache[slot] = memory;

426

}

427

428

void removeCacheEntry(int32_t slot) override

429

{

430

m_MemoryCache.erase(slot);

431

}

432

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

433

std::tuple<V1_0::ErrorStatus, hidl_vec<OutputShape>, Timing> execute(

434

const V1_0::Request& request, const std::vector<int32_t>& slots,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

435

MeasureTiming measure) override

436

{

437

ALOGV("ArmnnPreparedModel_1_2::BurstExecutorWithCache::execute");

438

hidl_vec<hidl_memory> pools(slots.size());

439

440

std::transform(slots.begin(), slots.end(), pools.begin(), [this](int32_t slot)

441

{

442

return m_MemoryCache[slot];

443

});

444

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

445

V1_0::Request fullRequest = request;

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

446

fullRequest.pools = std::move(pools);

447

448

// Setup Callback

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

449

V1_0::ErrorStatus returnedStatus = V1_0::ErrorStatus::GENERAL_FAILURE;

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

450

hidl_vec<OutputShape> returnedOutputShapes;

451

Timing returnedTiming;

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

452

auto cb = [&returnedStatus, &returnedOutputShapes, &returnedTiming](V1_0::ErrorStatus status,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

453

const hidl_vec<OutputShape>& outputShapes,

454

const Timing& timing)

455

{

456

returnedStatus = status;

457

returnedOutputShapes = outputShapes;

458

returnedTiming = timing;

};

// Execute

ALOGV("ArmnnPreparedModel_1_2::BurstExecutorWithCache executing");

463

const Return<void> ret = m_PreparedModel->executeSynchronously(fullRequest, measure, cb);

464

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

465

if (!ret.isOk() || returnedStatus != V1_0::ErrorStatus::NONE)

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

466

{

467

ALOGE("ArmnnPreparedModel_1_2::BurstExecutorWithCache::error executing");

468

}

469

return std::make_tuple(returnedStatus, std::move(returnedOutputShapes), returnedTiming);

470

}

471

472

private:

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

473

V1_2::IPreparedModel* const m_PreparedModel;

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

474

std::map<int, hidl_memory> m_MemoryCache;

};

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

478

template<typename HalVersion>

479

Return<void> ArmnnPreparedModel_1_2<HalVersion>::configureExecutionBurst(

480

const sp<V1_2::IBurstCallback>& callback,

481

const MQDescriptorSync<V1_2::FmqRequestDatum>& requestChannel,

482

const MQDescriptorSync<V1_2::FmqResultDatum>& resultChannel,

483

V1_2::IPreparedModel::configureExecutionBurst_cb cb)

484

{

485

ALOGV("ArmnnPreparedModel_1_2::configureExecutionBurst");

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

486

const std::shared_ptr<ArmnnBurstExecutorWithCache> executorWithCache =

487

std::make_shared<ArmnnBurstExecutorWithCache>(this);

488

const sp<V1_2::IBurstContext> burst = ExecutionBurstServer::create(callback,

489

requestChannel,

490

resultChannel,

491

executorWithCache);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

492

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

493

if (burst == nullptr)

494

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

495

cb(V1_0::ErrorStatus::GENERAL_FAILURE, {});

Mike Kelly

2019-07-08 17:37:35 +0100

[diff] [blame]

496

}

497

else

498

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

499

cb(V1_0::ErrorStatus::NONE, burst);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

}

return Void();

}

template<typename HalVersion>

505

void ArmnnPreparedModel_1_2<HalVersion>::ExecuteGraph(

506

std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,

507

std::shared_ptr<armnn::InputTensors>& pInputTensors,

508

std::shared_ptr<armnn::OutputTensors>& pOutputTensors,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

509

ArmnnCallback_1_2 cb)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

510

{

511

ALOGV("ArmnnPreparedModel_1_2::ExecuteGraph(...)");

512

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

513

TimePoint driverEnd, deviceStart, deviceEnd;

514

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

515

DumpTensorsIfRequired("Input", *pInputTensors);

516

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

517

std::vector<std::pair<int, armnn::Tensor> > outputTensors = *pOutputTensors.get();

518

std::vector<OutputShape> outputShapes(outputTensors.size());

519

520

for (unsigned int i = 0; i < outputTensors.size(); i++)

521

{

522

std::pair<int, armnn::Tensor> outputTensorPair = outputTensors[i];

523

const armnn::Tensor outputTensor = outputTensorPair.second;

524

const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();

525

526

hidl_vec<uint32_t> dimensions;

527

528

armnn::TensorShape tensorShape = outputTensorInfo.GetShape();

529

const unsigned int numDims = tensorShape.GetNumDimensions();

530

dimensions.resize(numDims);

531

532

for (unsigned int outputIdx = 0u; outputIdx < numDims; ++outputIdx)

533

{

534

dimensions[outputIdx] = tensorShape[outputIdx];

535

}

536

outputShapes[i].dimensions = dimensions;

537

outputShapes[i].isSufficient = true;

538

}

539

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

540

// run it

541

try

542

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

543

if (cb.measureTiming == MeasureTiming::YES)

{

deviceStart = Now();

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

548

armnn::Status status = m_Runtime->EnqueueWorkload(m_NetworkId, *pInputTensors, *pOutputTensors);

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

549

550

if (cb.measureTiming == MeasureTiming::YES)

551

{

552

deviceEnd = Now();

553

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

554

if (status != armnn::Status::Success)

555

{

556

ALOGW("EnqueueWorkload failed");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

557

cb.callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

558

"ArmnnPreparedModel_1_2::ExecuteGraph");

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

559

return;

560

}

561

}

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

562

catch (armnn::Exception& e)

563

{

564

ALOGW("armnn:Exception caught from EnqueueWorkload: %s", e.what());

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

565

cb.callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

566

return;

567

}

Derek Lamberti

2019-11-28 13:34:48 +0000

[diff] [blame]

568

catch (std::exception& e)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

569

{

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

570

ALOGE("std::exception caught from EnqueueWorkload: %s", e.what());

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

571

cb.callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::ExecuteGraph");

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

return;

}

DumpTensorsIfRequired("Output", *pOutputTensors);

576

577

// Commit output buffers.

578

// Note that we update *all* pools, even if they aren't actually used as outputs -

579

// this is simpler and is what the CpuExecutor does.

580

for (android::nn::RunTimePoolInfo& pool : *pMemPools)

581

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

582

// Type android::nn::RunTimePoolInfo has changed between Android P & Q and Android R, where

583

// update() has been removed and flush() added.

584

#if defined(ARMNN_ANDROID_R) // Use the new Android implementation.

pool.flush();

#else

pool.update();

#endif

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

589

}

590

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

591

if (cb.measureTiming == MeasureTiming::YES)

{

driverEnd = Now();

Timing timing;

timing.timeOnDevice = MicrosecondsDuration(deviceEnd, deviceStart);

596

timing.timeInDriver = MicrosecondsDuration(driverEnd, cb.driverStart);

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

597

cb.callback(V1_0::ErrorStatus::NONE, outputShapes, timing, "ExecuteGraph");

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

598

} else {

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

599

cb.callback(V1_0::ErrorStatus::NONE, outputShapes, g_NoTiming, "ExecuteGraph");

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

600

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

601

}

602

603

template<typename HalVersion>

604

bool ArmnnPreparedModel_1_2<HalVersion>::ExecuteWithDummyInputs()

605

{

606

std::vector<std::vector<char>> storage;

607

armnn::InputTensors inputTensors;

608

for (unsigned int i = 0; i < m_Model.inputIndexes.size(); i++)

609

{

610

const armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

611

storage.emplace_back(inputTensorInfo.GetNumBytes());

612

const armnn::ConstTensor inputTensor(inputTensorInfo, storage.back().data());

613

614

inputTensors.emplace_back(i, inputTensor);

615

}

616

617

armnn::OutputTensors outputTensors;

618

for (unsigned int i = 0; i < m_Model.outputIndexes.size(); i++)

619

{

620

const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

621

storage.emplace_back(outputTensorInfo.GetNumBytes());

622

const armnn::Tensor outputTensor(outputTensorInfo, storage.back().data());

623

624

outputTensors.emplace_back(i, outputTensor);

}

try

{

armnn::Status status = m_Runtime->EnqueueWorkload(m_NetworkId, inputTensors, outputTensors);

630

if (status != armnn::Status::Success)

631

{

632

ALOGW("ExecuteWithDummyInputs: EnqueueWorkload failed");

633

return false;

634

}

635

}

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

636

catch (armnn::Exception& e)

637

{

638

ALOGW("ExecuteWithDummyInputs: armnn::Exception caught from EnqueueWorkload: %s", e.what());

639

return false;

640

}

Derek Lamberti

2019-11-28 13:34:48 +0000

[diff] [blame]

641

catch (std::exception& e)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

642

{

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

643

ALOGE("ExecuteWithDummyInputs: std::exception caught from EnqueueWorkload: %s", e.what());

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

return false;

}

return true;

}

template<typename HalVersion>

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

650

Return <V1_0::ErrorStatus> ArmnnPreparedModel_1_2<HalVersion>::Execute(const V1_0::Request& request,

651

MeasureTiming measureTiming,

652

armnnExecuteCallback_1_2 callback)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

653

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

654

TimePoint driverStart;

655

656

if (measureTiming == MeasureTiming::YES)

{

driverStart = Now();

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

661

ALOGV("ArmnnPreparedModel_1_2::execute(): %s", GetModelSummary(m_Model).c_str());

662

m_RequestCount++;

663

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

664

if (!android::nn::validateRequest(request, m_Model))

665

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

666

callback(V1_0::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

667

return V1_0::ErrorStatus::INVALID_ARGUMENT;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

668

}

669

670

if (!m_RequestInputsAndOutputsDumpDir.empty())

671

{

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

672

ALOGD("Dumping inputs and outputs for request %" PRIuPTR, reinterpret_cast<std::uintptr_t>(&callback));

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

673

}

674

675

// allocate the tensors on the heap, as they are passed to the request thread

676

auto pInputTensors = std::make_shared<armnn::InputTensors>();

677

auto pOutputTensors = std::make_shared<armnn::OutputTensors>();

678

679

// map the memory pool into shared pointers

680

// use a shared memory pools vector on the heap, as it is passed to the request thread

681

auto pMemPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();

682

683

if (!setRunTimePoolInfosFromHidlMemories(pMemPools.get(), request.pools))

684

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

685

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

686

return V1_0::ErrorStatus::GENERAL_FAILURE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

687

}

688

689

// add the inputs and outputs with their data

690

try

691

{

692

pInputTensors->reserve(request.inputs.size());

693

for (unsigned int i = 0; i < request.inputs.size(); i++)

694

{

695

const auto& inputArg = request.inputs[i];

696

697

const armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);

698

const armnn::Tensor inputTensor = GetTensorForRequestArgument(inputArg, inputTensorInfo, *pMemPools);

699

700

if (inputTensor.GetMemoryArea() == nullptr)

701

{

702

ALOGE("Cannot execute request. Error converting request input %u to tensor", i);

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

703

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

704

return V1_0::ErrorStatus::GENERAL_FAILURE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

705

}

706

707

pInputTensors->emplace_back(i, inputTensor);

708

}

709

710

pOutputTensors->reserve(request.outputs.size());

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

711

std::vector<OutputShape> outputShapes(request.outputs.size());

712

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

713

for (unsigned int i = 0; i < request.outputs.size(); i++)

714

{

715

const auto& outputArg = request.outputs[i];

716

717

const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);

718

const armnn::Tensor outputTensor = GetTensorForRequestArgument(outputArg, outputTensorInfo, *pMemPools);

719

if (outputTensor.GetMemoryArea() == nullptr)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

720

{

721

ALOGE("Cannot execute request. Error converting request output %u to tensor", i);

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

722

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

723

return V1_0::ErrorStatus::GENERAL_FAILURE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

724

}

725

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

726

const size_t outputSize = outputTensorInfo.GetNumBytes();

727

const size_t bufferSize = pMemPools->at(outputArg.location.poolIndex).getHidlMemory().size();

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

728

pOutputTensors->emplace_back(i, outputTensor);

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

729

730

hidl_vec<uint32_t> dimensions;

731

732

armnn::TensorShape tensorShape = outputTensorInfo.GetShape();

733

const unsigned int numDims = tensorShape.GetNumDimensions();

734

dimensions.resize(numDims);

735

736

for (unsigned int outputIdx = 0u; outputIdx < numDims; ++outputIdx)

737

{

738

dimensions[outputIdx] = tensorShape[outputIdx];

739

}

740

outputShapes[i].dimensions = dimensions;

741

outputShapes[i].isSufficient = bufferSize >= outputSize;

742

743

if (bufferSize < outputSize)

744

{

745

ALOGW("ArmnnPreparedModel_1_2::Execute failed");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

746

callback(V1_0::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE,

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

747

outputShapes,

748

g_NoTiming,

749

"ArmnnPreparedModel_1_2::Execute");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

750

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

751

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

752

}

753

}

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

754

catch (armnn::Exception& e)

755

{

756

ALOGW("armnn::Exception caught while preparing for EnqueueWorkload: %s", e.what());

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

757

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

758

return V1_0::ErrorStatus::GENERAL_FAILURE;

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

759

}

Derek Lamberti

2019-11-28 13:34:48 +0000

[diff] [blame]

760

catch (std::exception& e)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

761

{

Kevin May

2020-02-10 12:10:07 +0000

[diff] [blame]

762

ALOGE("std::exception caught while preparing for EnqueueWorkload: %s", e.what());

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

763

callback(V1_0::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_2::execute");

764

return V1_0::ErrorStatus::GENERAL_FAILURE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

765

}

766

767

ALOGV("ArmnnPreparedModel_1_2::execute(...) before PostMsg");

768

// post the request for asynchronous execution

Mike Kelly

2019-07-22 14:06:00 +0100

[diff] [blame]

769

ArmnnCallback_1_2 armnnCb;

770

armnnCb.callback = callback;

771

armnnCb.measureTiming = measureTiming;

772

armnnCb.driverStart = driverStart;

773

m_RequestThread.PostMsg(this, pMemPools, pInputTensors, pOutputTensors, armnnCb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

774

ALOGV("ArmnnPreparedModel_1_2::execute(...) after PostMsg");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame^]

775

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

776

}

777

Mike Kelly