Blame - 1.2/ArmnnDriverImpl.cpp - ml/android-nn-driver

2019-06-11 16:35:25 +0100

[diff] [blame]

1

//

2

3

// SPDX-License-Identifier: MIT

4

//

5

6

#include "ArmnnDriverImpl.hpp"

7

#include "../ArmnnPreparedModel_1_2.hpp"

8

#include "../ModelToINetworkConverter.hpp"

9

#include "../SystemPropertiesUtils.hpp"

10

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

11

#include <armnnDeserializer/IDeserializer.hpp>

12

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

13

#include <log/log.h>

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

14

#include <sys/stat.h>

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

namespace

{

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

19

const char *g_RelaxedFloat32toFloat16PerformanceExecTime = "ArmNN.relaxedFloat32toFloat16Performance.execTime";

FinnWilliamsArm

df655ee

2019-07-24 16:04:18 +0100

[diff] [blame]

20

const char *g_RelaxedFloat32toFloat16PerformancePowerUsage = "ArmNN.relaxedFloat32toFloat16Performance.powerUsage";

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

21

22

const char *g_OperandTypeTensorFloat32PerformanceExecTime = "Armnn.operandTypeTensorFloat32Performance.execTime";

23

const char *g_OperandTypeTensorFloat32PerformancePowerUsage = "Armnn.operandTypeTensorFloat32Performance.powerUsage";

24

25

const char *g_OperandTypeFloat32PerformanceExecTime = "Armnn.operandTypeFloat32Performance.execTime";

26

const char *g_OperandTypeFloat32PerformancePowerUsage = "Armnn.operandTypeFloat32Performance.powerUsage";

27

28

const char *g_OperandTypeTensorFloat16PerformanceExecTime = "Armnn.operandTypeTensorFloat16Performance.execTime";

29

const char *g_OperandTypeTensorFloat16PerformancePowerUsage = "Armnn.operandTypeTensorFloat16Performance.powerUsage";

30

31

const char *g_OperandTypeFloat16PerformanceExecTime = "Armnn.operandTypeFloat16Performance.execTime";

32

const char *g_OperandTypeFloat16PerformancePowerUsage = "Armnn.operandTypeFloat16Performance.powerUsage";

33

34

const char *g_OperandTypeTensorQuant8AsymmPerformanceExecTime =

35

"Armnn.operandTypeTensorQuant8AsymmPerformance.execTime";

36

const char *g_OperandTypeTensorQuant8AsymmPerformancePowerUsage =

37

"Armnn.operandTypeTensorQuant8AsymmPerformance.powerUsage";

38

39

const char *g_OperandTypeTensorQuant16SymmPerformanceExecTime =

40

"Armnn.operandTypeTensorQuant16SymmPerformance.execTime";

41

const char *g_OperandTypeTensorQuant16SymmPerformancePowerUsage =

42

"Armnn.operandTypeTensorQuant16SymmPerformance.powerUsage";

43

Pablo Tello

fb45e2f

2019-10-18 16:51:57 +0100

[diff] [blame]

44

const char *g_OperandTypeTensorQuant8SymmPerformanceExecTime =

45

"Armnn.operandTypeTensorQuant8SymmPerformance.execTime";

46

const char *g_OperandTypeTensorQuant8SymmPerformancePowerUsage =

47

"Armnn.operandTypeTensorQuant8SymmPerformance.powerUsage";

48

Kevin May

87cb761

2019-11-11 17:30:35 +0000

[diff] [blame]

49

const char *g_OperandTypeTensorQuant8SymmPerChannelPerformanceExecTime =

50

"Armnn.operandTypeTensorQuant8SymmPerChannelPerformance.execTime";

51

const char *g_OperandTypeTensorQuant8SymmPerChannelPerformancePowerUsage =

52

"Armnn.operandTypeTensorQuant8SymmPerChannelPerformance.powerUsage";

53

Pablo Tello

fb45e2f

2019-10-18 16:51:57 +0100

[diff] [blame]

54

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

55

const char *g_OperandTypeTensorInt32PerformanceExecTime = "Armnn.operandTypeTensorInt32Performance.execTime";

56

const char *g_OperandTypeTensorInt32PerformancePowerUsage = "Armnn.operandTypeTensorInt32Performance.powerUsage";

57

58

const char *g_OperandTypeInt32PerformanceExecTime = "Armnn.operandTypeInt32Performance.execTime";

59

const char *g_OperandTypeInt32PerformancePowerUsage = "Armnn.operandTypeInt32Performance.powerUsage";

60

61

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

62

void NotifyCallbackAndCheck(const android::sp<V1_2::IPreparedModelCallback>& callback,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

63

V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

64

const android::sp<V1_2::IPreparedModel>& preparedModelPtr)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

65

{

Ferran Balaguer

b2397fd

2019-07-25 12:12:39 +0100

[diff] [blame]

66

Return<void> returned = callback->notify_1_2(errorStatus, preparedModelPtr);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

67

// This check is required, if the callback fails and it isn't checked it will bring down the service

68

if (!returned.isOk())

69

{

70

ALOGE("ArmnnDriverImpl::prepareModel: hidl callback failed to return properly: %s ",

71

returned.description().c_str());

}

}

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

75

Return<V1_0::ErrorStatus> FailPrepareModel(V1_0::ErrorStatus error,

76

const std::string& message,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

77

const android::sp<V1_2::IPreparedModelCallback>& callback)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

78

{

79

ALOGW("ArmnnDriverImpl::prepareModel: %s", message.c_str());

80

NotifyCallbackAndCheck(callback, error, nullptr);

return error;

}

} // anonymous namespace

85

86

namespace armnn_driver

{

namespace hal_1_2

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

91

Return<V1_0::ErrorStatus> ArmnnDriverImpl::prepareArmnnModel_1_2(

92

const armnn::IRuntimePtr& runtime,

93

const armnn::IGpuAccTunedParametersPtr& clTunedParameters,

94

const DriverOptions& options,

95

const V1_2::Model& model,

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

96

const android::hardware::hidl_vec<android::hardware::hidl_handle>& modelCacheHandle,

97

const android::hardware::hidl_vec<android::hardware::hidl_handle>& dataCacheHandle,

98

const HidlToken& token,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

99

const android::sp<V1_2::IPreparedModelCallback>& cb,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

100

bool float32ToFloat16)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

101

{

Matteo Martincigh

0bd89a8

2019-07-02 16:53:10 +0100

[diff] [blame]

102

ALOGV("ArmnnDriverImpl::prepareArmnnModel_1_2()");

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

103

104

if (cb.get() == nullptr)

105

{

106

ALOGW("ArmnnDriverImpl::prepareModel: Invalid callback passed to prepareModel");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

107

return V1_0::ErrorStatus::INVALID_ARGUMENT;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

}

if (!runtime)

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

112

return FailPrepareModel(V1_0::ErrorStatus::DEVICE_UNAVAILABLE, "Device unavailable", cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

113

}

114

115

if (!android::nn::validateModel(model))

116

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

117

return FailPrepareModel(V1_0::ErrorStatus::INVALID_ARGUMENT, "Invalid model passed as input", cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

118

}

119

120

// Deliberately ignore any unsupported operations requested by the options -

121

// at this point we're being asked to prepare a model that we've already declared support for

122

// and the operation indices may be different to those in getSupportedOperations anyway.

123

std::set<unsigned int> unsupportedOperations;

124

ModelToINetworkConverter<HalPolicy> modelConverter(options.GetBackends(),

125

model,

126

unsupportedOperations);

127

128

if (modelConverter.GetConversionResult() != ConversionResult::Success)

129

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

130

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "ModelToINetworkConverter failed", cb);

131

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

132

}

133

Sadik Armagan

2021-01-13 15:56:51 +0000

[diff] [blame]

134

// Serialize the network graph to a .armnn file if an output directory

135

// has been specified in the drivers' arguments.

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

136

std::vector<uint8_t> dataCacheData;

137

bool serializeToFile = dataCacheHandle.size() < 1 ? false : true;

Sadik Armagan

2021-01-13 15:56:51 +0000

[diff] [blame]

138

auto serializedNetworkFileName =

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

139

SerializeNetwork(*modelConverter.GetINetwork(),

140

options.GetRequestInputsAndOutputsDumpDir(),

141

dataCacheData,

142

serializeToFile);

Sadik Armagan

2021-01-13 15:56:51 +0000

[diff] [blame]

143

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

144

// Optimize the network

145

armnn::IOptimizedNetworkPtr optNet(nullptr, nullptr);

146

armnn::OptimizerOptions OptOptions;

147

OptOptions.m_ReduceFp32ToFp16 = float32ToFloat16;

Kevin May

daf7dd0

2021-10-22 11:57:30 +0100

[diff] [blame]

148

OptOptions.m_ProfilingEnabled = options.IsGpuProfilingEnabled();

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

149

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

150

int cachedFd = -1;

151

bool saveCachedNetwork = options.SaveCachedNetwork();

152

153

unsigned int numberOfCachedModelFiles = 0;

154

if (modelCacheHandle.size() > 0)

155

{

156

unsigned int index = 0;

157

for (auto& backend : options.GetBackends())

158

{

159

// modelCacheHandle size should be equal to numberOfCachedModelFiles

160

// modelCacheHandle vector should be in same order as backends

161

auto numberOfCacheFiles = GetNumberOfCacheFiles(backend);

162

if (numberOfCacheFiles > 0)

163

{

164

numberOfCachedModelFiles += numberOfCacheFiles;

165

if (modelCacheHandle[index]->numFds == 1)

166

{

167

if (backend == armnn::Compute::GpuAcc)

168

{

169

cachedFd = modelCacheHandle[index]->data[0];

170

saveCachedNetwork = true;

171

}

172

}

173

index += numberOfCachedModelFiles;

}

}

}

Mike Kelly

2020-09-30 20:22:56 +0100

[diff] [blame]

178

armnn::BackendOptions gpuAcc("GpuAcc",

179

{

Sadik Armagan

f36e10b

2021-01-11 16:34:01 +0000

[diff] [blame]

180

{ "FastMathEnabled", options.IsFastMathEnabled() },

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

181

{ "SaveCachedNetwork", saveCachedNetwork },

Finn Williams

f5ca16c

2021-02-12 14:26:23 +0000

[diff] [blame]

182

{ "CachedNetworkFilePath", options.GetCachedNetworkFilePath() },

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

183

{ "MLGOTuningFilePath", options.GetClMLGOTunedParametersFile() },

184

{ "CachedFileDescriptor", cachedFd }

Mike Kelly

7ed56dd

2020-09-30 20:22:56 +0100

[diff] [blame]

185

});

Finn Williams

f5ca16c

2021-02-12 14:26:23 +0000

[diff] [blame]

186

Mike Kelly

7ed56dd

2020-09-30 20:22:56 +0100

[diff] [blame]

187

armnn::BackendOptions cpuAcc("CpuAcc",

188

{

Matthew Sloyan

cd639c9

2021-02-11 16:57:38 +0000

[diff] [blame]

189

{ "FastMathEnabled", options.IsFastMathEnabled() },

190

{ "NumberOfThreads", options.GetNumberOfThreads() }

Mike Kelly

7ed56dd

2020-09-30 20:22:56 +0100

[diff] [blame]

191

});

192

OptOptions.m_ModelOptions.push_back(gpuAcc);

193

OptOptions.m_ModelOptions.push_back(cpuAcc);

194

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

195

std::vector<std::string> errMessages;

196

try

197

{

198

optNet = armnn::Optimize(*modelConverter.GetINetwork(),

199

options.GetBackends(),

200

runtime->GetDeviceSpec(),

201

OptOptions,

202

errMessages);

203

}

Derek Lamberti

2019-11-28 13:34:48 +0000

[diff] [blame]

204

catch (std::exception &e)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

205

{

206

std::stringstream message;

Derek Lamberti

2019-11-28 13:34:48 +0000

[diff] [blame]

207

message << "Exception (" << e.what() << ") caught from optimize.";

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

208

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);

209

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

210

}

211

212

// Check that the optimized network is valid.

213

if (!optNet)

214

{

215

std::stringstream message;

216

message << "Invalid optimized network";

217

for (const std::string& msg : errMessages)

218

{

219

message << "\n" << msg;

220

}

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

221

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);

222

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

223

}

224

225

// Export the optimized network graph to a dot file if an output dump directory

226

// has been specified in the drivers' arguments.

Jim Flynn

829ad30

2019-12-13 14:43:24 +0000

[diff] [blame]

227

std::string dotGraphFileName = ExportNetworkGraphToDotFile(*optNet,

228

options.GetRequestInputsAndOutputsDumpDir());

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

229

230

// Load it into the runtime.

231

armnn::NetworkId netId = 0;

Finn Williams

d8fb540

2021-05-19 20:52:00 +0100

[diff] [blame]

232

std::string msg;

233

armnn::INetworkProperties networkProperties(options.isAsyncModelExecutionEnabled(),

234

MemorySource::Undefined,

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

235

MemorySource::Undefined,

236

options.IsGpuProfilingEnabled());

237

238

auto numInputs = getMainModel(model).inputIndexes.size();

239

auto numOutputs = getMainModel(model).outputIndexes.size();

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

240

try

241

{

Finn Williams

d8fb540

2021-05-19 20:52:00 +0100

[diff] [blame]

242

if (runtime->LoadNetwork(netId, move(optNet), msg, networkProperties) != armnn::Status::Success)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

243

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

244

return FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, msg, cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

245

}

246

}

Derek Lamberti

2019-11-28 13:34:48 +0000

[diff] [blame]

247

catch (std::exception& e)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

248

{

249

std::stringstream message;

Derek Lamberti

2019-11-28 13:34:48 +0000

[diff] [blame]

250

message << "Exception (" << e.what()<< ") caught from LoadNetwork.";

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

251

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);

252

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

253

}

254

Sadik Armagan

2021-01-13 15:56:51 +0000

[diff] [blame]

255

// Now that we have a networkId for the graph rename the exported files to use it

256

// so that we can associate the graph file and the input/output tensor exported files

257

RenameExportedFiles(serializedNetworkFileName,

258

dotGraphFileName,

259

options.GetRequestInputsAndOutputsDumpDir(),

260

netId);

Jim Flynn

829ad30

2019-12-13 14:43:24 +0000

[diff] [blame]

261

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

262

std::unique_ptr<ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>> preparedModel(

263

new ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>(

netId,

runtime.get(),

model,

options.GetRequestInputsAndOutputsDumpDir(),

Finn Williams

d8fb540

2021-05-19 20:52:00 +0100

[diff] [blame]

268

options.IsGpuProfilingEnabled(),

Finn Williams

ca3a3e0

2021-06-11 15:04:02 +0100

[diff] [blame]

269

options.isAsyncModelExecutionEnabled(),

270

options.getNoOfArmnnThreads()));

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

271

272

// Run a single 'dummy' inference of the model. This means that CL kernels will get compiled (and tuned if

273

// this is enabled) before the first 'real' inference which removes the overhead of the first inference.

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

274

// Only run this if the GpuAcc backend has been added to options

275

if (std::find(options.GetBackends().begin(),

276

options.GetBackends().end(),

277

armnn::Compute::GpuAcc) != options.GetBackends().end())

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

278

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

279

if (!preparedModel->ExecuteWithDummyInputs(numInputs, numOutputs))

280

{

281

return FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "Network could not be executed", cb);

282

}

283

284

if (clTunedParameters &&

285

options.GetClTunedParametersMode() == armnn::IGpuAccTunedParameters::Mode::UpdateTunedParameters)

286

{

287

// Now that we've done one inference the CL kernel parameters will have been tuned,

288

// so save the updated file.

289

try

290

{

291

clTunedParameters->Save(options.GetClTunedParametersFile().c_str());

292

}

293

catch (std::exception& error)

294

{

295

ALOGE("ArmnnDriverImpl::prepareModel: Failed to save CL tuned parameters file '%s': %s",

296

options.GetClTunedParametersFile().c_str(), error.what());

297

}

298

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

299

}

300

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

301

size_t hashValue = 0;

302

// Cache the model

303

if (dataCacheHandle.size() > 0)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

304

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

305

// Cache the Arm NN model, should be only 1

306

if (dataCacheHandle.size() != 1)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

307

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

308

NotifyCallbackAndCheck(cb, V1_0::ErrorStatus::NONE, preparedModel.release());

309

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

310

}

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

311

312

if (dataCacheHandle[0]->numFds != 1)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

313

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

314

ALOGW("ArmnnDriverImpl::prepareArmnnModel_1_3: Cannot cache the data, numFds != 1.");

315

NotifyCallbackAndCheck(cb, V1_0::ErrorStatus::NONE, preparedModel.release());

316

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

317

}

Sadik Armagan

2021-11-05 14:41:52 +0000

[diff] [blame]

318

319

if (dataCacheHandle[0]->data[0] < 0)

320

{

321

ALOGW("ArmnnDriverImpl::prepareArmnnModel_1_3: Cannot cache the data, fd < 0");

322

NotifyCallbackAndCheck(cb, V1_0::ErrorStatus::NONE, preparedModel.release());

323

return V1_0::ErrorStatus::NONE;

324

}

325

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

326

int dataCacheFileAccessMode = fcntl(dataCacheHandle[0]->data[0], F_GETFL) & O_ACCMODE;

327

if (dataCacheFileAccessMode != O_RDWR)

328

{

329

ALOGW("ArmnnDriverImpl::prepareModelFromCache_1_2(): Invalid Access Mode.");

330

NotifyCallbackAndCheck(cb, V1_0::ErrorStatus::NONE, preparedModel.release());

331

return V1_0::ErrorStatus::NONE;

332

}

333

334

write(dataCacheHandle[0]->data[0], dataCacheData.data(), dataCacheData.size());

335

hashValue = CacheDataHandlerInstance().Hash(dataCacheData);

336

}

337

338

if (modelCacheHandle.size() > 0)

339

{

340

if (modelCacheHandle.size() != numberOfCachedModelFiles)

341

{

342

NotifyCallbackAndCheck(cb, V1_0::ErrorStatus::NONE, preparedModel.release());

343

return V1_0::ErrorStatus::NONE;

344

}

345

for (uint32_t i = 0; i < modelCacheHandle.size(); ++i)

346

{

347

if (modelCacheHandle[i]->numFds == 1)

348

{

349

int modelCacheFileAccessMode = fcntl(modelCacheHandle[i]->data[0], F_GETFL) & O_ACCMODE;

350

if (modelCacheFileAccessMode != O_RDONLY)

351

{

352

struct stat statBuffer;

353

if (fstat(modelCacheHandle[i]->data[0], &statBuffer) == 0)

354

{

355

long modelDataSize = statBuffer.st_size;

356

if (modelDataSize > 0)

357

{

358

std::vector <uint8_t> modelData(modelDataSize);

359

pread(modelCacheHandle[i]->data[0], modelData.data(), modelData.size(), 0);

360

hashValue ^= CacheDataHandlerInstance().Hash(modelData);

}

}

}

}

}

}

if (hashValue != 0)

{

CacheDataHandlerInstance().Register(token, hashValue, dataCacheData.size());

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

370

}

371

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

372

NotifyCallbackAndCheck(cb, V1_0::ErrorStatus::NONE, preparedModel.release());

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

373

return V1_0::ErrorStatus::NONE;

374

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

375

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

376

Return<V1_0::ErrorStatus> ArmnnDriverImpl::prepareModelFromCache(

377

const armnn::IRuntimePtr& runtime,

378

const DriverOptions& options,

379

const android::hardware::hidl_vec<android::hardware::hidl_handle>& modelCacheHandle,

380

const android::hardware::hidl_vec<android::hardware::hidl_handle>& dataCacheHandle,

381

const HidlToken& token,

382

const android::sp<V1_2::IPreparedModelCallback>& cb,

383

bool float32ToFloat16)

384

{

385

ALOGV("ArmnnDriverImpl::prepareModelFromCache()");

386

387

if (cb.get() == nullptr)

388

{

389

ALOGW("ArmnnDriverImpl::prepareModelFromCache: Invalid callback passed to prepareModel");

390

return V1_0::ErrorStatus::INVALID_ARGUMENT;

}

if (!runtime)

{

return FailPrepareModel(V1_0::ErrorStatus::DEVICE_UNAVAILABLE, "Device unavailable", cb);

396

}

397

398

if (token.size() != ANEURALNETWORKS_BYTE_SIZE_OF_CACHE_TOKEN)

399

{

400

FailPrepareModel(V1_0::ErrorStatus::INVALID_ARGUMENT, "Invalid token passed!", cb);

401

return V1_0::ErrorStatus::INVALID_ARGUMENT;

402

}

403

404

// DataCacheHandle size should always be 1

405

// Arm NN model

406

if (dataCacheHandle.size() != 1)

407

{

408

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "No data cache!", cb);

409

return V1_0::ErrorStatus::GENERAL_FAILURE;

410

}

411

412

// Check if model files cached they match the expected value

413

unsigned int numberOfCachedModelFiles = 0;

414

for (auto& backend : options.GetBackends())

415

{

416

numberOfCachedModelFiles += GetNumberOfCacheFiles(backend);

417

}

418

if (modelCacheHandle.size() != numberOfCachedModelFiles)

419

{

420

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "Invalid model cache!", cb);

421

return V1_0::ErrorStatus::GENERAL_FAILURE;

422

}

423

424

if (dataCacheHandle[0]->numFds != 1)

425

{

426

ALOGW("ArmnnDriverImpl::prepareModelFromCache: Cannot read from the cache data, numFds != 1.");

427

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "No data cache!", cb);

428

return V1_0::ErrorStatus::GENERAL_FAILURE;

429

}

430

Sadik Armagan

2021-11-05 14:41:52 +0000

[diff] [blame]

431

if (dataCacheHandle[0]->data[0] < 0)

432

{

433

ALOGW("ArmnnDriverImpl::prepareModelFromCache: Cannot read from the cache data, fd < 0");

434

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "No data cache!", cb);

435

return V1_0::ErrorStatus::GENERAL_FAILURE;

436

}

437

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

438

int dataCacheFileAccessMode = fcntl(dataCacheHandle[0]->data[0], F_GETFL) & O_ACCMODE;

439

if (dataCacheFileAccessMode != O_RDWR)

440

{

441

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "Invalid Access Mode!", cb);

442

return V1_0::ErrorStatus::GENERAL_FAILURE;

443

}

444

445

auto dataSize = CacheDataHandlerInstance().GetCacheSize(token);

446

if (dataSize == 0)

447

{

448

ALOGW("ArmnnDriverImpl::prepareModelFromCache: Invalid data to deserialize!");

449

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "Invalid data to deserialize!", cb);

450

return V1_0::ErrorStatus::GENERAL_FAILURE;

}

int offset = 0;

{

struct stat statBuffer;

456

if (fstat(dataCacheHandle[0]->data[0], &statBuffer) == 0)

457

{

458

unsigned long bufferSize = statBuffer.st_size;

Sadik Armagan

2021-11-05 14:41:52 +0000

[diff] [blame]

459

if (bufferSize != dataSize)

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

460

{

461

ALOGW("ArmnnDriverImpl::prepareModelFromCache: Invalid data to deserialize!");

462

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "Invalid data to deserialize!", cb);

463

return V1_0::ErrorStatus::GENERAL_FAILURE;

464

}

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

465

}

466

}

467

std::vector<uint8_t> dataCacheData(dataSize);

468

pread(dataCacheHandle[0]->data[0], dataCacheData.data(), dataCacheData.size(), offset);

469

auto hashValue = CacheDataHandlerInstance().Hash(dataCacheData);

470

471

int gpuAccCachedFd = -1;

472

bool saveCachedNetwork = false;

473

if (modelCacheHandle.size() > 0)

474

{

475

unsigned int index = 0;

476

for (auto& backend : options.GetBackends())

477

{

478

// modelCacheHandle size should be equal to numberOfCachedModelFiles

479

// modelCacheHandle vector should be in same order as backends

480

auto numberOfCacheFiles = GetNumberOfCacheFiles(backend);

481

if (numberOfCacheFiles > 0)

482

{

483

if (modelCacheHandle[index]->numFds != 1)

484

{

485

ALOGW("ArmnnDriverImpl::prepareModelFromCache: Cannot read from the model cache, numFds != 1.");

486

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE,

487

"Cannot read from the model cache, numFds != 1.", cb);

488

return V1_0::ErrorStatus::GENERAL_FAILURE;

489

}

490

auto cachedFd = modelCacheHandle[index]->data[0];

491

492

int modelCacheFileAccessMode = fcntl(cachedFd, F_GETFL) & O_ACCMODE;

493

if (modelCacheFileAccessMode != O_RDWR)

494

{

495

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "Invalid Access Mode!", cb);

496

return V1_0::ErrorStatus::GENERAL_FAILURE;

497

}

498

499

struct stat statBuffer;

500

if (cachedFd != -1 && fstat(cachedFd, &statBuffer) == 0)

501

{

502

long modelDataSize = statBuffer.st_size;

Sadik Armagan

2021-11-05 14:41:52 +0000

[diff] [blame]

503

if (modelDataSize <= 0)

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

504

{

Sadik Armagan

2021-11-05 14:41:52 +0000

[diff] [blame]

505

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "Wrong cached model size!", cb);

506

return V1_0::ErrorStatus::NONE;

507

}

508

std::vector<uint8_t> modelData(modelDataSize);

509

pread(cachedFd, modelData.data(), modelData.size(), 0);

510

hashValue ^= CacheDataHandlerInstance().Hash(modelData);

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

511

Sadik Armagan

2021-11-05 14:41:52 +0000

[diff] [blame]

512

// For GpuAcc numberOfCachedFiles is 1

513

if (backend == armnn::Compute::GpuAcc)

514

{

515

gpuAccCachedFd = cachedFd;

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

516

}

517

}

518

index += numberOfCacheFiles;

}

}

}

Sadik Armagan

2021-11-05 14:41:52 +0000

[diff] [blame]

523

if (!CacheDataHandlerInstance().Validate(token, hashValue, dataCacheData.size()))

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

524

{

525

ALOGW("ArmnnDriverImpl::prepareModelFromCache: ValidateHash() failed!");

526

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "ValidateHash Failed!", cb);

527

return V1_0::ErrorStatus::GENERAL_FAILURE;

528

}

529

530

// Deserialize the network..

Sadik Armagan

2021-11-05 14:41:52 +0000

[diff] [blame]

531

armnn::INetworkPtr network = armnn::INetworkPtr(nullptr, [](armnn::INetwork*){});

532

try

533

{

534

network = armnnDeserializer::IDeserializer::Create()->CreateNetworkFromBinary(dataCacheData);

535

}

536

catch (std::exception& e)

537

{

538

std::stringstream message;

539

message << "Exception (" << e.what() << ") caught from Deserializer.";

540

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);

541

return V1_0::ErrorStatus::GENERAL_FAILURE;

542

}

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame]

543

544

// Optimize the network

545

armnn::IOptimizedNetworkPtr optNet(nullptr, nullptr);

546

armnn::OptimizerOptions OptOptions;

547

OptOptions.m_ReduceFp32ToFp16 = float32ToFloat16;

548

OptOptions.m_ProfilingEnabled = options.IsGpuProfilingEnabled();

549

550

armnn::BackendOptions gpuAcc("GpuAcc",

551

{

552

{"FastMathEnabled", options.IsFastMathEnabled()},

553

{"SaveCachedNetwork", saveCachedNetwork},

554

{"CachedNetworkFilePath", options.GetCachedNetworkFilePath()},

555

{"MLGOTuningFilePath", options.GetClMLGOTunedParametersFile()},

556

{"CachedFileDescriptor", gpuAccCachedFd}

557

});

558

559

armnn::BackendOptions cpuAcc("CpuAcc",

560

{

561

{"FastMathEnabled", options.IsFastMathEnabled()},

562

{"NumberOfThreads", options.GetNumberOfThreads()}

563

});

564

OptOptions.m_ModelOptions.push_back(gpuAcc);

565

OptOptions.m_ModelOptions.push_back(cpuAcc);

566

567

std::vector<std::string> errMessages;

568

try

569

{

570

optNet = armnn::Optimize(*network.get(),

571

options.GetBackends(),

572

runtime->GetDeviceSpec(),

OptOptions,

errMessages);

}

catch (std::exception& e)

577

{

578

std::stringstream message;

579

message << "Exception (" << e.what() << ") caught from optimize.";

580

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);

581

return V1_0::ErrorStatus::NONE;

582

}

583

584

// Check that the optimized network is valid.

585

if (!optNet)

586

{

587

std::stringstream message;

588

message << "Invalid optimized network";

589

for (const std::string& msg : errMessages)

590

{

591

message << "\n" << msg;

592

}

593

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);

594

return V1_0::ErrorStatus::NONE;

595

}

596

597

// Export the optimized network graph to a dot file if an output dump directory

598

// has been specified in the drivers' arguments.

599

std::string dotGraphFileName = ExportNetworkGraphToDotFile(*optNet,

600

options.GetRequestInputsAndOutputsDumpDir());

601

602

// Load it into the runtime.

603

armnn::NetworkId netId = 0;

604

std::string msg;

605

armnn::INetworkProperties networkProperties(options.isAsyncModelExecutionEnabled(),

606

MemorySource::Undefined,

607

MemorySource::Undefined,

608

options.IsGpuProfilingEnabled());

try

{

if (runtime->LoadNetwork(netId, move(optNet), msg, networkProperties) != armnn::Status::Success)

613

{

614

return FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, msg, cb);

615

}

616

}

617

catch (std::exception& e)

618

{

619

std::stringstream message;

620

message << "Exception (" << e.what() << ") caught from LoadNetwork.";

621

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);

622

return V1_0::ErrorStatus::NONE;

623

}

624

625

std::unique_ptr<ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>> preparedModel(

626

new ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>(

627

netId,

628

runtime.get(),

629

options.GetRequestInputsAndOutputsDumpDir(),

630

options.IsGpuProfilingEnabled(),

631

options.isAsyncModelExecutionEnabled(),

632

options.getNoOfArmnnThreads(),

633

true));

634

635

NotifyCallbackAndCheck(cb, V1_0::ErrorStatus::NONE, preparedModel.release());

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

636

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

637

}

638

639

Return<void> ArmnnDriverImpl::getCapabilities_1_2(const armnn::IRuntimePtr& runtime,

640

V1_2::IDevice::getCapabilities_1_2_cb cb)

641

{

642

ALOGV("hal_1_2::ArmnnDriverImpl::getCapabilities()");

643

644

V1_2::Capabilities capabilities;

645

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

646

float defaultValue = .1f;

647

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

648

if (runtime)

649

{

650

capabilities.relaxedFloat32toFloat16PerformanceScalar.execTime =

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

651

ParseSystemProperty(g_RelaxedFloat32toFloat16PerformanceExecTime, defaultValue);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

652

Kevin May

2eaa119

2020-04-15 16:50:57 +0100

[diff] [blame]

653

capabilities.relaxedFloat32toFloat16PerformanceScalar.powerUsage =

654

ParseSystemProperty(g_RelaxedFloat32toFloat16PerformancePowerUsage, defaultValue);

655

656

capabilities.relaxedFloat32toFloat16PerformanceTensor.execTime =

657

ParseSystemProperty(g_RelaxedFloat32toFloat16PerformanceExecTime, defaultValue);

658

FinnWilliamsArm

df655ee

2019-07-24 16:04:18 +0100

[diff] [blame]

659

capabilities.relaxedFloat32toFloat16PerformanceTensor.powerUsage =

660

ParseSystemProperty(g_RelaxedFloat32toFloat16PerformancePowerUsage, defaultValue);

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

661

662

// Set the base value for all operand types

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

663

#if defined(ARMNN_ANDROID_R) || defined(ARMNN_ANDROID_S)

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

664

capabilities.operandPerformance = nonExtensionOperandPerformance<HalVersion::V1_2>({FLT_MAX, FLT_MAX});

665

#else

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

666

capabilities.operandPerformance = nonExtensionOperandPerformance({FLT_MAX, FLT_MAX});

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

667

#endif

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

668

669

// Load supported operand types

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

670

update(&capabilities.operandPerformance, V1_2::OperandType::TENSOR_FLOAT32,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

671

{

672

.execTime = ParseSystemProperty(g_OperandTypeTensorFloat32PerformanceExecTime, defaultValue),

673

.powerUsage = ParseSystemProperty(g_OperandTypeTensorFloat32PerformancePowerUsage, defaultValue)

674

});

675

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

676

update(&capabilities.operandPerformance, V1_2::OperandType::FLOAT32,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

677

{

678

.execTime = ParseSystemProperty(g_OperandTypeFloat32PerformanceExecTime, defaultValue),

679

.powerUsage = ParseSystemProperty(g_OperandTypeFloat32PerformancePowerUsage, defaultValue)

680

});

681

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

682

update(&capabilities.operandPerformance, V1_2::OperandType::TENSOR_FLOAT16,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

683

{

684

.execTime = ParseSystemProperty(g_OperandTypeTensorFloat16PerformanceExecTime, defaultValue),

685

.powerUsage = ParseSystemProperty(g_OperandTypeTensorFloat16PerformancePowerUsage, defaultValue)

686

});

687

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

688

update(&capabilities.operandPerformance, V1_2::OperandType::FLOAT16,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

689

{

690

.execTime = ParseSystemProperty(g_OperandTypeFloat16PerformanceExecTime, defaultValue),

691

.powerUsage = ParseSystemProperty(g_OperandTypeFloat16PerformancePowerUsage, defaultValue)

692

});

693

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

694

update(&capabilities.operandPerformance, V1_2::OperandType::TENSOR_QUANT8_ASYMM,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

695

{

696

.execTime = ParseSystemProperty(g_OperandTypeTensorQuant8AsymmPerformanceExecTime, defaultValue),

697

.powerUsage = ParseSystemProperty(g_OperandTypeTensorQuant8AsymmPerformancePowerUsage, defaultValue)

698

});

699

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

700

update(&capabilities.operandPerformance, V1_2::OperandType::TENSOR_QUANT8_SYMM,

Pablo Tello

fb45e2f

2019-10-18 16:51:57 +0100

[diff] [blame]

701

{

702

.execTime = ParseSystemProperty(g_OperandTypeTensorQuant8SymmPerformanceExecTime, defaultValue),

703

.powerUsage = ParseSystemProperty(g_OperandTypeTensorQuant8SymmPerformancePowerUsage, defaultValue)

704

});

705

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

706

update(&capabilities.operandPerformance, V1_2::OperandType::TENSOR_QUANT16_SYMM,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

707

{

708

.execTime = ParseSystemProperty(g_OperandTypeTensorQuant16SymmPerformanceExecTime, defaultValue),

709

.powerUsage = ParseSystemProperty(g_OperandTypeTensorQuant16SymmPerformancePowerUsage, defaultValue)

710

});

711

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

712

update(&capabilities.operandPerformance, V1_2::OperandType::TENSOR_QUANT8_SYMM_PER_CHANNEL,

Kevin May

87cb761

2019-11-11 17:30:35 +0000

[diff] [blame]

713

{

714

.execTime =

715

ParseSystemProperty(g_OperandTypeTensorQuant8SymmPerChannelPerformanceExecTime, defaultValue),

716

.powerUsage =

717

ParseSystemProperty(g_OperandTypeTensorQuant8SymmPerChannelPerformancePowerUsage, defaultValue)

718

});

719

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

720

update(&capabilities.operandPerformance, V1_2::OperandType::TENSOR_INT32,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

721

{

722

.execTime = ParseSystemProperty(g_OperandTypeTensorInt32PerformanceExecTime, defaultValue),

723

.powerUsage = ParseSystemProperty(g_OperandTypeTensorInt32PerformancePowerUsage, defaultValue)

724

});

725

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

726

update(&capabilities.operandPerformance, V1_2::OperandType::INT32,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

727

{

728

.execTime = ParseSystemProperty(g_OperandTypeInt32PerformanceExecTime, defaultValue),

729

.powerUsage = ParseSystemProperty(g_OperandTypeInt32PerformancePowerUsage, defaultValue)

730

});

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

731

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

732

cb(V1_0::ErrorStatus::NONE, capabilities);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

733

}

734

else

735

{

Kevin May

2eaa119

2020-04-15 16:50:57 +0100

[diff] [blame]

736

capabilities.relaxedFloat32toFloat16PerformanceScalar.execTime = 0;

737

capabilities.relaxedFloat32toFloat16PerformanceScalar.powerUsage = 0;

738

capabilities.relaxedFloat32toFloat16PerformanceTensor.execTime = 0;

739

capabilities.relaxedFloat32toFloat16PerformanceTensor.powerUsage = 0;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

740

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

741

// Set the base value for all operand types

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

742

#if defined(ARMNN_ANDROID_R) || defined(ARMNN_ANDROID_S)

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

743

capabilities.operandPerformance = nonExtensionOperandPerformance<HalVersion::V1_2>({0.f, 0.0f});

744

#else

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

745

capabilities.operandPerformance = nonExtensionOperandPerformance({0.f, 0.0f});

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

746

#endif

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

747

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

748

cb(V1_0::ErrorStatus::DEVICE_UNAVAILABLE, capabilities);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

}

return Void();

}

} // namespace hal_1_2

Kevin May