Blame - 1.2/ArmnnDriverImpl.cpp - ml/android-nn-driver

2019-06-11 16:35:25 +0100

[diff] [blame]

1

//

2

3

// SPDX-License-Identifier: MIT

4

//

5

6

#include "ArmnnDriverImpl.hpp"

7

#include "../ArmnnPreparedModel_1_2.hpp"

8

#include "../ModelToINetworkConverter.hpp"

9

#include "../SystemPropertiesUtils.hpp"

10

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

11

#include <armnnDeserializer/IDeserializer.hpp>

12

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

13

#include <log/log.h>

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

14

#include <sys/stat.h>

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

namespace

{

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

19

const char *g_RelaxedFloat32toFloat16PerformanceExecTime = "ArmNN.relaxedFloat32toFloat16Performance.execTime";

FinnWilliamsArm

df655ee

2019-07-24 16:04:18 +0100

[diff] [blame]

20

const char *g_RelaxedFloat32toFloat16PerformancePowerUsage = "ArmNN.relaxedFloat32toFloat16Performance.powerUsage";

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

21

22

const char *g_OperandTypeTensorFloat32PerformanceExecTime = "Armnn.operandTypeTensorFloat32Performance.execTime";

23

const char *g_OperandTypeTensorFloat32PerformancePowerUsage = "Armnn.operandTypeTensorFloat32Performance.powerUsage";

24

25

const char *g_OperandTypeFloat32PerformanceExecTime = "Armnn.operandTypeFloat32Performance.execTime";

26

const char *g_OperandTypeFloat32PerformancePowerUsage = "Armnn.operandTypeFloat32Performance.powerUsage";

27

28

const char *g_OperandTypeTensorFloat16PerformanceExecTime = "Armnn.operandTypeTensorFloat16Performance.execTime";

29

const char *g_OperandTypeTensorFloat16PerformancePowerUsage = "Armnn.operandTypeTensorFloat16Performance.powerUsage";

30

31

const char *g_OperandTypeFloat16PerformanceExecTime = "Armnn.operandTypeFloat16Performance.execTime";

32

const char *g_OperandTypeFloat16PerformancePowerUsage = "Armnn.operandTypeFloat16Performance.powerUsage";

33

34

const char *g_OperandTypeTensorQuant8AsymmPerformanceExecTime =

35

"Armnn.operandTypeTensorQuant8AsymmPerformance.execTime";

36

const char *g_OperandTypeTensorQuant8AsymmPerformancePowerUsage =

37

"Armnn.operandTypeTensorQuant8AsymmPerformance.powerUsage";

38

39

const char *g_OperandTypeTensorQuant16SymmPerformanceExecTime =

40

"Armnn.operandTypeTensorQuant16SymmPerformance.execTime";

41

const char *g_OperandTypeTensorQuant16SymmPerformancePowerUsage =

42

"Armnn.operandTypeTensorQuant16SymmPerformance.powerUsage";

43

Pablo Tello

fb45e2f

2019-10-18 16:51:57 +0100

[diff] [blame]

44

const char *g_OperandTypeTensorQuant8SymmPerformanceExecTime =

45

"Armnn.operandTypeTensorQuant8SymmPerformance.execTime";

46

const char *g_OperandTypeTensorQuant8SymmPerformancePowerUsage =

47

"Armnn.operandTypeTensorQuant8SymmPerformance.powerUsage";

48

Kevin May

87cb761

2019-11-11 17:30:35 +0000

[diff] [blame]

49

const char *g_OperandTypeTensorQuant8SymmPerChannelPerformanceExecTime =

50

"Armnn.operandTypeTensorQuant8SymmPerChannelPerformance.execTime";

51

const char *g_OperandTypeTensorQuant8SymmPerChannelPerformancePowerUsage =

52

"Armnn.operandTypeTensorQuant8SymmPerChannelPerformance.powerUsage";

53

Pablo Tello

fb45e2f

2019-10-18 16:51:57 +0100

[diff] [blame]

54

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

55

const char *g_OperandTypeTensorInt32PerformanceExecTime = "Armnn.operandTypeTensorInt32Performance.execTime";

56

const char *g_OperandTypeTensorInt32PerformancePowerUsage = "Armnn.operandTypeTensorInt32Performance.powerUsage";

57

58

const char *g_OperandTypeInt32PerformanceExecTime = "Armnn.operandTypeInt32Performance.execTime";

59

const char *g_OperandTypeInt32PerformancePowerUsage = "Armnn.operandTypeInt32Performance.powerUsage";

60

61

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

62

void NotifyCallbackAndCheck(const android::sp<V1_2::IPreparedModelCallback>& callback,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

63

V1_0::ErrorStatus errorStatus,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

64

const android::sp<V1_2::IPreparedModel>& preparedModelPtr)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

65

{

Ferran Balaguer

b2397fd

2019-07-25 12:12:39 +0100

[diff] [blame]

66

Return<void> returned = callback->notify_1_2(errorStatus, preparedModelPtr);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

67

// This check is required, if the callback fails and it isn't checked it will bring down the service

68

if (!returned.isOk())

69

{

70

ALOGE("ArmnnDriverImpl::prepareModel: hidl callback failed to return properly: %s ",

71

returned.description().c_str());

}

}

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

75

Return<V1_0::ErrorStatus> FailPrepareModel(V1_0::ErrorStatus error,

76

const std::string& message,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

77

const android::sp<V1_2::IPreparedModelCallback>& callback)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

78

{

79

ALOGW("ArmnnDriverImpl::prepareModel: %s", message.c_str());

80

NotifyCallbackAndCheck(callback, error, nullptr);

return error;

}

} // anonymous namespace

85

86

namespace armnn_driver

{

namespace hal_1_2

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

91

Return<V1_0::ErrorStatus> ArmnnDriverImpl::prepareArmnnModel_1_2(

92

const armnn::IRuntimePtr& runtime,

93

const armnn::IGpuAccTunedParametersPtr& clTunedParameters,

94

const DriverOptions& options,

95

const V1_2::Model& model,

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

96

const android::hardware::hidl_vec<android::hardware::hidl_handle>& modelCacheHandle,

97

const android::hardware::hidl_vec<android::hardware::hidl_handle>& dataCacheHandle,

98

const HidlToken& token,

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

99

const android::sp<V1_2::IPreparedModelCallback>& cb,

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

100

bool float32ToFloat16)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

101

{

Matteo Martincigh

0bd89a8

2019-07-02 16:53:10 +0100

[diff] [blame]

102

ALOGV("ArmnnDriverImpl::prepareArmnnModel_1_2()");

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

103

104

if (cb.get() == nullptr)

105

{

106

ALOGW("ArmnnDriverImpl::prepareModel: Invalid callback passed to prepareModel");

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

107

return V1_0::ErrorStatus::INVALID_ARGUMENT;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

}

if (!runtime)

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

112

return FailPrepareModel(V1_0::ErrorStatus::DEVICE_UNAVAILABLE, "Device unavailable", cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

113

}

114

115

if (!android::nn::validateModel(model))

116

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

117

return FailPrepareModel(V1_0::ErrorStatus::INVALID_ARGUMENT, "Invalid model passed as input", cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

118

}

119

120

// Deliberately ignore any unsupported operations requested by the options -

121

// at this point we're being asked to prepare a model that we've already declared support for

122

// and the operation indices may be different to those in getSupportedOperations anyway.

123

std::set<unsigned int> unsupportedOperations;

124

ModelToINetworkConverter<HalPolicy> modelConverter(options.GetBackends(),

125

model,

126

unsupportedOperations);

127

128

if (modelConverter.GetConversionResult() != ConversionResult::Success)

129

{

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

130

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "ModelToINetworkConverter failed", cb);

131

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

132

}

133

Sadik Armagan

2021-01-13 15:56:51 +0000

[diff] [blame]

134

// Serialize the network graph to a .armnn file if an output directory

135

// has been specified in the drivers' arguments.

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

136

std::vector<uint8_t> dataCacheData;

137

bool serializeToFile = dataCacheHandle.size() < 1 ? false : true;

Sadik Armagan

2021-01-13 15:56:51 +0000

[diff] [blame]

138

auto serializedNetworkFileName =

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

139

SerializeNetwork(*modelConverter.GetINetwork(),

140

options.GetRequestInputsAndOutputsDumpDir(),

141

dataCacheData,

142

serializeToFile);

Sadik Armagan

2021-01-13 15:56:51 +0000

[diff] [blame]

143

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

144

// Optimize the network

145

armnn::IOptimizedNetworkPtr optNet(nullptr, nullptr);

146

armnn::OptimizerOptions OptOptions;

147

OptOptions.m_ReduceFp32ToFp16 = float32ToFloat16;

Kevin May

daf7dd0

2021-10-22 11:57:30 +0100

[diff] [blame]

148

OptOptions.m_ProfilingEnabled = options.IsGpuProfilingEnabled();

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

149

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

150

int cachedFd = -1;

151

bool saveCachedNetwork = options.SaveCachedNetwork();

152

153

unsigned int numberOfCachedModelFiles = 0;

154

if (modelCacheHandle.size() > 0)

155

{

156

unsigned int index = 0;

157

for (auto& backend : options.GetBackends())

158

{

159

// modelCacheHandle size should be equal to numberOfCachedModelFiles

160

// modelCacheHandle vector should be in same order as backends

161

auto numberOfCacheFiles = GetNumberOfCacheFiles(backend);

162

if (numberOfCacheFiles > 0)

163

{

164

numberOfCachedModelFiles += numberOfCacheFiles;

165

if (modelCacheHandle[index]->numFds == 1)

166

{

167

if (backend == armnn::Compute::GpuAcc)

168

{

169

cachedFd = modelCacheHandle[index]->data[0];

170

saveCachedNetwork = true;

171

}

172

}

173

index += numberOfCachedModelFiles;

}

}

}

Mike Kelly

2020-09-30 20:22:56 +0100

[diff] [blame]

178

armnn::BackendOptions gpuAcc("GpuAcc",

179

{

Sadik Armagan

f36e10b

2021-01-11 16:34:01 +0000

[diff] [blame]

180

{ "FastMathEnabled", options.IsFastMathEnabled() },

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

181

{ "SaveCachedNetwork", saveCachedNetwork },

Finn Williams

f5ca16c

2021-02-12 14:26:23 +0000

[diff] [blame]

182

{ "CachedNetworkFilePath", options.GetCachedNetworkFilePath() },

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

183

{ "MLGOTuningFilePath", options.GetClMLGOTunedParametersFile() },

184

{ "CachedFileDescriptor", cachedFd }

Mike Kelly

7ed56dd

2020-09-30 20:22:56 +0100

[diff] [blame]

185

});

Finn Williams

f5ca16c

2021-02-12 14:26:23 +0000

[diff] [blame]

186

Mike Kelly

7ed56dd

2020-09-30 20:22:56 +0100

[diff] [blame]

187

armnn::BackendOptions cpuAcc("CpuAcc",

188

{

Matthew Sloyan

cd639c9

2021-02-11 16:57:38 +0000

[diff] [blame]

189

{ "FastMathEnabled", options.IsFastMathEnabled() },

190

{ "NumberOfThreads", options.GetNumberOfThreads() }

Mike Kelly

7ed56dd

2020-09-30 20:22:56 +0100

[diff] [blame]

191

});

192

OptOptions.m_ModelOptions.push_back(gpuAcc);

193

OptOptions.m_ModelOptions.push_back(cpuAcc);

194

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

195

std::vector<std::string> errMessages;

196

try

197

{

198

optNet = armnn::Optimize(*modelConverter.GetINetwork(),

199

options.GetBackends(),

200

runtime->GetDeviceSpec(),

201

OptOptions,

202

errMessages);

203

}

Derek Lamberti

2019-11-28 13:34:48 +0000

[diff] [blame]

204

catch (std::exception &e)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

205

{

206

std::stringstream message;

Derek Lamberti

2019-11-28 13:34:48 +0000

[diff] [blame]

207

message << "Exception (" << e.what() << ") caught from optimize.";

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

208

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);

209

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

210

}

211

212

// Check that the optimized network is valid.

213

if (!optNet)

214

{

215

std::stringstream message;

216

message << "Invalid optimized network";

217

for (const std::string& msg : errMessages)

218

{

219

message << "\n" << msg;

220

}

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

221

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);

222

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

223

}

224

225

// Export the optimized network graph to a dot file if an output dump directory

226

// has been specified in the drivers' arguments.

Jim Flynn

829ad30

2019-12-13 14:43:24 +0000

[diff] [blame]

227

std::string dotGraphFileName = ExportNetworkGraphToDotFile(*optNet,

228

options.GetRequestInputsAndOutputsDumpDir());

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

229

230

// Load it into the runtime.

231

armnn::NetworkId netId = 0;

Finn Williams

d8fb540

2021-05-19 20:52:00 +0100

[diff] [blame]

232

std::string msg;

233

armnn::INetworkProperties networkProperties(options.isAsyncModelExecutionEnabled(),

234

MemorySource::Undefined,

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

235

MemorySource::Undefined,

236

options.IsGpuProfilingEnabled());

237

238

auto numInputs = getMainModel(model).inputIndexes.size();

239

auto numOutputs = getMainModel(model).outputIndexes.size();

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

240

try

241

{

Finn Williams

d8fb540

2021-05-19 20:52:00 +0100

[diff] [blame]

242

if (runtime->LoadNetwork(netId, move(optNet), msg, networkProperties) != armnn::Status::Success)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

243

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

244

return FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, msg, cb);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

245

}

246

}

Derek Lamberti

2019-11-28 13:34:48 +0000

[diff] [blame]

247

catch (std::exception& e)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

248

{

249

std::stringstream message;

Derek Lamberti

2019-11-28 13:34:48 +0000

[diff] [blame]

250

message << "Exception (" << e.what()<< ") caught from LoadNetwork.";

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

251

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);

252

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

253

}

254

Sadik Armagan

2021-01-13 15:56:51 +0000

[diff] [blame]

255

// Now that we have a networkId for the graph rename the exported files to use it

256

// so that we can associate the graph file and the input/output tensor exported files

257

RenameExportedFiles(serializedNetworkFileName,

258

dotGraphFileName,

259

options.GetRequestInputsAndOutputsDumpDir(),

260

netId);

Jim Flynn

829ad30

2019-12-13 14:43:24 +0000

[diff] [blame]

261

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

262

std::unique_ptr<ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>> preparedModel(

263

new ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>(

netId,

runtime.get(),

model,

options.GetRequestInputsAndOutputsDumpDir(),

Finn Williams

d8fb540

2021-05-19 20:52:00 +0100

[diff] [blame]

268

options.IsGpuProfilingEnabled(),

Finn Williams

ca3a3e0

2021-06-11 15:04:02 +0100

[diff] [blame]

269

options.isAsyncModelExecutionEnabled(),

270

options.getNoOfArmnnThreads()));

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

271

272

// Run a single 'dummy' inference of the model. This means that CL kernels will get compiled (and tuned if

273

// this is enabled) before the first 'real' inference which removes the overhead of the first inference.

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

274

// Only run this if the GpuAcc backend has been added to options

275

if (std::find(options.GetBackends().begin(),

276

options.GetBackends().end(),

277

armnn::Compute::GpuAcc) != options.GetBackends().end())

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

278

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

279

if (!preparedModel->ExecuteWithDummyInputs(numInputs, numOutputs))

280

{

281

return FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "Network could not be executed", cb);

282

}

283

284

if (clTunedParameters &&

285

options.GetClTunedParametersMode() == armnn::IGpuAccTunedParameters::Mode::UpdateTunedParameters)

286

{

287

// Now that we've done one inference the CL kernel parameters will have been tuned,

288

// so save the updated file.

289

try

290

{

291

clTunedParameters->Save(options.GetClTunedParametersFile().c_str());

292

}

293

catch (std::exception& error)

294

{

295

ALOGE("ArmnnDriverImpl::prepareModel: Failed to save CL tuned parameters file '%s': %s",

296

options.GetClTunedParametersFile().c_str(), error.what());

297

}

298

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

299

}

300

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

301

size_t hashValue = 0;

302

// Cache the model

303

if (dataCacheHandle.size() > 0)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

304

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

305

// Cache the Arm NN model, should be only 1

306

if (dataCacheHandle.size() != 1)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

307

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

308

NotifyCallbackAndCheck(cb, V1_0::ErrorStatus::NONE, preparedModel.release());

309

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

310

}

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

311

312

if (dataCacheHandle[0]->numFds != 1)

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

313

{

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

314

ALOGW("ArmnnDriverImpl::prepareArmnnModel_1_3: Cannot cache the data, numFds != 1.");

315

NotifyCallbackAndCheck(cb, V1_0::ErrorStatus::NONE, preparedModel.release());

316

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

317

}

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

318

int dataCacheFileAccessMode = fcntl(dataCacheHandle[0]->data[0], F_GETFL) & O_ACCMODE;

319

if (dataCacheFileAccessMode != O_RDWR)

320

{

321

ALOGW("ArmnnDriverImpl::prepareModelFromCache_1_2(): Invalid Access Mode.");

322

NotifyCallbackAndCheck(cb, V1_0::ErrorStatus::NONE, preparedModel.release());

323

return V1_0::ErrorStatus::NONE;

324

}

325

326

write(dataCacheHandle[0]->data[0], dataCacheData.data(), dataCacheData.size());

327

hashValue = CacheDataHandlerInstance().Hash(dataCacheData);

328

}

329

330

if (modelCacheHandle.size() > 0)

331

{

332

if (modelCacheHandle.size() != numberOfCachedModelFiles)

333

{

334

NotifyCallbackAndCheck(cb, V1_0::ErrorStatus::NONE, preparedModel.release());

335

return V1_0::ErrorStatus::NONE;

336

}

337

for (uint32_t i = 0; i < modelCacheHandle.size(); ++i)

338

{

339

if (modelCacheHandle[i]->numFds == 1)

340

{

341

int modelCacheFileAccessMode = fcntl(modelCacheHandle[i]->data[0], F_GETFL) & O_ACCMODE;

342

if (modelCacheFileAccessMode != O_RDONLY)

343

{

344

struct stat statBuffer;

345

if (fstat(modelCacheHandle[i]->data[0], &statBuffer) == 0)

346

{

347

long modelDataSize = statBuffer.st_size;

348

if (modelDataSize > 0)

349

{

350

std::vector <uint8_t> modelData(modelDataSize);

351

pread(modelCacheHandle[i]->data[0], modelData.data(), modelData.size(), 0);

352

hashValue ^= CacheDataHandlerInstance().Hash(modelData);

}

}

}

}

}

}

if (hashValue != 0)

{

CacheDataHandlerInstance().Register(token, hashValue, dataCacheData.size());

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

362

}

363

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

364

NotifyCallbackAndCheck(cb, V1_0::ErrorStatus::NONE, preparedModel.release());

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

365

return V1_0::ErrorStatus::NONE;

366

}

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

367

Sadik Armagan

2021-10-06 16:41:44 +0100

[diff] [blame^]

368

Return<V1_0::ErrorStatus> ArmnnDriverImpl::prepareModelFromCache(

369

const armnn::IRuntimePtr& runtime,

370

const DriverOptions& options,

371

const android::hardware::hidl_vec<android::hardware::hidl_handle>& modelCacheHandle,

372

const android::hardware::hidl_vec<android::hardware::hidl_handle>& dataCacheHandle,

373

const HidlToken& token,

374

const android::sp<V1_2::IPreparedModelCallback>& cb,

375

bool float32ToFloat16)

376

{

377

ALOGV("ArmnnDriverImpl::prepareModelFromCache()");

378

379

if (cb.get() == nullptr)

380

{

381

ALOGW("ArmnnDriverImpl::prepareModelFromCache: Invalid callback passed to prepareModel");

382

return V1_0::ErrorStatus::INVALID_ARGUMENT;

}

if (!runtime)

{

return FailPrepareModel(V1_0::ErrorStatus::DEVICE_UNAVAILABLE, "Device unavailable", cb);

388

}

389

390

if (token.size() != ANEURALNETWORKS_BYTE_SIZE_OF_CACHE_TOKEN)

391

{

392

FailPrepareModel(V1_0::ErrorStatus::INVALID_ARGUMENT, "Invalid token passed!", cb);

393

return V1_0::ErrorStatus::INVALID_ARGUMENT;

394

}

395

396

// DataCacheHandle size should always be 1

397

// Arm NN model

398

if (dataCacheHandle.size() != 1)

399

{

400

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "No data cache!", cb);

401

return V1_0::ErrorStatus::GENERAL_FAILURE;

402

}

403

404

// Check if model files cached they match the expected value

405

unsigned int numberOfCachedModelFiles = 0;

406

for (auto& backend : options.GetBackends())

407

{

408

numberOfCachedModelFiles += GetNumberOfCacheFiles(backend);

409

}

410

if (modelCacheHandle.size() != numberOfCachedModelFiles)

411

{

412

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "Invalid model cache!", cb);

413

return V1_0::ErrorStatus::GENERAL_FAILURE;

414

}

415

416

if (dataCacheHandle[0]->numFds != 1)

417

{

418

ALOGW("ArmnnDriverImpl::prepareModelFromCache: Cannot read from the cache data, numFds != 1.");

419

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "No data cache!", cb);

420

return V1_0::ErrorStatus::GENERAL_FAILURE;

421

}

422

423

int dataCacheFileAccessMode = fcntl(dataCacheHandle[0]->data[0], F_GETFL) & O_ACCMODE;

424

if (dataCacheFileAccessMode != O_RDWR)

425

{

426

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "Invalid Access Mode!", cb);

427

return V1_0::ErrorStatus::GENERAL_FAILURE;

428

}

429

430

auto dataSize = CacheDataHandlerInstance().GetCacheSize(token);

431

if (dataSize == 0)

432

{

433

ALOGW("ArmnnDriverImpl::prepareModelFromCache: Invalid data to deserialize!");

434

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "Invalid data to deserialize!", cb);

435

return V1_0::ErrorStatus::GENERAL_FAILURE;

}

int offset = 0;

{

struct stat statBuffer;

441

if (fstat(dataCacheHandle[0]->data[0], &statBuffer) == 0)

442

{

443

unsigned long bufferSize = statBuffer.st_size;

444

if (bufferSize <= 0)

445

{

446

ALOGW("ArmnnDriverImpl::prepareModelFromCache: Invalid data to deserialize!");

447

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "Invalid data to deserialize!", cb);

448

return V1_0::ErrorStatus::GENERAL_FAILURE;

449

}

450

if (bufferSize > dataSize)

451

{

452

offset = bufferSize - dataSize;

}

}

}

std::vector<uint8_t> dataCacheData(dataSize);

457

pread(dataCacheHandle[0]->data[0], dataCacheData.data(), dataCacheData.size(), offset);

458

auto hashValue = CacheDataHandlerInstance().Hash(dataCacheData);

459

460

int gpuAccCachedFd = -1;

461

bool saveCachedNetwork = false;

462

if (modelCacheHandle.size() > 0)

463

{

464

unsigned int index = 0;

465

for (auto& backend : options.GetBackends())

466

{

467

// modelCacheHandle size should be equal to numberOfCachedModelFiles

468

// modelCacheHandle vector should be in same order as backends

469

auto numberOfCacheFiles = GetNumberOfCacheFiles(backend);

470

if (numberOfCacheFiles > 0)

471

{

472

if (modelCacheHandle[index]->numFds != 1)

473

{

474

ALOGW("ArmnnDriverImpl::prepareModelFromCache: Cannot read from the model cache, numFds != 1.");

475

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE,

476

"Cannot read from the model cache, numFds != 1.", cb);

477

return V1_0::ErrorStatus::GENERAL_FAILURE;

478

}

479

auto cachedFd = modelCacheHandle[index]->data[0];

480

481

int modelCacheFileAccessMode = fcntl(cachedFd, F_GETFL) & O_ACCMODE;

482

if (modelCacheFileAccessMode != O_RDWR)

483

{

484

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "Invalid Access Mode!", cb);

485

return V1_0::ErrorStatus::GENERAL_FAILURE;

486

}

487

488

struct stat statBuffer;

489

if (cachedFd != -1 && fstat(cachedFd, &statBuffer) == 0)

490

{

491

long modelDataSize = statBuffer.st_size;

492

if (modelDataSize > 0)

493

{

494

std::vector<uint8_t> modelData(modelDataSize);

495

pread(cachedFd, modelData.data(), modelData.size(), 0);

496

hashValue ^= CacheDataHandlerInstance().Hash(modelData);

497

498

// For GpuAcc numberOfCachedFiles is 1

499

if (backend == armnn::Compute::GpuAcc)

500

{

501

gpuAccCachedFd = cachedFd;

}

}

}

index += numberOfCacheFiles;

}

}

}

if (!CacheDataHandlerInstance().Validate(token, hashValue))

511

{

512

ALOGW("ArmnnDriverImpl::prepareModelFromCache: ValidateHash() failed!");

513

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "ValidateHash Failed!", cb);

514

return V1_0::ErrorStatus::GENERAL_FAILURE;

515

}

516

517

// Deserialize the network..

518

auto network = armnnDeserializer::IDeserializer::Create()->CreateNetworkFromBinary(dataCacheData);

519

520

// Optimize the network

521

armnn::IOptimizedNetworkPtr optNet(nullptr, nullptr);

522

armnn::OptimizerOptions OptOptions;

523

OptOptions.m_ReduceFp32ToFp16 = float32ToFloat16;

524

OptOptions.m_ProfilingEnabled = options.IsGpuProfilingEnabled();

525

526

armnn::BackendOptions gpuAcc("GpuAcc",

527

{

528

{"FastMathEnabled", options.IsFastMathEnabled()},

529

{"SaveCachedNetwork", saveCachedNetwork},

530

{"CachedNetworkFilePath", options.GetCachedNetworkFilePath()},

531

{"MLGOTuningFilePath", options.GetClMLGOTunedParametersFile()},

532

{"CachedFileDescriptor", gpuAccCachedFd}

533

});

534

535

armnn::BackendOptions cpuAcc("CpuAcc",

536

{

537

{"FastMathEnabled", options.IsFastMathEnabled()},

538

{"NumberOfThreads", options.GetNumberOfThreads()}

539

});

540

OptOptions.m_ModelOptions.push_back(gpuAcc);

541

OptOptions.m_ModelOptions.push_back(cpuAcc);

542

543

std::vector<std::string> errMessages;

544

try

545

{

546

optNet = armnn::Optimize(*network.get(),

547

options.GetBackends(),

548

runtime->GetDeviceSpec(),

OptOptions,

errMessages);

}

catch (std::exception& e)

553

{

554

std::stringstream message;

555

message << "Exception (" << e.what() << ") caught from optimize.";

556

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);

557

return V1_0::ErrorStatus::NONE;

558

}

559

560

// Check that the optimized network is valid.

561

if (!optNet)

562

{

563

std::stringstream message;

564

message << "Invalid optimized network";

565

for (const std::string& msg : errMessages)

566

{

567

message << "\n" << msg;

568

}

569

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);

570

return V1_0::ErrorStatus::NONE;

571

}

572

573

// Export the optimized network graph to a dot file if an output dump directory

574

// has been specified in the drivers' arguments.

575

std::string dotGraphFileName = ExportNetworkGraphToDotFile(*optNet,

576

options.GetRequestInputsAndOutputsDumpDir());

577

578

// Load it into the runtime.

579

armnn::NetworkId netId = 0;

580

std::string msg;

581

armnn::INetworkProperties networkProperties(options.isAsyncModelExecutionEnabled(),

582

MemorySource::Undefined,

583

MemorySource::Undefined,

584

options.IsGpuProfilingEnabled());

try

{

if (runtime->LoadNetwork(netId, move(optNet), msg, networkProperties) != armnn::Status::Success)

589

{

590

return FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, msg, cb);

591

}

592

}

593

catch (std::exception& e)

594

{

595

std::stringstream message;

596

message << "Exception (" << e.what() << ") caught from LoadNetwork.";

597

FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);

598

return V1_0::ErrorStatus::NONE;

599

}

600

601

std::unique_ptr<ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>> preparedModel(

602

new ArmnnPreparedModel_1_2<hal_1_2::HalPolicy>(

603

netId,

604

runtime.get(),

605

options.GetRequestInputsAndOutputsDumpDir(),

606

options.IsGpuProfilingEnabled(),

607

options.isAsyncModelExecutionEnabled(),

608

options.getNoOfArmnnThreads(),

609

true));

610

611

NotifyCallbackAndCheck(cb, V1_0::ErrorStatus::NONE, preparedModel.release());

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

612

return V1_0::ErrorStatus::NONE;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

613

}

614

615

Return<void> ArmnnDriverImpl::getCapabilities_1_2(const armnn::IRuntimePtr& runtime,

616

V1_2::IDevice::getCapabilities_1_2_cb cb)

617

{

618

ALOGV("hal_1_2::ArmnnDriverImpl::getCapabilities()");

619

620

V1_2::Capabilities capabilities;

621

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

622

float defaultValue = .1f;

623

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

624

if (runtime)

625

{

626

capabilities.relaxedFloat32toFloat16PerformanceScalar.execTime =

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

627

ParseSystemProperty(g_RelaxedFloat32toFloat16PerformanceExecTime, defaultValue);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

628

Kevin May

2eaa119

2020-04-15 16:50:57 +0100

[diff] [blame]

629

capabilities.relaxedFloat32toFloat16PerformanceScalar.powerUsage =

630

ParseSystemProperty(g_RelaxedFloat32toFloat16PerformancePowerUsage, defaultValue);

631

632

capabilities.relaxedFloat32toFloat16PerformanceTensor.execTime =

633

ParseSystemProperty(g_RelaxedFloat32toFloat16PerformanceExecTime, defaultValue);

634

FinnWilliamsArm

df655ee

2019-07-24 16:04:18 +0100

[diff] [blame]

635

capabilities.relaxedFloat32toFloat16PerformanceTensor.powerUsage =

636

ParseSystemProperty(g_RelaxedFloat32toFloat16PerformancePowerUsage, defaultValue);

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

637

638

// Set the base value for all operand types

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

639

#if defined(ARMNN_ANDROID_R) || defined(ARMNN_ANDROID_S)

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

640

capabilities.operandPerformance = nonExtensionOperandPerformance<HalVersion::V1_2>({FLT_MAX, FLT_MAX});

641

#else

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

642

capabilities.operandPerformance = nonExtensionOperandPerformance({FLT_MAX, FLT_MAX});

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

643

#endif

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

644

645

// Load supported operand types

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

646

update(&capabilities.operandPerformance, V1_2::OperandType::TENSOR_FLOAT32,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

647

{

648

.execTime = ParseSystemProperty(g_OperandTypeTensorFloat32PerformanceExecTime, defaultValue),

649

.powerUsage = ParseSystemProperty(g_OperandTypeTensorFloat32PerformancePowerUsage, defaultValue)

650

});

651

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

652

update(&capabilities.operandPerformance, V1_2::OperandType::FLOAT32,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

653

{

654

.execTime = ParseSystemProperty(g_OperandTypeFloat32PerformanceExecTime, defaultValue),

655

.powerUsage = ParseSystemProperty(g_OperandTypeFloat32PerformancePowerUsage, defaultValue)

656

});

657

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

658

update(&capabilities.operandPerformance, V1_2::OperandType::TENSOR_FLOAT16,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

659

{

660

.execTime = ParseSystemProperty(g_OperandTypeTensorFloat16PerformanceExecTime, defaultValue),

661

.powerUsage = ParseSystemProperty(g_OperandTypeTensorFloat16PerformancePowerUsage, defaultValue)

662

});

663

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

664

update(&capabilities.operandPerformance, V1_2::OperandType::FLOAT16,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

665

{

666

.execTime = ParseSystemProperty(g_OperandTypeFloat16PerformanceExecTime, defaultValue),

667

.powerUsage = ParseSystemProperty(g_OperandTypeFloat16PerformancePowerUsage, defaultValue)

668

});

669

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

670

update(&capabilities.operandPerformance, V1_2::OperandType::TENSOR_QUANT8_ASYMM,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

671

{

672

.execTime = ParseSystemProperty(g_OperandTypeTensorQuant8AsymmPerformanceExecTime, defaultValue),

673

.powerUsage = ParseSystemProperty(g_OperandTypeTensorQuant8AsymmPerformancePowerUsage, defaultValue)

674

});

675

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

676

update(&capabilities.operandPerformance, V1_2::OperandType::TENSOR_QUANT8_SYMM,

Pablo Tello

fb45e2f

2019-10-18 16:51:57 +0100

[diff] [blame]

677

{

678

.execTime = ParseSystemProperty(g_OperandTypeTensorQuant8SymmPerformanceExecTime, defaultValue),

679

.powerUsage = ParseSystemProperty(g_OperandTypeTensorQuant8SymmPerformancePowerUsage, defaultValue)

680

});

681

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

682

update(&capabilities.operandPerformance, V1_2::OperandType::TENSOR_QUANT16_SYMM,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

683

{

684

.execTime = ParseSystemProperty(g_OperandTypeTensorQuant16SymmPerformanceExecTime, defaultValue),

685

.powerUsage = ParseSystemProperty(g_OperandTypeTensorQuant16SymmPerformancePowerUsage, defaultValue)

686

});

687

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

688

update(&capabilities.operandPerformance, V1_2::OperandType::TENSOR_QUANT8_SYMM_PER_CHANNEL,

Kevin May

87cb761

2019-11-11 17:30:35 +0000

[diff] [blame]

689

{

690

.execTime =

691

ParseSystemProperty(g_OperandTypeTensorQuant8SymmPerChannelPerformanceExecTime, defaultValue),

692

.powerUsage =

693

ParseSystemProperty(g_OperandTypeTensorQuant8SymmPerChannelPerformancePowerUsage, defaultValue)

694

});

695

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

696

update(&capabilities.operandPerformance, V1_2::OperandType::TENSOR_INT32,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

697

{

698

.execTime = ParseSystemProperty(g_OperandTypeTensorInt32PerformanceExecTime, defaultValue),

699

.powerUsage = ParseSystemProperty(g_OperandTypeTensorInt32PerformancePowerUsage, defaultValue)

700

});

701

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

702

update(&capabilities.operandPerformance, V1_2::OperandType::INT32,

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

703

{

704

.execTime = ParseSystemProperty(g_OperandTypeInt32PerformanceExecTime, defaultValue),

705

.powerUsage = ParseSystemProperty(g_OperandTypeInt32PerformancePowerUsage, defaultValue)

706

});

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

707

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

708

cb(V1_0::ErrorStatus::NONE, capabilities);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

709

}

710

else

711

{

Kevin May

2eaa119

2020-04-15 16:50:57 +0100

[diff] [blame]

712

capabilities.relaxedFloat32toFloat16PerformanceScalar.execTime = 0;

713

capabilities.relaxedFloat32toFloat16PerformanceScalar.powerUsage = 0;

714

capabilities.relaxedFloat32toFloat16PerformanceTensor.execTime = 0;

715

capabilities.relaxedFloat32toFloat16PerformanceTensor.powerUsage = 0;

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

716

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

717

// Set the base value for all operand types

Sadik Armagan

2021-02-12 17:16:42 +0000

[diff] [blame]

718

#if defined(ARMNN_ANDROID_R) || defined(ARMNN_ANDROID_S)

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

719

capabilities.operandPerformance = nonExtensionOperandPerformance<HalVersion::V1_2>({0.f, 0.0f});

720

#else

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

721

capabilities.operandPerformance = nonExtensionOperandPerformance({0.f, 0.0f});

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

722

#endif

Ferran Balaguer

2019-07-01 13:37:44 +0100

[diff] [blame]

723

Kevin May

2020-02-26 17:00:39 +0000

[diff] [blame]

724

cb(V1_0::ErrorStatus::DEVICE_UNAVAILABLE, capabilities);

Mike Kelly

2019-06-11 16:35:25 +0100

[diff] [blame]

}

return Void();

}

} // namespace hal_1_2

Kevin May