Blame - src/backends/neon/NeonLayerSupport.cpp - ml/armnn

2018-03-09 14:13:49 +0000

[diff] [blame]

1

//

2

David Beck

ecb56cd

2018-09-05 12:52:57 +0100

[diff] [blame]

3

// SPDX-License-Identifier: MIT

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

5

6

#include "NeonLayerSupport.hpp"

David Beck

2018-10-17 14:17:50 +0100

[diff] [blame]

7

#include "NeonBackendId.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

8

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

9

#include <armnn/Descriptors.hpp>

Aron Virginas-Tar

c9cc804

2018-11-01 16:15:57 +0000

[diff] [blame]

10

#include <InternalTypes.hpp>

11

#include <LayerSupportCommon.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

12

#include <armnn/Tensor.hpp>

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

13

#include <armnn/Types.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

14

Aron Virginas-Tar

c9cc804

2018-11-01 16:15:57 +0000

[diff] [blame]

15

#include <backendsCommon/LayerSupportRegistry.hpp>

David Beck

2018-10-17 14:17:50 +0100

[diff] [blame]

16

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

17

#include <boost/core/ignore_unused.hpp>

18

19

#ifdef ARMCOMPUTENEON_ENABLED

David Beck

2018-09-24 15:59:27 +0100

[diff] [blame]

20

#include "workloads/NeonAdditionFloatWorkload.hpp"

Nattapat Chaimanowong

d4b7059

2018-10-12 11:21:49 +0100

[diff] [blame]

21

#include "workloads/NeonActivationWorkload.hpp"

David Beck

2018-09-24 15:59:27 +0100

[diff] [blame]

22

#include "workloads/NeonBatchNormalizationFloatWorkload.hpp"

Nattapat Chaimanowong

974b65f

2018-10-15 15:07:34 +0100

[diff] [blame]

23

#include "workloads/NeonConvolution2dWorkload.hpp"

Nattapat Chaimanowong

7714088

2018-10-17 11:12:19 +0100

[diff] [blame]

24

#include "workloads/NeonDepthwiseConvolutionWorkload.hpp"

David Beck

2018-09-24 15:59:27 +0100

[diff] [blame]

25

#include "workloads/NeonL2NormalizationFloatWorkload.hpp"

26

#include "workloads/NeonMultiplicationFloatWorkload.hpp"

27

#include "workloads/NeonNormalizationFloatWorkload.hpp"

28

#include "workloads/NeonFullyConnectedWorkload.hpp"

29

#include "workloads/NeonPermuteWorkload.hpp"

Nattapat Chaimanowong

5d2e700

2018-10-12 16:03:56 +0100

[diff] [blame]

30

#include "workloads/NeonPooling2dWorkload.hpp"

David Beck

2018-09-24 15:59:27 +0100

[diff] [blame]

31

#include "workloads/NeonSoftmaxBaseWorkload.hpp"

32

#include "workloads/NeonSubtractionFloatWorkload.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

33

#endif

34

35

using namespace boost;

36

37

namespace armnn

38

{

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

39

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

40

namespace

arovir01

7ff76c5

2018-10-09 09:40:58 +0100

[diff] [blame]

41

{

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

42

David Beck

2018-10-17 14:17:50 +0100

[diff] [blame]

43

ILayerSupportSharedPtr GetLayerSupportPointer()

44

{

45

static ILayerSupportSharedPtr instance{new NeonLayerSupport};

return instance;

}

static StaticRegistryInitializer<LayerSupportRegistry> g_RegisterHelper{

50

LayerSupportRegistryInstance(),

51

NeonBackendId(),

David Beck

9efb57d

2018-11-05 13:40:33 +0000

[diff] [blame^]

52

[]()

David Beck

2018-10-17 14:17:50 +0100

[diff] [blame]

53

{

54

return GetLayerSupportPointer();

}

};

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

58

bool IsNeonBackendSupported(Optional<std::string&> reasonIfUnsupported)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

59

{

60

#if ARMCOMPUTENEON_ENABLED

61

return true;

62

#else

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

63

if (reasonIfUnsupported)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

64

{

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

65

reasonIfUnsupported.value() = "The armnn library has been built without NEON support";

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return false;

#endif

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

71

template<typename FloatFunc, typename Uint8Func, typename ... Params>

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

72

bool IsSupportedForDataTypeNeon(Optional<std::string&> reasonIfUnsupported,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

73

DataType dataType,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

74

FloatFunc floatFuncPtr,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

75

Uint8Func uint8FuncPtr,

76

Params&&... params)

77

{

78

return IsNeonBackendSupported(reasonIfUnsupported) &&

79

IsSupportedForDataTypeGeneric(reasonIfUnsupported,

80

dataType,

81

floatFuncPtr,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

82

floatFuncPtr,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

83

uint8FuncPtr,

84

std::forward<Params>(params)...);

85

}

86

87

#if ARMCOMPUTENEON_ENABLED

88

template<class FuncType, class... Args>

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

89

inline bool IsWorkloadSupported(FuncType& func, Optional<std::string&> reasonIfUnsupported, Args&&... args)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

90

{

91

arm_compute::Status aclStatus = func(std::forward<Args>(args)...);

92

const bool supported = (aclStatus.error_code() == arm_compute::ErrorCode::OK);

93

if (!supported && reasonIfUnsupported)

94

{

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

95

reasonIfUnsupported.value() = aclStatus.error_description();

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return supported;

}

#define FORWARD_WORKLOAD_VALIDATE_FUNC(func, reasonIfUnsupported, ...) \

101

return IsWorkloadSupported(func, reasonIfUnsupported, __VA_ARGS__);

102

#else

103

#define FORWARD_WORKLOAD_VALIDATE_FUNC(func, reasonIfUnsupported, ...) \

104

return IsNeonBackendSupported(reasonIfUnsupported);

105

#endif

106

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

107

} // anonymous namespace

108

109

bool NeonLayerSupport::IsActivationSupported(const TensorInfo& input,

110

const TensorInfo& output,

111

const ActivationDescriptor& descriptor,

112

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

113

{

114

ignore_unused(descriptor);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

115

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonActivationWorkloadValidate,

reasonIfUnsupported,

input,

output,

descriptor);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

120

}

121

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

122

bool NeonLayerSupport::IsAdditionSupported(const TensorInfo& input0,

123

const TensorInfo& input1,

124

const TensorInfo& output,

125

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

126

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

127

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonAdditionWorkloadValidate,

reasonIfUnsupported,

input0,

input1,

output);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

132

}

133

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

134

bool NeonLayerSupport::IsBatchNormalizationSupported(const TensorInfo& input,

135

const TensorInfo& output,

136

const TensorInfo& mean,

137

const TensorInfo& var,

138

const TensorInfo& beta,

139

const TensorInfo& gamma,

140

const BatchNormalizationDescriptor& descriptor,

141

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

142

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

143

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonBatchNormalizationValidate,

reasonIfUnsupported,

input,

output,

mean,

var,

beta,

gamma,

descriptor);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

152

}

153

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

154

bool NeonLayerSupport::IsConstantSupported(const TensorInfo& output,

155

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

156

{

157

return IsSupportedForDataTypeNeon(reasonIfUnsupported,

158

output.GetDataType(),

&TrueFunc<>,

&TrueFunc<>);

}

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

163

bool NeonLayerSupport::IsConvertFp16ToFp32Supported(const TensorInfo& input,

164

const TensorInfo& output,

165

Optional<std::string&> reasonIfUnsupported) const

166

{

167

ignore_unused(input);

168

ignore_unused(output);

169

ignore_unused(reasonIfUnsupported);

return true;

}

bool NeonLayerSupport::IsConvertFp32ToFp16Supported(const TensorInfo& input,

174

const TensorInfo& output,

175

Optional<std::string&> reasonIfUnsupported) const

176

{

177

ignore_unused(input);

178

ignore_unused(output);

179

ignore_unused(reasonIfUnsupported);

return true;

}

bool NeonLayerSupport::IsConvolution2dSupported(const TensorInfo& input,

184

const TensorInfo& output,

185

const Convolution2dDescriptor& descriptor,

186

const TensorInfo& weights,

187

const Optional<TensorInfo>& biases,

188

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

189

{

surmeh01

3537c2c

2018-05-18 16:31:43 +0100

[diff] [blame]

190

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonConvolution2dWorkloadValidate,

reasonIfUnsupported,

input,

output,

descriptor,

weights,

biases);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

197

}

198

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

199

bool NeonLayerSupport::IsDepthwiseConvolutionSupported(const TensorInfo& input,

200

const TensorInfo& output,

201

const DepthwiseConvolution2dDescriptor& descriptor,

202

const TensorInfo& weights,

203

const Optional<TensorInfo>& biases,

204

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

205

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

206

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonDepthwiseConvolutionWorkloadValidate,

reasonIfUnsupported,

input,

output,

descriptor,

weights,

biases);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

213

}

214

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

215

bool NeonLayerSupport::IsDivisionSupported(const TensorInfo& input0,

216

const TensorInfo& input1,

217

const TensorInfo& output,

218

Optional<std::string&> reasonIfUnsupported) const

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

219

{

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

220

ignore_unused(input0);

221

ignore_unused(input1);

222

ignore_unused(output);

223

ignore_unused(reasonIfUnsupported);

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

return false;

}

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

227

bool NeonLayerSupport::IsFakeQuantizationSupported(const TensorInfo& input,

228

const FakeQuantizationDescriptor& descriptor,

229

Optional<std::string&> reasonIfUnsupported) const

David Beck

c2044fe

2018-09-05 15:00:38 +0100

[diff] [blame]

230

{

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

231

ignore_unused(input);

232

ignore_unused(descriptor);

233

ignore_unused(reasonIfUnsupported);

234

return false;

David Beck

c2044fe

2018-09-05 15:00:38 +0100

[diff] [blame]

235

}

236

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

237

bool NeonLayerSupport::IsFloorSupported(const TensorInfo& input,

238

const TensorInfo& output,

239

Optional<std::string&> reasonIfUnsupported) const

240

{

241

ignore_unused(output);

242

return IsNeonBackendSupported(reasonIfUnsupported) &&

243

IsSupportedForDataTypeGeneric(reasonIfUnsupported,

input.GetDataType(),

&FalseFuncF16<>,

&TrueFunc<>,

&FalseFuncU8<>);

}

bool NeonLayerSupport::IsFullyConnectedSupported(const TensorInfo& input,

251

const TensorInfo& output,

252

const TensorInfo& weights,

253

const TensorInfo& biases,

254

const FullyConnectedDescriptor& descriptor,

255

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

256

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

257

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonFullyConnectedWorkloadValidate,

reasonIfUnsupported,

input,

output,

weights,

biases,

descriptor);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

264

}

265

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

266

bool NeonLayerSupport::IsInputSupported(const TensorInfo& input,

267

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

268

{

269

return IsSupportedForDataTypeNeon(reasonIfUnsupported,

input.GetDataType(),

&TrueFunc<>,

&TrueFunc<>);

}

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

275

bool NeonLayerSupport::IsL2NormalizationSupported(const TensorInfo& input,

276

const TensorInfo& output,

277

const L2NormalizationDescriptor& descriptor,

278

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

279

{

Matteo Martincigh

bcd3c85

2018-09-28 14:14:12 +0100

[diff] [blame]

280

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonL2NormalizationWorkloadValidate, reasonIfUnsupported, input, output, descriptor);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

281

}

282

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

283

bool NeonLayerSupport::IsLstmSupported(const TensorInfo& input,

284

const TensorInfo& outputStateIn,

285

const TensorInfo& cellStateIn,

286

const TensorInfo& scratchBuffer,

287

const TensorInfo& outputStateOut,

288

const TensorInfo& cellStateOut,

289

const TensorInfo& output,

290

const LstmDescriptor& descriptor,

291

const TensorInfo& inputToForgetWeights,

292

const TensorInfo& inputToCellWeights,

293

const TensorInfo& inputToOutputWeights,

294

const TensorInfo& recurrentToForgetWeights,

295

const TensorInfo& recurrentToCellWeights,

296

const TensorInfo& recurrentToOutputWeights,

297

const TensorInfo& forgetGateBias,

298

const TensorInfo& cellBias,

299

const TensorInfo& outputGateBias,

300

const TensorInfo* inputToInputWeights,

301

const TensorInfo* recurrentToInputWeights,

302

const TensorInfo* cellToInputWeights,

303

const TensorInfo* inputGateBias,

304

const TensorInfo* projectionWeights,

305

const TensorInfo* projectionBias,

306

const TensorInfo* cellToForgetWeights,

307

const TensorInfo* cellToOutputWeights,

308

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

309

{

310

ignore_unused(input);

311

ignore_unused(outputStateIn);

312

ignore_unused(cellStateIn);

313

ignore_unused(scratchBuffer);

314

ignore_unused(outputStateOut);

315

ignore_unused(cellStateOut);

316

ignore_unused(output);

317

ignore_unused(descriptor);

318

ignore_unused(inputToForgetWeights);

319

ignore_unused(inputToCellWeights);

320

ignore_unused(inputToOutputWeights);

321

ignore_unused(recurrentToForgetWeights);

322

ignore_unused(recurrentToCellWeights);

323

ignore_unused(recurrentToOutputWeights);

324

ignore_unused(forgetGateBias);

325

ignore_unused(cellBias);

326

ignore_unused(outputGateBias);

327

ignore_unused(inputToInputWeights);

328

ignore_unused(recurrentToInputWeights);

329

ignore_unused(cellToInputWeights);

330

ignore_unused(inputGateBias);

331

ignore_unused(projectionWeights);

332

ignore_unused(projectionBias);

333

ignore_unused(cellToForgetWeights);

334

ignore_unused(cellToOutputWeights);

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

335

ignore_unused(reasonIfUnsupported);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

return false;

}

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

339

bool NeonLayerSupport::IsMeanSupported(const TensorInfo& input,

340

const TensorInfo& output,

341

const MeanDescriptor& descriptor,

342

Optional<std::string&> reasonIfUnsupported) const

narpra01

32b9046

2018-09-13 11:07:48 +0100

[diff] [blame]

343

{

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

344

ignore_unused(input);

345

ignore_unused(output);

346

ignore_unused(descriptor);

347

ignore_unused(reasonIfUnsupported);

narpra01

32b9046

2018-09-13 11:07:48 +0100

[diff] [blame]

return false;

}

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

351

bool NeonLayerSupport::IsMergerSupported(const std::vector<const TensorInfo*> inputs,

352

const OriginsDescriptor& descriptor,

353

Optional<std::string&> reasonIfUnsupported) const

354

{

355

ignore_unused(descriptor);

356

return IsSupportedForDataTypeNeon(reasonIfUnsupported,

357

inputs[0]->GetDataType(),

&TrueFunc<>,

&TrueFunc<>);

}

bool NeonLayerSupport::IsMultiplicationSupported(const TensorInfo& input0,

363

const TensorInfo& input1,

364

const TensorInfo& output,

365

Optional<std::string&> reasonIfUnsupported) const

366

{

367

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonMultiplicationWorkloadValidate,

reasonIfUnsupported,

input0,

input1,

output);

}

bool NeonLayerSupport::IsNormalizationSupported(const TensorInfo& input,

375

const TensorInfo& output,

376

const NormalizationDescriptor& descriptor,

377

Optional<std::string&> reasonIfUnsupported) const

378

{

379

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonNormalizationWorkloadValidate,

reasonIfUnsupported,

input,

output,

descriptor);

}

bool NeonLayerSupport::IsOutputSupported(const TensorInfo& output,

387

Optional<std::string&> reasonIfUnsupported) const

388

{

389

return IsSupportedForDataTypeNeon(reasonIfUnsupported,

390

output.GetDataType(),

&TrueFunc<>,

&TrueFunc<>);

}

bool NeonLayerSupport::IsPadSupported(const TensorInfo& input,

396

const TensorInfo& output,

397

const PadDescriptor& descriptor,

398

Optional<std::string&> reasonIfUnsupported) const

Nina Drozd

661dfa7

2018-10-02 11:14:17 +0100

[diff] [blame]

399

{

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

400

ignore_unused(input);

401

ignore_unused(output);

402

ignore_unused(descriptor);

403

ignore_unused(reasonIfUnsupported);

Nina Drozd

661dfa7

2018-10-02 11:14:17 +0100

[diff] [blame]

return false;

}

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

407

bool NeonLayerSupport::IsPermuteSupported(const TensorInfo& input,

408

const TensorInfo& output,

409

const PermuteDescriptor& descriptor,

410

Optional<std::string&> reasonIfUnsupported) const

411

{

412

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonPermuteWorkloadValidate, reasonIfUnsupported, input, output, descriptor);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

413

}

Aron Virginas-Tar