Blame - src/backends/neon/NeonLayerSupport.cpp - ml/armnn

2018-03-09 14:13:49 +0000

[diff] [blame]

1

//

2

David Beck

ecb56cd

2018-09-05 12:52:57 +0100

[diff] [blame]

3

// SPDX-License-Identifier: MIT

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

4

//

5

6

#include "NeonLayerSupport.hpp"

7

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

8

#include <armnn/Descriptors.hpp>

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

9

#include <armnn/InternalTypes.hpp>

10

#include <armnn/LayerSupportCommon.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

11

#include <armnn/Tensor.hpp>

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

12

#include <armnn/Types.hpp>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

13

14

#include <boost/core/ignore_unused.hpp>

15

16

#ifdef ARMCOMPUTENEON_ENABLED

David Beck

2018-09-24 15:59:27 +0100

[diff] [blame]

17

#include "workloads/NeonAdditionFloatWorkload.hpp"

Nattapat Chaimanowong

d4b7059

2018-10-12 11:21:49 +0100

[diff] [blame]

18

#include "workloads/NeonActivationWorkload.hpp"

David Beck

2018-09-24 15:59:27 +0100

[diff] [blame]

19

#include "workloads/NeonBatchNormalizationFloatWorkload.hpp"

Nattapat Chaimanowong

974b65f

2018-10-15 15:07:34 +0100

[diff] [blame]

20

#include "workloads/NeonConvolution2dWorkload.hpp"

Nattapat Chaimanowong

7714088

2018-10-17 11:12:19 +0100

[diff] [blame]

21

#include "workloads/NeonDepthwiseConvolutionWorkload.hpp"

David Beck

2018-09-24 15:59:27 +0100

[diff] [blame]

22

#include "workloads/NeonL2NormalizationFloatWorkload.hpp"

23

#include "workloads/NeonMultiplicationFloatWorkload.hpp"

24

#include "workloads/NeonNormalizationFloatWorkload.hpp"

25

#include "workloads/NeonFullyConnectedWorkload.hpp"

26

#include "workloads/NeonPermuteWorkload.hpp"

Nattapat Chaimanowong

5d2e700

2018-10-12 16:03:56 +0100

[diff] [blame]

27

#include "workloads/NeonPooling2dWorkload.hpp"

David Beck

2018-09-24 15:59:27 +0100

[diff] [blame]

28

#include "workloads/NeonSoftmaxBaseWorkload.hpp"

29

#include "workloads/NeonSubtractionFloatWorkload.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

30

#endif

31

32

using namespace boost;

33

34

namespace armnn

35

{

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

36

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

37

namespace

arovir01

7ff76c5

2018-10-09 09:40:58 +0100

[diff] [blame]

38

{

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

39

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

40

bool IsNeonBackendSupported(Optional<std::string&> reasonIfUnsupported)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

41

{

42

#if ARMCOMPUTENEON_ENABLED

43

return true;

44

#else

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

45

if (reasonIfUnsupported)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

46

{

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

47

reasonIfUnsupported.value() = "The armnn library has been built without NEON support";

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return false;

#endif

}

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

53

template<typename FloatFunc, typename Uint8Func, typename ... Params>

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

54

bool IsSupportedForDataTypeNeon(Optional<std::string&> reasonIfUnsupported,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

55

DataType dataType,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

56

FloatFunc floatFuncPtr,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

57

Uint8Func uint8FuncPtr,

58

Params&&... params)

59

{

60

return IsNeonBackendSupported(reasonIfUnsupported) &&

61

IsSupportedForDataTypeGeneric(reasonIfUnsupported,

62

dataType,

63

floatFuncPtr,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

64

floatFuncPtr,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

65

uint8FuncPtr,

66

std::forward<Params>(params)...);

67

}

68

69

#if ARMCOMPUTENEON_ENABLED

70

template<class FuncType, class... Args>

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

71

inline bool IsWorkloadSupported(FuncType& func, Optional<std::string&> reasonIfUnsupported, Args&&... args)

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

72

{

73

arm_compute::Status aclStatus = func(std::forward<Args>(args)...);

74

const bool supported = (aclStatus.error_code() == arm_compute::ErrorCode::OK);

75

if (!supported && reasonIfUnsupported)

76

{

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

77

reasonIfUnsupported.value() = aclStatus.error_description();

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

}

return supported;

}

#define FORWARD_WORKLOAD_VALIDATE_FUNC(func, reasonIfUnsupported, ...) \

83

return IsWorkloadSupported(func, reasonIfUnsupported, __VA_ARGS__);

84

#else

85

#define FORWARD_WORKLOAD_VALIDATE_FUNC(func, reasonIfUnsupported, ...) \

86

return IsNeonBackendSupported(reasonIfUnsupported);

87

#endif

88

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

89

} // anonymous namespace

90

91

bool NeonLayerSupport::IsActivationSupported(const TensorInfo& input,

92

const TensorInfo& output,

93

const ActivationDescriptor& descriptor,

94

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

95

{

96

ignore_unused(descriptor);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

97

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonActivationWorkloadValidate,

reasonIfUnsupported,

input,

output,

descriptor);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

102

}

103

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

104

bool NeonLayerSupport::IsAdditionSupported(const TensorInfo& input0,

105

const TensorInfo& input1,

106

const TensorInfo& output,

107

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

108

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

109

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonAdditionWorkloadValidate,

reasonIfUnsupported,

input0,

input1,

output);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

114

}

115

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

116

bool NeonLayerSupport::IsBatchNormalizationSupported(const TensorInfo& input,

117

const TensorInfo& output,

118

const TensorInfo& mean,

119

const TensorInfo& var,

120

const TensorInfo& beta,

121

const TensorInfo& gamma,

122

const BatchNormalizationDescriptor& descriptor,

123

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

124

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

125

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonBatchNormalizationValidate,

reasonIfUnsupported,

input,

output,

mean,

var,

beta,

gamma,

descriptor);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

134

}

135

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

136

bool NeonLayerSupport::IsConstantSupported(const TensorInfo& output,

137

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

138

{

139

return IsSupportedForDataTypeNeon(reasonIfUnsupported,

140

output.GetDataType(),

&TrueFunc<>,

&TrueFunc<>);

}

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

145

bool NeonLayerSupport::IsConvertFp16ToFp32Supported(const TensorInfo& input,

146

const TensorInfo& output,

147

Optional<std::string&> reasonIfUnsupported) const

148

{

149

ignore_unused(input);

150

ignore_unused(output);

151

ignore_unused(reasonIfUnsupported);

return true;

}

bool NeonLayerSupport::IsConvertFp32ToFp16Supported(const TensorInfo& input,

156

const TensorInfo& output,

157

Optional<std::string&> reasonIfUnsupported) const

158

{

159

ignore_unused(input);

160

ignore_unused(output);

161

ignore_unused(reasonIfUnsupported);

return true;

}

bool NeonLayerSupport::IsConvolution2dSupported(const TensorInfo& input,

166

const TensorInfo& output,

167

const Convolution2dDescriptor& descriptor,

168

const TensorInfo& weights,

169

const Optional<TensorInfo>& biases,

170

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

171

{

surmeh01

3537c2c

2018-05-18 16:31:43 +0100

[diff] [blame]

172

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonConvolution2dWorkloadValidate,

reasonIfUnsupported,

input,

output,

descriptor,

weights,

biases);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

179

}

180

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

181

bool NeonLayerSupport::IsDepthwiseConvolutionSupported(const TensorInfo& input,

182

const TensorInfo& output,

183

const DepthwiseConvolution2dDescriptor& descriptor,

184

const TensorInfo& weights,

185

const Optional<TensorInfo>& biases,

186

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

187

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

188

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonDepthwiseConvolutionWorkloadValidate,

reasonIfUnsupported,

input,

output,

descriptor,

weights,

biases);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

195

}

196

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

197

bool NeonLayerSupport::IsDivisionSupported(const TensorInfo& input0,

198

const TensorInfo& input1,

199

const TensorInfo& output,

200

Optional<std::string&> reasonIfUnsupported) const

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

201

{

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

202

ignore_unused(input0);

203

ignore_unused(input1);

204

ignore_unused(output);

205

ignore_unused(reasonIfUnsupported);

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

return false;

}

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

209

bool NeonLayerSupport::IsFakeQuantizationSupported(const TensorInfo& input,

210

const FakeQuantizationDescriptor& descriptor,

211

Optional<std::string&> reasonIfUnsupported) const

David Beck

c2044fe

2018-09-05 15:00:38 +0100

[diff] [blame]

212

{

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

213

ignore_unused(input);

214

ignore_unused(descriptor);

215

ignore_unused(reasonIfUnsupported);

216

return false;

David Beck

c2044fe

2018-09-05 15:00:38 +0100

[diff] [blame]

217

}

218

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

219

bool NeonLayerSupport::IsFloorSupported(const TensorInfo& input,

220

const TensorInfo& output,

221

Optional<std::string&> reasonIfUnsupported) const

222

{

223

ignore_unused(output);

224

return IsNeonBackendSupported(reasonIfUnsupported) &&

225

IsSupportedForDataTypeGeneric(reasonIfUnsupported,

input.GetDataType(),

&FalseFuncF16<>,

&TrueFunc<>,

&FalseFuncU8<>);

}

bool NeonLayerSupport::IsFullyConnectedSupported(const TensorInfo& input,

233

const TensorInfo& output,

234

const TensorInfo& weights,

235

const TensorInfo& biases,

236

const FullyConnectedDescriptor& descriptor,

237

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

238

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

239

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonFullyConnectedWorkloadValidate,

reasonIfUnsupported,

input,

output,

weights,

biases,

descriptor);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

246

}

247

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

248

bool NeonLayerSupport::IsInputSupported(const TensorInfo& input,

249

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

250

{

251

return IsSupportedForDataTypeNeon(reasonIfUnsupported,

input.GetDataType(),

&TrueFunc<>,

&TrueFunc<>);

}

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

257

bool NeonLayerSupport::IsL2NormalizationSupported(const TensorInfo& input,

258

const TensorInfo& output,

259

const L2NormalizationDescriptor& descriptor,

260

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

261

{

Matteo Martincigh

bcd3c85

2018-09-28 14:14:12 +0100

[diff] [blame]

262

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonL2NormalizationWorkloadValidate, reasonIfUnsupported, input, output, descriptor);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

263

}

264

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

265

bool NeonLayerSupport::IsLstmSupported(const TensorInfo& input,

266

const TensorInfo& outputStateIn,

267

const TensorInfo& cellStateIn,

268

const TensorInfo& scratchBuffer,

269

const TensorInfo& outputStateOut,

270

const TensorInfo& cellStateOut,

271

const TensorInfo& output,

272

const LstmDescriptor& descriptor,

273

const TensorInfo& inputToForgetWeights,

274

const TensorInfo& inputToCellWeights,

275

const TensorInfo& inputToOutputWeights,

276

const TensorInfo& recurrentToForgetWeights,

277

const TensorInfo& recurrentToCellWeights,

278

const TensorInfo& recurrentToOutputWeights,

279

const TensorInfo& forgetGateBias,

280

const TensorInfo& cellBias,

281

const TensorInfo& outputGateBias,

282

const TensorInfo* inputToInputWeights,

283

const TensorInfo* recurrentToInputWeights,

284

const TensorInfo* cellToInputWeights,

285

const TensorInfo* inputGateBias,

286

const TensorInfo* projectionWeights,

287

const TensorInfo* projectionBias,

288

const TensorInfo* cellToForgetWeights,

289

const TensorInfo* cellToOutputWeights,

290

Optional<std::string&> reasonIfUnsupported) const

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

291

{

292

ignore_unused(input);

293

ignore_unused(outputStateIn);

294

ignore_unused(cellStateIn);

295

ignore_unused(scratchBuffer);

296

ignore_unused(outputStateOut);

297

ignore_unused(cellStateOut);

298

ignore_unused(output);

299

ignore_unused(descriptor);

300

ignore_unused(inputToForgetWeights);

301

ignore_unused(inputToCellWeights);

302

ignore_unused(inputToOutputWeights);

303

ignore_unused(recurrentToForgetWeights);

304

ignore_unused(recurrentToCellWeights);

305

ignore_unused(recurrentToOutputWeights);

306

ignore_unused(forgetGateBias);

307

ignore_unused(cellBias);

308

ignore_unused(outputGateBias);

309

ignore_unused(inputToInputWeights);

310

ignore_unused(recurrentToInputWeights);

311

ignore_unused(cellToInputWeights);

312

ignore_unused(inputGateBias);

313

ignore_unused(projectionWeights);

314

ignore_unused(projectionBias);

315

ignore_unused(cellToForgetWeights);

316

ignore_unused(cellToOutputWeights);

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

317

ignore_unused(reasonIfUnsupported);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

return false;

}

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

321

bool NeonLayerSupport::IsMeanSupported(const TensorInfo& input,

322

const TensorInfo& output,

323

const MeanDescriptor& descriptor,

324

Optional<std::string&> reasonIfUnsupported) const

narpra01

32b9046

2018-09-13 11:07:48 +0100

[diff] [blame]

325

{

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

326

ignore_unused(input);

327

ignore_unused(output);

328

ignore_unused(descriptor);

329

ignore_unused(reasonIfUnsupported);

narpra01

32b9046

2018-09-13 11:07:48 +0100

[diff] [blame]

return false;

}

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

333

bool NeonLayerSupport::IsMergerSupported(const std::vector<const TensorInfo*> inputs,

334

const OriginsDescriptor& descriptor,

335

Optional<std::string&> reasonIfUnsupported) const

336

{

337

ignore_unused(descriptor);

338

return IsSupportedForDataTypeNeon(reasonIfUnsupported,

339

inputs[0]->GetDataType(),

&TrueFunc<>,

&TrueFunc<>);

}

bool NeonLayerSupport::IsMultiplicationSupported(const TensorInfo& input0,

345

const TensorInfo& input1,

346

const TensorInfo& output,

347

Optional<std::string&> reasonIfUnsupported) const

348

{

349

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonMultiplicationWorkloadValidate,

reasonIfUnsupported,

input0,

input1,

output);

}

bool NeonLayerSupport::IsNormalizationSupported(const TensorInfo& input,

357

const TensorInfo& output,

358

const NormalizationDescriptor& descriptor,

359

Optional<std::string&> reasonIfUnsupported) const

360

{

361

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonNormalizationWorkloadValidate,

reasonIfUnsupported,

input,

output,

descriptor);

}

bool NeonLayerSupport::IsOutputSupported(const TensorInfo& output,

369

Optional<std::string&> reasonIfUnsupported) const

370

{

371

return IsSupportedForDataTypeNeon(reasonIfUnsupported,

372

output.GetDataType(),

&TrueFunc<>,

&TrueFunc<>);

}

bool NeonLayerSupport::IsPadSupported(const TensorInfo& input,

378

const TensorInfo& output,

379

const PadDescriptor& descriptor,

380

Optional<std::string&> reasonIfUnsupported) const

Nina Drozd

661dfa7

2018-10-02 11:14:17 +0100

[diff] [blame]

381

{

arovir01

2018-10-08 14:48:19 +0100

[diff] [blame]

382

ignore_unused(input);

383

ignore_unused(output);

384

ignore_unused(descriptor);

385

ignore_unused(reasonIfUnsupported);

Nina Drozd

661dfa7

2018-10-02 11:14:17 +0100

[diff] [blame]

return false;

}

Aron Virginas-Tar

2018-10-15 15:00:13 +0100

[diff] [blame]

389

bool NeonLayerSupport::IsPermuteSupported(const TensorInfo& input,

390

const TensorInfo& output,

391

const PermuteDescriptor& descriptor,

392

Optional<std::string&> reasonIfUnsupported) const

393

{

394

FORWARD_WORKLOAD_VALIDATE_FUNC(NeonPermuteWorkloadValidate, reasonIfUnsupported, input, output, descriptor);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

395

}

Aron Virginas-Tar