Blame - src/armnn/backends/ClLayerSupport.cpp - ml/armnn

2018-03-09 14:13:49 +0000

[diff] [blame]

1

//

2

3

// See LICENSE file in the project root for full license information.

4

//

5

6

#include "LayerSupportCommon.hpp"

7

8

#include "ClLayerSupport.hpp"

9

#include "InternalTypes.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

10

#include <armnn/Descriptors.hpp>

11

#include <armnn/Types.hpp>

12

#include <armnn/Tensor.hpp>

13

14

#include <boost/core/ignore_unused.hpp>

15

16

#ifdef ARMCOMPUTECL_ENABLED

arovir01

2018-08-31 15:26:35 +0100

[diff] [blame^]

17

#include "ClWorkloads/ClAdditionFloatWorkload.hpp"

18

#include "ClWorkloads/ClActivationFloatWorkload.hpp"

19

#include "ClWorkloads/ClBatchNormalizationFloatWorkload.hpp"

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

20

#include "ClWorkloads/ClConvertFp16ToFp32Workload.hpp"

21

#include "ClWorkloads/ClConvertFp32ToFp16Workload.hpp"

surmeh01

3537c2c

2018-05-18 16:31:43 +0100

[diff] [blame]

22

#include "ClWorkloads/ClConvolution2dBaseWorkload.hpp"

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

23

#include "ClWorkloads/ClDepthwiseConvolutionBaseWorkload.hpp"

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

24

#include "ClWorkloads/ClDivisionFloatWorkload.hpp"

arovir01

2018-08-31 15:26:35 +0100

[diff] [blame^]

25

#include "ClWorkloads/ClL2NormalizationFloatWorkload.hpp"

26

#include "ClWorkloads/ClMultiplicationFloatWorkload.hpp"

27

#include "ClWorkloads/ClFullyConnectedFloatWorkload.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

28

#include "ClWorkloads/ClPooling2dBaseWorkload.hpp"

29

#include "ClWorkloads/ClPermuteWorkload.hpp"

arovir01

2018-08-31 15:26:35 +0100

[diff] [blame^]

30

#include "ClWorkloads/ClNormalizationFloatWorkload.hpp"

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

31

#include "ClWorkloads/ClSoftmaxBaseWorkload.hpp"

arovir01

2018-08-31 15:26:35 +0100

[diff] [blame^]

32

#include "ClWorkloads/ClLstmFloatWorkload.hpp"

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

33

#endif

34

35

using namespace boost;

namespace armnn

{

namespace

{

template<unsigned int FilterSize>

42

bool IsMatchingSize2d(const TensorInfo& weightInfo)

43

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

44

// Width & Height must match.

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

45

return (weightInfo.GetShape()[3] == FilterSize) && (weightInfo.GetShape()[2] == FilterSize);

46

}

47

48

template<uint32_t ValidStride>

49

bool IsMatchingStride(uint32_t actualStride)

50

{

51

return ValidStride == actualStride;

52

}

53

54

template<uint32_t FirstStride, uint32_t SecondStride, uint32_t... ValidStrides>

55

bool IsMatchingStride(uint32_t actualStride)

56

{

57

return IsMatchingStride<FirstStride>(actualStride) || IsMatchingStride<SecondStride, ValidStrides...>(actualStride);

58

};

59

60

bool IsClBackendSupported(std::string* reasonIfUnsupported)

61

{

62

#if ARMCOMPUTECL_ENABLED

63

return true;

64

#else

65

if (reasonIfUnsupported != nullptr)

66

{

67

*reasonIfUnsupported = "The armnn library has been built without CL support";

}

return false;

#endif

}

#if ARMCOMPUTECL_ENABLED

74

#define FORWARD_CL_LAYER_SUPPORT_FUNC(expr) (expr)

75

#else

76

#define FORWARD_CL_LAYER_SUPPORT_FUNC(expr) IsClBackendSupported(reasonIfUnsupported)

77

#endif

78

79

#if ARMCOMPUTECL_ENABLED

80

template<class FuncType, class... Args>

81

inline bool IsWorkloadSupported(FuncType&& func, std::string* reasonIfUnsupported, Args&&... args)

82

{

83

arm_compute::Status aclStatus = func(std::forward<Args>(args)...);

84

const bool supported = (aclStatus.error_code() == arm_compute::ErrorCode::OK);

85

if (!supported && reasonIfUnsupported)

86

{

87

*reasonIfUnsupported = aclStatus.error_description();

}

return supported;

}

#define FORWARD_WORKLOAD_VALIDATE_FUNC(func, reasonIfUnsupported, ...) \

93

return IsWorkloadSupported(func, reasonIfUnsupported, __VA_ARGS__);

94

#else

95

#define FORWARD_WORKLOAD_VALIDATE_FUNC(func, reasonIfUnsupported, ...) \

96

return IsClBackendSupported(reasonIfUnsupported);

#endif

} //namespace

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

101

template<typename FloatFunc, typename Uint8Func, typename ... Params>

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

102

bool IsSupportedForDataTypeCl(std::string* reasonIfUnsupported,

103

DataType dataType,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

104

FloatFunc floatFuncPtr,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

105

Uint8Func uint8FuncPtr,

106

Params&&... params)

107

{

108

return IsClBackendSupported(reasonIfUnsupported) &&

109

IsSupportedForDataTypeGeneric(reasonIfUnsupported,

110

dataType,

111

floatFuncPtr,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

112

floatFuncPtr,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

113

uint8FuncPtr,

114

std::forward<Params>(params)...);

115

}

116

117

bool IsActivationSupportedCl(const TensorInfo& input,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

118

const TensorInfo& output,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

119

const ActivationDescriptor& descriptor,

120

std::string* reasonIfUnsupported)

121

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

122

FORWARD_WORKLOAD_VALIDATE_FUNC(ClActivationWorkloadValidate,

reasonIfUnsupported,

input,

output,

descriptor);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

127

}

128

129

bool IsAdditionSupportedCl(const TensorInfo& input0,

130

const TensorInfo& input1,

131

const TensorInfo& output,

132

std::string* reasonIfUnsupported)

133

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

134

return FORWARD_CL_LAYER_SUPPORT_FUNC(ClAdditionValidate(input0,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

135

input1,

136

output,

137

reasonIfUnsupported));

138

}

139

140

bool IsBatchNormalizationSupportedCl(const TensorInfo& input,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

141

const TensorInfo& output,

142

const TensorInfo& mean,

143

const TensorInfo& var,

144

const TensorInfo& beta,

145

const TensorInfo& gamma,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

146

const BatchNormalizationDescriptor& descriptor,

147

std::string* reasonIfUnsupported)

148

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

149

FORWARD_WORKLOAD_VALIDATE_FUNC(ClBatchNormalizationValidate,

reasonIfUnsupported,

input,

output,

mean,

var,

beta,

gamma,

descriptor);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

158

}

159

160

bool IsConstantSupportedCl(const TensorInfo& output,

161

std::string* reasonIfUnsupported)

162

{

163

return IsSupportedForDataTypeCl(reasonIfUnsupported,

164

output.GetDataType(),

&TrueFunc<>,

&FalseFuncU8<>);

}

bool IsClDirectConvolution2dSupported(const TensorInfo& weightInfo, const Convolution2dDescriptor& desc)

170

{

171

bool isSupported = false;

172

173

bool strideXIsOneOrTwo = IsMatchingStride<1, 2>(desc.m_StrideX);

174

bool strideXIsThree = IsMatchingStride<3>(desc.m_StrideX);

175

176

bool strideYIsOneOrTwo = IsMatchingStride<1, 2>(desc.m_StrideY);

177

bool strideYIsThree = IsMatchingStride<3>(desc.m_StrideY);

178

179

bool strideIsOneOrTwo = strideXIsOneOrTwo && strideYIsOneOrTwo;

180

bool strideIsOneOrTwoOrThree = ( strideXIsOneOrTwo || strideXIsThree ) && ( strideYIsOneOrTwo || strideYIsThree );

181

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

182

// 1x1 convolution with strides of 1,2,3.

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

183

isSupported |= IsMatchingSize2d<1>(weightInfo) && ( strideIsOneOrTwoOrThree );

184

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

185

// 3x3 convolution with strides of 1,2.

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

186

isSupported |= IsMatchingSize2d<3>(weightInfo) && ( strideIsOneOrTwo );

187

188

// 5x5 convolution with strides of 1,2

189

isSupported |= IsMatchingSize2d<5>(weightInfo) && ( strideIsOneOrTwo );

190

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

191

//Fall back to normal convolution for the asymmetric padding case.

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

192

if (desc.m_PadLeft != desc.m_PadRight ||

193

desc.m_PadTop != desc.m_PadBottom)

194

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

195

//Direct convolution does not support asymmetric padding yet.

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

isSupported = false;

}

return isSupported;

}

bool IsDirectConvolution2dParamsSupportedCl(std::string* reasonIfUnsupported,

203

const Convolution2dDescriptor& parameters,

204

const TensorInfo& weightInfo)

205

{

206

return IsClDirectConvolution2dSupported(weightInfo, parameters);

207

}

208

209

bool IsConvolution2dSupportedCl(const TensorInfo& input,

surmeh01

3537c2c

2018-05-18 16:31:43 +0100

[diff] [blame]

210

const TensorInfo& output,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

211

const Convolution2dDescriptor& descriptor,

212

const TensorInfo& weights,

arovir01

a682410

2018-08-28 17:40:45 +0100

[diff] [blame]

213

const boost::optional<TensorInfo>& biases,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

214

std::string* reasonIfUnsupported)

215

{

surmeh01

3537c2c

2018-05-18 16:31:43 +0100

[diff] [blame]

216

FORWARD_WORKLOAD_VALIDATE_FUNC(ClConvolution2dWorkloadValidate,

reasonIfUnsupported,

input,

output,

descriptor,

weights,

biases);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

223

}

224

225

bool IsDepthwiseConvolutionSupportedCl(const TensorInfo& input,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

226

const TensorInfo& output,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

227

const DepthwiseConvolution2dDescriptor& descriptor,

228

const TensorInfo& weights,

arovir01

a682410

2018-08-28 17:40:45 +0100

[diff] [blame]

229

const boost::optional<TensorInfo>& biases,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

230

std::string* reasonIfUnsupported)

231

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

232

FORWARD_WORKLOAD_VALIDATE_FUNC(ClDepthwiseConvolutionWorkloadValidate,

reasonIfUnsupported,

input,

output,

descriptor,

weights,

biases);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

239

}

240

Francis Murtagh

e7a86a4

2018-08-29 12:42:10 +0100

[diff] [blame]

241

bool IsDivisionSupportedCl(const TensorInfo& input0,

242

const TensorInfo& input1,

243

const TensorInfo& output,

244

std::string* reasonIfUnsupported)

245

{

246

FORWARD_WORKLOAD_VALIDATE_FUNC(ClDivisionWorkloadValidate,

reasonIfUnsupported,

input0,

input1,

output);

}

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

253

bool IsFullyConnectedSupportedCl(const TensorInfo& input,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

254

const TensorInfo& output,

255

const TensorInfo& weights,

256

const TensorInfo& biases,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

257

const FullyConnectedDescriptor& descriptor,

258

std::string* reasonIfUnsupported)

259

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

260

// At the moment U8 is unsupported

261

if (input.GetDataType() == DataType::QuantisedAsymm8)

{

return false;

}

FORWARD_WORKLOAD_VALIDATE_FUNC(ClFullyConnectedWorkloadValidate,

reasonIfUnsupported,

input,

output,

weights,

biases,

descriptor);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

272

}

273

274

bool IsInputSupportedCl(const TensorInfo& input,

275

std::string* reasonIfUnsupported)

276

{

277

return IsSupportedForDataTypeCl(reasonIfUnsupported,

input.GetDataType(),

&TrueFunc<>,

&TrueFunc<>);

}

bool IsL2NormalizationSupportedCl(const TensorInfo& input,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

284

const TensorInfo& output,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

285

std::string* reasonIfUnsupported)

286

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

287

FORWARD_WORKLOAD_VALIDATE_FUNC(ClL2NormalizationWorkloadValidate, reasonIfUnsupported, input, output);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

288

}

289

290

bool IsMergerSupportedCl(const std::vector<const TensorInfo*> inputs,

291

const OriginsDescriptor& descriptor,

292

std::string* reasonIfUnsupported)

293

{

294

ignore_unused(descriptor);

295

return IsSupportedForDataTypeCl(reasonIfUnsupported,

296

inputs[0]->GetDataType(),

&TrueFunc<>,

&FalseFuncU8<>);

}

bool IsMultiplicationSupportedCl(const TensorInfo& input0,

302

const TensorInfo& input1,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

303

const TensorInfo& output,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

304

std::string* reasonIfUnsupported)

305

{

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

306

FORWARD_WORKLOAD_VALIDATE_FUNC(ClMultiplicationWorkloadValidate,

reasonIfUnsupported,

input0,

input1,

output);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

311

}

312

313

bool IsNormalizationSupportedCl(const TensorInfo& input,

314

const TensorInfo& output,

315

const NormalizationDescriptor& descriptor,

316

std::string* reasonIfUnsupported)

317

{

318

FORWARD_WORKLOAD_VALIDATE_FUNC(ClNormalizationWorkloadValidate, reasonIfUnsupported, input, output, descriptor);

319

}

320

321

bool IsOutputSupportedCl(const TensorInfo& output,

322

std::string* reasonIfUnsupported)

323

{

324

return IsSupportedForDataTypeCl(reasonIfUnsupported,

325

output.GetDataType(),

&TrueFunc<>,

&TrueFunc<>);

}

bool IsPermuteSupportedCl(const TensorInfo& input,

331

const TensorInfo& output,

332

const PermuteDescriptor& descriptor,

333

std::string* reasonIfUnsupported)

334

{

335

ignore_unused(input);

336

ignore_unused(output);

337

FORWARD_WORKLOAD_VALIDATE_FUNC(ClPermuteWorkloadValidate, reasonIfUnsupported, descriptor);

338

}

339

340

bool IsPooling2dSupportedCl(const TensorInfo& input,

341

const TensorInfo& output,

342

const Pooling2dDescriptor& descriptor,

343

std::string* reasonIfUnsupported)

344

{

345

FORWARD_WORKLOAD_VALIDATE_FUNC(ClPooling2dWorkloadValidate, reasonIfUnsupported, input, output, descriptor);

346

}

347

348

bool IsResizeBilinearSupportedCl(const TensorInfo& input,

349

std::string* reasonIfUnsupported)

350

{

351

return IsSupportedForDataTypeCl(reasonIfUnsupported,

input.GetDataType(),

&TrueFunc<>,

&FalseFuncU8<>);

}

bool IsSoftmaxSupportedCl(const TensorInfo& input,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

358

const TensorInfo& output,

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

359

const SoftmaxDescriptor& descriptor,

360

std::string* reasonIfUnsupported)

361

{

362

ignore_unused(descriptor);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

363

FORWARD_WORKLOAD_VALIDATE_FUNC(ClSoftmaxWorkloadValidate, reasonIfUnsupported, input, output);

telsoa01

2018-03-09 14:13:49 +0000

[diff] [blame]

364

}

365

366

bool IsSplitterSupportedCl(const TensorInfo& input,

367

const ViewsDescriptor& descriptor,

368

std::string* reasonIfUnsupported)

369

{

370

ignore_unused(descriptor);

371

return IsSupportedForDataTypeCl(reasonIfUnsupported,

input.GetDataType(),

&TrueFunc<>,

&TrueFunc<>);

}

bool IsFakeQuantizationSupportedCl(const TensorInfo& input,

378

const FakeQuantizationDescriptor& descriptor,

379

std::string* reasonIfUnsupported)

380

{

381

ignore_unused(input);

382

ignore_unused(descriptor);

return false;

}

bool IsReshapeSupportedCl(const TensorInfo& input,

387

std::string* reasonIfUnsupported)

388

{

389

ignore_unused(input);

return true;

}

bool IsFloorSupportedCl(const TensorInfo& input,

394

const TensorInfo& output,

395

std::string* reasonIfUnsupported)

396

{

397

ignore_unused(output);

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

398

return IsClBackendSupported(reasonIfUnsupported) &&

399

IsSupportedForDataTypeGeneric(reasonIfUnsupported,

input.GetDataType(),

&FalseFuncF16<>,

&TrueFunc<>,

&FalseFuncU8<>);

}

bool IsLstmSupportedCl(const TensorInfo& input, const TensorInfo& outputStateIn,

407

const TensorInfo& cellStateIn, const TensorInfo& scratchBuffer,

408

const TensorInfo& outputStateOut, const TensorInfo& cellStateOut,

409

const TensorInfo& output, const LstmDescriptor& descriptor,

410

const TensorInfo& inputToForgetWeights, const TensorInfo& inputToCellWeights,

411

const TensorInfo& inputToOutputWeights, const TensorInfo& recurrentToForgetWeights,

412

const TensorInfo& recurrentToCellWeights, const TensorInfo& recurrentToOutputWeights,

413

const TensorInfo& forgetGateBias, const TensorInfo& cellBias,

414

const TensorInfo& outputGateBias, const TensorInfo* inputToInputWeights,

415

const TensorInfo* recurrentToInputWeights, const TensorInfo* cellToInputWeights,

416

const TensorInfo* inputGateBias, const TensorInfo* projectionWeights,

417

const TensorInfo* projectionBias, const TensorInfo* cellToForgetWeights,

418

const TensorInfo* cellToOutputWeights, std::string* reasonIfUnsupported)

419

{

arovir01

2018-08-31 15:26:35 +0100

[diff] [blame^]

420

FORWARD_WORKLOAD_VALIDATE_FUNC(ClLstmFloatWorkloadValidate, reasonIfUnsupported,

telsoa01

2018-08-31 09:22:23 +0100

[diff] [blame]

421

input, outputStateIn, cellStateIn, scratchBuffer, outputStateOut, cellStateOut,

422

output, descriptor, inputToForgetWeights, inputToCellWeights,

423

inputToOutputWeights, recurrentToForgetWeights,

424

recurrentToCellWeights, recurrentToOutputWeights,

425

forgetGateBias, cellBias, outputGateBias,

426

inputToInputWeights, recurrentToInputWeights,

427

cellToInputWeights, inputGateBias, projectionWeights,

428

projectionBias, cellToForgetWeights, cellToOutputWeights);

429

}

430

431

bool IsConvertFp16ToFp32SupportedCl(const TensorInfo& input,

432

const TensorInfo& output,

433

std::string* reasonIfUnsupported)

434

{

435

FORWARD_WORKLOAD_VALIDATE_FUNC(ClConvertFp16ToFp32WorkloadValidate,

reasonIfUnsupported,

input,

output,

reasonIfUnsupported);

440

}

441

442

bool IsConvertFp32ToFp16SupportedCl(const TensorInfo& input,

443

const TensorInfo& output,

444

std::string* reasonIfUnsupported)

445

{

446

FORWARD_WORKLOAD_VALIDATE_FUNC(ClConvertFp32ToFp16WorkloadValidate,

reasonIfUnsupported,

input,

output,

reasonIfUnsupported);

telsoa01