Blame - src/core/NEON/kernels/NEFuseBatchNormalizationKernel.cpp - ml/ComputeLibrary

: _input_weights(nullptr), _input_bias(nullptr), _bn_mean(nullptr), _bn_var(nullptr), _bn_gamma(nullptr), _bn_beta(nullptr), _fused_weights(nullptr), _fused_bias(nullptr), _epsilon(),

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

416

_run_in_place_weights(false), _run_in_place_bias(false), _func(nullptr)

{

}

Manuel Bottini

2019-06-17 12:04:40 +0100

[diff] [blame]

420

void NEFuseBatchNormalizationKernel::configure(const ITensor *input_weights, const ITensor *bn_mean, const ITensor *bn_var,

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

421

ITensor *fused_weights, ITensor *fused_bias,

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

422

const ITensor *input_bias, const ITensor *bn_beta, const ITensor *bn_gamma,

423

float epsilon, FuseBatchNormalizationType fbn_type)

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

424

{

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

425

ARM_COMPUTE_ERROR_ON_NULLPTR(input_weights, bn_mean, bn_var);

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

426

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

427

_input_weights = input_weights;

428

_input_bias = input_bias;

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

_bn_mean = bn_mean;

_bn_var = bn_var;

_bn_beta = bn_beta;

_bn_gamma = bn_gamma;

433

_fused_weights = fused_weights;

434

_fused_bias = fused_bias;

435

_epsilon = epsilon;

436

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

437

_run_in_place_weights = (fused_weights == nullptr) || (fused_weights == input_weights);

438

_run_in_place_bias = (fused_bias == nullptr) || (input_bias != nullptr && fused_bias == input_bias);

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

439

440

// Auto initialize outputs

441

if(_fused_weights != nullptr)

442

{

443

// Output tensor auto initialization if not yet initialized

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

444

auto_init_if_empty(*_fused_weights->info(), *_input_weights->info()->clone());

445

fused_weights->info()->set_valid_region(input_weights->info()->valid_region());

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

446

}

447

if(_fused_bias != nullptr)

448

{

449

// Output tensor auto initialization if not yet initialized

450

auto_init_if_empty(*_fused_bias->info(), *_bn_mean->info()->clone());

451

_fused_bias->info()->set_valid_region(bn_mean->info()->valid_region());

452

}

453

454

// Validate arguments

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

455

ARM_COMPUTE_ERROR_THROW_ON(validate_arguments(input_weights->info(), bn_mean->info(), bn_var->info(),

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

456

(fused_weights != nullptr) ? fused_weights->info() : nullptr,

457

(fused_bias != nullptr) ? fused_bias->info() : nullptr,

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

458

(input_bias != nullptr) ? input_bias->info() : nullptr,

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

459

(bn_beta != nullptr) ? bn_beta->info() : nullptr,

460

(bn_gamma != nullptr) ? bn_gamma->info() : nullptr,

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

461

epsilon, fbn_type));

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

462

463

// Configure kernel window

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

464

Window win = calculate_max_window(*input_weights->info());

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

465

INEKernel::configure(win);

466

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

467

// Configure function

468

static std::map<std::string, FuseBatchNormFunction *> map_function =

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

469

{

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

470

{ "fused_batch_normalization_conv_NHWC_F32", &fused_batch_normalization_conv<wrapper::traits::neon_vector<float, 4>> },

471

{ "fused_batch_normalization_conv_NCHW_F32", &fused_batch_normalization_conv<wrapper::traits::neon_vector<float, 4>> },

472

{ "fused_batch_normalization_dwc_NHWC_F32", &fused_batch_normalization_dwc_nhwc<wrapper::traits::neon_vector<float, 4>> },

473

{ "fused_batch_normalization_dwc_NCHW_F32", &fused_batch_normalization_dwc_nchw<wrapper::traits::neon_vector<float, 4>> },

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

474

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

475

{ "fused_batch_normalization_conv_NHWC_F16", &fused_batch_normalization_conv<wrapper::traits::neon_vector<float16_t, 8>> },

476

{ "fused_batch_normalization_conv_NCHW_F16", &fused_batch_normalization_conv<wrapper::traits::neon_vector<float16_t, 8>> },

477

{ "fused_batch_normalization_dwc_NHWC_F16", &fused_batch_normalization_dwc_nhwc<wrapper::traits::neon_vector<float16_t, 8>> },

478

{ "fused_batch_normalization_dwc_NCHW_F16", &fused_batch_normalization_dwc_nchw<wrapper::traits::neon_vector<float16_t, 8>> },

479

#endif /* __ARM_FEATURE_FP16_VECTOR_ARITHMETIC */

480

};

481

482

std::string function_to_call("fused_batch_normalization_");

483

function_to_call += fbn_type == FuseBatchNormalizationType::CONVOLUTION ? "conv_" : "dwc_";

484

function_to_call += string_from_data_layout(_input_weights->info()->data_layout());

485

function_to_call += "_";

486

function_to_call += string_from_data_type(_input_weights->info()->data_type());

487

488

auto it = map_function.find(function_to_call);

489

490

if(it != map_function.end())

491

{

492

_func = it->second;

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

}

}

Manuel Bottini

2019-06-17 12:04:40 +0100

[diff] [blame]

496

Status NEFuseBatchNormalizationKernel::validate(const ITensorInfo *input_weights, const ITensorInfo *bn_mean, const ITensorInfo *bn_var,

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

497

const ITensorInfo *fused_weights, const ITensorInfo *fused_bias,

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

498

const ITensorInfo *input_bias, const ITensorInfo *bn_beta, const ITensorInfo *bn_gamma,

499

float epsilon, FuseBatchNormalizationType fbn_type)

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

500

{

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

501

ARM_COMPUTE_RETURN_ON_ERROR(validate_arguments(input_weights, bn_mean, bn_var, fused_weights, fused_bias, input_bias, bn_beta, bn_gamma, epsilon, fbn_type));

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

return Status{};

}