Blame - src/core/NEON/kernels/NEFuseBatchNormalizationKernel.cpp - ml/ComputeLibrary

: _input_weights(nullptr), _input_bias(nullptr), _bn_mean(nullptr), _bn_var(nullptr), _bn_gamma(nullptr), _bn_beta(nullptr), _fused_weights(nullptr), _fused_bias(nullptr), _epsilon(),

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

418

_run_in_place_weights(false), _run_in_place_bias(false), _func(nullptr)

{

}

Manuel Bottini

2019-06-17 12:04:40 +0100

[diff] [blame]

422

void NEFuseBatchNormalizationKernel::configure(const ITensor *input_weights, const ITensor *bn_mean, const ITensor *bn_var,

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

423

ITensor *fused_weights, ITensor *fused_bias,

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

424

const ITensor *input_bias, const ITensor *bn_beta, const ITensor *bn_gamma,

425

float epsilon, FuseBatchNormalizationType fbn_type)

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

426

{

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

427

ARM_COMPUTE_ERROR_ON_NULLPTR(input_weights, bn_mean, bn_var);

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

428

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

429

_input_weights = input_weights;

430

_input_bias = input_bias;

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

_bn_mean = bn_mean;

_bn_var = bn_var;

_bn_beta = bn_beta;

_bn_gamma = bn_gamma;

435

_fused_weights = fused_weights;

436

_fused_bias = fused_bias;

437

_epsilon = epsilon;

438

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

439

_run_in_place_weights = (fused_weights == nullptr) || (fused_weights == input_weights);

440

_run_in_place_bias = (fused_bias == nullptr) || (input_bias != nullptr && fused_bias == input_bias);

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

441

442

// Auto initialize outputs

443

if(_fused_weights != nullptr)

444

{

445

// Output tensor auto initialization if not yet initialized

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

446

auto_init_if_empty(*_fused_weights->info(), *_input_weights->info()->clone());

447

fused_weights->info()->set_valid_region(input_weights->info()->valid_region());

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

448

}

449

if(_fused_bias != nullptr)

450

{

451

// Output tensor auto initialization if not yet initialized

452

auto_init_if_empty(*_fused_bias->info(), *_bn_mean->info()->clone());

453

_fused_bias->info()->set_valid_region(bn_mean->info()->valid_region());

454

}

455

456

// Validate arguments

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

457

ARM_COMPUTE_ERROR_THROW_ON(validate_arguments(input_weights->info(), bn_mean->info(), bn_var->info(),

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

458

(fused_weights != nullptr) ? fused_weights->info() : nullptr,

459

(fused_bias != nullptr) ? fused_bias->info() : nullptr,

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

460

(input_bias != nullptr) ? input_bias->info() : nullptr,

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

461

(bn_beta != nullptr) ? bn_beta->info() : nullptr,

462

(bn_gamma != nullptr) ? bn_gamma->info() : nullptr,

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

463

epsilon, fbn_type));

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

464

465

// Configure kernel window

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

466

Window win = calculate_max_window(*input_weights->info());

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

467

INEKernel::configure(win);

468

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

469

// Configure function

470

static std::map<std::string, FuseBatchNormFunction *> map_function =

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

471

{

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

472

{ "fused_batch_normalization_conv_NHWC_F32", &fused_batch_normalization_conv<wrapper::traits::neon_vector<float, 4>> },

473

{ "fused_batch_normalization_conv_NCHW_F32", &fused_batch_normalization_conv<wrapper::traits::neon_vector<float, 4>> },

474

{ "fused_batch_normalization_dwc_NHWC_F32", &fused_batch_normalization_dwc_nhwc<wrapper::traits::neon_vector<float, 4>> },

475

{ "fused_batch_normalization_dwc_NCHW_F32", &fused_batch_normalization_dwc_nchw<wrapper::traits::neon_vector<float, 4>> },

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

476

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

477

{ "fused_batch_normalization_conv_NHWC_F16", &fused_batch_normalization_conv<wrapper::traits::neon_vector<float16_t, 8>> },

478

{ "fused_batch_normalization_conv_NCHW_F16", &fused_batch_normalization_conv<wrapper::traits::neon_vector<float16_t, 8>> },

479

{ "fused_batch_normalization_dwc_NHWC_F16", &fused_batch_normalization_dwc_nhwc<wrapper::traits::neon_vector<float16_t, 8>> },

480

{ "fused_batch_normalization_dwc_NCHW_F16", &fused_batch_normalization_dwc_nchw<wrapper::traits::neon_vector<float16_t, 8>> },

481

#endif /* __ARM_FEATURE_FP16_VECTOR_ARITHMETIC */

482

};

483

484

std::string function_to_call("fused_batch_normalization_");

485

function_to_call += fbn_type == FuseBatchNormalizationType::CONVOLUTION ? "conv_" : "dwc_";

486

function_to_call += string_from_data_layout(_input_weights->info()->data_layout());

487

function_to_call += "_";

488

function_to_call += string_from_data_type(_input_weights->info()->data_type());

489

490

auto it = map_function.find(function_to_call);

491

492

if(it != map_function.end())

493

{

494

_func = it->second;

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

}

}

Manuel Bottini

2019-06-17 12:04:40 +0100

[diff] [blame]

498

Status NEFuseBatchNormalizationKernel::validate(const ITensorInfo *input_weights, const ITensorInfo *bn_mean, const ITensorInfo *bn_var,

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

499

const ITensorInfo *fused_weights, const ITensorInfo *fused_bias,

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

500

const ITensorInfo *input_bias, const ITensorInfo *bn_beta, const ITensorInfo *bn_gamma,

501

float epsilon, FuseBatchNormalizationType fbn_type)

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

502

{

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

503

ARM_COMPUTE_RETURN_ON_ERROR(validate_arguments(input_weights, bn_mean, bn_var, fused_weights, fused_bias, input_bias, bn_beta, bn_gamma, epsilon, fbn_type));

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

return Status{};

}