Blame - src/core/NEON/kernels/NEFuseBatchNormalizationKernel.cpp - ml/ComputeLibrary

: _input_weights(nullptr), _input_bias(nullptr), _bn_mean(nullptr), _bn_var(nullptr), _bn_gamma(nullptr), _bn_beta(nullptr), _fused_weights(nullptr), _fused_bias(nullptr), _epsilon(),

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

417

_run_in_place_weights(false), _run_in_place_bias(false), _func(nullptr)

{

}

Manuel Bottini

2019-06-17 12:04:40 +0100

[diff] [blame]

421

void NEFuseBatchNormalizationKernel::configure(const ITensor *input_weights, const ITensor *bn_mean, const ITensor *bn_var,

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

422

ITensor *fused_weights, ITensor *fused_bias,

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

423

const ITensor *input_bias, const ITensor *bn_beta, const ITensor *bn_gamma,

424

float epsilon, FuseBatchNormalizationType fbn_type)

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

425

{

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

426

ARM_COMPUTE_ERROR_ON_NULLPTR(input_weights, bn_mean, bn_var);

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

427

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

428

_input_weights = input_weights;

429

_input_bias = input_bias;

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

_bn_mean = bn_mean;

_bn_var = bn_var;

_bn_beta = bn_beta;

_bn_gamma = bn_gamma;

434

_fused_weights = fused_weights;

435

_fused_bias = fused_bias;

436

_epsilon = epsilon;

437

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

438

_run_in_place_weights = (fused_weights == nullptr) || (fused_weights == input_weights);

439

_run_in_place_bias = (fused_bias == nullptr) || (input_bias != nullptr && fused_bias == input_bias);

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

440

441

// Auto initialize outputs

442

if(_fused_weights != nullptr)

443

{

444

// Output tensor auto initialization if not yet initialized

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

445

auto_init_if_empty(*_fused_weights->info(), *_input_weights->info()->clone());

446

fused_weights->info()->set_valid_region(input_weights->info()->valid_region());

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

447

}

448

if(_fused_bias != nullptr)

449

{

450

// Output tensor auto initialization if not yet initialized

451

auto_init_if_empty(*_fused_bias->info(), *_bn_mean->info()->clone());

452

_fused_bias->info()->set_valid_region(bn_mean->info()->valid_region());

453

}

454

455

// Validate arguments

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

456

ARM_COMPUTE_ERROR_THROW_ON(validate_arguments(input_weights->info(), bn_mean->info(), bn_var->info(),

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

457

(fused_weights != nullptr) ? fused_weights->info() : nullptr,

458

(fused_bias != nullptr) ? fused_bias->info() : nullptr,

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

459

(input_bias != nullptr) ? input_bias->info() : nullptr,

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

460

(bn_beta != nullptr) ? bn_beta->info() : nullptr,

461

(bn_gamma != nullptr) ? bn_gamma->info() : nullptr,

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

462

epsilon, fbn_type));

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

463

464

// Configure kernel window

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

465

Window win = calculate_max_window(*input_weights->info());

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

466

INEKernel::configure(win);

467

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

468

// Configure function

469

static std::map<std::string, FuseBatchNormFunction *> map_function =

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

470

{

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

471

{ "fused_batch_normalization_conv_NHWC_F32", &fused_batch_normalization_conv<wrapper::traits::neon_vector<float, 4>> },

472

{ "fused_batch_normalization_conv_NCHW_F32", &fused_batch_normalization_conv<wrapper::traits::neon_vector<float, 4>> },

473

{ "fused_batch_normalization_dwc_NHWC_F32", &fused_batch_normalization_dwc_nhwc<wrapper::traits::neon_vector<float, 4>> },

474

{ "fused_batch_normalization_dwc_NCHW_F32", &fused_batch_normalization_dwc_nchw<wrapper::traits::neon_vector<float, 4>> },

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

475

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

476

{ "fused_batch_normalization_conv_NHWC_F16", &fused_batch_normalization_conv<wrapper::traits::neon_vector<float16_t, 8>> },

477

{ "fused_batch_normalization_conv_NCHW_F16", &fused_batch_normalization_conv<wrapper::traits::neon_vector<float16_t, 8>> },

478

{ "fused_batch_normalization_dwc_NHWC_F16", &fused_batch_normalization_dwc_nhwc<wrapper::traits::neon_vector<float16_t, 8>> },

479

{ "fused_batch_normalization_dwc_NCHW_F16", &fused_batch_normalization_dwc_nchw<wrapper::traits::neon_vector<float16_t, 8>> },

480

#endif /* __ARM_FEATURE_FP16_VECTOR_ARITHMETIC */

481

};

482

483

std::string function_to_call("fused_batch_normalization_");

484

function_to_call += fbn_type == FuseBatchNormalizationType::CONVOLUTION ? "conv_" : "dwc_";

485

function_to_call += string_from_data_layout(_input_weights->info()->data_layout());

486

function_to_call += "_";

487

function_to_call += string_from_data_type(_input_weights->info()->data_type());

488

489

auto it = map_function.find(function_to_call);

490

491

if(it != map_function.end())

492

{

493

_func = it->second;

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

}

}

Manuel Bottini

2019-06-17 12:04:40 +0100

[diff] [blame]

497

Status NEFuseBatchNormalizationKernel::validate(const ITensorInfo *input_weights, const ITensorInfo *bn_mean, const ITensorInfo *bn_var,

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

498

const ITensorInfo *fused_weights, const ITensorInfo *fused_bias,

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

499

const ITensorInfo *input_bias, const ITensorInfo *bn_beta, const ITensorInfo *bn_gamma,

500

float epsilon, FuseBatchNormalizationType fbn_type)

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

501

{

Manuel Bottini

1109176

2019-06-17 12:04:40 +0100

[diff] [blame]

502

ARM_COMPUTE_RETURN_ON_ERROR(validate_arguments(input_weights, bn_mean, bn_var, fused_weights, fused_bias, input_bias, bn_beta, bn_gamma, epsilon, fbn_type));

giuros01

15ecc9a

2018-12-06 10:47:34 +0000

[diff] [blame]

return Status{};

}