Blame - src/runtime/NEON/functions/assembly/NEGEMMInterleavedWrapper.cpp - ml/ComputeLibrary

2018-09-11 17:49:10 +0100

[diff] [blame]

382

_tag = "NEGEMMInterleaved_";

383

_tag += get_strategy_name(input_type, use_dot);

384

Anthony Barbier

2018-07-23 16:42:59 +0100

[diff] [blame]

385

if(!_pretranspose_b)

386

{

Anthony Barbier

2018-11-30 10:42:40 +0000

[diff] [blame]

387

_block_sizes = calculate_block_sizes_from_data_type(NEScheduler::get().cpu_info(), _params.M, _params.N, _params.K, input_type, use_dot);

388

_batch_window.set(Window::DimX, Window::Dimension(0, ceil_to_multiple(_block_sizes.m_round, _block_sizes.strategy_out_height), _block_sizes.strategy_out_height));

389

_batch_window.set(Window::DimY, Window::Dimension(0, _params.batches));

390

// If the execution is single threaded or has only one window then the buffer manager only needs 1 buffer else we will use NUM_BUFFERS buffers and ping pong between them:

391

const unsigned int num_iterations = _batch_window.num_iterations_total();

392

if(NEScheduler::get().num_threads() == 1 || num_iterations == 1)

393

{

394

_buffer_manager = support::cpp14::make_unique<BufferManagerSingleThread>();

}

else

{

#ifdef NO_MULTI_THREADING

399

ARM_COMPUTE_ERROR("Can't have more than 1 buffer without multiple threads");

400

#else /* NO_MULTI_THREADING */

401

_buffer_manager = support::cpp14::make_unique<BufferManagerMultipleThreads>(NEScheduler::get().num_threads());

402

#endif /* NO_MULTI_THREADING */

403

}

Anthony Barbier

2018-07-23 16:42:59 +0100

[diff] [blame]

404

// If B is transposed at every iteration then transformed_B can be managed:

405

_memory_group.manage(&_transformed_b);

Anthony Barbier

2018-11-30 10:42:40 +0000

[diff] [blame]

406

auto_init_if_empty(*_transformed_b.info(), _b->info()->clone()->set_tensor_shape(TensorShape(_block_sizes.x_block * _block_sizes.k_block, _buffer_manager->num_buffers())));

Anthony Barbier

2018-07-23 16:42:59 +0100

[diff] [blame]

407

}

Anthony Barbier

2018-09-11 17:49:10 +0100

[diff] [blame]

408

else

Anthony Barbier

2018-07-23 16:42:59 +0100

[diff] [blame]

409

{

Anthony Barbier

2018-09-11 17:49:10 +0100

[diff] [blame]

410

_tag += "_preB";

Anthony Barbier

2018-11-30 10:42:40 +0000

[diff] [blame]

}

switch(input_type)

{

case DataType::F32:

_prepare_b = instantiate_prepareB<float>(_b, &_transformed_b, _params);

416

break;

Anthony Barbier

2018-07-23 16:42:59 +0100

[diff] [blame]

417

#ifdef __aarch64__

Anthony Barbier

2018-11-30 10:42:40 +0000

[diff] [blame]

418

case DataType::U8:

419

case DataType::QASYMM8:

420

if(use_dot)

421

{

422

_prepare_b = instantiate_prepareB<uint8_t, true>(_b, &_transformed_b, _params);

}

else

{

_prepare_b = instantiate_prepareB<uint8_t, false>(_b, &_transformed_b, _params);

}

break;

case DataType::S8:

if(use_dot)

{

_prepare_b = instantiate_prepareB<int8_t, true>(_b, &_transformed_b, _params);

}

else

{

_prepare_b = instantiate_prepareB<int8_t, false>(_b, &_transformed_b, _params);

437

}

438

break;

Anthony Barbier

2018-07-23 16:42:59 +0100

[diff] [blame]

439

#endif /* __aarch64__ */

440

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

Anthony Barbier

2018-11-30 10:42:40 +0000

[diff] [blame]

441

case DataType::F16:

442

_prepare_b = instantiate_prepareB<__fp16>(_b, &_transformed_b, _params);

443

break;

Anthony Barbier

2018-07-23 16:42:59 +0100

[diff] [blame]

444

#endif /* __ARM_FEATURE_FP16_VECTOR_ARITHMETIC */

Anthony Barbier

2018-11-30 10:42:40 +0000

[diff] [blame]

445

default:

446

ARM_COMPUTE_ERROR("DataType not supported");

447

break;

448

}

449

ARM_COMPUTE_ERROR_ON(_prepare_b == nullptr);

Anthony Barbier

2018-07-23 16:42:59 +0100

[diff] [blame]

450

Anthony Barbier

2018-11-30 10:42:40 +0000

[diff] [blame]

451

if(_pretranspose_b)

452

{

Anthony Barbier

2018-09-11 17:49:10 +0100

[diff] [blame]

453

_block_sizes = _prepare_b->block_sizes();

Anthony Barbier

2018-11-30 10:42:40 +0000

[diff] [blame]

454

_batch_window.set(Window::DimX, Window::Dimension(0, ceil_to_multiple(_block_sizes.m_round, _block_sizes.strategy_out_height), _block_sizes.strategy_out_height));

455

_batch_window.set(Window::DimY, Window::Dimension(0, _params.batches));

Anthony Barbier

2018-09-11 17:49:10 +0100

[diff] [blame]

456

}

Anthony Barbier

2018-07-23 16:42:59 +0100

[diff] [blame]

457

458

_block_walker.set(Window::DimX, Window::Dimension(0, ceil_to_multiple(_params.N, _block_sizes.x_block), _block_sizes.x_block));

459

_block_walker.set(Window::DimY, Window::Dimension(0, ceil_to_multiple(_params.K, _block_sizes.k_block), _block_sizes.k_block));

460

_block_walker.set(Window::DimZ, Window::Dimension(0, _params.multis));

461

Anthony Barbier