Blame - src/core/NEON/kernels/NEReductionOperationKernel.cpp - ml/ComputeLibrary

2017-08-03 10:19:40 +0100

[diff] [blame]

355

{

356

ARM_COMPUTE_UNUSED(out_slice);

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

357

auto init_res_value = static_cast<T>(0.f);

358

if(op == ReductionOperation::ARG_IDX_MAX || op == ReductionOperation::ARG_IDX_MIN)

359

{

360

init_res_value = *reinterpret_cast<T *>(input.ptr());

361

}

362

auto vec_res_value = wrapper::vdup_n(init_res_value, ExactTagType{});

363

uint32x4x4_t vec_res_idx{ 0 };

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

364

365

execute_window_loop(in_slice, [&](const Coordinates & id)

366

{

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

367

const auto in_ptr = reinterpret_cast<const T *>(input.ptr());

368

const auto vec_elements = wrapper::vloadq(in_ptr);

369

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

370

switch(op)

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

371

{

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

372

case ReductionOperation::SUM_SQUARE:

373

vec_res_value = wrapper::vadd(wrapper::vmul(vec_elements, vec_elements), vec_res_value);

374

break;

375

case ReductionOperation::MEAN_SUM:

376

case ReductionOperation::SUM:

377

vec_res_value = wrapper::vadd(vec_elements, vec_res_value);

378

break;

379

case ReductionOperation::ARG_IDX_MIN:

380

{

381

auto temp_vec_res_value = wrapper::vmin(vec_elements, vec_res_value);

382

vec_res_idx = calculate_index(id.x(), temp_vec_res_value, vec_res_value, vec_res_idx, op, 0);

383

vec_res_value = temp_vec_res_value;

384

break;

385

}

386

case ReductionOperation::ARG_IDX_MAX:

387

{

388

auto temp_vec_res_value = wrapper::vmax(vec_elements, vec_res_value);

389

vec_res_idx = calculate_index(id.x(), temp_vec_res_value, vec_res_value, vec_res_idx, op, 0);

390

vec_res_value = temp_vec_res_value;

break;

}

default:

ARM_COMPUTE_ERROR("Not supported");

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

395

}

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

},

input);

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

399

switch(op)

Michele Di Giorgio

1c948d4

2018-11-20 16:03:01 +0000

[diff] [blame]

400

{

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

401

case ReductionOperation::SUM:

402

case ReductionOperation::SUM_SQUARE:

403

case ReductionOperation::MEAN_SUM:

404

{

405

auto carry_res = wrapper::vpadd(wrapper::vgethigh(vec_res_value), wrapper::vgetlow(vec_res_value));

406

for(int i = 0; i < S / 4; ++i)

407

{

408

carry_res = wrapper::vpadd(carry_res, carry_res);

409

}

410

auto res = wrapper::vgetlane(carry_res, 0);

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

411

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

412

if(op == ReductionOperation::MEAN_SUM)

413

{

414

res /= in_info.dimension(0);

415

}

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

416

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

417

*(reinterpret_cast<T *>(output.ptr())) = res;

418

break;

419

}

420

case ReductionOperation::ARG_IDX_MIN:

421

case ReductionOperation::ARG_IDX_MAX:

422

{

423

auto res = calculate_vector_index(vec_res_idx, vec_res_value, op);

424

*(reinterpret_cast<uint32_t *>(output.ptr())) = res;

break;

}

default:

ARM_COMPUTE_ERROR("Not supported");

429

}

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

}

};

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

433

struct RedOpX_qasymm8

434

{

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

435

inline void operator()(Iterator &input, Iterator &output, Window &in_slice, Window &out_slice, const TensorInfo &in_info, const ReductionOperation op)

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

436

{

437

ARM_COMPUTE_UNUSED(out_slice);

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

438

auto vec_res_value1 = vdupq_n_u32(static_cast<uint32_t>(0.f));

439

auto vec_res_value2 = vdupq_n_u32(static_cast<uint32_t>(0.f));

440

auto vec_res_value3 = vdupq_n_u32(static_cast<uint32_t>(0.f));

441

auto vec_res_value4 = vdupq_n_u32(static_cast<uint32_t>(0.f));

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

442

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

443

uint8x16_t vec_res_value;

444

if(op == ReductionOperation::ARG_IDX_MAX || op == ReductionOperation::ARG_IDX_MIN)

445

{

446

vec_res_value = wrapper::vdup_n(*input.ptr(), wrapper::traits::vector_128_tag{});

447

}

448

449

uint32x4x4_t vec_res_idx{ 0 };

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

450

execute_window_loop(in_slice, [&](const Coordinates & id)

451

{

452

const auto vec_elements = wrapper::vloadq(input.ptr());

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

453

switch(op)

454

{

455

case ReductionOperation::SUM:

456

case ReductionOperation::MEAN_SUM:

457

{

458

const auto temp16x8t_1 = wrapper::vmovl(wrapper::vgetlow(vec_elements));

459

const auto temp16x8t_2 = wrapper::vmovl(wrapper::vgethigh(vec_elements));

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

460

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

461

const auto temp32x4t_1 = wrapper::vmovl(wrapper::vgetlow(temp16x8t_1));

462

const auto temp32x4t_2 = wrapper::vmovl(wrapper::vgethigh(temp16x8t_1));

463

const auto temp32x4t_3 = wrapper::vmovl(wrapper::vgetlow(temp16x8t_2));

464

const auto temp32x4t_4 = wrapper::vmovl(wrapper::vgethigh(temp16x8t_2));

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

465

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

466

vec_res_value1 = wrapper::vadd(temp32x4t_1, vec_res_value1);

467

vec_res_value2 = wrapper::vadd(temp32x4t_2, vec_res_value2);

468

vec_res_value3 = wrapper::vadd(temp32x4t_3, vec_res_value3);

469

vec_res_value4 = wrapper::vadd(temp32x4t_4, vec_res_value4);

470

break;

471

}

472

case ReductionOperation::ARG_IDX_MIN:

473

{

474

auto temp_vec_res_value = wrapper::vmin(vec_elements, vec_res_value);

475

vec_res_idx = calculate_index(id.x(), temp_vec_res_value, vec_res_value, vec_res_idx, op, 0);

476

vec_res_value = temp_vec_res_value;

477

break;

478

}

479

case ReductionOperation::ARG_IDX_MAX:

480

{

481

auto temp_vec_res_value = wrapper::vmax(vec_elements, vec_res_value);

482

vec_res_idx = calculate_index(id.x(), temp_vec_res_value, vec_res_value, vec_res_idx, op, 0);

483

vec_res_value = temp_vec_res_value;

break;

}

default:

ARM_COMPUTE_ERROR("Not supported");

488

}

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

},

input);

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

492

if(op == ReductionOperation::ARG_IDX_MIN || op == ReductionOperation::ARG_IDX_MAX)

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

493

{

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

494

auto res = calculate_vector_index(vec_res_idx, vec_res_value, op);

495

*(reinterpret_cast<uint32_t *>(output.ptr())) = res;

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

496

}

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

497

else

498

{

499

auto carry_res = wrapper::vadd(vec_res_value1, vec_res_value2);

500

carry_res = wrapper::vadd(carry_res, vec_res_value3);

501

carry_res = wrapper::vadd(carry_res, vec_res_value4);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

502

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

503

auto carry_paddition = wrapper::vpadd(wrapper::vgethigh(carry_res), wrapper::vgetlow(carry_res));

504

carry_paddition = wrapper::vpadd(carry_paddition, carry_paddition);

505

auto res = wrapper::vgetlane(carry_paddition, 0);

506

507

if(op == ReductionOperation::MEAN_SUM)

508

{

509

res /= in_info.dimension(0);

510

}

511

512

*(output.ptr()) = static_cast<uint8_t>(res);

513

}

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

}

};

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

517

template <typename T, int S>

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

518

struct RedOpYZW

519

{

520

/** NEON vector tag type. */

521

using ExactTagType = typename wrapper::traits::neon_vector<T, S>::tag_type;

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

522

using neon_vector = typename wrapper::traits::neon_vector<T, S>::type;

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

523

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

524

inline void operator()(Iterator &input, Iterator &output, Window &in_slice, Window &out_slice, const TensorInfo &in_info, int axis, const ReductionOperation op)

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

525

{

526

ARM_COMPUTE_UNUSED(out_slice);

527

528

execute_window_loop(in_slice, [&](const Coordinates & id)

529

{

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

530

neon_vector vec_res_value;

531

if(op == ReductionOperation::ARG_IDX_MAX || op == ReductionOperation::ARG_IDX_MIN)

532

{

533

vec_res_value = wrapper::vloadq(reinterpret_cast<T *>(input.ptr()));

}

else

{

vec_res_value = wrapper::vdup_n(static_cast<T>(0.f), ExactTagType{});

538

}

539

uint32x4x4_t vec_res_idx{ 0 };

540

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

541

for(unsigned int dim = 0; dim < in_info.dimension(axis); ++dim)

{

T *in_ptr;

switch(axis)

{

case 1:

in_ptr = reinterpret_cast<T *>(input.ptr() + in_info.offset_element_in_bytes(Coordinates(0, dim)));

548

break;

549

case 2:

550

in_ptr = reinterpret_cast<T *>(input.ptr() + in_info.offset_element_in_bytes(Coordinates(0, 0, dim)));

551

break;

552

case 3:

553

in_ptr = reinterpret_cast<T *>(input.ptr() + in_info.offset_element_in_bytes(Coordinates(0, 0, 0, dim)));

554

break;

555

default:

556

ARM_COMPUTE_ERROR("Not supported");

557

}

558

const auto vec_elements = wrapper::vloadq(in_ptr);

559

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

560

switch(op)

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

561

{

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

562

case ReductionOperation::SUM:

563

case ReductionOperation::MEAN_SUM:

564

vec_res_value = wrapper::vadd(vec_elements, vec_res_value);

565

break;

566

case ReductionOperation::SUM_SQUARE:

567

vec_res_value = wrapper::vadd(wrapper::vmul(vec_elements, vec_elements), vec_res_value);

568

break;

569

case ReductionOperation::ARG_IDX_MIN:

570

{

571

auto temp_vec_res_value = wrapper::vmin(vec_elements, vec_res_value);

572

vec_res_idx = calculate_index(dim, temp_vec_res_value, vec_res_value, vec_res_idx, op, axis);

573

vec_res_value = temp_vec_res_value;

574

break;

575

}

576

case ReductionOperation::ARG_IDX_MAX:

577

{

578

auto temp_vec_res_value = wrapper::vmax(vec_elements, vec_res_value);

579

vec_res_idx = calculate_index(dim, temp_vec_res_value, vec_res_value, vec_res_idx, op, axis);

580

vec_res_value = temp_vec_res_value;

break;

}

default:

ARM_COMPUTE_ERROR("Not supported");

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

}

}

if(op == ReductionOperation::MEAN_SUM)

589

{

590

auto vec_width_inv = wrapper::vinv(wrapper::vdup_n(static_cast<T>(in_info.dimension(axis)), ExactTagType{}));

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

591

vec_res_value = wrapper::vmul(vec_res_value, vec_width_inv);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

592

}

593

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

594

if(op == ReductionOperation::ARG_IDX_MIN || op == ReductionOperation::ARG_IDX_MAX)

595

{

596

wrapper::vstore(reinterpret_cast<uint32_t *>(output.ptr()), vec_res_idx.val[0]);

}

else

{

wrapper::vstore(reinterpret_cast<T *>(output.ptr()), vec_res_value);

601

}

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

},

input, output);

}

};

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

607

struct RedOpYZW_qasymm8

608

{

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

609

inline void operator()(Iterator &input, Iterator &output, Window &in_slice, Window &out_slice, const TensorInfo &in_info, int axis, const ReductionOperation op)

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

610

{

611

ARM_COMPUTE_UNUSED(out_slice);

612

613

execute_window_loop(in_slice, [&](const Coordinates & id)

614

{

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

615

uint32x4x4_t vec_res_idx{ 0 };

616

auto vec_res_value1 = vdupq_n_u32(0);

617

auto vec_res_value2 = vdupq_n_u32(0);

618

auto vec_res_value3 = vdupq_n_u32(0);

619

auto vec_res_value4 = vdupq_n_u32(0);

620

auto vec_res_value = wrapper::vloadq(input.ptr());

621

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

622

for(unsigned int dim = 0; dim < in_info.dimension(axis); ++dim)

{

uint8_t *in_ptr;

switch(axis)

{

case 1:

in_ptr = input.ptr() + in_info.offset_element_in_bytes(Coordinates(0, dim));

629

break;

630

case 2:

631

in_ptr = input.ptr() + in_info.offset_element_in_bytes(Coordinates(0, 0, dim));

632

break;

633

case 3:

634

in_ptr = input.ptr() + in_info.offset_element_in_bytes(Coordinates(0, 0, 0, dim));

635

break;

636

default:

637

ARM_COMPUTE_ERROR("Not supported");

638

}

639

const auto vec_elements = wrapper::vloadq(in_ptr);

640

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

641

switch(op)

642

{

643

case ReductionOperation::SUM:

644

case ReductionOperation::MEAN_SUM:

645

{

646

const auto temp16x8t_1 = wrapper::vmovl(wrapper::vgetlow(vec_elements));

647

const auto temp16x8t_2 = wrapper::vmovl(wrapper::vgethigh(vec_elements));

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

648

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

649

const auto temp32x4t_1 = wrapper::vmovl(wrapper::vgetlow(temp16x8t_1));

650

const auto temp32x4t_2 = wrapper::vmovl(wrapper::vgethigh(temp16x8t_1));

651

const auto temp32x4t_3 = wrapper::vmovl(wrapper::vgetlow(temp16x8t_2));

652

const auto temp32x4t_4 = wrapper::vmovl(wrapper::vgethigh(temp16x8t_2));

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

653

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

654

vec_res_value1 = wrapper::vadd(temp32x4t_1, vec_res_value1);

655

vec_res_value2 = wrapper::vadd(temp32x4t_2, vec_res_value2);

656

vec_res_value3 = wrapper::vadd(temp32x4t_3, vec_res_value3);

657

vec_res_value4 = wrapper::vadd(temp32x4t_4, vec_res_value4);

658

break;

659

}

660

case ReductionOperation::ARG_IDX_MIN:

661

{

662

auto temp_vec_res_value = wrapper::vmin(vec_elements, vec_res_value);

663

vec_res_idx = calculate_index(dim, temp_vec_res_value, vec_res_value, vec_res_idx, op, axis);

664

vec_res_value = temp_vec_res_value;

665

break;

666

}

667

case ReductionOperation::ARG_IDX_MAX:

668

{

669

auto temp_vec_res_value = wrapper::vmax(vec_elements, vec_res_value);

670

vec_res_idx = calculate_index(dim, temp_vec_res_value, vec_res_value, vec_res_idx, op, axis);

671

vec_res_value = temp_vec_res_value;

break;

}

default:

ARM_COMPUTE_ERROR("Not supported");

676

}

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

677

}

678

679

if(op == ReductionOperation::MEAN_SUM)

680

{

681

const auto vec_width_inv = wrapper::vinv(vdupq_n_f32(in_info.dimension(axis)));

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

682

const auto vec_res_value1_f = wrapper::vmul(vcvtq_f32_u32(vec_res_value1), vec_width_inv);

683

const auto vec_res_value2_f = wrapper::vmul(vcvtq_f32_u32(vec_res_value2), vec_width_inv);

684

const auto vec_res_value3_f = wrapper::vmul(vcvtq_f32_u32(vec_res_value3), vec_width_inv);

685

const auto vec_res_value4_f = wrapper::vmul(vcvtq_f32_u32(vec_res_value4), vec_width_inv);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

686

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

687

vec_res_value1 = vcvtq_u32_f32(vec_res_value1_f);

688

vec_res_value2 = vcvtq_u32_f32(vec_res_value2_f);

689

vec_res_value3 = vcvtq_u32_f32(vec_res_value3_f);

690

vec_res_value4 = vcvtq_u32_f32(vec_res_value4_f);

691

}

692

if(op == ReductionOperation::ARG_IDX_MIN || op == ReductionOperation::ARG_IDX_MAX)

693

{

694

wrapper::vstore(reinterpret_cast<uint32_t *>(output.ptr()), vec_res_idx.val[0]);

695

wrapper::vstore(reinterpret_cast<uint32_t *>(output.ptr()) + 4, vec_res_idx.val[1]);

696

wrapper::vstore(reinterpret_cast<uint32_t *>(output.ptr()) + 8, vec_res_idx.val[2]);

697

wrapper::vstore(reinterpret_cast<uint32_t *>(output.ptr()) + 12, vec_res_idx.val[3]);

}

else

{

const auto temp16x8t_1 = vcombine_u16(wrapper::vqmovn(vec_res_value1), wrapper::vqmovn(vec_res_value2));

702

const auto temp16x8t_2 = vcombine_u16(wrapper::vqmovn(vec_res_value3), wrapper::vqmovn(vec_res_value4));

703

auto res = vcombine_u8(wrapper::vqmovn(temp16x8t_1), wrapper::vqmovn(temp16x8t_2));

704

wrapper::vstore(output.ptr(), res);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

705

}

706

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

707

},

708

input, output);

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

}

};

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

712

void reduce_op(const Window &window, const ITensor *input, ITensor *output, unsigned int axis, const ReductionOperation op)

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

{

switch(axis)

{

case 0:

switch(input->info()->data_type())

718

{

719

case DataType::QASYMM8:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

720

return Reducer<RedOpX_qasymm8>::reduceX(window, input, output, RedOpX_qasymm8(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

721

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

722

case DataType::F16:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

723

return Reducer<RedOpX<float16_t, 8>>::reduceX(window, input, output, RedOpX<float16_t, 8>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

724

#endif // __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

725

case DataType::F32:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

726

return Reducer<RedOpX<float, 4>>::reduceX(window, input, output, RedOpX<float, 4>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

727

default:

728

ARM_COMPUTE_ERROR("Not supported");

729

}

730

case 1:

731

switch(input->info()->data_type())

732

{

733

case DataType::QASYMM8:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

734

return Reducer<RedOpYZW_qasymm8>::reduceY(window, input, output, RedOpYZW_qasymm8(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

735

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

736

case DataType::F16:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

737

return Reducer<RedOpYZW<float16_t, 8>>::reduceY(window, input, output, RedOpYZW<float16_t, 8>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

738

#endif // __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

739

case DataType::F32:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

740

return Reducer<RedOpYZW<float, 4>>::reduceY(window, input, output, RedOpYZW<float, 4>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

741

default:

742

ARM_COMPUTE_ERROR("Not supported");

743

}

744

case 2:

745

switch(input->info()->data_type())

746

{

747

case DataType::QASYMM8:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

748

return Reducer<RedOpYZW_qasymm8>::reduceZ(window, input, output, RedOpYZW_qasymm8(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

749

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

750

case DataType::F16:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

751

return Reducer<RedOpYZW<float16_t, 8>>::reduceZ(window, input, output, RedOpYZW<float16_t, 8>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

752

#endif // __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

753

case DataType::F32:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

754

return Reducer<RedOpYZW<float, 4>>::reduceZ(window, input, output, RedOpYZW<float, 4>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

755

default:

756

ARM_COMPUTE_ERROR("Not supported");

757

}

758

case 3:

759

switch(input->info()->data_type())

760

{

761

case DataType::QASYMM8:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

762

return Reducer<RedOpYZW_qasymm8>::reduceW(window, input, output, RedOpYZW_qasymm8(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

763

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

764

case DataType::F16:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

765

return Reducer<RedOpYZW<float16_t, 8>>::reduceW(window, input, output, RedOpYZW<float16_t, 8>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

766

#endif // __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

767

case DataType::F32:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

768

return Reducer<RedOpYZW<float, 4>>::reduceW(window, input, output, RedOpYZW<float, 4>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

769

default:

770

ARM_COMPUTE_ERROR("Not supported");

771

}

772

default:

773

ARM_COMPUTE_ERROR("Unsupported reduction axis");

774

}

775

}

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

776

777

Status validate_arguments(const ITensorInfo *input, const ITensorInfo *output, unsigned int axis, ReductionOperation op)

778

{

779

ARM_COMPUTE_UNUSED(op);

780

781

ARM_COMPUTE_RETURN_ERROR_ON_NULLPTR(input, output);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

782

ARM_COMPUTE_RETURN_ERROR_ON_DATA_TYPE_CHANNEL_NOT_IN(input, 1, DataType::QASYMM8, DataType::F16, DataType::F32);

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

783

784

ARM_COMPUTE_RETURN_ERROR_ON_MSG(axis >= TensorShape::num_max_dimensions, "Reduction axis greater than max number of dimensions");

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

785

ARM_COMPUTE_RETURN_ERROR_ON_MSG(axis > 3, "Unsupported reduction axis");

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

786

787

if(output->total_size() != 0)

788

{

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

789

bool is_arg_min_max = (op == ReductionOperation::ARG_IDX_MAX || op == ReductionOperation::ARG_IDX_MIN);

790

if(!is_arg_min_max)

791

{

792

ARM_COMPUTE_RETURN_ERROR_ON_MISMATCHING_DATA_TYPES(input, output);

}

else

{

ARM_COMPUTE_RETURN_ERROR_ON_DATA_TYPE_CHANNEL_NOT_IN(output, 1, DataType::U32);

797

}

798

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

799

ARM_COMPUTE_RETURN_ERROR_ON_MISMATCHING_DATA_LAYOUT(input, output);

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

800

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

801

const TensorShape output_shape = arm_compute::misc::shape_calculator::compute_reduced_shape(input->tensor_shape(), axis);

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

802

const TensorInfo tensor_info_reshaped = input->clone()->set_tensor_shape(output_shape);

803

ARM_COMPUTE_RETURN_ERROR_ON_MISMATCHING_SHAPES(output, &tensor_info_reshaped);

}

return Status{};

}

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

809

std::tuple<Status, Window> validate_and_configure_window(ITensorInfo *input, ITensorInfo *output, unsigned int axis, ReductionOperation op)

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

810

{

811

// Calculate output shape and set if empty

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

812

const TensorShape output_shape = arm_compute::misc::shape_calculator::compute_reduced_shape(input->tensor_shape(), axis);

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

813

814

// Output auto initialization if not yet initialized

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

815

const bool is_arg_min_max = (op == ReductionOperation::ARG_IDX_MIN || op == ReductionOperation::ARG_IDX_MAX);

816

DataType output_data_type = is_arg_min_max ? DataType::U32 : input->data_type();

817

auto_init_if_empty(*output, output_shape, 1, output_data_type);

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

818

819

unsigned int num_elems_processed_per_iteration = 16 / data_size_from_type(input->data_type());

820

821

// Configure kernel window

822

Window win = calculate_max_window(*input, Steps(num_elems_processed_per_iteration));

823

AccessWindowHorizontal input_access(input, 0, num_elems_processed_per_iteration);

824

AccessWindowHorizontal output_access(output, 0, num_elems_processed_per_iteration);

825

826

bool window_changed = update_window_and_padding(win, input_access, output_access);

827

output_access.set_valid_region(win, ValidRegion(Coordinates(), output->tensor_shape()));

828

829

Status err = (window_changed) ? ARM_COMPUTE_CREATE_ERROR(ErrorCode::RUNTIME_ERROR, "Insufficient Padding!") : Status{};

830

831

return std::make_tuple(err, win);

832

}

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

833

} // namespace

834

835

NEReductionOperationKernel::NEReductionOperationKernel()

836

: _input(nullptr), _output(nullptr), _reduction_axis(0), _op(ReductionOperation::SUM_SQUARE), _border_size()

{

}

BorderSize NEReductionOperationKernel::border_size() const

{

return _border_size;

}

void NEReductionOperationKernel::configure(const ITensor *input, ITensor *output, unsigned int axis, ReductionOperation op)

846

{

847

ARM_COMPUTE_ERROR_ON_NULLPTR(input, output);

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

848

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

849

ARM_COMPUTE_ERROR_THROW_ON(validate_arguments(input->info(), output->info(), axis, op));

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

850

851

unsigned int num_elems_processed_per_iteration = 16 / data_size_from_type(input->info()->data_type());

852

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

853

_input = input;

854

_output = output;

855

_border_size = (axis == 0) ? BorderSize(0, num_elems_processed_per_iteration - (input->info()->dimension(0) % num_elems_processed_per_iteration), 0, 0) : BorderSize();

856

_op = op;

857

_reduction_axis = axis;

Georgios Pinitas