Blame - src/core/NEON/kernels/NEReductionOperationKernel.cpp - ml/ComputeLibrary

2020-01-28 10:38:07 +0000

[diff] [blame]

1534

return Reducer<RedOpX_quantized<uint8_t>>::reduceX(window, input, output, RedOpX_quantized<uint8_t>(), op);

1535

case DataType::QASYMM8_SIGNED:

1536

return Reducer<RedOpX_quantized<int8_t>>::reduceX(window, input, output, RedOpX_quantized<int8_t>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1537

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1538

case DataType::F16:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1539

return Reducer<RedOpX<float16_t, 8>>::reduceX(window, input, output, RedOpX<float16_t, 8>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1540

#endif // __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1541

case DataType::F32:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1542

return Reducer<RedOpX<float, 4>>::reduceX(window, input, output, RedOpX<float, 4>(), op);

Michalis Spyrou

2019-05-13 17:41:01 +0100

[diff] [blame]

1543

case DataType::S32:

1544

return Reducer<RedOpX<int32_t, 4>>::reduceX(window, input, output, RedOpX<int32_t, 4>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1545

default:

1546

ARM_COMPUTE_ERROR("Not supported");

1547

}

1548

case 1:

1549

switch(input->info()->data_type())

1550

{

1551

case DataType::QASYMM8:

Luca Foschiani

2020-01-28 10:38:07 +0000

[diff] [blame]

1552

return Reducer<RedOpYZW_quantized<uint8_t>>::reduceY(window, input, output, RedOpYZW_quantized<uint8_t>(), op);

1553

case DataType::QASYMM8_SIGNED:

1554

return Reducer<RedOpYZW_quantized<int8_t>>::reduceY(window, input, output, RedOpYZW_quantized<int8_t>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1555

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1556

case DataType::F16:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1557

return Reducer<RedOpYZW<float16_t, 8>>::reduceY(window, input, output, RedOpYZW<float16_t, 8>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1558

#endif // __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1559

case DataType::F32:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1560

return Reducer<RedOpYZW<float, 4>>::reduceY(window, input, output, RedOpYZW<float, 4>(), op);

Michalis Spyrou

2019-05-13 17:41:01 +0100

[diff] [blame]

1561

case DataType::S32:

1562

return Reducer<RedOpYZW<int32_t, 4>>::reduceY(window, input, output, RedOpYZW<int32_t, 4>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1563

default:

1564

ARM_COMPUTE_ERROR("Not supported");

1565

}

1566

case 2:

1567

switch(input->info()->data_type())

1568

{

1569

case DataType::QASYMM8:

Luca Foschiani

2020-01-28 10:38:07 +0000

[diff] [blame]

1570

return Reducer<RedOpYZW_quantized<uint8_t>>::reduceZ(window, input, output, RedOpYZW_quantized<uint8_t>(), op);

1571

case DataType::QASYMM8_SIGNED:

1572

return Reducer<RedOpYZW_quantized<int8_t>>::reduceZ(window, input, output, RedOpYZW_quantized<int8_t>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1573

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1574

case DataType::F16:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1575

return Reducer<RedOpYZW<float16_t, 8>>::reduceZ(window, input, output, RedOpYZW<float16_t, 8>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1576

#endif // __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1577

case DataType::F32:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1578

return Reducer<RedOpYZW<float, 4>>::reduceZ(window, input, output, RedOpYZW<float, 4>(), op);

Michalis Spyrou

2019-05-13 17:41:01 +0100

[diff] [blame]

1579

case DataType::S32:

1580

return Reducer<RedOpYZW<int32_t, 4>>::reduceZ(window, input, output, RedOpYZW<int32_t, 4>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1581

default:

1582

ARM_COMPUTE_ERROR("Not supported");

1583

}

1584

case 3:

1585

switch(input->info()->data_type())

1586

{

1587

case DataType::QASYMM8:

Luca Foschiani

2020-01-28 10:38:07 +0000

[diff] [blame]

1588

return Reducer<RedOpYZW_quantized<uint8_t>>::reduceW(window, input, output, RedOpYZW_quantized<uint8_t>(), op);

1589

case DataType::QASYMM8_SIGNED:

1590

return Reducer<RedOpYZW_quantized<int8_t>>::reduceW(window, input, output, RedOpYZW_quantized<int8_t>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1591

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1592

case DataType::F16:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1593

return Reducer<RedOpYZW<float16_t, 8>>::reduceW(window, input, output, RedOpYZW<float16_t, 8>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1594

#endif // __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1595

case DataType::F32:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1596

return Reducer<RedOpYZW<float, 4>>::reduceW(window, input, output, RedOpYZW<float, 4>(), op);

Michalis Spyrou

2019-05-13 17:41:01 +0100

[diff] [blame]

1597

case DataType::S32:

1598

return Reducer<RedOpYZW<int32_t, 4>>::reduceW(window, input, output, RedOpYZW<int32_t, 4>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1599

default:

1600

ARM_COMPUTE_ERROR("Not supported");

1601

}

1602

default:

1603

ARM_COMPUTE_ERROR("Unsupported reduction axis");

1604

}

1605

}

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

1606

1607

Status validate_arguments(const ITensorInfo *input, const ITensorInfo *output, unsigned int axis, ReductionOperation op)

1608

{

1609

ARM_COMPUTE_UNUSED(op);

1610

1611

ARM_COMPUTE_RETURN_ERROR_ON_NULLPTR(input, output);

Georgios Pinitas

8f5802f

2019-02-22 11:08:32 +0000

[diff] [blame]

1612

ARM_COMPUTE_RETURN_ERROR_ON_CPU_F16_UNSUPPORTED(input);

giuros01

154bc1c

2019-03-26 17:44:40 +0000

[diff] [blame]

1613

1614

if(input->num_channels() == 1)

1615

{

Luca Foschiani

2020-01-28 10:38:07 +0000

[diff] [blame]

1616

ARM_COMPUTE_RETURN_ERROR_ON_DATA_TYPE_CHANNEL_NOT_IN(input, 1, DataType::QASYMM8_SIGNED, DataType::QASYMM8, DataType::S32, DataType::F16, DataType::F32);

giuros01

154bc1c

2019-03-26 17:44:40 +0000

[diff] [blame]

}

else

{

ARM_COMPUTE_RETURN_ERROR_ON_DATA_TYPE_CHANNEL_NOT_IN(input, 2, DataType::F32);

1621

ARM_COMPUTE_RETURN_ERROR_ON(op != ReductionOperation::SUM);

1622

ARM_COMPUTE_RETURN_ERROR_ON(axis != 2);

1623

}

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

1624

1625

ARM_COMPUTE_RETURN_ERROR_ON_MSG(axis >= TensorShape::num_max_dimensions, "Reduction axis greater than max number of dimensions");

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1626

ARM_COMPUTE_RETURN_ERROR_ON_MSG(axis > 3, "Unsupported reduction axis");

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

1627

1628

if(output->total_size() != 0)

1629

{

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1630

bool is_arg_min_max = (op == ReductionOperation::ARG_IDX_MAX || op == ReductionOperation::ARG_IDX_MIN);

1631

if(!is_arg_min_max)

1632

{

1633

ARM_COMPUTE_RETURN_ERROR_ON_MISMATCHING_DATA_TYPES(input, output);

Isabella Gottardi

0a1090a

2019-02-14 18:07:36 +0000

[diff] [blame]

1634

ARM_COMPUTE_RETURN_ERROR_ON_MISMATCHING_QUANTIZATION_INFO(input, output);

giuros01

154bc1c

2019-03-26 17:44:40 +0000

[diff] [blame]

1635

ARM_COMPUTE_RETURN_ERROR_ON(input->num_channels() != output->num_channels());

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1636

}

1637

else

1638

{

Michele Di Giorgio

9637b2e

2019-09-23 16:49:49 +0100

[diff] [blame]

1639

ARM_COMPUTE_RETURN_ERROR_ON_DATA_TYPE_CHANNEL_NOT_IN(output, 1, DataType::U32, DataType::S32);

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1640

}

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

1641

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1642

const TensorShape output_shape = arm_compute::misc::shape_calculator::compute_reduced_shape(input->tensor_shape(), axis);

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

1643

const TensorInfo tensor_info_reshaped = input->clone()->set_tensor_shape(output_shape);

1644

ARM_COMPUTE_RETURN_ERROR_ON_MISMATCHING_SHAPES(output, &tensor_info_reshaped);

}

return Status{};

}

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

1649

} // namespace

1650

1651

NEReductionOperationKernel::NEReductionOperationKernel()

Sheri Zhang

4d91dc6

2020-09-23 11:22:50 +0100

[diff] [blame]

1652

: _input(nullptr), _output(nullptr), _reduction_axis(0), _op(ReductionOperation::SUM_SQUARE)

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

{

}

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

1656

void NEReductionOperationKernel::configure(const ITensor *input, ITensor *output, unsigned int axis, ReductionOperation op)

1657

{

1658

ARM_COMPUTE_ERROR_ON_NULLPTR(input, output);

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

1659

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

1660

ARM_COMPUTE_ERROR_THROW_ON(validate_arguments(input->info(), output->info(), axis, op));

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

1661

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1662

_input = input;

1663

_output = output;

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1664

_op = op;

1665

_reduction_axis = axis;

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

1666

1667

// Configure kernel window

Sheri Zhang

4d91dc6

2020-09-23 11:22:50 +0100

[diff] [blame]

1668

Coordinates coord;

1669

coord.set_num_dimensions(input->info()->num_dimensions());

1670

input->info()->set_valid_region(ValidRegion(coord, input->info()->tensor_shape()));

1671

Window win = calculate_max_window(*input->info(), Steps(input->info()->dimension(0)));

1672

INEKernel::configure(win);

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

1673

Sheri Zhang

4d91dc6

2020-09-23 11:22:50 +0100

[diff] [blame]

1674

// Calculate output shape and set if empty

1675

const TensorShape output_shape = arm_compute::misc::shape_calculator::compute_reduced_shape(input->info()->tensor_shape(), axis);

1676

// Output auto initialization if not yet initialized

1677

const bool is_arg_min_max = (op == ReductionOperation::ARG_IDX_MIN || op == ReductionOperation::ARG_IDX_MAX);

1678

DataType output_data_type = is_arg_min_max ? DataType::S32 : input->info()->data_type();

1679

auto_init_if_empty(*output->info(), input->info()->clone()->set_tensor_shape(output_shape).set_data_type(output_data_type).reset_padding().set_is_resizable(true));

1680

output->info()->set_valid_region(ValidRegion(coord, output_shape));

John Richardson