Blame - src/core/NEON/kernels/NEReductionOperationKernel.cpp - ml/ComputeLibrary

2020-01-28 10:38:07 +0000

[diff] [blame]

1538

return Reducer<RedOpX_quantized<uint8_t>>::reduceX(window, input, output, RedOpX_quantized<uint8_t>(), op);

1539

case DataType::QASYMM8_SIGNED:

1540

return Reducer<RedOpX_quantized<int8_t>>::reduceX(window, input, output, RedOpX_quantized<int8_t>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1541

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1542

case DataType::F16:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1543

return Reducer<RedOpX<float16_t, 8>>::reduceX(window, input, output, RedOpX<float16_t, 8>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1544

#endif // __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1545

case DataType::F32:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1546

return Reducer<RedOpX<float, 4>>::reduceX(window, input, output, RedOpX<float, 4>(), op);

Michalis Spyrou

2019-05-13 17:41:01 +0100

[diff] [blame]

1547

case DataType::S32:

1548

return Reducer<RedOpX<int32_t, 4>>::reduceX(window, input, output, RedOpX<int32_t, 4>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1549

default:

1550

ARM_COMPUTE_ERROR("Not supported");

1551

}

1552

case 1:

1553

switch(input->info()->data_type())

1554

{

1555

case DataType::QASYMM8:

Luca Foschiani

2020-01-28 10:38:07 +0000

[diff] [blame]

1556

return Reducer<RedOpYZW_quantized<uint8_t>>::reduceY(window, input, output, RedOpYZW_quantized<uint8_t>(), op);

1557

case DataType::QASYMM8_SIGNED:

1558

return Reducer<RedOpYZW_quantized<int8_t>>::reduceY(window, input, output, RedOpYZW_quantized<int8_t>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1559

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1560

case DataType::F16:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1561

return Reducer<RedOpYZW<float16_t, 8>>::reduceY(window, input, output, RedOpYZW<float16_t, 8>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1562

#endif // __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1563

case DataType::F32:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1564

return Reducer<RedOpYZW<float, 4>>::reduceY(window, input, output, RedOpYZW<float, 4>(), op);

Michalis Spyrou

2019-05-13 17:41:01 +0100

[diff] [blame]

1565

case DataType::S32:

1566

return Reducer<RedOpYZW<int32_t, 4>>::reduceY(window, input, output, RedOpYZW<int32_t, 4>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1567

default:

1568

ARM_COMPUTE_ERROR("Not supported");

1569

}

1570

case 2:

1571

switch(input->info()->data_type())

1572

{

1573

case DataType::QASYMM8:

Luca Foschiani

2020-01-28 10:38:07 +0000

[diff] [blame]

1574

return Reducer<RedOpYZW_quantized<uint8_t>>::reduceZ(window, input, output, RedOpYZW_quantized<uint8_t>(), op);

1575

case DataType::QASYMM8_SIGNED:

1576

return Reducer<RedOpYZW_quantized<int8_t>>::reduceZ(window, input, output, RedOpYZW_quantized<int8_t>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1577

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1578

case DataType::F16:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1579

return Reducer<RedOpYZW<float16_t, 8>>::reduceZ(window, input, output, RedOpYZW<float16_t, 8>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1580

#endif // __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1581

case DataType::F32:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1582

return Reducer<RedOpYZW<float, 4>>::reduceZ(window, input, output, RedOpYZW<float, 4>(), op);

Michalis Spyrou

2019-05-13 17:41:01 +0100

[diff] [blame]

1583

case DataType::S32:

1584

return Reducer<RedOpYZW<int32_t, 4>>::reduceZ(window, input, output, RedOpYZW<int32_t, 4>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1585

default:

1586

ARM_COMPUTE_ERROR("Not supported");

1587

}

1588

case 3:

1589

switch(input->info()->data_type())

1590

{

1591

case DataType::QASYMM8:

Luca Foschiani

2020-01-28 10:38:07 +0000

[diff] [blame]

1592

return Reducer<RedOpYZW_quantized<uint8_t>>::reduceW(window, input, output, RedOpYZW_quantized<uint8_t>(), op);

1593

case DataType::QASYMM8_SIGNED:

1594

return Reducer<RedOpYZW_quantized<int8_t>>::reduceW(window, input, output, RedOpYZW_quantized<int8_t>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1595

#ifdef __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1596

case DataType::F16:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1597

return Reducer<RedOpYZW<float16_t, 8>>::reduceW(window, input, output, RedOpYZW<float16_t, 8>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1598

#endif // __ARM_FEATURE_FP16_VECTOR_ARITHMETIC

1599

case DataType::F32:

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1600

return Reducer<RedOpYZW<float, 4>>::reduceW(window, input, output, RedOpYZW<float, 4>(), op);

Michalis Spyrou

2019-05-13 17:41:01 +0100

[diff] [blame]

1601

case DataType::S32:

1602

return Reducer<RedOpYZW<int32_t, 4>>::reduceW(window, input, output, RedOpYZW<int32_t, 4>(), op);

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1603

default:

1604

ARM_COMPUTE_ERROR("Not supported");

1605

}

1606

default:

1607

ARM_COMPUTE_ERROR("Unsupported reduction axis");

1608

}

1609

}

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

1610

1611

Status validate_arguments(const ITensorInfo *input, const ITensorInfo *output, unsigned int axis, ReductionOperation op)

1612

{

1613

ARM_COMPUTE_UNUSED(op);

1614

1615

ARM_COMPUTE_RETURN_ERROR_ON_NULLPTR(input, output);

Georgios Pinitas

8f5802f

2019-02-22 11:08:32 +0000

[diff] [blame]

1616

ARM_COMPUTE_RETURN_ERROR_ON_CPU_F16_UNSUPPORTED(input);

giuros01

154bc1c

2019-03-26 17:44:40 +0000

[diff] [blame]

1617

1618

if(input->num_channels() == 1)

1619

{

Luca Foschiani

2020-01-28 10:38:07 +0000

[diff] [blame]

1620

ARM_COMPUTE_RETURN_ERROR_ON_DATA_TYPE_CHANNEL_NOT_IN(input, 1, DataType::QASYMM8_SIGNED, DataType::QASYMM8, DataType::S32, DataType::F16, DataType::F32);

giuros01

154bc1c

2019-03-26 17:44:40 +0000

[diff] [blame]

}

else

{

ARM_COMPUTE_RETURN_ERROR_ON_DATA_TYPE_CHANNEL_NOT_IN(input, 2, DataType::F32);

1625

ARM_COMPUTE_RETURN_ERROR_ON(op != ReductionOperation::SUM);

1626

ARM_COMPUTE_RETURN_ERROR_ON(axis != 2);

1627

}

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

1628

1629

ARM_COMPUTE_RETURN_ERROR_ON_MSG(axis >= TensorShape::num_max_dimensions, "Reduction axis greater than max number of dimensions");

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1630

ARM_COMPUTE_RETURN_ERROR_ON_MSG(axis > 3, "Unsupported reduction axis");

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

1631

1632

if(output->total_size() != 0)

1633

{

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1634

bool is_arg_min_max = (op == ReductionOperation::ARG_IDX_MAX || op == ReductionOperation::ARG_IDX_MIN);

1635

if(!is_arg_min_max)

1636

{

1637

ARM_COMPUTE_RETURN_ERROR_ON_MISMATCHING_DATA_TYPES(input, output);

Isabella Gottardi

0a1090a

2019-02-14 18:07:36 +0000

[diff] [blame]

1638

ARM_COMPUTE_RETURN_ERROR_ON_MISMATCHING_QUANTIZATION_INFO(input, output);

giuros01

154bc1c

2019-03-26 17:44:40 +0000

[diff] [blame]

1639

ARM_COMPUTE_RETURN_ERROR_ON(input->num_channels() != output->num_channels());

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1640

}

1641

else

1642

{

Michele Di Giorgio

9637b2e

2019-09-23 16:49:49 +0100

[diff] [blame]

1643

ARM_COMPUTE_RETURN_ERROR_ON_DATA_TYPE_CHANNEL_NOT_IN(output, 1, DataType::U32, DataType::S32);

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1644

}

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

1645

Michalis Spyrou

2019-01-03 11:10:25 +0000

[diff] [blame]

1646

const TensorShape output_shape = arm_compute::misc::shape_calculator::compute_reduced_shape(input->tensor_shape(), axis);

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

1647

const TensorInfo tensor_info_reshaped = input->clone()->set_tensor_shape(output_shape);

1648

ARM_COMPUTE_RETURN_ERROR_ON_MISMATCHING_SHAPES(output, &tensor_info_reshaped);

}

return Status{};

}

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

1653

} // namespace

1654

1655

NEReductionOperationKernel::NEReductionOperationKernel()

Sheri Zhang

4d91dc6

2020-09-23 11:22:50 +0100

[diff] [blame]

1656

: _input(nullptr), _output(nullptr), _reduction_axis(0), _op(ReductionOperation::SUM_SQUARE)

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

{

}

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

1660

void NEReductionOperationKernel::configure(const ITensor *input, ITensor *output, unsigned int axis, ReductionOperation op)

1661

{

1662

ARM_COMPUTE_ERROR_ON_NULLPTR(input, output);

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

1663

John Richardson

2018-05-08 14:34:33 +0100

[diff] [blame]

1664

ARM_COMPUTE_ERROR_THROW_ON(validate_arguments(input->info(), output->info(), axis, op));

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

1665

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1666

_input = input;

1667

_output = output;

Michalis Spyrou

2018-10-12 10:51:31 +0100

[diff] [blame]

1668

_op = op;

1669

_reduction_axis = axis;

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

1670

1671

// Configure kernel window

Sheri Zhang

4d91dc6

2020-09-23 11:22:50 +0100

[diff] [blame]

1672

Coordinates coord;

1673

coord.set_num_dimensions(input->info()->num_dimensions());

1674

input->info()->set_valid_region(ValidRegion(coord, input->info()->tensor_shape()));

1675

Window win = calculate_max_window(*input->info(), Steps(input->info()->dimension(0)));

1676

INEKernel::configure(win);

Georgios Pinitas

2017-08-03 10:19:40 +0100

[diff] [blame]

1677

Sheri Zhang

4d91dc6

2020-09-23 11:22:50 +0100

[diff] [blame]

1678

// Calculate output shape and set if empty

1679

const TensorShape output_shape = arm_compute::misc::shape_calculator::compute_reduced_shape(input->info()->tensor_shape(), axis);

1680

// Output auto initialization if not yet initialized

1681

const bool is_arg_min_max = (op == ReductionOperation::ARG_IDX_MIN || op == ReductionOperation::ARG_IDX_MAX);

1682

DataType output_data_type = is_arg_min_max ? DataType::S32 : input->info()->data_type();

1683

auto_init_if_empty(*output->info(), input->info()->clone()->set_tensor_shape(output_shape).set_data_type(output_data_type).reset_padding().set_is_resizable(true));

1684

output->info()->set_valid_region(ValidRegion(coord, output_shape));

John Richardson