Blame - src/core/NEON/kernels/NEGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPointKernel.cpp - ml/ComputeLibrary

2017-12-07 09:26:56 +0000

[diff] [blame]

149

}

150

151

// Compute left-over elements

152

for(; x < window_end_x; ++x)

Gian Marco

2017-11-28 09:10:03 +0000

[diff] [blame]

153

{

Gian Marco

2017-12-07 09:26:56 +0000

[diff] [blame]

154

const int32_t bias_value = *(reinterpret_cast<const int32_t *>(bias.ptr()) + x);

155

int32_t in_value = *(reinterpret_cast<const int32_t *>(in.ptr()) + x);

Gian Marco

2017-11-28 09:10:03 +0000

[diff] [blame]

156

Gian Marco

2017-12-07 09:26:56 +0000

[diff] [blame]

157

// Add bias

158

in_value += bias_value;

Gian Marco

2017-12-07 09:26:56 +0000

[diff] [blame]

159

// Finalize and store the result

George Wort

2d7e683

2019-02-22 16:37:41 +0000

[diff] [blame]

160

*(out.ptr() + x) = finalize_quantization<is_bounded_relu>(in_value, _result_fixedpoint_multiplier, _result_shift, _result_offset_after_shift, static_cast<uint8_t>(_min), static_cast<uint8_t>(_max));

Gian Marco

2017-12-07 09:26:56 +0000

[diff] [blame]

161

}

Gian Marco

2017-11-28 09:10:03 +0000

[diff] [blame]

162

},

Georgios Pinitas

2018-11-08 10:22:01 +0000

[diff] [blame]

163

in, out, bias);

Gian Marco

2017-11-28 09:10:03 +0000

[diff] [blame]

164

}

165

else

166

{

Michalis Spyrou

a4f378d

2019-04-26 14:54:54 +0100

[diff] [blame]

167

execute_window_loop(win_collapsed, [&](const Coordinates &)

Gian Marco

2017-11-28 09:10:03 +0000

[diff] [blame]

168

{

Gian Marco

2017-12-07 09:26:56 +0000

[diff] [blame]

169

// Compute 16 elements per iteration

170

int x = window_start_x;

171

for(; x <= (window_end_x - window_step_x); x += window_step_x)

Gian Marco

2017-11-28 09:10:03 +0000

[diff] [blame]

172

{

Gian Marco

2017-12-07 09:26:56 +0000

[diff] [blame]

173

int32x4x4_t in_s32 =

Gian Marco

2017-11-28 09:10:03 +0000

[diff] [blame]

174

{

Gian Marco

2017-12-07 09:26:56 +0000

[diff] [blame]

175

{

176

vld1q_s32(reinterpret_cast<const int32_t *>(in.ptr()) + x + 0),

177

vld1q_s32(reinterpret_cast<const int32_t *>(in.ptr()) + x + 4),

178

vld1q_s32(reinterpret_cast<const int32_t *>(in.ptr()) + x + 8),

179

vld1q_s32(reinterpret_cast<const int32_t *>(in.ptr()) + x + 12)

180

}

181

};

Gian Marco

2017-11-28 09:10:03 +0000

[diff] [blame]

182

Georgios Pinitas

2018-11-08 10:22:01 +0000

[diff] [blame]

183

vst1q_u8(out.ptr() + x, finalize_quantization<is_bounded_relu>(in_s32, _result_fixedpoint_multiplier, _result_shift, result_offset_after_shift_s32, min_u8, max_u8));

Gian Marco

2017-12-07 09:26:56 +0000

[diff] [blame]

184

}

185

186

// Compute left-over elements

187

for(; x < window_end_x; ++x)

188

{

George Wort

2d7e683

2019-02-22 16:37:41 +0000

[diff] [blame]

189

const int32_t in_value = *(reinterpret_cast<const int32_t *>(in.ptr()) + x);

Gian Marco

2017-12-07 09:26:56 +0000

[diff] [blame]

190

191

// Finalize and store the result

George Wort

2d7e683

2019-02-22 16:37:41 +0000

[diff] [blame]

192

*(out.ptr() + x) = finalize_quantization<is_bounded_relu>(in_value, _result_fixedpoint_multiplier, _result_shift, _result_offset_after_shift, static_cast<uint8_t>(_min), static_cast<uint8_t>(_max));

Gian Marco

2017-12-07 09:26:56 +0000

[diff] [blame]

193

}

Gian Marco

2017-11-28 09:10:03 +0000

[diff] [blame]

194

},

Georgios Pinitas

2018-11-08 10:22:01 +0000

[diff] [blame]

195

in, out);

Gian Marco

2017-11-28 09:10:03 +0000

[diff] [blame]

}

}

NEGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPointKernel::NEGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPointKernel()

Georgios Pinitas

2018-11-08 10:22:01 +0000

[diff] [blame]

200

: _func(nullptr), _input(nullptr), _bias(nullptr), _output(nullptr), _result_fixedpoint_multiplier(0), _result_shift(0), _result_offset_after_shift(0), _min(0), _max(0)

Gian Marco

2017-11-28 09:10:03 +0000

[diff] [blame]

{

}

void NEGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPointKernel::configure(const ITensor *input, const ITensor *bias, ITensor *output, int result_fixedpoint_multiplier, int result_shift,

Georgios Pinitas

2018-11-08 10:22:01 +0000

[diff] [blame]

205

int result_offset_after_shift, int min, int max)

Gian Marco

2017-11-28 09:10:03 +0000

[diff] [blame]

206

{

207

// Perform validate step

208

ARM_COMPUTE_ERROR_ON_NULLPTR(input, output);

Georgios Pinitas

2018-11-08 10:22:01 +0000

[diff] [blame]

209

ARM_COMPUTE_ERROR_THROW_ON(validate_arguments(input->info(), (bias != nullptr) ? bias->info() : nullptr, output->info(), min, max));

Gian Marco

2017-11-28 09:10:03 +0000

[diff] [blame]

_input = input;

_bias = bias;

_output = output;

_result_fixedpoint_multiplier = result_fixedpoint_multiplier;

215

_result_shift = result_shift;

216

_result_offset_after_shift = result_offset_after_shift;

_min = min;

_max = max;

// Configure kernel window

Georgios Pinitas

5a59453

2018-12-03 14:30:05 +0000

[diff] [blame]

221

auto win_config = validate_and_configure_window(input->info(), output->info());

Gian Marco

2017-11-28 09:10:03 +0000

[diff] [blame]

222

ARM_COMPUTE_ERROR_THROW_ON(win_config.first);

223

INEKernel::configure(win_config.second);

224

225

// Check if we need to clamp the result using min and max

Giorgio Arena

1856ff7

2020-02-07 13:46:45 +0000

[diff] [blame^]

226

const bool is_bounded_relu = !(min <= 0 && max >= 255);

Gian Marco

2017-11-28 09:10:03 +0000

[diff] [blame]

227

_func = is_bounded_relu ? &NEGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPointKernel::run<true> : &NEGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPointKernel::run<false>;

228

}

229

Georgios Pinitas

2018-11-08 10:22:01 +0000

[diff] [blame]

230

Status NEGEMMLowpQuantizeDownInt32ToUint8ScaleByFixedPointKernel::validate(const ITensorInfo *input, const ITensorInfo *bias, const ITensorInfo *output, int min, int max)

Gian Marco