Blame - src/core/CL/kernels/CLDepthwiseConvolutionLayer3x3NCHWKernel.cpp - ml/ComputeLibrary

2017-08-01 16:09:33 +0100

[diff] [blame]

{

}

Giorgio Arena

2018-01-31 10:30:59 +0000

[diff] [blame]

200

BorderSize CLDepthwiseConvolutionLayer3x3NCHWKernel::border_size() const

Giorgio Arena

2017-08-01 16:09:33 +0100

[diff] [blame]

{

return _border_size;

}

Giorgio Arena

2018-01-31 10:30:59 +0000

[diff] [blame]

205

void CLDepthwiseConvolutionLayer3x3NCHWKernel::configure(const ICLTensor *input, const ICLTensor *weights, const ICLTensor *biases, ICLTensor *output, const PadStrideInfo &conv_info,

Giorgio Arena

7657224

2018-04-04 17:44:26 +0100

[diff] [blame]

206

unsigned int depth_multiplier,

Giorgio Arena

dfca60b

2018-01-31 10:30:59 +0000

[diff] [blame]

207

ActivationLayerInfo act_info)

Giorgio Arena

2017-08-01 16:09:33 +0100

[diff] [blame]

208

{

Giorgio Arena

2018-04-23 16:16:21 +0100

[diff] [blame]

209

ARM_COMPUTE_ERROR_ON_NULLPTR(input, weights, output);

Giorgio Arena

2017-08-01 16:09:33 +0100

[diff] [blame]

210

Giorgio Arena

287b570

2018-02-16 11:01:04 +0000

[diff] [blame]

211

bool is_qasymm = is_data_type_quantized_asymmetric(input->info()->data_type());

212

Giorgio Arena

2017-08-01 16:09:33 +0100

[diff] [blame]

213

_input = input;

214

_output = output;

215

_weights = weights;

Georgios Pinitas

81a26ad

2017-10-23 20:29:30 +0100

[diff] [blame]

216

_biases = biases;

Giorgio Arena

2017-08-01 16:09:33 +0100

[diff] [blame]

217

_conv_stride_x = conv_info.stride().first;

218

_conv_stride_y = conv_info.stride().second;

Jaroslaw Rzepecki

16cdf89

2017-10-27 13:15:03 +0100

[diff] [blame]

219

_conv_pad_left = conv_info.pad_left();

220

_conv_pad_top = conv_info.pad_top();

221

_border_size = BorderSize(_conv_pad_top, conv_info.pad_right(), conv_info.pad_bottom(), _conv_pad_left);

Giorgio Arena

2017-08-01 16:09:33 +0100

[diff] [blame]

222

223

// Set build options

Dmitry Savenko

d7295b7

2017-11-20 22:00:08 +0700

[diff] [blame]

224

CLBuildOptions build_opts;

Giorgio Arena

7657224

2018-04-04 17:44:26 +0100

[diff] [blame]

225

build_opts.add_option("-DDEPTH_MULTIPLIER=" + support::cpp11::to_string(depth_multiplier));

Dmitry Savenko

d7295b7

2017-11-20 22:00:08 +0700

[diff] [blame]

226

build_opts.add_option("-DCONV_STRIDE_X=" + support::cpp11::to_string(_conv_stride_x));

227

build_opts.add_option_if(_biases != nullptr, "-DHAS_BIAS");

Giorgio Arena

2017-08-01 16:09:33 +0100

[diff] [blame]

228

Giorgio Arena

287b570

2018-02-16 11:01:04 +0000

[diff] [blame]

229

if(is_qasymm)

230

{

231

float multiplier = _input->info()->quantization_info().scale * _weights->info()->quantization_info().scale / _output->info()->quantization_info().scale;

232

int output_multiplier = 0;

233

int output_shift = 0;

234

quantization::calculate_quantized_multiplier_less_than_one(multiplier, &output_multiplier, &output_shift);

235

236

build_opts.add_option("-DCONV_STRIDE_Y=" + support::cpp11::to_string(_conv_stride_y));

237

build_opts.add_option("-DINPUT_OFFSET=" + support::cpp11::to_string(-_input->info()->quantization_info().offset));

238

build_opts.add_option("-DWEIGHTS_OFFSET=" + support::cpp11::to_string(-_weights->info()->quantization_info().offset));

239

build_opts.add_option("-DOUTPUT_OFFSET=" + support::cpp11::to_string(_output->info()->quantization_info().offset));

240

build_opts.add_option("-DK_OFFSET=" + support::cpp11::to_string(9 * input->info()->quantization_info().offset * weights->info()->quantization_info().offset));

241

build_opts.add_option("-DOUTPUT_MULTIPLIER=" + support::cpp11::to_string(output_multiplier));

242

build_opts.add_option("-DOUTPUT_SHIFT=" + support::cpp11::to_string(output_shift));

Giorgio Arena

99ac60b

2018-02-16 15:17:23 +0000

[diff] [blame]

243

244

if(act_info.enabled())

245

{

246

const int a_val = input->info()->quantization_info().quantize(act_info.a(), RoundingPolicy::TO_NEAREST_UP);

247

const int b_val = input->info()->quantization_info().quantize(act_info.b(), RoundingPolicy::TO_NEAREST_UP);

248

const int o1 = input->info()->quantization_info().offset;

249

250

build_opts.add_option("-DFUSED_ACTIVATION=" + lower_string(string_from_activation_func(act_info.activation())));

251

build_opts.add_option("-DA_VAL=" + support::cpp11::to_string(a_val));

252

build_opts.add_option("-DB_VAL=" + support::cpp11::to_string(b_val));

253

build_opts.add_option("-DCONST_0=" + support::cpp11::to_string(o1));

254

255

if(output != nullptr)

256

{

257

const float s1 = input->info()->quantization_info().scale;

258

const float s2 = output->info()->quantization_info().scale;

259

const int o2 = output->info()->quantization_info().offset;

260

261

if(o1 != o2 || s1 != s2)

262

{

263

build_opts.add_option("-DS1_VAL=" + float_to_string_with_full_precision(s1));

264

build_opts.add_option("-DS2_VAL=" + float_to_string_with_full_precision(s2));

265

build_opts.add_option("-DO1_VAL=" + support::cpp11::to_string(o1));

266

build_opts.add_option("-DO2_VAL=" + support::cpp11::to_string(o2));

267

}

268

}

269

}

Giorgio Arena

287b570

2018-02-16 11:01:04 +0000

[diff] [blame]

270

}

271

Gian Marco

2018-02-01 16:57:48 +0000

[diff] [blame]

272

// Configure kernel window

Giorgio Arena

2018-04-23 16:16:21 +0100

[diff] [blame]

273

std::string kernel_name;

274

const GPUTarget gpu_target = get_target();

Gian Marco

2018-02-01 16:57:48 +0000

[diff] [blame]

275

Giorgio Arena

2018-04-23 16:16:21 +0100

[diff] [blame]

276

auto win_config = validate_and_configure_window(input->info(), weights->info(), output->info(), conv_info, depth_multiplier, gpu_target, kernel_name);

277

ARM_COMPUTE_ERROR_THROW_ON(win_config.first);

278

ICLKernel::configure(win_config.second);

Gian Marco

2018-02-01 16:57:48 +0000

[diff] [blame]

279

280

_kernel = static_cast<cl::Kernel>(CLKernelLibrary::get().create_kernel(kernel_name, build_opts.options()));

Giorgio Arena

2017-08-01 16:09:33 +0100

[diff] [blame]

281

Gian Marco

85e6f51

2018-02-01 16:57:48 +0000

[diff] [blame]

282

// Set config_id for enabling LWS tuning

Gian Marco

2018-02-01 16:57:48 +0000

[diff] [blame]

283

_config_id = kernel_name;

284

_config_id += "_";

Gian Marco

85e6f51

2018-02-01 16:57:48 +0000

[diff] [blame]

285

_config_id += lower_string(string_from_data_type(input->info()->data_type()));

286

_config_id += "_";

287

_config_id += support::cpp11::to_string(input->info()->dimension(0));

288

_config_id += "_";

289

_config_id += support::cpp11::to_string(input->info()->dimension(1));

290

_config_id += "_";

291

_config_id += support::cpp11::to_string(input->info()->dimension(2));

292

_config_id += "_";

293

_config_id += support::cpp11::to_string(output->info()->dimension(0));

294

_config_id += "_";

295

_config_id += support::cpp11::to_string(output->info()->dimension(1));

Giorgio Arena

2017-08-01 16:09:33 +0100

[diff] [blame]

296

}

297

Giorgio Arena