Blame - src/core/CL/kernels/CLStridedSliceKernel.cpp - ml/ComputeLibrary

const Coordinates starts_abs = arm_compute::helpers::tensor_transform::strided_slice_absolute_start_coords(input_shape, starts, final_strides, begin_mask);

118

const Coordinates ends_abs = arm_compute::helpers::tensor_transform::strided_slice_absolute_end_coords(input_shape, starts_abs, ends, final_strides, end_mask, shrink_axis_mask);

119

120

// Configure kernel window

121

auto win_config = validate_and_configure_window(input->info(), output->info(), starts, ends, strides, begin_mask, end_mask, shrink_axis_mask);

122

ARM_COMPUTE_ERROR_THROW_ON(win_config.first);

123

ICLKernel::configure_internal(win_config.second);

124

125

// Create build options

126

CLBuildOptions build_opts;

127

build_opts.add_option("-DDATA_TYPE=" + get_cl_type_from_data_type(input->info()->data_type()));

128

for(unsigned int i = 0; i < input_shape.num_dimensions(); ++i)

129

{

130

build_opts.add_option("-DSTART_" + support::cpp11::to_string(i) + "=" + support::cpp11::to_string(starts_abs[i]));

131

build_opts.add_option("-DSTRIDE_" + support::cpp11::to_string(i) + "=" + support::cpp11::to_string(final_strides[i]));

132

}

133

build_opts.add_option_if_else(input_shape.num_dimensions() > 2,

134

"-DSRC_DEPTH=" + support::cpp11::to_string(input_shape.z()),

135

"-DSRC_DEPTH=1");

136

build_opts.add_option_if_else(_output->info()->num_dimensions() > 2,

137

"-DDST_DEPTH=" + support::cpp11::to_string(_output->info()->tensor_shape().z()),

"-DDST_DEPTH=1");

// Create kernel

_kernel = static_cast<cl::Kernel>(CLKernelLibrary::get().create_kernel("strided_slice", build_opts.options()));

142

143

// Set config_id for enabling LWS tuning

144

_config_id = "strided_slice";

145

_config_id += "_";

146

_config_id += lower_string(string_from_data_type(input->info()->data_type()));

147

for(unsigned int i = 0; i < input_shape.num_dimensions(); ++i)

148

{

149

_config_id += "_";

150

_config_id += support::cpp11::to_string(input->info()->dimension(i));

151

_config_id += "_";

152

_config_id += support::cpp11::to_string(starts_abs[i]);

153

_config_id += "_";

154

_config_id += support::cpp11::to_string(ends_abs[i]);

155

_config_id += "_";

156

_config_id += support::cpp11::to_string(final_strides[i]);

}

}

Status CLStridedSliceKernel::validate(const ITensorInfo *input, const ITensorInfo *output,

161

const Coordinates &starts, const Coordinates &ends, const BiStrides &strides,

162

int32_t begin_mask, int32_t end_mask, int32_t shrink_axis_mask)

163

{

164

ARM_COMPUTE_RETURN_ON_ERROR(validate_arguments(input, output, starts, ends, strides, begin_mask, end_mask, shrink_axis_mask));

165

ARM_COMPUTE_RETURN_ON_ERROR(validate_and_configure_window(input->clone().get(), output->clone().get(),

166

starts, ends, strides, begin_mask, end_mask, shrink_axis_mask)

.first);

return Status{};

}

void CLStridedSliceKernel::run(const Window &window, cl::CommandQueue &queue)

173

{

174

ARM_COMPUTE_ERROR_ON_UNCONFIGURED_KERNEL(this);

175

ARM_COMPUTE_ERROR_ON_INVALID_SUBWINDOW(ICLKernel::window(), window);

176

177

Window window_collapsed = window.collapse_if_possible(ICLKernel::window(), Window::DimZ);

178

Window slice = window_collapsed.first_slice_window_4D();

do

{

unsigned int idx = 0;

183

add_4D_tensor_argument(idx, _input, slice);

184

add_4D_tensor_argument(idx, _output, slice);

185

enqueue(queue, *this, slice, lws_hint());

186

}

187

while(window_collapsed.slide_window_slice_4D(slice));

188

}

189

} // namespace arm_compute