Blame - arm_compute/runtime/CL/functions/CLLSTMLayerQuantized.h - ml/ComputeLibrary

* @param[out] output_state_out Destination tensor. Output is a 2D tensor with dimensions [output_size, batch_size].Data types supported: Same as @p input.

101

*/

102

void configure(const ICLTensor *input,

103

const ICLTensor *input_to_input_weights, const ICLTensor *input_to_forget_weights, const ICLTensor *input_to_cell_weights, const ICLTensor *input_to_output_weights,

104

const ICLTensor *recurrent_to_input_weights, const ICLTensor *recurrent_to_forget_weights, const ICLTensor *recurrent_to_cell_weights, const ICLTensor *recurrent_to_output_weights,

105

const ICLTensor *input_gate_bias, const ICLTensor *forget_gate_bias, const ICLTensor *cell_bias, const ICLTensor *output_gate_bias,

106

ICLTensor *cell_state_in, const ICLTensor *output_state_in,

107

ICLTensor *cell_state_out, ICLTensor *output_state_out);

Manuel Bottini

2b84be5

2020-04-08 10:15:51 +0100

[diff] [blame]

108

/** Initialize function's tensors.

109

*

110

* @param[in] compile_context The compile context to be used.

111

* @param[in] input Source tensor. Input is a 2D tensor with dimensions [input_size, batch_size]. Data types supported: QASYMM8.

112

* @param[in] input_to_input_weights 2D weights tensor with dimensions [input_size, output_size]. Data type supported: Same as @p input.

113

* @param[in] input_to_forget_weights 2D weights tensor with dimensions [input_size, output_size]. Data type supported: Same as @p input.

114

* @param[in] input_to_cell_weights 2D weights tensor with dimensions [input_size, output_size]. Data type supported: Same as @p input.

115

* @param[in] input_to_output_weights 2D weights tensor with dimensions [input_size, output_size]. Data type supported: Same as @p input.

116

* @param[in] recurrent_to_input_weights 2D weights tensor with dimensions [output_size, output_size]. Data type supported: Same as @p input.

117

* @param[in] recurrent_to_forget_weights 2D weights tensor with dimensions [output_size, output_size]. Data type supported: Same as @p input.

118

* @param[in] recurrent_to_cell_weights 2D weights tensor with dimensions [output_size, output_size]. Data type supported: Same as @p input.

119

* @param[in] recurrent_to_output_weights 2D weights tensor with dimensions [output_size, output_size]. Data type supported: Same as @p input.

120

* @param[in] input_gate_bias 1D weights tensor with dimensions [output_size]. Data type supported: S32.

121

* @param[in] forget_gate_bias 1D weights tensor with dimensions [output_size]. Data type supported: S32.

122

* @param[in] cell_bias 1D weights tensor with dimensions [output_size]. Data type supported: S32.

123

* @param[in] output_gate_bias 1D weights tensor with dimensions [output_size]. Data type supported: S32.

124

* @param[in] cell_state_in 2D tensor with dimensions [output_size, batch_size]. Data type supported: QSYMM16.

125

* @param[in] output_state_in 2D tensor with dimensions [output_size, batch_size]. Data type supported: Same as @p input.

126

* @param[out] cell_state_out Destination tensor. Output is a 2D tensor with dimensions [output_size, batch_size]. Data type supported: QSYMM16.

127

* @param[out] output_state_out Destination tensor. Output is a 2D tensor with dimensions [output_size, batch_size].Data types supported: Same as @p input.

128

*/

129

void configure(const CLCompileContext &compile_context, const ICLTensor *input,

130

const ICLTensor *input_to_input_weights, const ICLTensor *input_to_forget_weights, const ICLTensor *input_to_cell_weights, const ICLTensor *input_to_output_weights,

131

const ICLTensor *recurrent_to_input_weights, const ICLTensor *recurrent_to_forget_weights, const ICLTensor *recurrent_to_cell_weights, const ICLTensor *recurrent_to_output_weights,

132

const ICLTensor *input_gate_bias, const ICLTensor *forget_gate_bias, const ICLTensor *cell_bias, const ICLTensor *output_gate_bias,

133

ICLTensor *cell_state_in, const ICLTensor *output_state_in,

134

ICLTensor *cell_state_out, ICLTensor *output_state_out);

Manuel Bottini

10c53f1

2019-07-17 16:11:53 +0100

[diff] [blame]

135

136

/** Static function to check if given info will lead to a valid configuration of @ref CLLSTMLayerQuantized

137

*

138

* @param[in] input Source tensor info. Input is a 2D tensor info with dimensions [input_size, batch_size]. Data types supported: QASYMM8.

139

* @param[in] input_to_input_weights 2D weights tensor info with dimensions [input_size, output_size]. Data type supported: Same as @p input.

140

* @param[in] input_to_forget_weights 2D weights tensor info with dimensions [input_size, output_size]. Data type supported: Same as @p input.

141

* @param[in] input_to_cell_weights 2D weights tensor info with dimensions [input_size, output_size]. Data type supported: Same as @p input.

142

* @param[in] input_to_output_weights 2D weights tensor info with dimensions [input_size, output_size]. Data type supported: Same as @p input.

143

* @param[in] recurrent_to_input_weights 2D weights tensor info with dimensions [output_size, output_size]. Data type supported: Same as @p input.

144

* @param[in] recurrent_to_forget_weights 2D weights tensor info with dimensions [output_size, output_size]. Data type supported: Same as @p input.

145

* @param[in] recurrent_to_cell_weights 2D weights tensor info with dimensions [output_size, output_size]. Data type supported: Same as @p input.

146

* @param[in] recurrent_to_output_weights 2D weights tensor info with dimensions [output_size, output_size]. Data type supported: Same as @p input.

147

* @param[in] input_gate_bias 1D weights tensor info with dimensions [output_size]. Data type supported: S32.

148

* @param[in] forget_gate_bias 1D weights tensor info with dimensions [output_size]. Data type supported: S32.

149

* @param[in] cell_bias 1D weights tensor info with dimensions [output_size]. Data type supported: S32.

150

* @param[in] output_gate_bias 1D weights tensor info with dimensions [output_size]. Data type supported: S32.

151

* @param[in] cell_state_in 2D tensor info with dimensions [output_size, batch_size]. Data type supported: QSYMM16.

152

* @param[in] output_state_in 2D tensor info with dimensions [output_size, batch_size]. Data type supported: Same as @p input.

153

* @param[out] cell_state_out Destination tensor info. Output is a 2D tensor info with dimensions [output_size, batch_size]. Data type supported: QSYMM16.

154

* @param[out] output_state_out Destination tensor info. Output is a 2D tensor info with dimensions [output_size, batch_size].Data types supported: Same as @p input.

*

* @return a status

*/

static Status validate(const ITensorInfo *input,

159

const ITensorInfo *input_to_input_weights, const ITensorInfo *input_to_forget_weights, const ITensorInfo *input_to_cell_weights, const ITensorInfo *input_to_output_weights,

160

const ITensorInfo *recurrent_to_input_weights, const ITensorInfo *recurrent_to_forget_weights, const ITensorInfo *recurrent_to_cell_weights, const ITensorInfo *recurrent_to_output_weights,

161

const ITensorInfo *input_gate_bias, const ITensorInfo *forget_gate_bias, const ITensorInfo *cell_bias, const ITensorInfo *output_gate_bias,

162

const ITensorInfo *cell_state_in, const ITensorInfo *output_state_in,

163

const ITensorInfo *cell_state_out, const ITensorInfo *output_state_out);

164

165

// Inherited methods overridden:

166

void run() override;

167

void prepare() override;

168

169

private:

Georgios Pinitas

26014cf

2019-09-09 19:00:57 +0100

[diff] [blame]

170

MemoryGroup _memory_group;

Manuel Bottini

10c53f1

2019-07-17 16:11:53 +0100

[diff] [blame]

171

172

// Functions used

173

CLGEMMLowpMatrixMultiplyCore _gemmlowp;

174

CLGEMMLowpQuantizeDownInt32ToInt16ScaleByFixedPoint _output_stage;

175

CLTranspose _transpose_weights;

176

CLConcatenateLayer _concat_input_weights;

177

CLConcatenateLayer _concat_recurrent_weights;

178

CLConcatenateLayer _concat_weights;

179

CLConcatenateLayer _concat_inputs;

180

CLConcatenateLayer _concat_bias;

181

CLActivationLayer _sigmoid_forget_gate;

182

CLActivationLayer _sigmoid_input_gate;

183

CLActivationLayer _sigmoid_output_gate;

184

CLActivationLayer _tanh_modulation_gate;

185

CLActivationLayer _tanh_output_state;

186

CLArithmeticAddition _add_cell_state_tmps;

187

CLArithmeticAddition _add2;

188

CLPixelWiseMultiplication _mul_forget_gate_cell_state;

189

CLPixelWiseMultiplication _mul_input_gate_input_mod_gate;

190

CLPixelWiseMultiplication _mul_output_state_tmp_output_gate;

191

CLSlice _slice_input_tensor;

192

CLSlice _slice_forget_tensor;

193

CLSlice _slice_cell_tensor;

194

CLSlice _slice_output_tensor;

195

CLDequantizationLayer _dequantize;

196

CLQuantizationLayer _quantize;

197

198

// Tensor pointers

199

const ICLTensor *_input_to_input_weights;

200

const ICLTensor *_input_to_forget_weights;

201

const ICLTensor *_input_to_cell_weights;

202

const ICLTensor *_input_to_output_weights;

203

const ICLTensor *_recurrent_to_input_weights;

204

const ICLTensor *_recurrent_to_forget_weights;

205

const ICLTensor *_recurrent_to_cell_weights;

206

const ICLTensor *_recurrent_to_output_weights;

207

const ICLTensor *_input_gate_bias;

208

const ICLTensor *_forget_gate_bias;

209

const ICLTensor *_cell_bias;

210

const ICLTensor *_output_gate_bias;

211

212

// Temporary tensors

213

CLTensor _recurrent_weights;

214

CLTensor _input_weights;

215

CLTensor _weights;

216

CLTensor _input;

217

CLTensor _weights_transposed;

218

CLTensor _output_highp;

219

CLTensor _output_lowp;

220

CLTensor _bias;

221

CLTensor _forget_gate_input;

222

CLTensor _input_gate_input;

223

CLTensor _output_gate_input;

224

CLTensor _input_modulation_gate_input;

225

CLTensor _forget_gate_output;

226

CLTensor _input_gate_output;

227

CLTensor _output_gate_output;

228

CLTensor _input_modulation_gate_output;

229

CLTensor _cell_state_tmp1;

230

CLTensor _cell_state_tmp2;

231

CLTensor _output_state_tmp;

232

CLTensor _output_state_out_symm;

233

CLTensor _output_state_out_f32;

bool _is_prepared;

};

} // namespace arm_compute

Michalis Spyrou

f464337

2019-11-29 16:17:13 +0000

[diff] [blame]

238

#endif /* ARM_COMPUTE_CLLSTMLAYERQUANTIZED_H */