Blame - arm_compute/runtime/CL/functions/CLLSTMLayerQuantized.h - ml/ComputeLibrary

* @param[out] output_state_out Destination tensor. Output is a 2D tensor with dimensions [output_size, batch_size].Data types supported: Same as @p input.

93

*/

94

void configure(const ICLTensor *input,

95

const ICLTensor *input_to_input_weights, const ICLTensor *input_to_forget_weights, const ICLTensor *input_to_cell_weights, const ICLTensor *input_to_output_weights,

96

const ICLTensor *recurrent_to_input_weights, const ICLTensor *recurrent_to_forget_weights, const ICLTensor *recurrent_to_cell_weights, const ICLTensor *recurrent_to_output_weights,

97

const ICLTensor *input_gate_bias, const ICLTensor *forget_gate_bias, const ICLTensor *cell_bias, const ICLTensor *output_gate_bias,

98

ICLTensor *cell_state_in, const ICLTensor *output_state_in,

99

ICLTensor *cell_state_out, ICLTensor *output_state_out);

100

101

/** Static function to check if given info will lead to a valid configuration of @ref CLLSTMLayerQuantized

102

*

103

* @param[in] input Source tensor info. Input is a 2D tensor info with dimensions [input_size, batch_size]. Data types supported: QASYMM8.

104

* @param[in] input_to_input_weights 2D weights tensor info with dimensions [input_size, output_size]. Data type supported: Same as @p input.

105

* @param[in] input_to_forget_weights 2D weights tensor info with dimensions [input_size, output_size]. Data type supported: Same as @p input.

106

* @param[in] input_to_cell_weights 2D weights tensor info with dimensions [input_size, output_size]. Data type supported: Same as @p input.

107

* @param[in] input_to_output_weights 2D weights tensor info with dimensions [input_size, output_size]. Data type supported: Same as @p input.

108

* @param[in] recurrent_to_input_weights 2D weights tensor info with dimensions [output_size, output_size]. Data type supported: Same as @p input.

109

* @param[in] recurrent_to_forget_weights 2D weights tensor info with dimensions [output_size, output_size]. Data type supported: Same as @p input.

110

* @param[in] recurrent_to_cell_weights 2D weights tensor info with dimensions [output_size, output_size]. Data type supported: Same as @p input.

111

* @param[in] recurrent_to_output_weights 2D weights tensor info with dimensions [output_size, output_size]. Data type supported: Same as @p input.

112

* @param[in] input_gate_bias 1D weights tensor info with dimensions [output_size]. Data type supported: S32.

113

* @param[in] forget_gate_bias 1D weights tensor info with dimensions [output_size]. Data type supported: S32.

114

* @param[in] cell_bias 1D weights tensor info with dimensions [output_size]. Data type supported: S32.

115

* @param[in] output_gate_bias 1D weights tensor info with dimensions [output_size]. Data type supported: S32.

116

* @param[in] cell_state_in 2D tensor info with dimensions [output_size, batch_size]. Data type supported: QSYMM16.

117

* @param[in] output_state_in 2D tensor info with dimensions [output_size, batch_size]. Data type supported: Same as @p input.

118

* @param[out] cell_state_out Destination tensor info. Output is a 2D tensor info with dimensions [output_size, batch_size]. Data type supported: QSYMM16.

119

* @param[out] output_state_out Destination tensor info. Output is a 2D tensor info with dimensions [output_size, batch_size].Data types supported: Same as @p input.

*

* @return a status

*/

static Status validate(const ITensorInfo *input,

124

const ITensorInfo *input_to_input_weights, const ITensorInfo *input_to_forget_weights, const ITensorInfo *input_to_cell_weights, const ITensorInfo *input_to_output_weights,

125

const ITensorInfo *recurrent_to_input_weights, const ITensorInfo *recurrent_to_forget_weights, const ITensorInfo *recurrent_to_cell_weights, const ITensorInfo *recurrent_to_output_weights,

126

const ITensorInfo *input_gate_bias, const ITensorInfo *forget_gate_bias, const ITensorInfo *cell_bias, const ITensorInfo *output_gate_bias,

127

const ITensorInfo *cell_state_in, const ITensorInfo *output_state_in,

128

const ITensorInfo *cell_state_out, const ITensorInfo *output_state_out);

129

130

// Inherited methods overridden:

131

void run() override;

132

void prepare() override;

133

134

private:

Georgios Pinitas

26014cf

2019-09-09 19:00:57 +0100

[diff] [blame]

135

MemoryGroup _memory_group;

Manuel Bottini

10c53f1

2019-07-17 16:11:53 +0100

[diff] [blame]

136

137

// Functions used

138

CLGEMMLowpMatrixMultiplyCore _gemmlowp;

139

CLGEMMLowpQuantizeDownInt32ToInt16ScaleByFixedPoint _output_stage;

140

CLTranspose _transpose_weights;

141

CLConcatenateLayer _concat_input_weights;

142

CLConcatenateLayer _concat_recurrent_weights;

143

CLConcatenateLayer _concat_weights;

144

CLConcatenateLayer _concat_inputs;

145

CLConcatenateLayer _concat_bias;

146

CLActivationLayer _sigmoid_forget_gate;

147

CLActivationLayer _sigmoid_input_gate;

148

CLActivationLayer _sigmoid_output_gate;

149

CLActivationLayer _tanh_modulation_gate;

150

CLActivationLayer _tanh_output_state;

151

CLArithmeticAddition _add_cell_state_tmps;

152

CLArithmeticAddition _add2;

153

CLPixelWiseMultiplication _mul_forget_gate_cell_state;

154

CLPixelWiseMultiplication _mul_input_gate_input_mod_gate;

155

CLPixelWiseMultiplication _mul_output_state_tmp_output_gate;

156

CLSlice _slice_input_tensor;

157

CLSlice _slice_forget_tensor;

158

CLSlice _slice_cell_tensor;

159

CLSlice _slice_output_tensor;

160

CLDequantizationLayer _dequantize;

161

CLQuantizationLayer _quantize;

162

163

// Tensor pointers

164

const ICLTensor *_input_to_input_weights;

165

const ICLTensor *_input_to_forget_weights;

166

const ICLTensor *_input_to_cell_weights;

167

const ICLTensor *_input_to_output_weights;

168

const ICLTensor *_recurrent_to_input_weights;

169

const ICLTensor *_recurrent_to_forget_weights;

170

const ICLTensor *_recurrent_to_cell_weights;

171

const ICLTensor *_recurrent_to_output_weights;

172

const ICLTensor *_input_gate_bias;

173

const ICLTensor *_forget_gate_bias;

174

const ICLTensor *_cell_bias;

175

const ICLTensor *_output_gate_bias;

176

177

// Temporary tensors

178

CLTensor _recurrent_weights;

179

CLTensor _input_weights;

180

CLTensor _weights;

181

CLTensor _input;

182

CLTensor _weights_transposed;

183

CLTensor _output_highp;

184

CLTensor _output_lowp;

185

CLTensor _bias;

186

CLTensor _forget_gate_input;

187

CLTensor _input_gate_input;

188

CLTensor _output_gate_input;

189

CLTensor _input_modulation_gate_input;

190

CLTensor _forget_gate_output;

191

CLTensor _input_gate_output;

192

CLTensor _output_gate_output;

193

CLTensor _input_modulation_gate_output;

194

CLTensor _cell_state_tmp1;

195

CLTensor _cell_state_tmp2;

196

CLTensor _output_state_tmp;

197

CLTensor _output_state_out_symm;

198

CLTensor _output_state_out_f32;

bool _is_prepared;

};

} // namespace arm_compute

Michalis Spyrou

f464337

2019-11-29 16:17:13 +0000

[diff] [blame]

203

#endif /* ARM_COMPUTE_CLLSTMLAYERQUANTIZED_H */