Blame - arm_compute/runtime/NEON/functions/NELSTMLayerQuantized.h - ml/ComputeLibrary

* @param[out] output_state_out Destination tensor. Output is a 2D tensor with dimensions [output_size, batch_size].Data types supported: Same as @p input.

105

*/

106

void configure(const ITensor *input,

107

const ITensor *input_to_input_weights, const ITensor *input_to_forget_weights, const ITensor *input_to_cell_weights, const ITensor *input_to_output_weights,

108

const ITensor *recurrent_to_input_weights, const ITensor *recurrent_to_forget_weights, const ITensor *recurrent_to_cell_weights, const ITensor *recurrent_to_output_weights,

109

const ITensor *input_gate_bias, const ITensor *forget_gate_bias, const ITensor *cell_bias, const ITensor *output_gate_bias,

110

ITensor *cell_state_in, const ITensor *output_state_in,

111

ITensor *cell_state_out, ITensor *output_state_out);

112

113

/** Static function to check if given info will lead to a valid configuration of @ref NELSTMLayer

114

*

115

* @param[in] input Source tensor info. Input is a 2D tensor info with dimensions [input_size, batch_size]. Data types supported: QASYMM8.

116

* @param[in] input_to_input_weights 2D weights tensor info with dimensions [input_size, output_size]. Data type supported: Same as @p input.

117

* @param[in] input_to_forget_weights 2D weights tensor info with dimensions [input_size, output_size]. Data type supported: Same as @p input.

118

* @param[in] input_to_cell_weights 2D weights tensor info with dimensions [input_size, output_size]. Data type supported: Same as @p input.

119

* @param[in] input_to_output_weights 2D weights tensor info with dimensions [input_size, output_size]. Data type supported: Same as @p input.

120

* @param[in] recurrent_to_input_weights 2D weights tensor info with dimensions [output_size, output_size]. Data type supported: Same as @p input.

121

* @param[in] recurrent_to_forget_weights 2D weights tensor info with dimensions [output_size, output_size]. Data type supported: Same as @p input.

122

* @param[in] recurrent_to_cell_weights 2D weights tensor info with dimensions [output_size, output_size]. Data type supported: Same as @p input.

123

* @param[in] recurrent_to_output_weights 2D weights tensor info with dimensions [output_size, output_size]. Data type supported: Same as @p input.

124

* @param[in] input_gate_bias 1D weights tensor info with dimensions [output_size]. Data type supported: S32.

125

* @param[in] forget_gate_bias 1D weights tensor info with dimensions [output_size]. Data type supported: S32.

126

* @param[in] cell_bias 1D weights tensor info with dimensions [output_size]. Data type supported: S32.

127

* @param[in] output_gate_bias 1D weights tensor info with dimensions [output_size]. Data type supported: S32.

128

* @param[in] cell_state_in 2D tensor info with dimensions [output_size, batch_size]. Data type supported: QSYMM16.

129

* @param[in] output_state_in 2D tensor info with dimensions [output_size, batch_size]. Data type supported: Same as @p input.

130

* @param[out] cell_state_out Destination tensor info. Output is a 2D tensor info with dimensions [output_size, batch_size]. Data type supported: QSYMM16.

131

* @param[out] output_state_out Destination tensor info. Output is a 2D tensor info with dimensions [output_size, batch_size].Data types supported: Same as @p input.

*

* @return a status

*/

static Status validate(const ITensorInfo *input,

136

const ITensorInfo *input_to_input_weights, const ITensorInfo *input_to_forget_weights, const ITensorInfo *input_to_cell_weights, const ITensorInfo *input_to_output_weights,

137

const ITensorInfo *recurrent_to_input_weights, const ITensorInfo *recurrent_to_forget_weights, const ITensorInfo *recurrent_to_cell_weights, const ITensorInfo *recurrent_to_output_weights,

138

const ITensorInfo *input_gate_bias, const ITensorInfo *forget_gate_bias, const ITensorInfo *cell_bias, const ITensorInfo *output_gate_bias,

139

const ITensorInfo *cell_state_in, const ITensorInfo *output_state_in,

140

const ITensorInfo *cell_state_out, const ITensorInfo *output_state_out);

141

142

// Inherited methods overridden:

143

void run() override;

144

void prepare() override;

145

146

private:

147

MemoryGroup _memory_group;

148

149

// Functions used

Manuel Bottini

ae58bdf

2021-06-17 17:18:45 +0100

[diff] [blame]

150

NEGEMMLowpMatrixMultiplyCore _gemmlowp;

151

NEGEMMLowpOutputStage _output_stage;

152

NETranspose _transpose_weights;

153

NEConcatenateLayer _concat_input_weights;

154

NEConcatenateLayer _concat_recurrent_weights;

155

NEConcatenateLayer _concat_weights;

156

NEConcatenateLayer _concat_inputs;

157

NEConcatenateLayer _concat_bias;

158

NEActivationLayer _sigmoid_forget_gate;

159

NEActivationLayer _sigmoid_input_gate;

160

NEActivationLayer _sigmoid_output_gate;

161

NEActivationLayer _tanh_modulation_gate;

162

NEActivationLayer _tanh_output_state;

163

NEArithmeticAddition _add1;

164

NEArithmeticAddition _add2;

165

NEPixelWiseMultiplication _mul1;

166

NEPixelWiseMultiplication _mul2;

167

NEPixelWiseMultiplication _mul3;

168

NESlice _slice_input_tensor;

169

NESlice _slice_forget_tensor;

170

NESlice _slice_cell_tensor;

171

NESlice _slice_output_tensor;

172

NEDequantizationLayer _dequantize;

173

NEQuantizationLayer _quantize;

Michalis Spyrou

ba27e44

2019-05-28 10:04:57 +0100

[diff] [blame]

174

175

// Tensor pointers

176

const ITensor *_input_to_input_weights;

177

const ITensor *_input_to_forget_weights;

178

const ITensor *_input_to_cell_weights;

179

const ITensor *_input_to_output_weights;

180

const ITensor *_recurrent_to_input_weights;

181

const ITensor *_recurrent_to_forget_weights;

182

const ITensor *_recurrent_to_cell_weights;

183

const ITensor *_recurrent_to_output_weights;

184

const ITensor *_input_gate_bias;

185

const ITensor *_forget_gate_bias;

186

const ITensor *_cell_bias;

187

const ITensor *_output_gate_bias;

188

189

// Temporary tensors

190

Tensor _recurrent_weights;

191

Tensor _input_weights;

192

Tensor _weights;

193

Tensor _input;

194

Tensor _weights_transposed;

195

Tensor _output_highp;

196

Tensor _output_lowp;

197

Tensor _bias;

198

Tensor _forget_gate_input;

199

Tensor _input_gate_input;

200

Tensor _output_gate_input;

201

Tensor _input_modulation_gate_input;

202

Tensor _forget_gate_output;

203

Tensor _input_gate_output;

204

Tensor _output_gate_output;

205

Tensor _input_modulation_gate_output;

206

Tensor _cell_state1;

207

Tensor _cell_state2;

208

Tensor _output_state_tmp;

209

Tensor _output_state_out_symm;

210

Tensor _output_state_out_f32;

bool _is_prepared;

};

} // namespace arm_compute

Michalis Spyrou

f464337

2019-11-29 16:17:13 +0000

[diff] [blame]

215

#endif /* ARM_COMPUTE_NELSTMLAYERQUANTIZED_H */