Blame - arm_compute/runtime/CL/functions/CLLSTMLayer.h - ml/ComputeLibrary

2018-03-22 14:55:08 +0000

[diff] [blame]

90

*/

Georgios Pinitas

2018-07-18 19:51:24 +0100

[diff] [blame]

91

void configure(const ICLTensor *input,

92

const ICLTensor *input_to_forget_weights, const ICLTensor *input_to_cell_weights, const ICLTensor *input_to_output_weights,

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

93

const ICLTensor *recurrent_to_forget_weights, const ICLTensor *recurrent_to_cell_weights, const ICLTensor *recurrent_to_output_weights,

Georgios Pinitas

2018-07-18 19:51:24 +0100

[diff] [blame]

94

const ICLTensor *forget_gate_bias, const ICLTensor *cell_bias, const ICLTensor *output_gate_bias,

95

const ICLTensor *output_state_in, const ICLTensor *cell_state_in,

96

ICLTensor *scratch_buffer, ICLTensor *output_state_out, ICLTensor *cell_state_out, ICLTensor *output,

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

97

const LSTMParams<ICLTensor> &lstm_params, const ActivationLayerInfo &activation_info, float cell_threshold = 0.f, float projection_threshold = 0.f);

98

99

/** Static function to check if given info will lead to a valid configuration of @ref CLLSTMLayer

100

*

Georgios Pinitas

2018-07-18 19:51:24 +0100

[diff] [blame]

101

* @param[in] input Source tensor. Input is a 2D tensor with dimensions [input_size, batch_size]. Data types supported: F16/F32.

102

* @param[in] input_to_forget_weights 2D weights tensor with dimensions [input_size, num_units]. Data type supported: Same as @p input.

103

* @param[in] input_to_cell_weights 2D weights tensor with dimensions [input_size, num_units]. Data type supported: Same as @p input.

104

* @param[in] input_to_output_weights 2D weights tensor with dimensions [input_size, num_units]. Data type supported: Same as @p input.

105

* @param[in] recurrent_to_forget_weights 2D weights tensor with dimensions [output_size, num_units]. Data type supported: Same as @p input.

106

* @param[in] recurrent_to_cell_weights 2D weights tensor with dimensions [output_size, num_units]. Data type supported: Same as @p input.

107

* @param[in] recurrent_to_output_weights 2D weights tensor with dimensions [output_size, num_units]. Data type supported: Same as @p input.

108

* @param[in] forget_gate_bias 1D weights tensor with dimensions [num_units]. Data type supported: Same as @p input.

109

* @param[in] cell_bias 1D weights tensor with dimensions [num_units]. Data type supported: Same as @p input.

110

* @param[in] output_gate_bias 1D weights tensor with dimensions [num_units]. Data type supported: Same as @p input.

111

* @param[in] output_state_in 2D weights tensor with dimensions [output_size, batch_size]. Data type supported: Same as @p input.

112

* @param[in] cell_state_in 2D tensor with dimensions [num_units, batch_size]. Data type supported: Same as @p input.

113

* @param[in] scratch_buffer 2D tensor with dimensions [num_units * 4, batch_size] with CIFG or [num_units * 3, batch_size] without CIGF. Data type supported: Same as @p input.

114

* @param[in] output_state_out 2D weights tensor with dimensions [output_size, batch_size]. Data type supported: Same as @p input.

115

* @param[in] cell_state_out 2D tensor with dimensions [num_units, batch_size]. Data type supported: Same as @p input.

116

* @param[in] output Destination tensor. Output is a 2D tensor with dimensions [output_size, batch_size].

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

117

* Data types supported: Same as @p input.

118

* @param[in] lstm_params (Optional) Weights tensors used in peephole optimization:

119

* input_to_input_weights 2D weights tensor with dimensions [input_size, num_units]. Data type supported: Same as @p input.

120

* recurrent_to_input_weights 2D weights tensor with dimensions [output_size, num_units]. Data type supported: Same as @p input.

121

* cell_to_input_weights 1D weights tensor with dimensions [num_units]. Can be nullptr. Data type supported: Same as @p input.

122

* cell_to_forget_weights 1D weights tensor with dimensions [num_units]. Data type supported: Same as @p input.

123

* cell_to_output_weights 1D weights tensor with dimensions [num_units]. Data type supported: Same as @p input.

124

* input_gate_bias 1D weights tensor with dimensions [num_units]. Data type supported: Same as @p input

125

* projection_weights 2D weights tensor with dimensions [output_size, num_units]. Data type supported: Same as @p input.

126

* projection_bias 1D weights tensor with dimensions [output_size]. Data type supported: Same as @p input.

127

* @param[in] activation_info Contains activation information described in @ref ActivationLayerInfo.

128

* @param[in] cell_threshold The clipping threshold for the cell state, such that values are bound within [-cell_clip, cell_clip]. If set to 0.0 then clipping is disabled.

129

* @param[in] projection_threshold The clipping threshold for the output from the projection layer, such that values are bound within [-proj_clip, proj_clip]. If set to 0.0 then clipping is disabled.

130

*

131

* @return a status

132

*/

Georgios Pinitas

2018-07-18 19:51:24 +0100

[diff] [blame]

133

static Status validate(const ITensorInfo *input,

134

const ITensorInfo *input_to_forget_weights, const ITensorInfo *input_to_cell_weights, const ITensorInfo *input_to_output_weights,

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

135

const ITensorInfo *recurrent_to_forget_weights, const ITensorInfo *recurrent_to_cell_weights, const ITensorInfo *recurrent_to_output_weights,

136

const ITensorInfo *forget_gate_bias, const ITensorInfo *cell_bias, const ITensorInfo *output_gate_bias,

Georgios Pinitas

2018-07-18 19:51:24 +0100

[diff] [blame]

137

const ITensorInfo *output_state_in, const ITensorInfo *cell_state_in,

138

const ITensorInfo *scratch_buffer, const ITensorInfo *output_state_out, const ITensorInfo *cell_state_out, const ITensorInfo *output,

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

139

const LSTMParams<ITensorInfo> &lstm_params, const ActivationLayerInfo &activation_info, float cell_threshold = 0.f, float projection_threshold = 0.f);

140

141

// Inherited methods overridden:

142

void run() override;

John Kesapides

2019-02-19 15:53:59 +0000

[diff] [blame]

143

void prepare() override;

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

144

145

private:

giuros01

2018-11-20 18:34:46 +0000

[diff] [blame]

146

CLMemoryGroup _memory_group;

147

CLFullyConnectedLayer _fully_connected_input_gate;

148

CLGEMM _gemm_input_gate;

149

CLTransposeKernel _transpose_input_gate;

150

CLSaturatedArithmeticOperationKernel _accum_input_gate1;

151

CLArithmeticAddition _accum_input_gate2;

152

CLSaturatedArithmeticOperationKernel _subtract_input_gate;

153

CLPixelWiseMultiplicationKernel _pixelwise_mul_input_gate;

154

CLActivationLayerKernel _activation_input_gate;

155

CLFullyConnectedLayer _fully_connected_forget_gate;

156

CLGEMM _gemm_forget_gate;

157

CLTransposeKernel _transpose_forget_gate;

158

CLSaturatedArithmeticOperationKernel _accum_forget_gate1;

159

CLArithmeticAddition _accum_forget_gate2;

160

CLPixelWiseMultiplicationKernel _pixelwise_mul_forget_gate;

161

CLActivationLayerKernel _activation_forget_gate;

162

CLFullyConnectedLayer _fully_connected_cell_state;

163

CLGEMM _gemm_cell_state1;

164

CLGEMM _gemm_cell_state2;

165

CLTransposeKernel _transpose_cell_state;

166

CLSaturatedArithmeticOperationKernel _accum_cell_state1;

167

CLSaturatedArithmeticOperationKernel _accum_cell_state2;

168

CLPixelWiseMultiplicationKernel _pixelwise_mul_cell_state1;

169

CLActivationLayerKernel _activation_cell_state;

170

CLActivationLayerKernel _cell_clip;

171

CLPixelWiseMultiplicationKernel _pixelwise_mul_cell_state2;

172

CLFullyConnectedLayer _fully_connected_output;

173

CLGEMM _gemm_output;

174

CLPixelWiseMultiplicationKernel _pixelwise_mul_output_state1;

175

CLTransposeKernel _transpose_output;

176

CLSaturatedArithmeticOperationKernel _accum_output1;

177

CLArithmeticAddition _accum_output2;

178

CLActivationLayerKernel _activation_output;

179

CLActivationLayerKernel _activation_output_state;

180

CLPixelWiseMultiplicationKernel _pixelwise_mul_output_state2;

181

CLFullyConnectedLayer _fully_connected_output_state;

182

CLGEMM _gemm_output_state;

183

CLSaturatedArithmeticOperationKernel _accum_output_state;

184

CLActivationLayerKernel _projection_clip;

185

CLCopyKernel _copy_cell_state;

186

CLCopyKernel _copy_output;

187

CLWidthConcatenateLayer _concat_scratch_buffer;

John Kesapides

2019-02-19 15:53:59 +0000

[diff] [blame]

188

CLWidthConcatenate2TensorsKernel _concat_inputs_forget_gate;

189

CLWidthConcatenate2TensorsKernel _concat_weights_forget_gate;

190

CLWidthConcatenate2TensorsKernel _concat_weights_input_gate;

191

CLWidthConcatenate2TensorsKernel _concat_weights_output;

Georgios Pinitas

dbfc2dc

2019-04-02 12:51:21 +0100

[diff] [blame^]

192

CLMemsetKernel _ones_memset_kernel;

giuros01

2018-11-20 18:34:46 +0000

[diff] [blame]

193

CLTensor _input_gate_out1;

194

CLTensor _input_gate_out2;

195

CLTensor _input_gate_out3;

196

CLTensor _input_gate_out4;

giuros01

2018-11-20 18:34:46 +0000

[diff] [blame]

197

CLTensor _forget_gate_out1;

198

CLTensor _forget_gate_out2;

199

CLTensor _forget_gate_out3;

200

CLTensor _forget_gate_out4;

201

CLTensor _forget_gate_out5;

John Kesapides

2019-02-19 15:53:59 +0000

[diff] [blame]

202

CLTensor _forget_gate_out6;

giuros01

2018-11-20 18:34:46 +0000

[diff] [blame]

203

CLTensor _cell_state_out1;

204

CLTensor _cell_state_out2;

205

CLTensor _cell_state_out3;

206

CLTensor _cell_state_out4;

207

CLTensor _cell_state_out5;

CLTensor _output1;

CLTensor _output2;

CLTensor _output3;

CLTensor _output4;

giuros01

2018-11-20 18:34:46 +0000

[diff] [blame]

212

CLTensor _cell_state_activation;

213

CLTensor _output_state1;

214

CLTensor _ones;

215

bool _run_peephole_opt;

216

bool _run_cifg_opt;

217

bool _perform_cell_clipping;

218

bool _has_projection_weights;

219

bool _perform_projection_clipping;

John Kesapides

2019-02-19 15:53:59 +0000

[diff] [blame]

220

bool _is_prepared;

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

221

};

John Kesapides

2019-02-19 15:53:59 +0000

[diff] [blame]

222

} // namespace arm_compute

Michalis Spyrou