Blame - arm_compute/runtime/CL/functions/CLLSTMLayer.h - ml/ComputeLibrary

2018-03-22 14:55:08 +0000

[diff] [blame]

89

*/

Georgios Pinitas

2018-07-18 19:51:24 +0100

[diff] [blame]

90

void configure(const ICLTensor *input,

91

const ICLTensor *input_to_forget_weights, const ICLTensor *input_to_cell_weights, const ICLTensor *input_to_output_weights,

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

92

const ICLTensor *recurrent_to_forget_weights, const ICLTensor *recurrent_to_cell_weights, const ICLTensor *recurrent_to_output_weights,

Georgios Pinitas

2018-07-18 19:51:24 +0100

[diff] [blame]

93

const ICLTensor *forget_gate_bias, const ICLTensor *cell_bias, const ICLTensor *output_gate_bias,

94

const ICLTensor *output_state_in, const ICLTensor *cell_state_in,

95

ICLTensor *scratch_buffer, ICLTensor *output_state_out, ICLTensor *cell_state_out, ICLTensor *output,

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

96

const LSTMParams<ICLTensor> &lstm_params, const ActivationLayerInfo &activation_info, float cell_threshold = 0.f, float projection_threshold = 0.f);

97

98

/** Static function to check if given info will lead to a valid configuration of @ref CLLSTMLayer

99

*

Georgios Pinitas

2018-07-18 19:51:24 +0100

[diff] [blame]

100

* @param[in] input Source tensor. Input is a 2D tensor with dimensions [input_size, batch_size]. Data types supported: F16/F32.

101

* @param[in] input_to_forget_weights 2D weights tensor with dimensions [input_size, num_units]. Data type supported: Same as @p input.

102

* @param[in] input_to_cell_weights 2D weights tensor with dimensions [input_size, num_units]. Data type supported: Same as @p input.

103

* @param[in] input_to_output_weights 2D weights tensor with dimensions [input_size, num_units]. Data type supported: Same as @p input.

104

* @param[in] recurrent_to_forget_weights 2D weights tensor with dimensions [output_size, num_units]. Data type supported: Same as @p input.

105

* @param[in] recurrent_to_cell_weights 2D weights tensor with dimensions [output_size, num_units]. Data type supported: Same as @p input.

106

* @param[in] recurrent_to_output_weights 2D weights tensor with dimensions [output_size, num_units]. Data type supported: Same as @p input.

107

* @param[in] forget_gate_bias 1D weights tensor with dimensions [num_units]. Data type supported: Same as @p input.

108

* @param[in] cell_bias 1D weights tensor with dimensions [num_units]. Data type supported: Same as @p input.

109

* @param[in] output_gate_bias 1D weights tensor with dimensions [num_units]. Data type supported: Same as @p input.

110

* @param[in] output_state_in 2D weights tensor with dimensions [output_size, batch_size]. Data type supported: Same as @p input.

111

* @param[in] cell_state_in 2D tensor with dimensions [num_units, batch_size]. Data type supported: Same as @p input.

112

* @param[in] scratch_buffer 2D tensor with dimensions [num_units * 4, batch_size] with CIFG or [num_units * 3, batch_size] without CIGF. Data type supported: Same as @p input.

113

* @param[in] output_state_out 2D weights tensor with dimensions [output_size, batch_size]. Data type supported: Same as @p input.

114

* @param[in] cell_state_out 2D tensor with dimensions [num_units, batch_size]. Data type supported: Same as @p input.

115

* @param[in] output Destination tensor. Output is a 2D tensor with dimensions [output_size, batch_size].

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

116

* Data types supported: Same as @p input.

117

* @param[in] lstm_params (Optional) Weights tensors used in peephole optimization:

118

* input_to_input_weights 2D weights tensor with dimensions [input_size, num_units]. Data type supported: Same as @p input.

119

* recurrent_to_input_weights 2D weights tensor with dimensions [output_size, num_units]. Data type supported: Same as @p input.

120

* cell_to_input_weights 1D weights tensor with dimensions [num_units]. Can be nullptr. Data type supported: Same as @p input.

121

* cell_to_forget_weights 1D weights tensor with dimensions [num_units]. Data type supported: Same as @p input.

122

* cell_to_output_weights 1D weights tensor with dimensions [num_units]. Data type supported: Same as @p input.

123

* input_gate_bias 1D weights tensor with dimensions [num_units]. Data type supported: Same as @p input

124

* projection_weights 2D weights tensor with dimensions [output_size, num_units]. Data type supported: Same as @p input.

125

* projection_bias 1D weights tensor with dimensions [output_size]. Data type supported: Same as @p input.

126

* @param[in] activation_info Contains activation information described in @ref ActivationLayerInfo.

127

* @param[in] cell_threshold The clipping threshold for the cell state, such that values are bound within [-cell_clip, cell_clip]. If set to 0.0 then clipping is disabled.

128

* @param[in] projection_threshold The clipping threshold for the output from the projection layer, such that values are bound within [-proj_clip, proj_clip]. If set to 0.0 then clipping is disabled.

129

*

130

* @return a status

131

*/

Georgios Pinitas

2018-07-18 19:51:24 +0100

[diff] [blame]

132

static Status validate(const ITensorInfo *input,

133

const ITensorInfo *input_to_forget_weights, const ITensorInfo *input_to_cell_weights, const ITensorInfo *input_to_output_weights,

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

134

const ITensorInfo *recurrent_to_forget_weights, const ITensorInfo *recurrent_to_cell_weights, const ITensorInfo *recurrent_to_output_weights,

135

const ITensorInfo *forget_gate_bias, const ITensorInfo *cell_bias, const ITensorInfo *output_gate_bias,

Georgios Pinitas

2018-07-18 19:51:24 +0100

[diff] [blame]

136

const ITensorInfo *output_state_in, const ITensorInfo *cell_state_in,

137

const ITensorInfo *scratch_buffer, const ITensorInfo *output_state_out, const ITensorInfo *cell_state_out, const ITensorInfo *output,

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

138

const LSTMParams<ITensorInfo> &lstm_params, const ActivationLayerInfo &activation_info, float cell_threshold = 0.f, float projection_threshold = 0.f);

139

140

// Inherited methods overridden:

void run() override;

private:

CLMemoryGroup _memory_group;

145

CLFullyConnectedLayer _fully_connected_input_gate;

Georgios Pinitas

2018-07-09 14:35:32 +0100

[diff] [blame]

146

CLGEMM _gemm_input_gate;

147

CLTransposeKernel _transpose_input_gate;

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

148

CLArithmeticAdditionKernel _accum_input_gate1;

149

CLArithmeticAddition _accum_input_gate2;

150

CLArithmeticSubtractionKernel _subtract_input_gate;

Georgios Pinitas

2018-07-09 14:35:32 +0100

[diff] [blame]

151

CLPixelWiseMultiplicationKernel _pixelwise_mul_input_gate;

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

152

CLActivationLayerKernel _activation_input_gate;

153

CLFullyConnectedLayer _fully_connected_forget_gate;

Georgios Pinitas

2018-07-09 14:35:32 +0100

[diff] [blame]

154

CLGEMM _gemm_forget_gate;

155

CLTransposeKernel _transpose_forget_gate;

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

156

CLArithmeticAdditionKernel _accum_forget_gate1;

157

CLArithmeticAddition _accum_forget_gate2;

Georgios Pinitas

2018-07-09 14:35:32 +0100

[diff] [blame]

158

CLPixelWiseMultiplicationKernel _pixelwise_mul_forget_gate;

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

159

CLActivationLayerKernel _activation_forget_gate;

160

CLFullyConnectedLayer _fully_connected_cell_state;

161

CLGEMM _gemm_cell_state1;

162

CLGEMM _gemm_cell_state2;

Georgios Pinitas

2018-07-09 14:35:32 +0100

[diff] [blame]

163

CLTransposeKernel _transpose_cell_state;

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

164

CLArithmeticAdditionKernel _accum_cell_state1;

165

CLArithmeticAdditionKernel _accum_cell_state2;

166

CLPixelWiseMultiplicationKernel _pixelwise_mul_cell_state1;

167

CLActivationLayerKernel _activation_cell_state;

168

CLActivationLayerKernel _cell_clip;

169

CLPixelWiseMultiplicationKernel _pixelwise_mul_cell_state2;

170

CLFullyConnectedLayer _fully_connected_output;

Georgios Pinitas

2018-07-09 14:35:32 +0100

[diff] [blame]

171

CLGEMM _gemm_output;

172

CLPixelWiseMultiplicationKernel _pixelwise_mul_output_state1;

173

CLTransposeKernel _transpose_output;

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

174

CLArithmeticAdditionKernel _accum_output1;

175

CLArithmeticAddition _accum_output2;

176

CLActivationLayerKernel _activation_output;

177

CLActivationLayerKernel _activation_output_state;

Georgios Pinitas

2018-07-09 14:35:32 +0100

[diff] [blame]

178

CLPixelWiseMultiplicationKernel _pixelwise_mul_output_state2;

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

179

CLFullyConnectedLayer _fully_connected_output_state;

180

CLGEMM _gemm_output_state;

181

CLArithmeticAdditionKernel _accum_output_state;

182

CLActivationLayerKernel _projection_clip;

183

CLCopyKernel _copy_cell_state;

184

CLCopyKernel _copy_output;

185

CLWidthConcatenateLayer _concat_scratch_buffer;

186

CLTensor _input_gate_out1;

187

CLTensor _input_gate_out2;

188

CLTensor _input_gate_out3;

189

CLTensor _input_gate_out4;

190

CLTensor _input_gate_out5;

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

191

CLTensor _forget_gate_out1;

192

CLTensor _forget_gate_out2;

193

CLTensor _forget_gate_out3;

194

CLTensor _forget_gate_out4;

195

CLTensor _forget_gate_out5;

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

196

CLTensor _cell_state_out1;

197

CLTensor _cell_state_out2;

198

CLTensor _cell_state_out3;

199

CLTensor _cell_state_out4;

200

CLTensor _cell_state_out5;

CLTensor _output1;

CLTensor _output2;

CLTensor _output3;

CLTensor _output4;

CLTensor _output5;

Michalis Spyrou

2018-03-22 14:55:08 +0000

[diff] [blame]

206

CLTensor _cell_state_activation;

Georgios Pinitas

2018-07-18 19:51:24 +0100

[diff] [blame]

207

CLTensor _output_state1;

Michalis Spyrou