VivianoRiccardo
diff --git a/‎src/dueling_categorical_dqn.c‎
Lines changed: 21 additions & 0 deletions b/‎src/dueling_categorical_dqn.c‎
Lines changed: 21 additions & 0 deletions
diff --git a/‎src/dueling_categorical_dqn.h‎
Lines changed: 2 additions & 0 deletions b/‎src/dueling_categorical_dqn.h‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/fully_connected_layers.c‎
Lines changed: 18 additions & 0 deletions b/‎src/fully_connected_layers.c‎
Lines changed: 18 additions & 0 deletions
diff --git a/‎src/fully_connected_layers.h‎
Lines changed: 2 additions & 0 deletions b/‎src/fully_connected_layers.h‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/llab.h‎
Lines changed: 1 addition & 2 deletions b/‎src/llab.h‎
Lines changed: 1 addition & 2 deletions
diff --git a/‎src/model.c‎
Lines changed: 22 additions & 108 deletions b/‎src/model.c‎
Lines changed: 22 additions & 108 deletions
diff --git a/‎src/model.h‎
Lines changed: 2 additions & 0 deletions b/‎src/model.h‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/neat.c‎
Lines changed: 1 addition & 0 deletions b/‎src/neat.c‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎src/neat_functions.h‎
Lines changed: 1 addition & 0 deletions b/‎src/neat_functions.h‎
Lines changed: 1 addition & 0 deletions
@@ -24,6 +24,7 @@ SOFTWARE.
 
 #include "dueling_categorical_dqn.h"
 
+
 dueling_categorical_dqn* dueling_categorical_dqn_init(int input_size, int action_size, int n_atoms, float v_min, float v_max, model* shared_hidden_layers, model* v_hidden_layers, model* a_hidden_layers, model* v_linear_last_layer, model* a_linear_last_layer){
     if(shared_hidden_layers == NULL || v_hidden_layers == NULL || a_hidden_layers == NULL || v_linear_last_layer == NULL || a_linear_last_layer == NULL){
         fprintf(stderr,"Error: you cannot have null model passed as input!\n");
@@ -1360,6 +1361,10 @@ float compute_kl_dueling_categorical_dqn_opt(dueling_categorical_dqn* online_net
     // used to rescale alpha that is the most important part)
     * */
     clip_vector(error,-clip,clip,online_net->action_size);
+    /*for(i = 0; i < online_net->action_size; i++){
+        printf("%f ",error[i]);
+    }
+    printf("\n");*/
     // we got the partial derivatives of the q functions, now we need to compute the partial derivatives respect to the softmax final layer of the network
     for(i = 0; i < online_net->action_size; i++){
         for(j = 0; j < online_net->n_atoms; j++){
@@ -1508,3 +1513,19 @@ int get_input_layer_size_dueling_categorical_dqn(dueling_categorical_dqn* dqn){
         return 0;
     return get_input_layer_size(dqn->shared_hidden_layers);
 }
+
+void inference_dqn(dueling_categorical_dqn* dqn){
+	inference_model(dqn->shared_hidden_layers);
+	inference_model(dqn->a_hidden_layers);
+	inference_model(dqn->v_hidden_layers);
+	inference_model(dqn->a_linear_last_layer);
+	inference_model(dqn->v_linear_last_layer);
+}
+
+void train_dqn(dueling_categorical_dqn* dqn){
+	train_model(dqn->shared_hidden_layers);
+	train_model(dqn->a_hidden_layers);
+	train_model(dqn->v_hidden_layers);
+	train_model(dqn->a_linear_last_layer);
+	train_model(dqn->v_linear_last_layer);
+}
@@ -94,5 +94,7 @@ int get_input_layer_size_dueling_categorical_dqn(dueling_categorical_dqn* dqn);
 float* get_loss_for_dueling_categorical_dqn_opt_with_error(dueling_categorical_dqn* online_net,dueling_categorical_dqn* online_net_wlp, dueling_categorical_dqn* target_net, dueling_categorical_dqn* target_net_wlp, float* state_t, int action_t, float reward_t, float* state_t_1, float lambda_value, int state_sizes, int nonterminal_s_t_1, float* new_error, float weight_error);
 float compute_kl_dueling_categorical_dqn(dueling_categorical_dqn* online_net, float* state_t, float* q_functions,  float weight, float alpha, float clip);
 float compute_kl_dueling_categorical_dqn_opt(dueling_categorical_dqn* online_net,dueling_categorical_dqn* online_net_wlp, float* state_t, float* q_functions,  float weight, float alpha, float clip);
+void inference_dqn(dueling_categorical_dqn* dqn);
+void train_dqn(dueling_categorical_dqn* dqn);
 
 #endif
@@ -2061,3 +2061,21 @@ void make_the_fcl_only_for_ff(fcl* f){
         f->dropout_threshold = 1-f->dropout_threshold;
     }
 }
+
+void inference_fcl(fcl* f){
+    if(f == NULL)
+        return;
+    if(f->dropout_flag == DROPOUT){
+        f->dropout_flag = DROPOUT_TEST;
+        f->dropout_threshold = 1-f->dropout_threshold;
+    }
+}
+
+void train_fcl(fcl* f){
+    if(f == NULL)
+        return;
+    if(f->dropout_flag == DROPOUT_TEST){
+        f->dropout_flag = DROPOUT;
+        f->dropout_threshold = 1-f->dropout_threshold;
+    }
+}
@@ -82,6 +82,8 @@ uint64_t count_weights_fcl(fcl* f);
 void make_the_fcl_only_for_ff(fcl* f);
 fcl* fully_connected_without_arrays(int input, int output, int layer, int dropout_flag, int activation_flag, float dropout_threshold, int n_groups, int normalization_flag, int training_mode, int feed_forward_flag);
 void free_fully_connected_without_arrays(fcl* f);
+void inference_fcl(fcl* f);
+void train_fcl(fcl* f);
 
 
 
 
@@ -809,6 +809,7 @@ typedef struct rainbow{
     float** diversity_driven_states;
     float* last_errors_dqn;
     float* last_errors_diversity_driven;
+    int* uniform_sampling_indices;
     int* positive_rewards;
     int* negative_rewards;
     int* neutral_rewards;
@@ -852,7 +853,6 @@ typedef struct rainbow{
 
 #include "attention.h"
 #include "batch_norm_layers.h"
-#include "client.h"
 #include "clipping_gradient.h"
 #include "convolutional.h"
 #include "convolutional_layers.h"
@@ -882,7 +882,6 @@ typedef struct rainbow{
 #include "rmodel.h"
 #include "positional_encoding.h"
 #include "scaled_l2_norm_layers.h"
-#include "server.h"
 #include "struct_conn.h"
 #include "struct_conn_handler.h"
 #include "training.h"
 
@@ -7360,36 +7360,7 @@ int model_tensor_input_ff_without_arrays(model* m, int tensor_depth, int tensor_
 						return 0;
 					}
 
-                    if(k3-count == m->rls[z]->n_cl-1){
-                        if(m->rls[z]->cls[k3-count]->pooling_flag){
-                            float* pooltemp_prev = m->rls[z]->cls[k3-count]->post_pooling;
-                            if(m->rls[z]->cls[k3-count]->convolutional_flag == NO_CONVOLUTION && m->rls[z]->cls[k3-count]->stride2_cols == 1 && m->rls[z]->cls[k3-count]->stride2_rows == 1 && m->rls[z]->cls[k3-count]->padding2_rows == 0 && m->rls[z]->cls[k3-count]->padding2_cols == 0 && m->rls[z]->cls[k3-count]->pooling_rows == 1 && m->rls[z]->cls[k3-count]->pooling_cols == 1){
-                                pooltemp_prev = m->rls[z]->cls[k3-count]->pooltemp;
-                            }
-                            sum1D(m->rls[z]->input,pooltemp_prev,m->rls[z]->cl_output->pre_activation,m->rls[z]->cls[k3-count]->n_kernels*m->rls[z]->cls[k3-count]->rows2*m->rls[z]->cls[k3-count]->cols2);
-                        }
-                        else if(m->rls[z]->cls[k3-count]->normalization_flag)
-                            sum1D(m->rls[z]->input,m->rls[z]->cls[k3-count]->post_normalization,m->rls[z]->cl_output->pre_activation,m->rls[z]->cls[k3-count]->n_kernels*m->rls[z]->cls[k3-count]->rows1*m->rls[z]->cls[k3-count]->cols1);
-                        
-                        else if(m->rls[z]->cls[k3-count]->activation_flag){
-                            sum1D(m->rls[z]->input,m->rls[z]->cls[k3-count]->post_activation,m->rls[z]->cl_output->pre_activation,m->rls[z]->cls[k3-count]->n_kernels*m->rls[z]->cls[k3-count]->rows1*m->rls[z]->cls[k3-count]->cols1);
-                        }
-                        else
-                            sum1D(m->rls[z]->input,m->rls[z]->cls[k3-count]->pre_activation,m->rls[z]->cl_output->pre_activation,m->rls[z]->cls[k3-count]->n_kernels*m->rls[z]->cls[k3-count]->rows1*m->rls[z]->cls[k3-count]->cols1);
-                        
-                        if(m->rls[z]->cl_output->activation_flag == LEAKY_RELU){
-                            leaky_relu_array(m->rls[z]->cl_output->pre_activation,m->rls[z]->cl_output->post_activation, m->rls[z]->cl_output->n_kernels*m->rls[z]->cl_output->rows1*m->rls[z]->cl_output->cols1);
-                        }
-                        else if(m->rls[z]->cl_output->activation_flag == RELU){
-                            relu_array(m->rls[z]->cl_output->pre_activation,m->rls[z]->cl_output->post_activation, m->rls[z]->cl_output->n_kernels*m->rls[z]->cl_output->rows1*m->rls[z]->cl_output->cols1);
-                        }
-                        else if(m->rls[z]->cl_output->activation_flag == ELU)
-                            elu_array(m->rls[z]->cl_output->pre_activation,m->rls[z]->cl_output->post_activation, m->rls[z]->cl_output->n_kernels*m->rls[z]->cl_output->rows1*m->rls[z]->cl_output->cols1,ELU_THRESHOLD);
-                        else if(m->rls[z]->cl_output->activation_flag == SIGMOID)
-                            sigmoid_array(m->rls[z]->cl_output->pre_activation,m->rls[z]->cl_output->post_activation, m->rls[z]->cl_output->n_kernels*m->rls[z]->cl_output->rows1*m->rls[z]->cl_output->cols1);
-                        else if(m->rls[z]->cl_output->activation_flag == TANH)
-                            tanhh_array(m->rls[z]->cl_output->pre_activation,m->rls[z]->cl_output->post_activation, m->rls[z]->cl_output->n_kernels*m->rls[z]->cl_output->rows1*m->rls[z]->cl_output->cols1);
-                    }
+
 
                     k3++;
 
@@ -7508,31 +7479,7 @@ int model_tensor_input_ff_without_arrays(model* m, int tensor_depth, int tensor_
 
 
                     if(m->sla[i-1][0] == FCLS){
-                        if(k3-count == 0){
-                            if(m->fcls[k1-1]->dropout_flag){
-                                if(m->fcls[k1-1]->activation_flag){
-                                    dot1D(m->fcls[k1-1]->post_activation,m->fcls[k1-1]->dropout_mask,m->fcls[k1-1]->dropout_temp,m->rls[z]->channels*m->rls[z]->input_rows*m->rls[z]->input_cols);
-                                    m->rls[z]->input = m->fcls[k1-1]->dropout_temp;
-                                }
-                                else{
-                                    dot1D(m->fcls[k1-1]->pre_activation,m->fcls[k1-1]->dropout_mask,m->fcls[k1-1]->dropout_temp,m->rls[z]->channels*m->rls[z]->input_rows*m->rls[z]->input_cols);
-                                    m->rls[z]->input = m->fcls[k1-1]->dropout_temp;
-                                }
-                            }
-                            else{
-                                
-                                if(m->fcls[k1-1]->normalization_flag){
-                                    m->rls[z]->input = m->fcls[k1-1]->post_normalization;
-                                }
-                                
-                                else if(m->fcls[k1-1]->activation_flag){
-                                    m->rls[z]->input = m->fcls[k1-1]->post_activation;
-                                }
-                                else{
-                                    m->rls[z]->input = m->fcls[k1-1]->pre_activation;
-                                }
-                            }
-                        }
+
 
                         if(!ff_fcl_cl_without_arrays(m->fcls[k1-1],m->rls[z]->cls[k3-count])){
 							free(temp);
@@ -7541,25 +7488,7 @@ int model_tensor_input_ff_without_arrays(model* m, int tensor_depth, int tensor_
                     }
 
                     else if(m->sla[i-1][0] == CLS){
-                        if(k3-count == 0){
-                            if(m->cls[k2-1]->pooling_flag){
-                                float* pooltemp_prev = m->cls[k2-1]->post_pooling;
-                                if(m->cls[k2-1]->convolutional_flag == NO_CONVOLUTION && m->cls[k2-1]->stride2_cols == 1 && m->cls[k2-1]->stride2_rows == 1 && m->cls[k2-1]->padding2_rows == 0 && m->cls[k2-1]->padding2_cols == 0 && m->cls[k2-1]->pooling_rows == 1 && m->cls[k2-1]->pooling_cols == 1){
-                                    pooltemp_prev = m->cls[k2-1]->pooltemp;
-                                }
-                                m->rls[z]->input = pooltemp_prev;
-                            }
-                            else if(m->cls[k2-1]->normalization_flag){
-                                m->rls[z]->input = m->cls[k2-1]->post_normalization;
-                            }
-                            
-                            else if(m->cls[k2-1]->activation_flag){
-                                m->rls[z]->input = m->cls[k2-1]->post_activation;
-                            }
-                            else{
-                                m->rls[z]->input = m->cls[k2-1]->pre_activation;
-                            }
-                        }
+
                         if(!ff_cl_cl_without_arrays(m->cls[k2-1],m->rls[z]->cls[k3-count])){
 							free(temp);
 							return 0;
@@ -7596,40 +7525,7 @@ int model_tensor_input_ff_without_arrays(model* m, int tensor_depth, int tensor_
                         }
                     }
 
-                    if(k3-count == m->rls[z]->n_cl-1){
-                        if(m->rls[z]->cls[k3-count]->pooling_flag){
-                            float* pooltemp_prev = m->rls[z]->cls[k3-count]->post_pooling;
-                            if(m->rls[z]->cls[k3-count]->convolutional_flag == NO_CONVOLUTION && m->rls[z]->cls[k3-count]->stride2_cols == 1 && m->rls[z]->cls[k3-count]->stride2_rows == 1 && m->rls[z]->cls[k3-count]->padding2_rows == 0 && m->rls[z]->cls[k3-count]->padding2_cols == 0 && m->rls[z]->cls[k3-count]->pooling_rows == 1 && m->rls[z]->cls[k3-count]->pooling_cols == 1){
-                                pooltemp_prev = m->rls[z]->cls[k3-count]->pooltemp;
-                            }
-                            sum1D(m->rls[z]->input,pooltemp_prev,m->rls[z]->cl_output->pre_activation,m->rls[z]->cls[k3-count]->n_kernels*m->rls[z]->cls[k3-count]->rows2*m->rls[z]->cls[k3-count]->cols2);
-                            //printf("summing from previous pooling\n");
-                        }
-                        else if(m->rls[z]->cls[k3-count]->normalization_flag)
-                            sum1D(m->rls[z]->input,m->rls[z]->cls[k3-count]->post_normalization,m->rls[z]->cl_output->pre_activation,m->rls[z]->cls[k3-count]->n_kernels*m->rls[z]->cls[k3-count]->rows1*m->rls[z]->cls[k3-count]->cols1);
-                        else if(m->rls[z]->cls[k3-count]->activation_flag){
-                            sum1D(m->rls[z]->input,m->rls[z]->cls[k3-count]->post_activation,m->rls[z]->cl_output->pre_activation,m->rls[z]->cls[k3-count]->n_kernels*m->rls[z]->cls[k3-count]->rows1*m->rls[z]->cls[k3-count]->cols1);
-                            //printf("summing from previous activation\n");
-                        }
-                        else
-                            sum1D(m->rls[z]->input,m->rls[z]->cls[k3-count]->pre_activation,m->rls[z]->cl_output->pre_activation,m->rls[z]->cls[k3-count]->n_kernels*m->rls[z]->cls[k3-count]->rows1*m->rls[z]->cls[k3-count]->cols1);
-                        
-                        if(m->rls[z]->cl_output->activation_flag == LEAKY_RELU){
-                            leaky_relu_array(m->rls[z]->cl_output->pre_activation,m->rls[z]->cl_output->post_activation, m->rls[z]->cl_output->n_kernels*m->rls[z]->cl_output->rows1*m->rls[z]->cl_output->cols1);
-                            //printf("applying leaky relu rls\n");
-                        }
-                        else if(m->rls[z]->cl_output->activation_flag == RELU){
-                            relu_array(m->rls[z]->cl_output->pre_activation,m->rls[z]->cl_output->post_activation, m->rls[z]->cl_output->n_kernels*m->rls[z]->cl_output->rows1*m->rls[z]->cl_output->cols1);
-                            //printf("applying relu rls\n");
-                        }
-                        else if(m->rls[z]->cl_output->activation_flag == ELU)
-                            elu_array(m->rls[z]->cl_output->pre_activation,m->rls[z]->cl_output->post_activation, m->rls[z]->cl_output->n_kernels*m->rls[z]->cl_output->rows1*m->rls[z]->cl_output->cols1,ELU_THRESHOLD);
-                        else if(m->rls[z]->cl_output->activation_flag == SIGMOID)
-                            sigmoid_array(m->rls[z]->cl_output->pre_activation,m->rls[z]->cl_output->post_activation, m->rls[z]->cl_output->n_kernels*m->rls[z]->cl_output->rows1*m->rls[z]->cl_output->cols1);
-                        else if(m->rls[z]->cl_output->activation_flag == TANH)
-                            tanhh_array(m->rls[z]->cl_output->pre_activation,m->rls[z]->cl_output->post_activation, m->rls[z]->cl_output->n_kernels*m->rls[z]->cl_output->rows1*m->rls[z]->cl_output->cols1);
-
-                    }
+                    
 
                     k3++;
 
@@ -9208,6 +9104,24 @@ void make_the_model_only_for_ff(model* m){
     }
 }
 
+void inference_model(model* m){
+    if(m == NULL)
+        return;
+    int i,j;
+    for(i = 0; i < m->n_fcl; i++){
+        inference_fcl(m->fcls[i]);
+    }
+}
+
+void train_model(model* m){
+    if(m == NULL)
+        return;
+    int i,j;
+    for(i = 0; i < m->n_fcl; i++){
+        train_fcl(m->fcls[i]);
+    }
+}
+
 void set_model_beta(model* m, float beta1, float beta2){
     if(m == NULL)
         return;
 
@@ -121,5 +121,7 @@ int ff_fcl_cl_without_arrays(fcl* f1, cl* f2);
 int ff_cl_fcl_without_arrays(cl* f1, fcl* f2);
 int ff_cl_cl_without_arrays(cl* f1, cl* f2);
 int model_tensor_input_ff_without_arrays(model* m, int tensor_depth, int tensor_i, int tensor_j, float* input);
+void inference_model(model* m);
+void train_model(model* m);
 
 #endif
@@ -429,6 +429,7 @@ void neat_generation_run(neat* nes){
     nes->count+=nes->actual_genomes;
     for(nes->i = 0; nes->i < nes->actual_genomes; nes->i++){
         gg[nes->i]->fitness = 0;
+        adjust_genome(gg[nes->i]);
     }
 }
 
 
@@ -47,6 +47,7 @@ int round_up(float num);
 char* get_genome_array(genome* g, int global_inn_numb_connections);
 genome* init_genome_from_array(int global_inn_numb_connections, char* g_array);
 int get_genome_array_size(genome* g, int global_inn_numb_connections);
+void adjust_genome(genome* g);
 
 
 // Functions defined in mutations.c
Original file line number	Diff line number	Diff line change
`@@ -429,6 +429,7 @@ void neat_generation_run(neat* nes){`
`429`	`429`	`nes->count+=nes->actual_genomes;`
`430`	`430`	`for(nes->i = 0; nes->i < nes->actual_genomes; nes->i++){`
`431`	`431`	`gg[nes->i]->fitness = 0;`
	`432`	`+ adjust_genome(gg[nes->i]);`
`432`	`433`	`}`
`433`	`434`	`}`
`434`	`435`