fix bugs of gelu activation function

Lu · Lu · commit 7c34c5862fc2 · 2020-05-09T01:27:36.000+08:00
diff --git a/source/CMakeLists.txt b/source/CMakeLists.txt
@@ -184,6 +184,11 @@ include_directories(${TensorFlow_INCLUDE_DIRS})
 if (BUILD_CPP_IF)
   set (LIB_DEEPMD		"deepmd")
   set (LIB_DEEPMD_OP		"deepmd_op")
+  if (USE_CUDA_TOOLKIT)
+    set (LIB_DEEPMD_OP_CUDA		"deepmd_op_cuda")
+  else ()
+    set (LIB_DEEPMD_OP_CUDA		"deepmd_op")
+  endif()
   if (CMAKE_CXX_COMPILER_VERSION VERSION_GREATER_EQUAL 4.9)
     set (LIB_DEEPMD_NATIVE	"deepmd_native_md")
     set (LIB_DEEPMD_IPI		"deepmd_ipi")
diff --git a/source/lmp/env.sh.in b/source/lmp/env.sh.in
@@ -8,4 +8,4 @@ TF_RPATH=`echo $TENSORFLOW_LIBRARY_PATH | sed "s/;/ -Wl,-rpath=/g"`
 
 NNP_INC=" -std=c++11 @PREC_DEF@ @TTM_DEF@ @OLD_LMP_PPPM_DEF@ -I$TF_INCLUDE_DIRS -I$DEEPMD_ROOT/include/deepmd "
 NNP_PATH=" -L$TF_LIBRARY_PATH -L$DEEPMD_ROOT/lib"
-NNP_LIB=" -Wl,--no-as-needed -l@LIB_DEEPMD_OP@ -l@LIB_DEEPMD@ -ltensorflow_cc -ltensorflow_framework -Wl,-rpath=$TF_RPATH -Wl,-rpath=$DEEPMD_ROOT/lib"
+NNP_LIB=" -Wl,--no-as-needed -l@LIB_DEEPMD_OP_CUDA@ -l@LIB_DEEPMD_OP@ -l@LIB_DEEPMD@ -ltensorflow_cc -ltensorflow_framework -Wl,-rpath=$TF_RPATH -Wl,-rpath=$DEEPMD_ROOT/lib"
diff --git a/source/op/CMakeLists.txt b/source/op/CMakeLists.txt
@@ -24,6 +24,8 @@ if (BUILD_CPP_IF)
 endif (BUILD_CPP_IF)
 
 if (BUILD_PY_IF)
+  set(CMAKE_BUILD_WITH_INSTALL_RPATH TRUE)
+  set(CMAKE_INSTALL_RPATH DESTINATION ${CMAKE_BINARY_DIR}/op/cuda)
   if (USE_CUDA_TOOLKIT)
     add_library(op_abi SHARED ${OP_PY_CUDA_SRC} ${OP_LIB})
     add_library(op_grads SHARED ${OP_GRADS_SRC})
@@ -33,11 +35,11 @@ if (BUILD_PY_IF)
     set (EXTRA_LIBS ${EXTRA_LIBS} deepmd_op_cuda)
     target_link_libraries (op_abi ${EXTRA_LIBS})
     target_link_libraries (op_grads ${EXTRA_LIBS})
-    message(STATUS ${TensorFlowFramework_LIBRARY})
   else (USE_CUDA_TOOLKIT)
     add_library(op_abi SHARED ${OP_SRC} ${OP_LIB})
     add_library(op_grads SHARED ${OP_GRADS_SRC})
   endif(USE_CUDA_TOOLKIT)
+  message(STATUS ${TensorFlowFramework_LIBRARY})
   target_link_libraries(
     op_abi ${TensorFlowFramework_LIBRARY}
     )
diff --git a/source/op/_gelu.py b/source/op/_gelu.py
@@ -7,9 +7,9 @@
 from deepmd.env import op_module
 
 @ops.RegisterGradient("Gelu")
-def gelu_cc (op, dy) :
+def _gelu_cc (op, dy) :
     return op_module.gelu_grad(dy, op.inputs[0])     
 
 @ops.RegisterGradient("GeluGrad")
-def gelu_grad_cc (op, dy) :
-    return [None, op_module.gelu_grad_grad(dy, op.inputs[0], op.inputs[1])]
+def _gelu_grad_cc (op, dy) :
+    return [op_module.gelu_grad(dy, op.inputs[1]), op_module.gelu_grad_grad(dy, op.inputs[0], op.inputs[1])]
diff --git a/source/op/cuda/CMakeLists.txt b/source/op/cuda/CMakeLists.txt
@@ -83,7 +83,7 @@ set (SOURCE_FILES
     descrpt_se_a.cu descrpt_se_r.cu prod_force_se_a.cu prod_force_se_r.cu prod_virial_se_a.cu prod_virial_se_r.cu gelu.cu 
 )
 
-cuda_add_library(deepmd_op_cuda STATIC ${SOURCE_FILES})
+cuda_add_library(deepmd_op_cuda SHARED ${SOURCE_FILES})
 
 if (BUILD_CPP_IF)
     install(TARGETS deepmd_op_cuda DESTINATION lib/)
diff --git a/source/op/gelu.cc b/source/op/gelu.cc
@@ -11,32 +11,20 @@ using GPUDevice = Eigen::GpuDevice;
 REGISTER_OP("Gelu")
     .Attr("T: {float, double}")
     .Input("x: T")
-    .Output("output: T")
-    .SetShapeFn([](::tensorflow::shape_inference::InferenceContext* c) {
-        c->set_output(0, c->input(0));
-        return Status::OK();
-    });
+    .Output("output: T");
 
 REGISTER_OP("GeluGrad")
     .Attr("T: {float, double}")
     .Input("dy: T")
     .Input("x: T")
-    .Output("output: T")
-    .SetShapeFn([](::tensorflow::shape_inference::InferenceContext* c) {
-        c->set_output(0, c->input(1));
-        return Status::OK();
-    });
+    .Output("output: T");
 
 REGISTER_OP("GeluGradGrad")
     .Attr("T: {float, double}")
     .Input("dy: T")
     .Input("dy_: T")
     .Input("x: T")
-    .Output("output: T")
-    .SetShapeFn([](::tensorflow::shape_inference::InferenceContext* c) {
-        c->set_output(0, c->input(2));
-        return Status::OK();
-    });
+    .Output("output: T");
 
 template <typename Device, typename T>
 struct GeluFunctor {
diff --git a/source/op/gelu_gpu.cc b/source/op/gelu_gpu.cc
@@ -10,32 +10,20 @@ using GPUDevice = Eigen::GpuDevice;
 REGISTER_OP("Gelu")
     .Attr("T: {float, double}")
     .Input("x: T")
-    .Output("output: T")
-    .SetShapeFn([](::tensorflow::shape_inference::InferenceContext* c) {
-        c->set_output(0, c->input(0));
-        return Status::OK();
-    });
+    .Output("output: T");
 
 REGISTER_OP("GeluGrad")
     .Attr("T: {float, double}")
     .Input("dy: T")
     .Input("x: T")
-    .Output("output: T")
-    .SetShapeFn([](::tensorflow::shape_inference::InferenceContext* c) {
-        c->set_output(0, c->input(1));
-        return Status::OK();
-    });
+    .Output("output: T");
 
 REGISTER_OP("GeluGradGrad")
     .Attr("T: {float, double}")
     .Input("dy: T")
     .Input("dy_: T")
     .Input("x: T")
-    .Output("output: T")
-    .SetShapeFn([](::tensorflow::shape_inference::InferenceContext* c) {
-        c->set_output(0, c->input(2));
-        return Status::OK();
-    });
+    .Output("output: T");
 
 // maybe instead use cudnn activation forward 
 void GeluLauncher(const float * in, float * out, int const size);
diff --git a/source/train/DescrptSeA.py b/source/train/DescrptSeA.py
@@ -353,6 +353,7 @@ def _filter(self,
                                   self.filter_precision,
                                   tf.random_normal_initializer(stddev=stddev, mean = bavg, seed = seed), 
                                     trainable = trainable)
+                hidden = tf.reshape(activation_fn(tf.matmul(xyz_scatter, w) + b), [-1, outputs_size[ii]])
                 if self.filter_resnet_dt :
                     idt = tf.get_variable('idt_'+str(ii)+'_'+str(type_i), 
                                           [1, outputs_size[ii]], 
@@ -361,16 +362,16 @@ def _filter(self,
                                           trainable = trainable)
                 if outputs_size[ii] == outputs_size[ii-1]:
                     if self.filter_resnet_dt :
-                        xyz_scatter += activation_fn(tf.matmul(xyz_scatter, w) + b) * idt
+                        xyz_scatter += hidden * idt
                     else :
-                        xyz_scatter += activation_fn(tf.matmul(xyz_scatter, w) + b)
+                        xyz_scatter += hidden
                 elif outputs_size[ii] == outputs_size[ii-1] * 2: 
                     if self.filter_resnet_dt :
-                        xyz_scatter = tf.concat([xyz_scatter,xyz_scatter], 1) + activation_fn(tf.matmul(xyz_scatter, w) + b) * idt
+                        xyz_scatter = tf.concat([xyz_scatter,xyz_scatter], 1) + hidden * idt
                     else :
-                        xyz_scatter = tf.concat([xyz_scatter,xyz_scatter], 1) + activation_fn(tf.matmul(xyz_scatter, w) + b)
+                        xyz_scatter = tf.concat([xyz_scatter,xyz_scatter], 1) + hidden
                 else:
-                    xyz_scatter = activation_fn(tf.matmul(xyz_scatter, w) + b)
+                    xyz_scatter = hidden
             else:
               w = tf.zeros((outputs_size[0], outputs_size[-1]), dtype=global_tf_float_precision)
               xyz_scatter = tf.matmul(xyz_scatter, w)
@@ -440,6 +441,7 @@ def _filter_type_ext(self,
                                 self.filter_precision,
                                 tf.random_normal_initializer(stddev=stddev, mean = bavg, seed = seed),
                                   trainable = trainable)
+              hidden = tf.reshape(activation_fn(tf.matmul(xyz_scatter, w) + b), [-1, outputs_size[ii]])
               if self.filter_resnet_dt :
                   idt = tf.get_variable('idt_'+str(ii)+'_'+str(type_i), 
                                         [1, outputs_size[ii]], 
@@ -448,16 +450,16 @@ def _filter_type_ext(self,
                                         trainable = trainable)
               if outputs_size[ii] == outputs_size[ii-1]:
                   if self.filter_resnet_dt :
-                      xyz_scatter += activation_fn(tf.matmul(xyz_scatter, w) + b) * idt
+                      xyz_scatter += hidden * idt
                   else :
-                      xyz_scatter += activation_fn(tf.matmul(xyz_scatter, w) + b)
+                      xyz_scatter += hidden
               elif outputs_size[ii] == outputs_size[ii-1] * 2: 
                   if self.filter_resnet_dt :
-                      xyz_scatter = tf.concat([xyz_scatter,xyz_scatter], 1) + activation_fn(tf.matmul(xyz_scatter, w) + b) * idt
+                      xyz_scatter = tf.concat([xyz_scatter,xyz_scatter], 1) + hidden * idt
                   else :
-                      xyz_scatter = tf.concat([xyz_scatter,xyz_scatter], 1) + activation_fn(tf.matmul(xyz_scatter, w) + b)
+                      xyz_scatter = tf.concat([xyz_scatter,xyz_scatter], 1) + hidden
               else:
-                  xyz_scatter = activation_fn(tf.matmul(xyz_scatter, w) + b)
+                  xyz_scatter = hidden
             # natom x nei_type_i x out_size
             xyz_scatter = tf.reshape(xyz_scatter, (-1, shape_i[1]//4, outputs_size[-1]))
             # natom x nei_type_i x 4  
diff --git a/source/train/DescrptSeR.py b/source/train/DescrptSeR.py
@@ -298,6 +298,7 @@ def _filter_r(self,
                                             self.filter_precision,
                                             tf.random_normal_initializer(stddev=stddev, mean = bavg, seed = seed), 
                                             trainable = trainable)
+                        hidden = tf.reshape(activation_fn(tf.matmul(xyz_scatter, w) + b), [-1, outputs_size[ii]])
                         if self.filter_resnet_dt :
                             idt = tf.get_variable('idt_'+str(ii)+'_'+str(type_i), 
                                                   [1, outputs_size[ii]], 
@@ -306,16 +307,16 @@ def _filter_r(self,
                                                   trainable = trainable)
                         if outputs_size[ii] == outputs_size[ii-1]:
                             if self.filter_resnet_dt :
-                                xyz_scatter += activation_fn(tf.matmul(xyz_scatter, w) + b) * idt
+                                xyz_scatter += hidden * idt
                             else :
-                                xyz_scatter += activation_fn(tf.matmul(xyz_scatter, w) + b)
+                                xyz_scatter += hidden
                         elif outputs_size[ii] == outputs_size[ii-1] * 2: 
                             if self.filter_resnet_dt :
-                                xyz_scatter = tf.concat([xyz_scatter,xyz_scatter], 1) + activation_fn(tf.matmul(xyz_scatter, w) + b) * idt
+                                xyz_scatter = tf.concat([xyz_scatter,xyz_scatter], 1) + hidden * idt
                             else :
-                                xyz_scatter = tf.concat([xyz_scatter,xyz_scatter], 1) + activation_fn(tf.matmul(xyz_scatter, w) + b)
+                                xyz_scatter = tf.concat([xyz_scatter,xyz_scatter], 1) + hidden
                         else:
-                            xyz_scatter = activation_fn(tf.matmul(xyz_scatter, w) + b)
+                            xyz_scatter = hidden
                 else:
                     w = tf.zeros((outputs_size[0], outputs_size[-1]), dtype=global_tf_float_precision)
                     xyz_scatter = tf.matmul(xyz_scatter, w)
diff --git a/source/train/Network.py b/source/train/Network.py
@@ -41,9 +41,9 @@ def one_layer(inputs,
                 # return activation_fn(hidden_bn)
             else:
                 if use_timestep :
-                    return activation_fn(hidden) * idt
+                    return tf.reshape(activation_fn(hidden), [-1, outputs_size]) * idt
                 else :
-                    return activation_fn(hidden)                    
+                    return tf.reshape(activation_fn(hidden), [-1, outputs_size])                    
         else:
             if useBN:
                 None

Original file line number	Diff line number	Diff line change
`@@ -83,7 +83,7 @@ set (SOURCE_FILES`
`83`	`83`	`descrpt_se_a.cu descrpt_se_r.cu prod_force_se_a.cu prod_force_se_r.cu prod_virial_se_a.cu prod_virial_se_r.cu gelu.cu`
`84`	`84`	`)`
`85`	`85`
`86`		`-cuda_add_library(deepmd_op_cuda STATIC ${SOURCE_FILES})`
	`86`	`+cuda_add_library(deepmd_op_cuda SHARED ${SOURCE_FILES})`
`87`	`87`
`88`	`88`	`if (BUILD_CPP_IF)`
`89`	`89`	`install(TARGETS deepmd_op_cuda DESTINATION lib/)`