Delete the commented code

leo-pony · leo-pony · commit c4e84796f6d1 · 2024-11-08T17:55:27.000+08:00
diff --git a/ggml/src/ggml-cann/kernels/get_row_f16.cpp b/ggml/src/ggml-cann/kernels/get_row_f16.cpp
@@ -65,18 +65,7 @@ class GET_ROW_F16 {
         size_t tail = len % elem_per_block;
         len = len & ~(elem_per_block - 1);
         if(tail != 0) {
-            //printf("f16 get_row: copy_in: offset:%d, len:%d, origin_len:%d, tail:%d, elem_per_block:%d.\n", offset, len, origin_len, tail, elem_per_block);
-            //DumpTensor(input_local, 5, elem_per_block);
             len += elem_per_block;
-            // DataCopy(input_local[len], input_gm[offset + len], elem_per_block);
-#if 0
-            DataCopyExtParams dataCopyParams;
-            dataCopyParams.blockCount = 1;
-            dataCopyParams.blockLen = tail * sizeof(half);
-            DataCopyPadExtParams<half> padParams;
-            DataCopyPad(input_local[len], input_gm[offset + len],
-                        dataCopyParams, padParams);
-#endif
         }
         DataCopy(input_local, input_gm[offset], len);
         input_queue.EnQue(input_local);
@@ -90,30 +79,15 @@ class GET_ROW_F16 {
         if (len > 0) {
             DataCopy(output_gm[offset], output_local, len);
         }
-#if 1
         if(tail != 0) {
-/*             printf("\nf16 BLOCK_IDX:%d get_row: Copy_Out AtomicAdd: offset:%d, len:%d, tail:%d, elem_per_block:%d.\n", op_block_idx, offset, len, tail, elem_per_block);
-            DumpTensor(output_gm, 5, elem_per_block); */
             for (size_t i = tail; i < elem_per_block; i++) {
                 output_local[len + i].SetValue(0, 0);
             }
-            // DumpTensor(output_local[len], 5, elem_per_block);
             SetAtomicAdd<float>();
             DataCopy(output_gm[offset + len], output_local[len], elem_per_block);
             SetAtomicNone();
-            // DumpTensor(output_gm, 5, elem_per_block);
         }
-#endif
 
-#if 0
-        if(tail != 0) {
-            DataCopyExtParams dataCopyParams;
-            dataCopyParams.blockCount = 1;
-            dataCopyParams.blockLen = tail * sizeof(float);
-            DataCopyPad(output_gm[offset + len], output_local[len],
-                        dataCopyParams);
-        }
-#endif
         output_queue.FreeTensor(output_local);
     }
 
diff --git a/ggml/src/ggml-cann/kernels/get_row_f32.cpp b/ggml/src/ggml-cann/kernels/get_row_f32.cpp
@@ -51,47 +51,18 @@ class GET_ROW_F32 {
         // All data should asign to 32. It's ok because all data is align to 32.
         pipe.InitBuffer(input_queue, BUFFER_NUM, local_buffer_size);
         pipe.InitBuffer(output_queue, BUFFER_NUM, local_buffer_size);
-        // printf("f32 BLOCK_IDX:%d get_row: init: ir:%d, dr:%d, n_elements:%d.\n", op_block_idx, ir, dr, n_elements);
     }
 
     __aicore__ inline void copy_in(uint32_t offset, size_t len) {
-        size_t origin_len = len;
         LocalTensor<float> input_local = input_queue.AllocTensor<float>();
         const size_t elem_per_block = 32 / sizeof(float);
         size_t tail = len % elem_per_block;
         len = len & ~(elem_per_block - 1);
 
-        //printf("f32 BLOCK_IDX:%d get_row: Copy_in: offset:%d, len:%d, origin_len:%d, tail:%d, elem_per_block:%d.\n", op_block_idx, offset, len, origin_len, tail, elem_per_block);
         if (len > 0)
             DataCopy(input_local, input_gm[offset], len);
-        //printf("f32 BLOCK_IDX:%d get_row: Copy_in executed: offset:%d, len:%d, origin_len:%d, tail:%d, elem_per_block:%d.\n", op_block_idx, offset, len, origin_len, tail, elem_per_block);
         if(tail != 0) {
-#if 1
-/*             //printf("f32 BLOCK_IDX:%d get_row: Copy_in ENTER tail != 0: offset:%d, len:%d, origin_len:%d, tail:%d, elem_per_block:%d.\n", op_block_idx, offset, len, origin_len, tail, elem_per_block);
-            for (int i = 0; i < elem_per_block; i++) {
-                printf("f32 BLOCK_IDX:%d get_row: Copy_in: get value idx:%d, origin input local val:%f.\n", op_block_idx, i, input_local[len + i].GetValue(0));
-            }
-            //DumpTensor(input_gm[offset + len], 5, elem_per_block);
-            for (int i = 0; i < tail; i++) {
-                printf("f32 BLOCK_IDX:%d get_row: Copy_in: get value idx:%d, input local val:%f, input_gm:%f.\n", op_block_idx, len + i, input_local[len + i].GetValue(0), input_gm[offset + len + i]);
-            } */
             DataCopy(input_local[len], input_gm[offset + len], elem_per_block);
-            // clean
-/*             for (int i = tail; i < elem_per_block; i++) {
-                input_local[len + i].SetValue(0, 0);
-            }
-            for (int i = 0; i < elem_per_block; i++) {
-                printf("f32 BLOCK_IDX:%d get_row: Copy_in: get value idx:%d, after clean and copy, input local val:%f.\n", op_block_idx, i, input_local[len + i].GetValue(0));
-            }  */
-#endif
-#if 0
-            DataCopyExtParams dataCopyParams;
-            dataCopyParams.blockCount = 1;
-            dataCopyParams.blockLen = tail * sizeof(float);
-            DataCopyPadExtParams<float> padParams;
-            DataCopyPad(input_local[len], input_gm[offset + len],
-                        dataCopyParams, padParams);
-#endif
         }
         input_queue.EnQue(input_local);
     }
@@ -104,31 +75,15 @@ class GET_ROW_F32 {
         if (len > 0) {
             DataCopy(output_gm[offset], output_local, len);
         }
-
-#if 1
         if(tail != 0) {
             for (size_t i = tail; i < elem_per_block; i++) {
                 output_local[len + i].SetValue(0, 0);
             }
-            //printf("\nf32 BLOCK_IDX:%d get_row: Copy_Out AtomicAdd: offset:%d, len:%d, tail:%d, elem_per_block:%d.\n", op_block_idx, offset, len, tail, elem_per_block);
-/*             DumpTensor(output_gm[offset + len], 5, elem_per_block);
-            DumpTensor(output_local[len], 5, elem_per_block); */
             SetAtomicAdd<float>();
             DataCopy(output_gm[offset + len], output_local[len], elem_per_block);
             SetAtomicNone();
-/*             DumpTensor(output_gm[offset + len], 5, elem_per_block); */
         }
-#endif
-#if 0
-        if(tail != 0) {
 
-            DataCopyExtParams dataCopyParams;
-            dataCopyParams.blockCount = 1;
-            dataCopyParams.blockLen = tail * sizeof(float);
-            DataCopyPad(output_gm[offset + len], output_local[len],
-                        dataCopyParams);
-        }
-#endif
         output_queue.FreeTensor(output_local);
     }