@@ -368,10 +368,10 @@ def generate(self):
368368 id = llama_cpp .llama_sample_token_mirostat_v2 (self .ctx , candidates_p , llama_cpp .c_float (self .params .mirostat_tau ), llama_cpp .c_float (self .params .mirostat_eta ), llama_cpp .c_float (mirostat_mu ))
369369 else :
370370 # Temperature sampling
371- llama_cpp .llama_sample_top_k (self .ctx , candidates_p , top_k )
372- llama_cpp .llama_sample_tail_free (self .ctx , candidates_p , llama_cpp .c_float (self .params .tfs_z ))
373- llama_cpp .llama_sample_typical (self .ctx , candidates_p , llama_cpp .c_float (self .params .typical_p ))
374- llama_cpp .llama_sample_top_p (self .ctx , candidates_p , llama_cpp .c_float (self .params .top_p ))
371+ llama_cpp .llama_sample_top_k (self .ctx , candidates_p , top_k , min_keep = llama_cpp . c_size_t ( 1 ) )
372+ llama_cpp .llama_sample_tail_free (self .ctx , candidates_p , llama_cpp .c_float (self .params .tfs_z ), min_keep = llama_cpp . c_size_t ( 1 ) )
373+ llama_cpp .llama_sample_typical (self .ctx , candidates_p , llama_cpp .c_float (self .params .typical_p ), min_keep = llama_cpp . c_size_t ( 1 ) )
374+ llama_cpp .llama_sample_top_p (self .ctx , candidates_p , llama_cpp .c_float (self .params .top_p ), min_keep = llama_cpp . c_size_t ( 1 ) )
375375 llama_cpp .llama_sample_temperature (self .ctx , candidates_p , llama_cpp .c_float (self .params .temp ))
376376 id = llama_cpp .llama_sample_token (self .ctx , candidates_p )
377377 # print("`{}`".format(candidates_p.size))
0 commit comments