Skip to content

RefalMachine/ruadapt

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

56 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

RuAdapt

Репозиторий проекта RuAdapt.

plot

Models

todo

Paper

Препринт: https://arxiv.org/pdf/2312.02598.pdf

Tikhomirov, M. M., Chernyshev D. I. Impact of Tokenization on LLaMa Russian Adaptation, Proceedings of Ivannikov ISPRAS Open Conference (2023)

Credits

Код для instruction tuning полностью основан на https://github.com/IlyaGusev/saiga

Код для расширения токенизации частично основан на коде модели Qwen https://github.com/QwenLM/Qwen

TODO

  1. Составить нормально базовые конфиги

  2. Отладить pipeline

  3. ft - transformers, sft & kto unsloth

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages

  • Python 98.1%
  • Shell 1.9%