| ๋ฌธ๊ตญํ | ๋ฅ์งํ | ์ด์นํ | ์ ์ฌํ | ์กฐ์ ๋ฏธ | ์ด๋๊ฒฝ | ์ด์ค์ |
| ํ์ฅ, ๋ชจ๋ธ๋ง ์ด๊ด | ๋ชจ๋ธ ์คํ ๋ฐ ์ต์ ํ | EDA ๋ฐ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ | ๋ชจ๋ธ ๊ฒ์ฆ ๋ฐ ์ฑ๋ฅ ๋ถ์ | ๋ชจ๋ธ ์คํ ๋ฐ ์ต์ ํ | EDA ๋ฐ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ | ๋ชจ๋ธ ๊ฒ์ฆ ๋ฐ ์ฑ๋ฅ ๋ถ์ |
- Python 3.10.13 ์ด์
- CUDA ์ง์ GPU ํ๊ฒฝ (PyTorch 2.7.1)
- uv ํจํค์ง ๋งค๋์
์ฃผ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ:
torch>=2.7.1- ๋ฅ๋ฌ๋ ํ๋ ์์ํฌtransformers>=4.54.0- Hugging Face Transformerspytorch-lightning>=2.5.2- PyTorch Lightningwandb>=0.21.0- ์คํ ์ถ์ ๋ฐ ์๊ฐํaccelerate>=0.26.0- ๋ถ์ฐ ํ์ต ์ง์rouge>=1.0.1- ROUGE ํ๊ฐ ์งํpandas>=2.3.1- ๋ฐ์ดํฐ ์ฒ๋ฆฌpython-dotenv>=1.1.1- ํ๊ฒฝ ๋ณ์ ๊ด๋ฆฌ
- ๋ํ๋ช : Dialogue Summarization | ์ผ์ ๋ํ ์์ฝ
- ๋ชฉํ: ์ผ์ ๋ํ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์์ฝํ๋ ๋ชจ๋ธ ๊ฐ๋ฐ
- ์ฃผ์ : ํ๊ต ์ํ, ์ง์ฅ, ์น๋ฃ, ์ผํ, ์ฌ๊ฐ, ์ฌํ ๋ฑ ๊ด๋ฒ์ํ ์ผ์ ์ํ ์ค ๋๋๋ ๋ํ๋ค์ ๋ํ ์์ฝ
- ์ค๋ช : ํ์๋ ํ ์๋ ๋ฌผ๋ก ์ด๊ณ , ์ฌ์ํ ์ผ์ ๋ํ ์ค์๋ ์๋ก ๋ค์ํ ์ฃผ์ ์ ์ ์ฅ๋ค์ ์ฃผ๊ณ ๋ฐ์ต๋๋ค. ๋ํ๋ฅผ ๋ น์ํด๋๋๋ผ๋ ์ ์ฒด๋ฅผ ๋ค์ ๋ค์ ์๋ ์๊ธฐ ๋๋ฌธ์ ์์ฝ์ด ํ์ํ๋ฉฐ, ์ด๋ฅผ ์ํ ํตํ ๋น์์ ๊ฐ์ ์๋น์ค๋ค๋ ๋ฑ์ฅํ๊ณ ์์ต๋๋ค.
- ๋ํ ์์: 2025๋ 7์ 25์ผ 10:00
- ๋ํ ์ข ๋ฃ: 2025๋ 8์ 6์ผ 19:00
โโโ code # ์ฝ๋ ๊ด๋ จ ํด๋
โย ย โโโ baseline # ๋ฒ ์ด์ค๋ผ์ธ ์ฝ๋ ํด๋
โย ย โย ย โโโ baseline.ipynb # ๋ฒ ์ด์ค๋ผ์ธ ์ฃผํผํฐ ๋
ธํธ๋ถ ๋ฒ์
โย ย โย ย โโโ baseline.py # ๋ฒ ์ด์ค๋ผ์ธ .py ๋ฒ์
โย ย โย ย โโโ config.yaml # ๋ชจ๋ธ ์ค์ ํ์ผ
โย ย โย ย โโโ env_template.txt # ํ๊ฒฝ ๋ณ์ ํ
ํ๋ฆฟ
โย ย โย ย โโโ requirements.txt # ํ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋ชฉ๋ก
โย ย โย ย โโโ solar_api.ipynb # Solar API ํ์ฉ ์ฃผํผํฐ ๋
ธํธ๋ถ
โย ย โย ย โโโ solar_api.py # Solar API ํ์ฉ .py ๋ฒ์
โย ย โโโ jhryu # ํ์ ํด๋
โย ย โย ย โโโ aeda_augmentation.py # EDA ๋ฐ์ดํฐ ์ฆ๊ฐ ์คํฌ๋ฆฝํธ
โย ย โย ย โโโ augmented_data # EDA ์ฆ๊ฐ ๋ฐ์ดํฐ ์ ์ฅ ๋๋ ํ ๋ฆฌ
โย ย โย ย โย ย โโโ aeda_report.json # EDA ์ฆ๊ฐ ๊ฒฐ๊ณผ ๋ฐ ๋ฆฌํฌํธ
โย ย โย ย โย ย โโโ augmentation_report.json # ๋ฐ์ดํฐ ์ฆ๊ฐ ๊ฒฐ๊ณผ ๋ฐ ๋ฆฌํฌํธ
โย ย โย ย โย ย โโโ train2.csv # ์ฆ๊ฐ๋ ํ์ต ๋ฐ์ดํฐ
โย ย โย ย โโโ baseline.py # ๊ฐ์ ๋ ๋ฒ ์ด์ค๋ผ์ธ ์คํฌ๋ฆฝํธ
โย ย โย ย โโโ config # ์คํ๋ณ ์ค์ ํ์ผ ๋๋ ํ ๋ฆฌ
โย ย โย ย โโโ config_sweep_solar.yaml # Solar API sweep ์ค์
โย ย โย ย โโโ config_sweep.yaml # sweep ์ค์ ํ์ผ
โย ย โย ย โโโ config.yaml # ๋ฉ์ธ ๋ชจ๋ธ ์ค์ ํ์ผ
โย ย โย ย โโโ data_augmentation.py # ๋ฐ์ดํฐ ์ฆ๊ฐ ์คํฌ๋ฆฝํธ
โย ย โย ย โโโ ensemble_inference_best.py # ์์๋ธ ์ถ๋ก ์คํฌ๋ฆฝํธ - ๋ฆฌ๋๋ณด๋ ๊ฐฑ์
โย ย โย ย โโโ ensemble_inference.py # ์์๋ธ ์ถ๋ก ์คํฌ๋ฆฝํธ
โย ย โย ย โโโ ensemble_usage.md # ์์๋ธ ์ฌ์ฉ๋ฒ ๋ฌธ์
โย ย โย ย โโโ env_template.txt # ํ๊ฒฝ ๋ณ์ ํ
ํ๋ฆฟ
โย ย โย ย โโโ inference.py # ๋จ์ผ ๋ชจ๋ธ ์ถ๋ก ์คํฌ๋ฆฝํธ
โย ย โย ย โโโ solar_api_sweep.py # Solar API sweep ์คํฌ๋ฆฝํธ
โย ย โย ย โโโ solar_api.py # Solar API ํ์ฉ ์คํฌ๋ฆฝํธ
โย ย โย ย โโโ wandb_sweep.py # wandb sweep ์คํ ์คํฌ๋ฆฝํธ
โย ย โโโ Moon # ํ์ฅ ํด๋
โย ย โย ย โโโ conf # ์ค์ ํ์ผ ํด๋
โย ย โย ย โย ย โโโ config.yaml # ๋ฉ์ธ ์ค์ ํ์ผ
โย ย โย ย โย ย โโโ data # ๋ฐ์ดํฐ ์ค์
โย ย โย ย โย ย โย ย โโโ default.yaml # ๊ธฐ๋ณธ ๋ฐ์ดํฐ ์ค์
โย ย โย ย โย ย โโโ inference # ์ถ๋ก ์ค์
โย ย โย ย โย ย โย ย โโโ default.yaml # ๊ธฐ๋ณธ ์ถ๋ก ์ค์
โย ย โย ย โย ย โโโ model # ๋ชจ๋ธ ์ค์
โย ย โย ย โย ย โย ย โโโ model.yaml # ๊ธฐ๋ณธ ๋ชจ๋ธ ์ค์
โย ย โย ย โย ย โโโ training # ํ์ต ์ค์
โย ย โย ย โย ย ย ย โโโ default.yaml # ๊ธฐ๋ณธ ํ์ต ์ค์
โย ย โย ย โโโ docs # ๋ฌธ์ ํด๋
โย ย โย ย โย ย โโโ Wandb.README.md # Wandb ๋ฌธ์
โย ย โย ย โโโ input # ์
๋ ฅ ๋ฐ์ดํฐ ๊ด๋ จ ํด๋
โย ย โย ย โย ย โโโ get_data.sh # ๋ฐ์ดํฐ ๋ค์ด๋ก๋ ์คํฌ๋ฆฝํธ
โย ย โย ย โโโ jupyter # ์ฃผํผํฐ ๋
ธํธ๋ถ ํด๋
โย ย โย ย โย ย โโโ EDA.ipynb # EDA ์ฃผํผํฐ ๋
ธํธ๋ถ
โย ย โย ย โโโ src # ์์ค์ฝ๋ ํด๋
โย ย โย ย ย ย โโโ check_gpu.py # GPU ํ์ธ ์ ํธ๋ฆฌํฐ
โย ย โย ย ย ย โโโ data.py # ๋ฐ์ดํฐ ์ฒ๋ฆฌ ์คํฌ๋ฆฝํธ
โย ย โย ย ย ย โโโ inference.py # ์ถ๋ก ์คํฌ๋ฆฝํธ
โย ย โย ย ย ย โโโ main.ipynb # ๋ฉ์ธ ์ฃผํผํฐ ๋
ธํธ๋ถ
โย ย โย ย ย ย โโโ main.py # ๋ฉ์ธ ์คํ ์คํฌ๋ฆฝํธ
โย ย โย ย ย ย โโโ model.py # ๋ชจ๋ธ ์คํฌ๋ฆฝํธ
โย ย โย ย ย ย โโโ train.py # ํ์ต ์คํฌ๋ฆฝํธ
โย ย โย ย ย ย โโโ utils.py # ์ ํธ๋ฆฌํฐ ์คํฌ๋ฆฝํธ
โย ย โโโ seung_notebook # ํ์ ํด๋
โย ย โย ย โโโ baseline.py # ๋ฒ ์ด์ค๋ผ์ธ ์คํฌ๋ฆฝํธ
โย ย โย ย โโโ eda.ipynb # EDA ์ฃผํผํฐ ๋
ธํธ๋ถ
โย ย โย ย โโโ preprocess.py # ์ ์ฒ๋ฆฌ ์คํฌ๋ฆฝํธ
โย ย โโโ utils # ๊ณตํต ์ ํธ๋ฆฌํฐ ํด๋
โย ย ย ย โโโ check_gpu.py # GPU ํ์ธ ์ ํธ๋ฆฌํฐ
โย ย ย ย โโโ log_util.py # ๋ก๊น
์ ํธ๋ฆฌํฐ
โโโ config.yaml # ๋ฉ์ธ ์ค์ ํ์ผ
โโโ data # ๋ฐ์ดํฐ ํด๋
โย ย โโโ dev_clean.csv # ๊ฒ์ฆ ๋ฐ์ดํฐ (ํด๋ฆฐ)
โย ย โโโ dev.csv # ๊ฒ์ฆ ๋ฐ์ดํฐ
โย ย โโโ sample_submission.csv # ์ ์ถ ์์
โย ย โโโ test_clean.csv # ํ
์คํธ ๋ฐ์ดํฐ (ํด๋ฆฐ)
โย ย โโโ test.csv # ํ
์คํธ ๋ฐ์ดํฐ
โย ย โโโ train_clean.csv # ํ์ต ๋ฐ์ดํฐ (ํด๋ฆฐ)
โย ย โโโ train.csv # ํ์ต ๋ฐ์ดํฐ
โโโ docs # ๋ฌธ์ ํด๋
โย ย โโโ Wandb.README.md # Wandb ๋ฌธ์
โโโ input # ์
๋ ฅ ๋ฐ์ดํฐ ๊ด๋ จ ํด๋
โย ย โโโ get_data.sh # ๋ฐ์ดํฐ ๋ค์ด๋ก๋ ์คํฌ๋ฆฝํธ
โโโ pyproject.toml # ํ๋ก์ ํธ ์์กด์ฑ ๋ฐ ๋ฉํ๋ฐ์ดํฐ ์ ์ (UV)
โโโ README.md # ํ๋ก์ ํธ ๋ฌธ์
โโโ uv.lock # ์์กด์ฑ ๋ฒ์ ์ ๊ธ ํ์ผ (UV)
- cd input && ./get_data.sh ๋ฅผ ์คํํ๋ฉด ๋ฐ์ดํฐ๋ฅผ ๋ค์ด๋ก๋ ํ์ฌ dataํด๋๊ฐ ์๊ธฐ๊ฒ ๋ฉ๋๋ค.
- UV๋ก ์คํํ ๊ฒฝ์ฐ ๋ค์ ๋ช ๋ น์ด๋ก ์คํํ ์ ์์ต๋๋ค:
uv run code/baseline/baseline.py-
๋ฐ์ดํฐ์ ํฌ๊ธฐ:
- Train: 12,457๊ฐ
- Dev: 499๊ฐ
- Test: 250๊ฐ
-
๋ฐ์ดํฐ ๊ตฌ์กฐ:
fname: ํ์ผ๋ช (์: train_0)dialogue: ๋ํ ๋ด์ฉ (์ต์ 2๋ช ์์ ์ต๋ 7๋ช ์ฐธ์ฌ)summary: ๋ํ ์์ฝ๋ฌธ (train/dev์๋ง ์กด์ฌ)topic: ๋ํ ์ฃผ์
-
๋ํ ์ฐธ์ฌ์ ํ์:
- #Person1#, #Person2#, #Person3# ๋ฑ์ผ๋ก ํ์ ๊ตฌ๋ถ
- ๊ฐ์ธ์ ๋ณด๋ #PhoneNumber#, #Address#, #PassportNumber# ๋ฑ์ผ๋ก ๋ง์คํน
- ๋ํ ๊ธธ์ด ๋ถ์: ํ๊ท 512 ํ ํฐ ์ด๋ด์ ๋ํ
- ์์ฝ๋ฌธ ๊ธธ์ด: ํ๊ท 100 ํ ํฐ ์ด๋ด
- ์ฃผ์ ๋ถํฌ: ์ผ์์ํ, ์ง์ฅ, ํ๊ต, ์๋ฃ, ์ผํ ๋ฑ ๋ค์ํ ์ฃผ์
- ํ์ ์ ๋ถํฌ: 2-7๋ช ์ ํ์๊ฐ ์ฐธ์ฌํ๋ ๋ํ
-
Special Tokens ์ฒ๋ฆฌ:
- ํ์ ํ ํฐ: #Person1#, #Person2#, #Person3#
- ๊ฐ์ธ์ ๋ณด ๋ง์คํน: #PhoneNumber#, #Address#, #PassportNumber#
- ํ ํฌ๋์ด์ ์ special_tokens๋ก ์ถ๊ฐํ์ฌ ๋ถํด๋์ง ์๋๋ก ์ฒ๋ฆฌ
-
ํ ํฌ๋์ด์ ์ค์ :
- Encoder ์ต๋ ๊ธธ์ด: 512 ํ ํฐ
- Decoder ์ต๋ ๊ธธ์ด: 100 ํ ํฐ
- BOS ํ ํฐ:
<s> - EOS ํ ํฐ:
</s>
-
๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ:
- Train ์: decoder_input์ BOS ํ ํฐ ์ถ๊ฐ, decoder_output์ EOS ํ ํฐ ์ถ๊ฐ
- Inference ์: ์์ฑ๋ ์์ฝ๋ฌธ์์ ํน์ ํ ํฐ ์ ๊ฑฐ
-
์ฆ๊ฐ ๋ฐฉ์:
- ๊ตฌ๋์ ์ฝ์ : ๋ฌธ์ฅ ์ค๊ฐ์ ์ผํ, ๋ง์ค์ํ ๋ฑ ์์ฐ์ค๋ฌ์ด ๊ตฌ๋์ ์ถ๊ฐ
- ๊ฐํ์ฌ/์ถ์์ ์ฝ์ : '์', '์', '๊ทธ๋ฐ๋ฐ', '๊ทธ๋ฌ๋๊น' ๋ฑ ํ๊ตญ์ด ์์ฐ์ค๋ฌ์ด ์ถ์์ ์ถ๊ฐ
- ์ ์์ด ๊ต์ฒด: '์ข์'โ'๊ด์ฐฎ์', '๋ค'โ'์' ๋ฑ ๊ธฐ๋ณธ์ ์ธ ์ ์์ด ๋ณํ
- ๋์๋ง/๋ฐ๋ง ๋ณํ: ๋ฌธ์ฒด ์ผ๊ด์ฑ์ ์ ์งํ๋ฉด์ ์กด๋๋ง๊ณผ ๋ฐ๋ง ๊ฐ ๋ณํ
- ๋ฌธ์ฅ ๋ถํ /๊ฒฐํฉ: ๊ธด ๋ฌธ์ฅ ๋ถ๋ฆฌ ๋๋ ์งง์ ๋ฌธ์ฅ๋ค์ ์์ฐ์ค๋ฌ์ด ๊ฒฐํฉ
-
์ฆ๊ฐ ๊ฐ๋: medium (์ํ๋น 2๊ฐ ๋ณํ ์์ฑ)
-
ํน์ง: API ์์ด ๋น ๋ฅธ ์๋๋ก ํ๊ตญ์ด ๋ํ๋ฌธ์ ํนํ๋ ์ฆ๊ฐ ์ํ
-
์ฑ๋ฅ ๊ฒฐ๊ณผ:
- AEDA 2์์๋ธ: 49.52(Mid) 45.61(Final)
- ์ฆ๊ฐ์์ 3์์๋ธ: 49.69(Mid) 46.54(Final)
- ๋ถ์: ์ฑ๋ฅ ์ฐจ์ด๊ฐ ๋ฏธ๋ฏธํ์ฌ ๋จ์ํ ๊ท์น ๊ธฐ๋ฐ ์ฆ๊ฐ์ผ๋ก๋ ์ค์ง์ ์ฑ๋ฅ ํฅ์ ํ๊ณ ํ์ธ
-
์ฌ์ฉ ๋ชจ๋ธ: digit82/kobart-summarization
- KoBART ๊ธฐ๋ฐ ํ๊ตญ์ด ์์ฝ ์ ์ฉ ๋ชจ๋ธ
- Encoder-Decoder ๊ตฌ์กฐ์ Seq2Seq ๋ชจ๋ธ
- ํ๊ตญ์ด ๋ด์ค ๊ธฐ์ฌ ์์ฝ์ผ๋ก ์ฌ์ ํ์ต๋จ
-
์ ํ ์ด์ :
-
ํ๊ตญ์ด ์์ฝ ํ์คํฌ์ ํนํ๋ ์ฌ์ ํ์ต ๋ชจ๋ธ
-
BART์ ๊ฐ๋ ฅํ ์์ฑ ๋ฅ๋ ฅ๊ณผ ํ๊ตญ์ด ์ดํด ๋ฅ๋ ฅ ๊ฒฐํฉ
-
Fine-tuning์ ํตํด ๋ํ ์์ฝ ํ์คํฌ์ ์ ์ ๊ฐ๋ฅ
-
์ฌ์ฉ ๋ชจ๋ธ: psyche/KoT5-summarization
-
T5 ๊ธฐ๋ฐ ํ๊ตญ์ด ์์ฝ ์ ์ฉ ๋ชจ๋ธ
-
์ ํ ์ด์ :
-
ํ๊ตญ์ด ์์ฝ ํ์คํฌ์ ํนํ๋ ์ฌ์ ํ์ต ๋ชจ๋ธ
-
T5์ ์ ์ฐํ ์ธ์ฝ๋-๋์ฝ๋ ๊ตฌ์กฐ๋ฅผ ํ์ฉํ ์์ ์ ์ธ ์ฑ๋ฅ
-
Encoder์ Decoder์ embedding ๊ณต์
-
- Epochs: 20
- Learning Rate: 1e-5
- Batch Size:
- Train: 50
- Eval: 32
- Optimizer: AdamW
- LR Scheduler: Cosine
- Mixed Precision: FP16 ์ฌ์ฉ
- Early Stopping:
- Patience: 3 epochs
- Threshold: 0.001
- ํ๊ฐ ์ ๋ต: Epoch ๋จ์ ํ๊ฐ
- ๋ชจ๋ธ ์ ์ฅ: ์ต๊ณ ์ฑ๋ฅ ๋ชจ๋ธ ์ ์ฅ (save_total_limit: 5)
- Beam Search: num_beams=4
- No Repeat N-gram: size=2
- Max Length: 100 ํ ํฐ
- Early Stopping: True
- Wandb๋ฅผ ํตํ ์ค์๊ฐ ๋ชจ๋ํฐ๋ง (์ ํ์ฌํญ)
- ROUGE ์ ์ ๊ธฐ๋ฐ ์ฑ๋ฅ ํ๊ฐ
- ํ์ต/๊ฒ์ฆ ์์ค ์ถ์
1. ๋ฒ ์ด์ค๋ผ์ธ ๋ชจ๋ธ ์ต์ ํ (wandb_sweep.py)
- ์ต์ ํ ๋ฐฉ๋ฒ: Bayesian Optimization
- ๋ชฉํ ์งํ: eval/rouge-1 ์ต๋ํ
- ์ฃผ์ ์ต์ ํ ํ๋ผ๋ฏธํฐ:
- Learning Rate: 1e-5 ~ 5e-4 (log uniform)
- Batch Size: [8, 16, 32, 48]
- Epochs: 5 ~ 20
- Warmup Ratio: 0.0 ~ 0.2
- Scheduler: [cosine, linear, polynomial]
- Sequence Length: encoder(256
768), decoder(40120) - Beam Search: [4, 6, 8, 10, 12]
2. Solar API ํ๋ผ๋ฏธํฐ ์ต์ ํ (solar_api_sweep.py)
- ์ต์ ํ ๋ฐฉ๋ฒ: Bayesian Optimization
- ๋ชฉํ ์งํ: eval/rouge_avg ์ต๋ํ
- ์ฃผ์ ์ต์ ํ ํ๋ผ๋ฏธํฐ:
- Model: [solar-pro2, solar-pro, solar-mini, solar-1-mini-chat ๋ฑ]
- Few-shot Count: [1, 2, 3, 4, 5]
- Temperature: 0.1 ~ 0.5 (์ฐฝ์์ฑ ์กฐ์ )
- Top-p: 0.1 ~ 0.9 (ํ ํฐ ์ ํ ๋ฒ์) ํน์ง:
- API Rate Limit ๊ณ ๋ คํ 10๋ถ ๋๊ธฐ ์๊ฐ ํฌํจ
- ํ๋ผ๋ฏธํฐ ์ค๋ฒ๋ผ์ด๋ ๊ธฐ๋ฅ์ผ๋ก ํน์ ๊ฐ ๊ณ ์ ๊ฐ๋ฅ
์์๋ธ ๋ฐฉ๋ฒ:
๐ Post-Generation ์์๋ธ (๊ฐ๋ณ ๋ชจ๋ธ ์ถ๋ก ํ ๊ฒฐ๊ณผ ํ์ฒ๋ฆฌ):
- Hard Voting: ๊ฐ ๋ชจ๋ธ์ด ์์ ํ ํ ์คํธ ์์ฑ ํ ํ ํฐ๋ณ ๋ค์๊ฒฐ ํฌํ
- Score-based Selection: ๊ฐ ๋ชจ๋ธ์ด Beam Search๋ก ์ฌ๋ฌ ํ๋ณด ์์ฑ ํ ์ ์๊ฐ ๊ฐ์ฅ ๋์ ๊ฒฐ๊ณผ ์ ํ
- Length Based: ๊ฐ ๋ชจ๋ธ ๊ฒฐ๊ณผ ์ค ๊ฐ์ฅ ๊ธด ๊ฒ์ ์ ํ
โก Real-time ์์๋ธ (์ค์๊ฐ์ผ๋ก ํ ํฐ๋ณ ์์๋ธ ์ถ๋ก ): 4. Logit Beam Search: ๊ฐ ์คํ ์์ ์์ k๊ฐ์ ๋น์ ์ ์งํ๊ณ ์ ์ ๊ธฐ๋ฐ์ผ๋ก ์ต์ข ์ ํ 5. Logit Greedy Decoding: ๋งค ํ ํฐ๋ง๋ค ๋ชจ๋ ๋ชจ๋ธ์ ํ๋ฅ ๋ถํฌ๋ฅผ ํ๊ท ํ์ฌ ์์ฑ
์ฑ๋ฅ ๊ฒฐ๊ณผ (ROUGE-avg ๊ธฐ์ค):
- 1์: Logit Beam Search - 0.296869 (292.5์ด) - ๋ฆฌ๋๋ณด๋ ๊ฐฑ์
- 2์: Length Based - 0.276318 (269.7์ด)
- 3์: Score-based Selection - 0.215161 (272.5์ด)
- 4์: Logit Greedy Decoding - 0.211966 (216.3์ด)
- 5์: Hard Voting - 0.197943 (271.1์ด)
์คํ ์๊ฐ ์์:
- 1์: Logit Greedy Decoding - 216.3์ด (๊ฐ์ฅ ๋น ๋ฆ)
- 2์: Length Based - 269.7์ด
- 3์: Hard Voting - 271.1์ด
- 4์: Score-based Selection - 272.5์ด
- 5์: Logit Beam Search - 292.5์ด
ํน์ง:
- 8๊ฐ ์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ์ ํ์ฉํ ์์๋ธ๋ก ๋ฆฌ๋๋ณด๋ ๊ฐฑ์ (Rougeํ๊ท 49.6957)
- ๊ฐ ๋ฐฉ๋ฒ๋ณ ์ฆ์ ROUGE ์ ์ ์ถ๋ ฅ ๋ฐ ์ฑ๋ฅ ๋น๊ต
- baseline.py์ ๋์ผํ ํ๊ฐ ๋ฐฉ์์ผ๋ก ์ ํํ ์ฑ๋ฅ ์ธก์
- ํ๊ฐ ์งํ: ROUGE-L F1 Score
- ์ ์ถ ํ์ผ ํ์: CSV (fname, summary ์ปฌ๋ผ)
์ต์ข ์ฑ๋ฅ ๊ฒฐ๊ณผ:
- 8๋ชจ๋ธ ์์๋ธ: ROUGE-L 49.69(Mid), 46.54(Final)
- 3๋ชจ๋ธ ์์๋ธ: ROUGE-L 49.29(Mid), 46.43(Final)
- AEDA 2๋ชจ๋ธ ์์๋ธ: ROUGE-L 49.52(Mid), 45.61(Final)
- ๋จ์ผ ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ ์ต์ ํ: ROUGE-L 48.04(Mid), 45.41(Final)
- Insert your presentaion file(pdf) link
- Insert your meeting log link like Notion or Google Docs
- Insert related reference