You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Try out on [colab](https://colab.research.google.com/drive/1s5zZZL8j2waMTkwUOmSOv6IywoBrNm1z?usp=sharing)
48
43
49
-
Or try out on [colab](https://colab.research.google.com/drive/1s5zZZL8j2waMTkwUOmSOv6IywoBrNm1z?usp=sharing)
44
+
or go to [KoGPT2-train](https://github.com/ksjae/KoGPT2-train) and use scripts/demo.py
50
45
51
46
#### Limitations and bias
52
47
53
48
v0.1 may have faulty tokenizers, producing bad outputs.
54
49
55
-
v0.2 will be GPT2 with n_ctx of 2048. True form of GPT-3 implementation(alternating layers) will not be available within the year.
50
+
v0.2+ be GPT2 with n_ctx of 2048. True form of GPT-3 implementation(alternating layers) will not be available within the year.
51
+
v0.2-story is producing hashtags (which were not finetuned for)
56
52
If other limitations or errors are found, please open an issue.
57
53
58
54
## Training data
@@ -67,7 +63,7 @@ The following data was used, and is available for redistribution [here](https://
67
63
- NAVER movie reviews
68
64
- Korean news(about 1GB) from Leipzig(a German university)
69
65
- Context data from KorSQUAD questions
70
-
- Parsed CommonCrawl data(WIP)
66
+
- Parsed Korean CommonCrawl data(WIP)
71
67
72
68
Please note the completed dataset includes <|endoftext|> tags.
73
69
@@ -86,21 +82,24 @@ All hyperparameters are the same as GPT2-large
86
82
One paragraph per line(TextDataset)
87
83
88
84
Early models(GPT2-large v0.2 and prior) are trained on 2xTesla V100 for 3~4 weeks.
89
-
Some models are trained on v3-8 TPUs.
90
-
Larger models are trained on v3-128 TPUs.
85
+
Models up to XL size are trained on v3-8 TPUs.
91
86
92
87
## Eval results
93
88
> prompt >>> 나는 어두운 숲 속을 거닐고 있다.
94
89
90
+
### v0.1 (xl)
95
91
> 어느새 나는 그 작은 산들을 향해 뛰기 시작했다. 그리고 내 시야에는 이 골짜기에 대한 어떤 동경도, 혹은 동경과 환희조차 엿보였다가 사라졌다가는 사라져 버리고 말았 다. 그러나 나 역시 그것을 믿지 않았다. 아니 그것도 모른다……. 그렇다면 그것은 또 무슨 말인가? 내가 이렇게 말해도 좋을 텐데…… 하지만 어쨌든 이곳엔 왜 그리 먼 곳에서부터 찾아올까 하고 생각해 보았다. 그래서 그는 지금 어느 한 곳만을 헤매면서 자 꾸만 걸어오는 것일까?
96
92
93
+
### v0.2-story (xl)
94
+
> 나는 어두운 숲 속을 거닐고 있다. #앨리건트테이블 의 #코코넛젤리 색이 넘 예쁘고 맛나다. #그릭요거트 원물이 들어간 마지막 베이커리 #말차초코케이크 도 맛나고 겉에 초코도 두껍게 씹히고..✨💕💕👍🏻 . . #앨리건트테이블 @eleganttable_ #간식 #카페어니언베이커리베이커 #콩콩볼 #쿠키 #디저트맛집 #디저트카페 #dessert #카페스타그램 #맛스타그램 #먹스타 그램 #먹방 #일상 #daily
0 commit comments