Skip to content

Commit 08f207e

Browse files
committed
CI for Italian tests
1 parent 56fae9b commit 08f207e

File tree

4 files changed

+97
-0
lines changed

4 files changed

+97
-0
lines changed

.github/workflows/italian.yml

Lines changed: 62 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,62 @@
1+
name: Italian tests
2+
3+
on: [workflow_dispatch, push, pull_request]
4+
5+
jobs:
6+
7+
canary-multi-turn:
8+
runs-on: ubuntu-22.04
9+
timeout-minutes: 3
10+
strategy:
11+
max-parallel: 3
12+
fail-fast: false
13+
matrix:
14+
model:
15+
- meta-llama/llama-3.2-3b-instruct # $0.0100/$0.0200 [ 128K]
16+
- google/gemma-3n-e4b-it # $0.0200/$0.0400 [ 32K]
17+
- google/gemma-3-4b-it # $0.0200/$0.0400 [ 128K]
18+
- mistralai/mistral-small-3.2-24b-instruct # $0.0500/$0.1000 [ 32K]
19+
- google/gemma-3-12b-it # $0.0500/$0.1000 [ 128K]
20+
- qwen/qwen3-8b # $0.0350/$0.1380 [ 128K]
21+
- google/gemini-flash-1.5-8b # $0.0380/$0.1500 [1000K]
22+
23+
steps:
24+
- uses: actions/checkout@v4
25+
26+
- run: ./chat-llm.js tests/it/canary-single-turn.txt
27+
env:
28+
LLM_API_BASE_URL: https://openrouter.ai/api/v1
29+
LLM_API_KEY: ${{ secrets.LLM_API_KEY }}
30+
LLM_CHAT_MODEL: ${{ matrix.model }}
31+
32+
- run: ./chat-llm.js tests/it/canary-multi-turn.txt
33+
env:
34+
LLM_API_BASE_URL: https://openrouter.ai/api/v1
35+
LLM_API_KEY: ${{ secrets.LLM_API_KEY }}
36+
LLM_CHAT_MODEL: ${{ matrix.model }}
37+
38+
39+
high-school-stem:
40+
runs-on: ubuntu-22.04
41+
timeout-minutes: 5
42+
strategy:
43+
max-parallel: 3
44+
fail-fast: false
45+
matrix:
46+
model:
47+
- meta-llama/llama-3.2-3b-instruct # $0.0100/$0.0200 [ 128K]
48+
- google/gemma-3n-e4b-it # $0.0200/$0.0400 [ 32K]
49+
- google/gemma-3-4b-it # $0.0200/$0.0400 [ 128K]
50+
- mistralai/mistral-small-3.2-24b-instruct # $0.0500/$0.1000 [ 32K]
51+
- google/gemma-3-12b-it # $0.0500/$0.1000 [ 128K]
52+
- qwen/qwen3-8b # $0.0350/$0.1380 [ 128K]
53+
- google/gemini-flash-1.5-8b # $0.0380/$0.1500 [1000K]
54+
55+
steps:
56+
- uses: actions/checkout@v4
57+
58+
- run: ./chat-llm.js tests/it/high-school-stem.txt
59+
env:
60+
LLM_API_BASE_URL: https://openrouter.ai/api/v1
61+
LLM_API_KEY: ${{ secrets.LLM_API_KEY }}
62+
LLM_CHAT_MODEL: ${{ matrix.model }}

tests/it/canary-multi-turn.txt

Lines changed: 11 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,11 @@
1+
User: Quale pianeta del nostro sistema solare è il più grande?
2+
Assistant: /Giove|Giuove/ è il pianeta più grande del nostro sistema solare.
3+
4+
User: E il più caldo?
5+
Assistant: /Venere|Venera/ è il pianeta più caldo del nostro sistema solare.
6+
7+
User: E quale ha il soprannome "Il Pianeta Rosso"?
8+
Assistant: /Marte/, a causa del suo aspetto rossastro causato dall'ossido di ferro sulla sua superficie.
9+
10+
User: E quale è noto per il sistema di anelli più complesso?
11+
Assistant: Deve essere /Saturno/!

tests/it/canary-single-turn.txt

Lines changed: 2 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,2 @@
1+
User: Quale pianeta del nostro sistema solare è il più grande?
2+
Assistant: /Giove|Giuove/ è il pianeta più grande del nostro sistema solare.

tests/it/high-school-stem.txt

Lines changed: 22 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,22 @@
1+
Story: Domande sui temi STEM a livello liceale
2+
3+
User: Quale forza attrae gli oggetti verso il centro della Terra?
4+
Assistant: La /gravità|forza di gravità|forza gravitazionale/ attrae gli oggetti verso il centro della Terra.
5+
6+
User: Qual è il numero atomico del carbonio?
7+
Assistant: Il numero atomico del carbonio è /6|sei/.
8+
9+
User: Attraverso quale processo le piante producono il proprio cibo?
10+
Assistant: Le piante producono il proprio cibo attraverso il processo della /fotosintesi|fotosintesi clorofilliana/.
11+
12+
User: Qual è la somma (in gradi) degli angoli interni di un triangolo?
13+
Assistant: La somma degli angoli interni di un triangolo è /180/ gradi.
14+
15+
User: Qual è l'unità di misura della forza?
16+
Assistant: L'unità di misura della forza è il /newton/ (N).
17+
18+
User: Qual è il simbolo chimico del magnesio?
19+
Assistant: Il simbolo chimico del magnesio è /Mg/.
20+
21+
User: Quali sono i più piccoli costituenti conosciuti della materia?
22+
Assistant: I più piccoli costituenti conosciuti della materia sono /particelle elementari|particelle subatomiche|particelle ancora|quark|quant|leptoni|atomi|protoni|neutroni|elettroni/.

0 commit comments

Comments
 (0)