Skip to content

Model llama3 2

hydropix edited this page Dec 23, 2025 · 1 revision

llama3.2

Ollama Model ID: llama3.2


Summary

Metric Value
Average Score ⚫ 2.5/10
Accuracy 3.4/10
Fluency 2.5/10
Style 2.3/10
Languages Tested 19
Total Translations 95
Best Language Spanish (5.0)
Worst Language Hebrew (1.0)

Language Performance

Top Languages

Rank Language Overall Accuracy Fluency Style
1 Spanish 🟠 5.0 6.0 5.0 4.8
2 Portuguese 🔴 4.8 5.8 4.8 4.6
3 Vietnamese 🔴 4.8 5.8 4.8 4.2
4 Italian 🔴 4.4 5.4 4.4 4.2
5 French 🔴 4.2 5.2 4.2 4.0
6 German 🔴 3.8 4.8 3.8 3.4
7 Thai 🔴 3.2 4.0 3.2 2.6
8 Hindi ⚫ 2.6 3.4 2.6 2.6
9 Chinese (Simplified) ⚫ 2.2 3.2 2.2 2.0
10 Polish ⚫ 2.0 2.6 2.0 1.6
View all 19 languages
Rank Language Overall Accuracy Fluency Style
1 Spanish 🟠 5.0 6.0 5.0 4.8
2 Portuguese 🔴 4.8 5.8 4.8 4.6
3 Vietnamese 🔴 4.8 5.8 4.8 4.2
4 Italian 🔴 4.4 5.4 4.4 4.2
5 French 🔴 4.2 5.2 4.2 4.0
6 German 🔴 3.8 4.8 3.8 3.4
7 Thai 🔴 3.2 4.0 3.2 2.6
8 Hindi ⚫ 2.6 3.4 2.6 2.6
9 Chinese (Simplified) ⚫ 2.2 3.2 2.2 2.0
10 Polish ⚫ 2.0 2.6 2.0 1.6
11 Chinese (Traditional) ⚫ 2.0 3.0 2.0 1.6
12 Japanese ⚫ 1.8 2.4 1.8 1.4
13 Tamil ⚫ 1.2 2.0 1.2 1.0
14 Arabic ⚫ 1.2 2.0 1.2 1.0
15 Korean ⚫ 1.0 1.8 1.0 1.0
16 Bengali ⚫ 1.0 1.8 1.0 1.0
17 Russian ⚫ 1.0 1.8 1.0 1.0
18 Ukrainian ⚫ 1.0 2.0 1.0 1.0
19 Hebrew ⚫ 1.0 1.0 1.0 1.0

Performance by Category

European Major Languages

Language Overall Accuracy Fluency Style
Spanish 🟠 5.0 6.0 5.0 4.8
Portuguese 🔴 4.8 5.8 4.8 4.6
Italian 🔴 4.4 5.4 4.4 4.2
French 🔴 4.2 5.2 4.2 4.0
German 🔴 3.8 4.8 3.8 3.4
Polish ⚫ 2.0 2.6 2.0 1.6

Category Average: 🔴 4.0

Asian Languages

Language Overall Accuracy Fluency Style
Vietnamese 🔴 4.8 5.8 4.8 4.2
Thai 🔴 3.2 4.0 3.2 2.6
Hindi ⚫ 2.6 3.4 2.6 2.6
Chinese (Simplified) ⚫ 2.2 3.2 2.2 2.0
Chinese (Traditional) ⚫ 2.0 3.0 2.0 1.6
Japanese ⚫ 1.8 2.4 1.8 1.4
Tamil ⚫ 1.2 2.0 1.2 1.0
Korean ⚫ 1.0 1.8 1.0 1.0
Bengali ⚫ 1.0 1.8 1.0 1.0

Category Average: ⚫ 2.2

Semitic Languages

Language Overall Accuracy Fluency Style
Arabic ⚫ 1.2 2.0 1.2 1.0
Hebrew ⚫ 1.0 1.0 1.0 1.0

Category Average: ⚫ 1.1

Cyrillic Languages

Language Overall Accuracy Fluency Style
Russian ⚫ 1.0 1.8 1.0 1.0
Ukrainian ⚫ 1.0 2.0 1.0 1.0

Category Average: ⚫ 1.0


Translation Examples

Best Translation

Spanish - Pride and Prejudice Score: 🟡 7.0/10

View Translation

Original:

Translation:

<TRANSLACIÓN>

Es una verdad universalmente reconocida, que un hombre soltero en posesión de una buena fortuna, debe estar buscando a una esposa. Sin embargo poco conocidos puedan ser los sentimientos o las opiniones de tal hombre al primer entrar en un barrio vecinal, esta verdad está tan bien fijada en las mentes de las familias circundantes que se le considera como la propiedad legítima de alguna de sus hijas.

</TRANSLACIÓN>

Feedback: The translation preserves the meaning accurately with only minor issues ("barrio vecinal" is slightly redundant, and "tal hombre" is somewhat formal). However, the fluency suffers from awkward phrasing like "poco conocidos puedan ser" which disrupts the natural flow, and the ironic tone is slightly diminished compared to Austen's original wit.

Worst Translation

Polish - Moby-Dick Score: ⚫ 1.0/10

View Translation

Original:

Translation:

<TRANSLACIÓN> Zwyciężcie mnie Izael. Kilkoro lat temu—nie liczyę dokładnie, jak długie to właściwie—z niewielkim lub nieistniejącym w moim zacisku pieniędzu i niczym specjalnymem nie interesując się na ziemi, uważałem, że będę chciał wyczerpuć się na morzu trochę i zobaczyć część świata wodnego. To jest moją metodą rozczarcia umysłu i regulowania krążki. W chwili, kiedy staje się mnie sam na samego; kiedy to jest mokre i grzebienny listopad w moim duszy, uważam, że jest już czasem, by jak schnel

Feedback: This translation is severely flawed with numerous critical errors: 'Zwyciężcie mnie' (conquer me) instead of 'Nazwij mnie' (call me), nonsensical phrases like 'z niewielkim...w moim zacisku' (with little in my grip), and 'wyczerpuć się na morzu' (exhaust myself at sea). The text is largely incomprehensible, with grammatical errors, malapropisms, and complete loss of the original's eloquent, meditative tone.


Score Distribution

Score Range Count Percentage
🟢 Excellent (9-10) 0 0.0%
🟡 Good (7-8) 3 3.2%
🟠 Acceptable (5-6) 11 11.6%
🔴 Poor (3-4) 26 27.4%
⚫ Failed (1-2) 55 57.9%

Performance Metrics

Metric Value
Average Translation Time 1127.0ms
Success Rate 100.0%

← Back to Home | All Models

Clone this wiki locally