Skip to content

Model mistral small 24b

hydropix edited this page Dec 23, 2025 · 1 revision

mistral-small:24b

Ollama Model ID: mistral-small:24b


Summary

Metric Value
Average Score 🟠 6.4/10
Accuracy 7.2/10
Fluency 6.4/10
Style 6.2/10
Languages Tested 19
Total Translations 95
Best Language French (7.8)
Worst Language Bengali (4.8)

Language Performance

Top Languages

Rank Language Overall Accuracy Fluency Style
1 French 🟡 7.8 8.2 7.6 7.8
2 Spanish 🟡 7.6 8.0 7.4 7.2
3 Portuguese 🟡 7.4 8.2 7.2 7.4
4 Italian 🟡 7.2 7.8 7.4 7.2
5 Chinese (Traditional) 🟡 7.2 7.6 7.2 6.6
6 Chinese (Simplified) 🟡 7.0 7.6 7.2 6.6
7 Russian 🟡 7.0 7.6 6.8 7.0
8 German 🟠 6.8 7.6 6.8 6.8
9 Vietnamese 🟠 6.6 7.6 6.6 6.4
10 Polish 🟠 6.4 7.4 6.4 6.2
View all 19 languages
Rank Language Overall Accuracy Fluency Style
1 French 🟡 7.8 8.2 7.6 7.8
2 Spanish 🟡 7.6 8.0 7.4 7.2
3 Portuguese 🟡 7.4 8.2 7.2 7.4
4 Italian 🟡 7.2 7.8 7.4 7.2
5 Chinese (Traditional) 🟡 7.2 7.6 7.2 6.6
6 Chinese (Simplified) 🟡 7.0 7.6 7.2 6.6
7 Russian 🟡 7.0 7.6 6.8 7.0
8 German 🟠 6.8 7.6 6.8 6.8
9 Vietnamese 🟠 6.6 7.6 6.6 6.4
10 Polish 🟠 6.4 7.4 6.4 6.2
11 Japanese 🟠 6.4 7.0 6.4 5.6
12 Ukrainian 🟠 6.4 7.2 6.4 6.4
13 Korean 🟠 6.0 6.8 6.2 5.6
14 Hindi 🟠 5.6 6.6 5.6 5.2
15 Arabic 🟠 5.6 6.6 5.6 5.2
16 Hebrew 🟠 5.6 6.6 5.6 5.4
17 Thai 🟠 5.4 6.4 5.4 5.2
18 Tamil 🟠 5.4 6.4 5.4 4.8
19 Bengali 🔴 4.8 5.8 4.8 4.4

Performance by Category

European Major Languages

Language Overall Accuracy Fluency Style
French 🟡 7.8 8.2 7.6 7.8
Spanish 🟡 7.6 8.0 7.4 7.2
Portuguese 🟡 7.4 8.2 7.2 7.4
Italian 🟡 7.2 7.8 7.4 7.2
German 🟠 6.8 7.6 6.8 6.8
Polish 🟠 6.4 7.4 6.4 6.2

Category Average: 🟡 7.2

Asian Languages

Language Overall Accuracy Fluency Style
Chinese (Traditional) 🟡 7.2 7.6 7.2 6.6
Chinese (Simplified) 🟡 7.0 7.6 7.2 6.6
Vietnamese 🟠 6.6 7.6 6.6 6.4
Japanese 🟠 6.4 7.0 6.4 5.6
Korean 🟠 6.0 6.8 6.2 5.6
Hindi 🟠 5.6 6.6 5.6 5.2
Thai 🟠 5.4 6.4 5.4 5.2
Tamil 🟠 5.4 6.4 5.4 4.8
Bengali 🔴 4.8 5.8 4.8 4.4

Category Average: 🟠 6.0

Cyrillic Languages

Language Overall Accuracy Fluency Style
Russian 🟡 7.0 7.6 6.8 7.0
Ukrainian 🟠 6.4 7.2 6.4 6.4

Category Average: 🟠 6.7

Semitic Languages

Language Overall Accuracy Fluency Style
Arabic 🟠 5.6 6.6 5.6 5.2
Hebrew 🟠 5.6 6.6 5.6 5.4

Category Average: 🟠 5.6


Translation Examples

Best Translation

French - Pride and Prejudice Score: 🟢 9.0/10

View Translation

Original:

Translation:

C'est une vérité universellement reconnue qu'un célibataire pourvu d'une belle fortune doit être en quête d'une épouse. Si peu que l'on connaisse ses sentiments ou ses opinions sur ce point, dès son arrivée dans un quartier, cette vérité est si bien ancrée dans l'esprit des familles environnantes qu'il est considéré comme la propriété légitime de l'une ou l'autre de leurs filles.

Feedback: The translation faithfully preserves Austen's ironic meaning and satirical tone, with excellent equivalents like 'vérité universellement reconnue' and 'propriété légitime.' The prose flows naturally in French with only minor stylistic variations from the original.

Worst Translation

Thai - Moby-Dick Score: 🔴 4.0/10

View Translation

Original:

Translation:

เรียกฉันว่า อิสมาอีล ใคร่คิดว่าปีที่ผ่านมา ไม่รู้ว่ามานานเท่าไหร่ ฉันมีเงินในกระเป๋าไม่มากนัก และไม่มีอะไรที่น่าสนใจบนฝั่ง ฉันจึงคิดว่าเราจะออกเดินทางไปทั่วโลกที่เป็นน้ำเล็กน้อยและดูส่วนของโลกนี้ที่เป็นน้ำ เป็นวิธีหนึ่งที่ฉันใช้ในการขับไล่ความเศร้า และปรับปรุงการไหลเวียนของเลือด เมื่อฉันพบว่าตัวเองกลายเป็นคนที่มีใบหน้าที่เห็นได้ชัดเจนและไม่สบายใจ หรือเมื่อมีอากาศหนาวเย็นในจิตใจฉัน ฉันคิดว่าเป็นเวลาที่ดีที่สุดแล้วที่จะออกไปทะเลเร็วที่สุดเท่าที่จะทำได้

Feedback: The translation loses significant meaning and nuance from the original—'growing grim about the mouth' is mistranslated as 'having a clearly visible face,' and the poetic metaphor of 'damp, drizzly November in my soul' becomes awkwardly literal. The archaic, introspective tone is largely absent, resulting in awkward phrasing that reads more like a mechanical translation than natural Thai prose.


Score Distribution

Score Range Count Percentage
🟢 Excellent (9-10) 2 2.1%
🟡 Good (7-8) 45 47.4%
🟠 Acceptable (5-6) 45 47.4%
🔴 Poor (3-4) 3 3.2%
⚫ Failed (1-2) 0 0.0%

Performance Metrics

Metric Value
Average Translation Time 2986.0ms
Success Rate 100.0%

← Back to Home | All Models

Clone this wiki locally