hydropix
diff --git a/‎README.md‎
Lines changed: 4 additions & 4 deletions b/‎README.md‎
Lines changed: 4 additions & 4 deletions
diff --git a/‎benchmark/wiki/generator.py‎
Lines changed: 4 additions & 4 deletions b/‎benchmark/wiki/generator.py‎
Lines changed: 4 additions & 4 deletions
diff --git a/‎benchmark/wiki/templates/home.md.j2‎
Lines changed: 9 additions & 8 deletions b/‎benchmark/wiki/templates/home.md.j2‎
Lines changed: 9 additions & 8 deletions
diff --git a/‎benchmark/wiki/templates/language.md.j2‎
Lines changed: 4 additions & 4 deletions b/‎benchmark/wiki/templates/language.md.j2‎
Lines changed: 4 additions & 4 deletions
diff --git a/‎benchmark/wiki/templates/model.md.j2‎
Lines changed: 6 additions & 6 deletions b/‎benchmark/wiki/templates/model.md.j2‎
Lines changed: 6 additions & 6 deletions
@@ -45,12 +45,12 @@ The web interface opens at **http://localhost:5000**
 | Provider | Type | Setup |
 |----------|------|-------|
 | **Ollama** | Local | [ollama.com](https://ollama.com/) |
-| **LM Studio** | Local (OpenAI-compatible) | [lmstudio.ai](https://lmstudio.ai/) |
+| **OpenAI-Compatible** | Local | llama.cpp, LM Studio, vLLM, LocalAI... |
 | **OpenRouter** | Cloud (200+ models) | [openrouter.ai/keys](https://openrouter.ai/keys) |
 | **OpenAI** | Cloud | [platform.openai.com](https://platform.openai.com/api-keys) |
 | **Gemini** | Cloud | [Google AI Studio](https://makersuite.google.com/app/apikey) |
 
-> **LM Studio / Local OpenAI-compatible servers:** Use `--provider openai` with `--api_endpoint http://localhost:1234/v1/chat/completions`
+> **OpenAI-Compatible servers:** Use `--provider openai` with your server's endpoint (e.g., llama.cpp: `http://localhost:8080/v1/chat/completions`, LM Studio: `http://localhost:1234/v1/chat/completions`)
 
 See [docs/PROVIDERS.md](docs/PROVIDERS.md) for detailed setup instructions.
 
@@ -88,9 +88,9 @@ python translate.py -i book.txt -o book_fr.txt --provider openai \
 python translate.py -i book.txt -o book_fr.txt --provider gemini \
     --gemini_api_key YOUR_KEY -m gemini-2.0-flash
 
-# With LM Studio (or any OpenAI-compatible local server)
+# With local OpenAI-compatible server (llama.cpp, LM Studio, vLLM, etc.)
 python translate.py -i book.txt -o book_fr.txt --provider openai \
-    --api_endpoint http://localhost:1234/v1/chat/completions -m your-model
+    --api_endpoint http://localhost:8080/v1/chat/completions -m your-model
 ```
 
 ### Main Options
 
@@ -270,15 +270,15 @@ def _generate_all_languages_page(self, run: BenchmarkRun) -> None:
             lang_info = self._get_language_info(stats.language_code)
             indicator = get_score_indicator(stats.avg_overall)
             rows.append([
-                f"[{lang_info['name']}](languages/{self._slugify(lang_info['name'])}.md)",
+                f"[{lang_info['name']}](languages/{self._slugify(lang_info['name'])})",
                 lang_info['native_name'],
                 lang_info['category'],
                 f"{indicator} {stats.avg_overall:.1f}",
                 stats.best_model or "N/A",
             ])
 
         table = format_markdown_table(headers, rows)
-        content = f"# All Languages\n\n{table}\n\n---\n\n[< Back to Home](Home.md)\n"
+        content = f"# All Languages\n\n{table}\n\n---\n\n[< Back to Home](Home)\n"
 
         (self.output_dir / "All-Languages.md").write_text(content, encoding="utf-8")
 
@@ -292,7 +292,7 @@ def _generate_all_models_page(self, run: BenchmarkRun) -> None:
         for stats in sorted(model_stats, key=lambda x: x.avg_overall, reverse=True):
             indicator = get_score_indicator(stats.avg_overall)
             rows.append([
-                f"[{stats.model}](models/{self._slugify(stats.model)}.md)",
+                f"[{stats.model}](models/{self._slugify(stats.model)})",
                 f"{indicator} {stats.avg_overall:.1f}",
                 f"{stats.avg_accuracy:.1f}",
                 f"{stats.avg_fluency:.1f}",
@@ -301,7 +301,7 @@ def _generate_all_models_page(self, run: BenchmarkRun) -> None:
             ])
 
         table = format_markdown_table(headers, rows)
-        content = f"# All Models\n\n{table}\n\n---\n\n[< Back to Home](Home.md)\n"
+        content = f"# All Models\n\n{table}\n\n---\n\n[< Back to Home](Home)\n"
 
         (self.output_dir / "All-Models.md").write_text(content, encoding="utf-8")
 
 
@@ -23,7 +23,7 @@ Overall performance across all tested languages:
 | Rank | Model | Avg Score | Accuracy | Fluency | Style | Languages Tested |
 |------|-------|-----------|----------|---------|-------|------------------|
 {% for model in model_rankings %}
-| {{ loop.index }} | [{{ model.name }}](models/{{ model.slug }}.md) | {{ model.indicator }} {{ model.avg_overall|round(1) }} | {{ model.avg_accuracy|round(1) }} | {{ model.avg_fluency|round(1) }} | {{ model.avg_style|round(1) }} | {{ model.languages_tested }} |
+| {{ loop.index }} | [{{ model.name }}](models/{{ model.slug }}) | {{ model.indicator }} {{ model.avg_overall|round(1) }} | {{ model.avg_accuracy|round(1) }} | {{ model.avg_fluency|round(1) }} | {{ model.avg_style|round(1) }} | {{ model.languages_tested }} |
 {% endfor %}
 
 ---
@@ -35,11 +35,11 @@ Best translation quality by target language:
 | Rank | Language | Native | Avg Score | Best Model | Tests |
 |------|----------|--------|-----------|------------|-------|
 {% for lang in language_rankings[:15] %}
-| {{ loop.index }} | [{{ lang.name }}](languages/{{ lang.slug }}.md) | {{ lang.native_name }} | {{ lang.indicator }} {{ lang.avg_overall|round(1) }} | {{ lang.best_model }} | {{ lang.total_translations }} |
+| {{ loop.index }} | [{{ lang.name }}](languages/{{ lang.slug }}) | {{ lang.native_name }} | {{ lang.indicator }} {{ lang.avg_overall|round(1) }} | {{ lang.best_model }} | {{ lang.total_translations }} |
 {% endfor %}
 
 {% if language_rankings|length > 15 %}
-[View all {{ language_rankings|length }} languages...](All-Languages.md)
+[View all {{ language_rankings|length }} languages...](All-Languages)
 {% endif %}
 
 ---
@@ -64,7 +64,7 @@ Best translation quality by target language:
 | Language | Avg Score | Best Model |
 |----------|-----------|------------|
 {% for lang in category.languages %}
-| [{{ lang.name }}](languages/{{ lang.slug }}.md) | {{ lang.indicator }} {{ lang.avg_overall|round(1) }} | {{ lang.best_model }} |
+| [{{ lang.name }}](languages/{{ lang.slug }}) | {{ lang.indicator }} {{ lang.avg_overall|round(1) }} | {{ lang.best_model }} |
 {% endfor %}
 
 {% endfor %}
@@ -73,10 +73,11 @@ Best translation quality by target language:
 
 ## Browse
 
-- **By Language:** [All Languages](All-Languages.md)
-- **By Model:** [All Models](All-Models.md)
-- **Raw Data:** [Download JSON](https://github.com/yourusername/TranslateBookWithLLM/tree/main/benchmark_results)
+- **By Language:** [All Languages](All-Languages)
+- **By Model:** [All Models](All-Models)
+- **Benchmark Documentation:** [How to Run Benchmarks](Benchmark-System)
+- **Raw Data:** [Download JSON](https://github.com/hydropix/TranslateBookWithLLM/tree/main/benchmark_results)
 
 ---
 
-*Generated by [TranslateBookWithLLM](https://github.com/yourusername/TranslateBookWithLLM) benchmark system*
+*Generated by [TranslateBookWithLLM](https://github.com/hydropix/TranslateBookWithLLM) benchmark system*
@@ -15,8 +15,8 @@
 | **Fluency** | {{ avg_fluency|round(1) }}/10 |
 | **Style** | {{ avg_style|round(1) }}/10 |
 | **Total Tests** | {{ total_translations }} |
-| **Best Model** | [{{ best_model }}](../models/{{ best_model_slug }}.md) |
-| **Worst Model** | [{{ worst_model }}](../models/{{ worst_model_slug }}.md) |
+| **Best Model** | [{{ best_model }}](../models/{{ best_model_slug }}) |
+| **Worst Model** | [{{ worst_model }}](../models/{{ worst_model_slug }}) |
 
 ---
 
@@ -25,7 +25,7 @@
 | Model | Overall | Accuracy | Fluency | Style |
 |-------|---------|----------|---------|-------|
 {% for result in model_results %}
-| [{{ result.model }}](../models/{{ result.model_slug }}.md) | {{ result.indicator }} {{ result.avg_overall|round(1) }} | {{ result.avg_accuracy|round(1) }} | {{ result.avg_fluency|round(1) }} | {{ result.avg_style|round(1) }} |
+| [{{ result.model }}](../models/{{ result.model_slug }}) | {{ result.indicator }} {{ result.avg_overall|round(1) }} | {{ result.avg_accuracy|round(1) }} | {{ result.avg_fluency|round(1) }} | {{ result.avg_style|round(1) }} |
 {% endfor %}
 
 ---
@@ -70,4 +70,4 @@
 
 ---
 
-[< Back to Home](../Home.md) | [All Languages](../All-Languages.md)
+[< Back to Home](../Home) | [All Languages](../All-Languages)
@@ -14,8 +14,8 @@
 | **Style** | {{ avg_style|round(1) }}/10 |
 | **Languages Tested** | {{ total_languages }} |
 | **Total Translations** | {{ total_translations }} |
-| **Best Language** | [{{ best_language }}](../languages/{{ best_language_slug }}.md) ({{ best_language_score|round(1) }}) |
-| **Worst Language** | [{{ worst_language }}](../languages/{{ worst_language_slug }}.md) ({{ worst_language_score|round(1) }}) |
+| **Best Language** | [{{ best_language }}](../languages/{{ best_language_slug }}) ({{ best_language_score|round(1) }}) |
+| **Worst Language** | [{{ worst_language }}](../languages/{{ worst_language_slug }}) ({{ worst_language_score|round(1) }}) |
 
 ---
 
@@ -26,7 +26,7 @@
 | Rank | Language | Overall | Accuracy | Fluency | Style |
 |------|----------|---------|----------|---------|-------|
 {% for lang in language_results[:10] %}
-| {{ loop.index }} | [{{ lang.name }}](../languages/{{ lang.slug }}.md) | {{ lang.indicator }} {{ lang.avg_overall|round(1) }} | {{ lang.avg_accuracy|round(1) }} | {{ lang.avg_fluency|round(1) }} | {{ lang.avg_style|round(1) }} |
+| {{ loop.index }} | [{{ lang.name }}](../languages/{{ lang.slug }}) | {{ lang.indicator }} {{ lang.avg_overall|round(1) }} | {{ lang.avg_accuracy|round(1) }} | {{ lang.avg_fluency|round(1) }} | {{ lang.avg_style|round(1) }} |
 {% endfor %}
 
 {% if language_results|length > 10 %}
@@ -36,7 +36,7 @@
 | Rank | Language | Overall | Accuracy | Fluency | Style |
 |------|----------|---------|----------|---------|-------|
 {% for lang in language_results %}
-| {{ loop.index }} | [{{ lang.name }}](../languages/{{ lang.slug }}.md) | {{ lang.indicator }} {{ lang.avg_overall|round(1) }} | {{ lang.avg_accuracy|round(1) }} | {{ lang.avg_fluency|round(1) }} | {{ lang.avg_style|round(1) }} |
+| {{ loop.index }} | [{{ lang.name }}](../languages/{{ lang.slug }}) | {{ lang.indicator }} {{ lang.avg_overall|round(1) }} | {{ lang.avg_accuracy|round(1) }} | {{ lang.avg_fluency|round(1) }} | {{ lang.avg_style|round(1) }} |
 {% endfor %}
 
 </details>
@@ -52,7 +52,7 @@
 | Language | Overall | Accuracy | Fluency | Style |
 |----------|---------|----------|---------|-------|
 {% for lang in category.languages %}
-| [{{ lang.name }}](../languages/{{ lang.slug }}.md) | {{ lang.indicator }} {{ lang.avg_overall|round(1) }} | {{ lang.avg_accuracy|round(1) }} | {{ lang.avg_fluency|round(1) }} | {{ lang.avg_style|round(1) }} |
+| [{{ lang.name }}](../languages/{{ lang.slug }}) | {{ lang.indicator }} {{ lang.avg_overall|round(1) }} | {{ lang.avg_accuracy|round(1) }} | {{ lang.avg_fluency|round(1) }} | {{ lang.avg_style|round(1) }} |
 {% endfor %}
 
 **Category Average:** {{ category.indicator }} {{ category.avg_overall|round(1) }}
@@ -130,4 +130,4 @@
 
 ---
 
-[< Back to Home](../Home.md) | [All Models](../All-Models.md)
+[< Back to Home](../Home) | [All Models](../All-Models)