Release 0.4.0a1 (#10)

JarbasAl · web-flow · commit cc4c459cec36 · 2025-04-10T21:39:46.000+01:00
* feat:ollama_api_support (#9) * Increment Version to 0.4.0a1 * Update Changelog --------- Co-authored-by: JarbasAI <33701864+JarbasAl@users.noreply.github.com> Co-authored-by: JarbasAl <JarbasAl@users.noreply.github.com>
diff --git a/CHANGELOG.md b/CHANGELOG.md
@@ -1,12 +1,12 @@
 # Changelog
 
-## [0.3.2a1](https://github.com/OpenVoiceOS/ovos-persona-server/tree/0.3.2a1) (2025-03-05)
+## [0.4.0a1](https://github.com/OpenVoiceOS/ovos-persona-server/tree/0.4.0a1) (2025-04-10)
 
-[Full Changelog](https://github.com/OpenVoiceOS/ovos-persona-server/compare/0.3.1...0.3.2a1)
+[Full Changelog](https://github.com/OpenVoiceOS/ovos-persona-server/compare/0.3.2...0.4.0a1)
 
 **Merged pull requests:**
 
-- Fix/streaming [\#6](https://github.com/OpenVoiceOS/ovos-persona-server/pull/6) ([JarbasAl](https://github.com/JarbasAl))
+- feat:ollama\_api\_support [\#9](https://github.com/OpenVoiceOS/ovos-persona-server/pull/9) ([JarbasAl](https://github.com/JarbasAl))
 
 
 
diff --git a/ovos_persona_server/__init__.py b/ovos_persona_server/__init__.py
@@ -1,3 +1,4 @@
+import datetime
 import json
 import os.path
 import random
@@ -6,6 +7,7 @@
 from typing import Any
 
 from flask import Flask, request
+from ovos_bus_client.session import SessionManager
 from ovos_persona import Persona
 
 
@@ -18,13 +20,16 @@ def get_app(persona_json):
 
     persona = Persona(persona["name"], persona)
 
+    #######
     @app.route("/status", methods=["GET"])
     def status():
         return {"persona": persona.name,
                 "solvers": list(persona.solvers.loaded_modules.keys()),
                 "models": {s: persona.config.get(s, {}).get("model")
                            for s in persona.solvers.loaded_modules.keys()}}
 
+    ##############
+    # OpenAI api compat
     @app.route("/chat/completions", methods=["POST"])
     def chat_completions():
         data = request.get_json()
@@ -97,4 +102,173 @@ def streaming():
 
         return app.response_class(streaming(), mimetype="text/event-stream")
 
+    ############
+    # Ollama api compat
+    @app.route("/api/chat", methods=["POST"])
+    def chat():
+        model = request.json.get("model")
+        messages = request.json.get("messages")
+        tools = request.json.get("tools")
+        stream = request.json.get("stream")
+
+        # Format timestamp to the desired format
+        completion_timestamp = (datetime.datetime.now().strftime('%Y-%m-%dT%H:%M:%S')
+                                + f'.{int(time.time() * 1_000_000) % 1_000_000:06d}Z')
+
+        sess = SessionManager().get()
+
+        if not stream:
+            ans = persona.chat(messages, lang=sess.lang, units=sess.system_unit)
+            data = {
+                "model": persona.name,
+                "created_at": completion_timestamp,
+                "message": {
+                    "role": "assistant",
+                    "content": ans,
+                },
+                "done": True
+                # "context": [1, 2, 3],
+                # "total_duration": 5043500667,
+                # "load_duration": 5025959,
+                # "prompt_eval_count": 26,
+                # "prompt_eval_duration": 325953000,
+                # "eval_count": 290,
+                # "eval_duration": 4709213000
+            }
+            return data
+
+        def streaming():
+            for ans in persona.stream(messages, lang=sess.lang, units=sess.system_unit):
+                data = {
+                    "model": persona.name,
+                    "created_at": completion_timestamp,
+                    "message": {
+                        "role": "assistant",
+                        "content": ans
+                    },
+                    "done": False,
+                    # "context": [1, 2, 3],
+                    # "total_duration": 10706818083,
+                    # "load_duration": 6338219291,
+                    # "prompt_eval_count": 26,
+                    # "prompt_eval_duration": 130079000,
+                    # "eval_count": 259,
+                    # "eval_duration": 4232710000
+                }
+                content = json.dumps(data)
+                yield content + "\n"
+
+            end_completion_data = {
+                "model": persona.name,
+                "created_at": completion_timestamp,
+                "message": {
+                    "role": "assistant",
+                    "content": ""
+                },
+                "done": True,
+                # "context": [1, 2, 3],
+                # "total_duration": 10706818083,
+                # "load_duration": 6338219291,
+                # "prompt_eval_count": 26,
+                # "prompt_eval_duration": 130079000,
+                # "eval_count": 259,
+                # "eval_duration": 4232710000
+            }
+            content = json.dumps(end_completion_data)
+            yield content + "\n"
+
+        return app.response_class(streaming(), mimetype="application/json")
+
+    @app.route("/api/generate", methods=["POST"])
+    def generate():
+        model = request.json.get("model")
+        prompt = request.json.get("prompt")
+        suffix = request.json.get("suffix")
+        system = request.json.get("system")
+        template = request.json.get("template")
+        stream = request.json.get("stream")
+
+        sess = SessionManager().get()
+
+        messages = [{
+            "role": "user",
+            "content": prompt
+        }]
+        if system:
+            messages.insert(0, {"role": "system", "content": system})
+
+        # Format timestamp to the desired format
+        completion_timestamp = (datetime.datetime.now().strftime('%Y-%m-%dT%H:%M:%S')
+                                + f'.{int(time.time() * 1_000_000) % 1_000_000:06d}Z')
+
+        sess = SessionManager().get()
+
+        if not stream:
+            ans = persona.chat(messages, lang=sess.lang, units=sess.system_unit)
+            data = {
+                "model": persona.name,
+                "created_at": completion_timestamp,
+                "message": {
+                    "role": "assistant",
+                    "content": ans,
+                },
+                "done": True
+                # "context": [1, 2, 3],
+                # "total_duration": 5043500667,
+                # "load_duration": 5025959,
+                # "prompt_eval_count": 26,
+                # "prompt_eval_duration": 325953000,
+                # "eval_count": 290,
+                # "eval_duration": 4709213000
+            }
+            return data
+
+        def streaming():
+            for ans in persona.stream(messages, lang=sess.lang, units=sess.system_unit):
+                data = {
+                    "model": persona.name,
+                    "created_at": completion_timestamp,
+                    "message": {
+                        "role": "assistant",
+                        "content": ans
+                    },
+                    "done": False,
+                    # "context": [1, 2, 3],
+                    # "total_duration": 10706818083,
+                    # "load_duration": 6338219291,
+                    # "prompt_eval_count": 26,
+                    # "prompt_eval_duration": 130079000,
+                    # "eval_count": 259,
+                    # "eval_duration": 4232710000
+                }
+                content = json.dumps(data)
+                yield content + "\n"
+
+            end_completion_data = {
+                "model": persona.name,
+                "created_at": completion_timestamp,
+                "message": {
+                    "role": "assistant",
+                    "content": ""
+                },
+                "done": True,
+                # "context": [1, 2, 3],
+                # "total_duration": 10706818083,
+                # "load_duration": 6338219291,
+                # "prompt_eval_count": 26,
+                # "prompt_eval_duration": 130079000,
+                # "eval_count": 259,
+                # "eval_duration": 4232710000
+            }
+            content = json.dumps(end_completion_data)
+            yield content + "\n"
+
+        return app.response_class(streaming(), mimetype="text/event-stream")
+
+    @app.route("/api/tags", methods=["GET"])
+    def tags():
+        return {"models": [
+            {"name": persona.name, "model": str(persona.solvers.sort_order[0])}
+        ]}
+
     return app
diff --git a/ovos_persona_server/version.py b/ovos_persona_server/version.py
@@ -1,6 +1,6 @@
 # START_VERSION_BLOCK
 VERSION_MAJOR = 0
-VERSION_MINOR = 3
-VERSION_BUILD = 2
-VERSION_ALPHA = 0
+VERSION_MINOR = 4
+VERSION_BUILD = 0
+VERSION_ALPHA = 1
 # END_VERSION_BLOCK