oceanbase
diff --git a/‎.github/workflows/api-tests.yml‎
Lines changed: 3 additions & 1 deletion b/‎.github/workflows/api-tests.yml‎
Lines changed: 3 additions & 1 deletion
diff --git a/‎.github/workflows/db-migration-test.yml‎
Lines changed: 3 additions & 1 deletion b/‎.github/workflows/db-migration-test.yml‎
Lines changed: 3 additions & 1 deletion
diff --git a/‎.github/workflows/style.yml‎
Lines changed: 3 additions & 1 deletion b/‎.github/workflows/style.yml‎
Lines changed: 3 additions & 1 deletion
diff --git a/‎api/core/rag/retrieval/dataset_retrieval.py‎
Lines changed: 29 additions & 35 deletions b/‎api/core/rag/retrieval/dataset_retrieval.py‎
Lines changed: 29 additions & 35 deletions
diff --git a/‎api/core/workflow/nodes/knowledge_retrieval/knowledge_retrieval_node.py‎
Lines changed: 53 additions & 53 deletions b/‎api/core/workflow/nodes/knowledge_retrieval/knowledge_retrieval_node.py‎
Lines changed: 53 additions & 53 deletions
diff --git a/‎api/libs/helper.py‎
Lines changed: 3 additions & 3 deletions b/‎api/libs/helper.py‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎api/migrations/versions/04c602f5dc9b_update_appmodelconfig_and_add_table_.py‎
Lines changed: 1 addition & 2 deletions b/‎api/migrations/versions/04c602f5dc9b_update_appmodelconfig_and_add_table_.py‎
Lines changed: 1 addition & 2 deletions
diff --git a/‎api/migrations/versions/053da0c1d756_add_api_tool_privacy.py‎
Lines changed: 1 addition & 2 deletions b/‎api/migrations/versions/053da0c1d756_add_api_tool_privacy.py‎
Lines changed: 1 addition & 2 deletions
diff --git a/‎api/migrations/versions/16fa53d9faec_add_provider_model_support.py‎
Lines changed: 3 additions & 4 deletions b/‎api/migrations/versions/16fa53d9faec_add_provider_model_support.py‎
Lines changed: 3 additions & 4 deletions
diff --git a/‎api/migrations/versions/2024_08_15_0956-0251a1c768cc_add_tidb_auth_binding.py‎
Lines changed: 1 addition & 2 deletions b/‎api/migrations/versions/2024_08_15_0956-0251a1c768cc_add_tidb_auth_binding.py‎
Lines changed: 1 addition & 2 deletions
@@ -1,7 +1,9 @@
 name: Run Pytest
 
 on:
-  workflow_call:
+  push:
+    branches:
+      - mysql-adapt
 
 concurrency:
   group: api-tests-${{ github.head_ref || github.run_id }}
 
@@ -1,7 +1,9 @@
 name: DB Migration Test
 
 on:
-  workflow_call:
+  push:
+    branches:
+      - mysql-adapt
 
 concurrency:
   group: db-migration-test-${{ github.ref }}
 
@@ -1,7 +1,9 @@
 name: Style check
 
 on:
-  workflow_call:
+  push:
+    branches:
+      - mysql-adapt
 
 concurrency:
   group: style-${{ github.head_ref || github.run_id }}
 
@@ -7,8 +7,7 @@
 from typing import Any, Union, cast
 
 from flask import Flask, current_app
-from sqlalchemy import Float, and_, or_, select, text
-from sqlalchemy import cast as sqlalchemy_cast
+from sqlalchemy import and_, or_, select
 
 from core.app.app_config.entities import (
     DatasetEntity,
@@ -1023,60 +1022,55 @@ def _process_metadata_filter_func(
         self, sequence: int, condition: str, metadata_name: str, value: Any | None, filters: list
     ):
         if value is None and condition not in ("empty", "not empty"):
-            return
+            return filters
+
+        json_field = DatasetDocument.doc_metadata[metadata_name].as_string()
 
-        key = f"{metadata_name}_{sequence}"
-        key_value = f"{metadata_name}_{sequence}_value"
         match condition:
             case "contains":
-                filters.append(
-                    (text(f"documents.doc_metadata ->> :{key} LIKE :{key_value}")).params(
-                        **{key: metadata_name, key_value: f"%{value}%"}
-                    )
-                )
+                filters.append(json_field.like(f"%{value}%"))
+
             case "not contains":
-                filters.append(
-                    (text(f"documents.doc_metadata ->> :{key} NOT LIKE :{key_value}")).params(
-                        **{key: metadata_name, key_value: f"%{value}%"}
-                    )
-                )
+                filters.append(json_field.notlike(f"%{value}%"))
+
             case "start with":
-                filters.append(
-                    (text(f"documents.doc_metadata ->> :{key} LIKE :{key_value}")).params(
-                        **{key: metadata_name, key_value: f"{value}%"}
-                    )
-                )
+                filters.append(json_field.like(f"{value}%"))
 
             case "end with":
-                filters.append(
-                    (text(f"documents.doc_metadata ->> :{key} LIKE :{key_value}")).params(
-                        **{key: metadata_name, key_value: f"%{value}"}
-                    )
-                )
+                filters.append(json_field.like(f"%{value}"))
+
             case "is" | "=":
                 if isinstance(value, str):
-                    filters.append(DatasetDocument.doc_metadata[metadata_name] == f'"{value}"')
-                else:
-                    filters.append(sqlalchemy_cast(DatasetDocument.doc_metadata[metadata_name].astext, Float) == value)
+                    filters.append(json_field == value)
+                elif isinstance(value, (int, float)):
+                    filters.append(DatasetDocument.doc_metadata[metadata_name].as_float() == value)
+
             case "is not" | "≠":
                 if isinstance(value, str):
-                    filters.append(DatasetDocument.doc_metadata[metadata_name] != f'"{value}"')
-                else:
-                    filters.append(sqlalchemy_cast(DatasetDocument.doc_metadata[metadata_name].astext, Float) != value)
+                    filters.append(json_field != value)
+                elif isinstance(value, (int, float)):
+                    filters.append(DatasetDocument.doc_metadata[metadata_name].as_float() != value)
+
             case "empty":
                 filters.append(DatasetDocument.doc_metadata[metadata_name].is_(None))
+
             case "not empty":
                 filters.append(DatasetDocument.doc_metadata[metadata_name].isnot(None))
+
             case "before" | "<":
-                filters.append(sqlalchemy_cast(DatasetDocument.doc_metadata[metadata_name].astext, Float) < value)
+                filters.append(DatasetDocument.doc_metadata[metadata_name].as_float() < value)
+
             case "after" | ">":
-                filters.append(sqlalchemy_cast(DatasetDocument.doc_metadata[metadata_name].astext, Float) > value)
+                filters.append(DatasetDocument.doc_metadata[metadata_name].as_float() > value)
+
             case "≤" | "<=":
-                filters.append(sqlalchemy_cast(DatasetDocument.doc_metadata[metadata_name].astext, Float) <= value)
+                filters.append(DatasetDocument.doc_metadata[metadata_name].as_float() <= value)
+
             case "≥" | ">=":
-                filters.append(sqlalchemy_cast(DatasetDocument.doc_metadata[metadata_name].astext, Float) >= value)
+                filters.append(DatasetDocument.doc_metadata[metadata_name].as_float() >= value)
             case _:
                 pass
+
         return filters
 
     def _fetch_model_config(
 
@@ -6,12 +6,12 @@
 from collections.abc import Mapping, Sequence
 from typing import TYPE_CHECKING, Any, cast
 
-from sqlalchemy import Float, and_, func, or_, select, text
-from sqlalchemy import cast as sqlalchemy_cast
+from sqlalchemy import and_, func, literal, or_, select
 from sqlalchemy.orm import sessionmaker
 
 from core.app.app_config.entities import DatasetRetrieveConfigEntity
 from core.app.entities.app_invoke_entities import ModelConfigWithCredentialsEntity
+from core.callback_handler.index_tool_callback_handler import DatasetDocument
 from core.entities.agent_entities import PlanningStrategy
 from core.entities.model_entities import ModelStatus
 from core.model_manager import ModelInstance, ModelManager
@@ -597,79 +597,79 @@ def _process_metadata_filter_func(
         if value is None and condition not in ("empty", "not empty"):
             return filters
 
-        key = f"{metadata_name}_{sequence}"
-        key_value = f"{metadata_name}_{sequence}_value"
+        json_field = DatasetDocument.doc_metadata[metadata_name].as_string()
+
         match condition:
             case "contains":
-                filters.append(
-                    (text(f"documents.doc_metadata ->> :{key} LIKE :{key_value}")).params(
-                        **{key: metadata_name, key_value: f"%{value}%"}
-                    )
-                )
+                filters.append(json_field.like(f"%{value}%"))
+
             case "not contains":
-                filters.append(
-                    (text(f"documents.doc_metadata ->> :{key} NOT LIKE :{key_value}")).params(
-                        **{key: metadata_name, key_value: f"%{value}%"}
-                    )
-                )
+                filters.append(json_field.notlike(f"%{value}%"))
+
             case "start with":
-                filters.append(
-                    (text(f"documents.doc_metadata ->> :{key} LIKE :{key_value}")).params(
-                        **{key: metadata_name, key_value: f"{value}%"}
-                    )
-                )
+                filters.append(json_field.like(f"{value}%"))
+
             case "end with":
-                filters.append(
-                    (text(f"documents.doc_metadata ->> :{key} LIKE :{key_value}")).params(
-                        **{key: metadata_name, key_value: f"%{value}"}
-                    )
-                )
+                filters.append(json_field.like(f"%{value}"))
             case "in":
                 if isinstance(value, str):
-                    escaped_values = [v.strip().replace("'", "''") for v in str(value).split(",")]
-                    escaped_value_str = ",".join(escaped_values)
+                    value_list = [v.strip() for v in value.split(",") if v.strip()]
+                elif isinstance(value, (list, tuple)):
+                    value_list = [str(v) for v in value if v is not None]
                 else:
-                    escaped_value_str = str(value)
-                filters.append(
-                    (text(f"documents.doc_metadata ->> :{key} = any(string_to_array(:{key_value},','))")).params(
-                        **{key: metadata_name, key_value: escaped_value_str}
-                    )
-                )
+                    value_list = [str(value)] if value is not None else []
+
+                if not value_list:
+                    filters.append(literal(False))
+                else:
+                    filters.append(json_field.in_(value_list))
+
             case "not in":
                 if isinstance(value, str):
-                    escaped_values = [v.strip().replace("'", "''") for v in str(value).split(",")]
-                    escaped_value_str = ",".join(escaped_values)
+                    value_list = [v.strip() for v in value.split(",") if v.strip()]
+                elif isinstance(value, (list, tuple)):
+                    value_list = [str(v) for v in value if v is not None]
                 else:
-                    escaped_value_str = str(value)
-                filters.append(
-                    (text(f"documents.doc_metadata ->> :{key} != all(string_to_array(:{key_value},','))")).params(
-                        **{key: metadata_name, key_value: escaped_value_str}
-                    )
-                )
-            case "=" | "is":
-                if isinstance(value, str):
-                    filters.append(Document.doc_metadata[metadata_name] == f'"{value}"')
+                    value_list = [str(value)] if value is not None else []
+
+                if not value_list:
+                    filters.append(literal(True))
                 else:
-                    filters.append(sqlalchemy_cast(Document.doc_metadata[metadata_name].astext, Float) == value)
+                    filters.append(json_field.notin_(value_list))
+
+            case "is" | "=":
+                if isinstance(value, str):
+                    filters.append(json_field == value)
+                elif isinstance(value, (int, float)):
+                    filters.append(DatasetDocument.doc_metadata[metadata_name].as_float() == value)
+
             case "is not" | "≠":
                 if isinstance(value, str):
-                    filters.append(Document.doc_metadata[metadata_name] != f'"{value}"')
-                else:
-                    filters.append(sqlalchemy_cast(Document.doc_metadata[metadata_name].astext, Float) != value)
+                    filters.append(json_field != value)
+                elif isinstance(value, (int, float)):
+                    filters.append(DatasetDocument.doc_metadata[metadata_name].as_float() != value)
+
             case "empty":
-                filters.append(Document.doc_metadata[metadata_name].is_(None))
+                filters.append(DatasetDocument.doc_metadata[metadata_name].is_(None))
+
             case "not empty":
-                filters.append(Document.doc_metadata[metadata_name].isnot(None))
+                filters.append(DatasetDocument.doc_metadata[metadata_name].isnot(None))
+
             case "before" | "<":
-                filters.append(sqlalchemy_cast(Document.doc_metadata[metadata_name].astext, Float) < value)
+                filters.append(DatasetDocument.doc_metadata[metadata_name].as_float() < value)
+
             case "after" | ">":
-                filters.append(sqlalchemy_cast(Document.doc_metadata[metadata_name].astext, Float) > value)
+                filters.append(DatasetDocument.doc_metadata[metadata_name].as_float() > value)
+
             case "≤" | "<=":
-                filters.append(sqlalchemy_cast(Document.doc_metadata[metadata_name].astext, Float) <= value)
+                filters.append(DatasetDocument.doc_metadata[metadata_name].as_float() <= value)
+
             case "≥" | ">=":
-                filters.append(sqlalchemy_cast(Document.doc_metadata[metadata_name].astext, Float) >= value)
+                filters.append(DatasetDocument.doc_metadata[metadata_name].as_float() >= value)
+
             case _:
                 pass
+
         return filters
 
     @classmethod
 
@@ -178,12 +178,12 @@ def timezone(timezone_string):
 
 
 def convert_datetime_to_date(field, target_timezone: str = ":tz"):
-    if dify_config.SQLALCHEMY_DATABASE_URI_SCHEME == "postgresql":
+    if dify_config.DB_TYPE == "postgresql":
         return f"DATE(DATE_TRUNC('day', {field} AT TIME ZONE 'UTC' AT TIME ZONE {target_timezone}))"
-    elif "mysql" in dify_config.SQLALCHEMY_DATABASE_URI_SCHEME:
+    elif dify_config.DB_TYPE == "mysql":
         return f"DATE(CONVERT_TZ({field}, 'UTC', {target_timezone}))"
     else:
-        raise NotImplementedError(f"Unsupported database URI scheme: {dify_config.SQLALCHEMY_DATABASE_URI_SCHEME}")
+        raise NotImplementedError(f"Unsupported database type: {dify_config.DB_TYPE}")
 
 
 def generate_string(n):
 
@@ -7,7 +7,6 @@
 """
 import sqlalchemy as sa
 from alembic import op
-from uuid import uuid4
 
 import models.types
 
@@ -38,7 +37,7 @@ def upgrade():
         )
     else:
         op.create_table('tracing_app_configs',
-        sa.Column('id', models.types.StringUUID(), default=lambda: str(uuid4()), nullable=False),
+        sa.Column('id', models.types.StringUUID(), nullable=False),
         sa.Column('app_id', models.types.StringUUID(), nullable=False),
         sa.Column('tracing_provider', sa.String(length=255), nullable=True),
         sa.Column('tracing_config', sa.JSON(), nullable=True),  
 
@@ -7,7 +7,6 @@
 """
 import sqlalchemy as sa
 from alembic import op
-from uuid import uuid4
 from sqlalchemy.dialects import postgresql
 
 import models.types
@@ -40,7 +39,7 @@ def upgrade():
         )
     else:
         op.create_table('tool_conversation_variables',
-        sa.Column('id', models.types.StringUUID(), default=lambda: str(uuid4()), nullable=False),
+        sa.Column('id', models.types.StringUUID(), nullable=False),
         sa.Column('user_id', models.types.StringUUID(), nullable=False),
         sa.Column('tenant_id', models.types.StringUUID(), nullable=False),
         sa.Column('conversation_id', models.types.StringUUID(), nullable=False),
 
@@ -7,7 +7,6 @@
 """
 import sqlalchemy as sa
 from alembic import op
-from uuid import uuid4
 from sqlalchemy.dialects import postgresql
 
 import models.types
@@ -43,7 +42,7 @@ def upgrade():
         )
     else:
         op.create_table('provider_models',
-        sa.Column('id', models.types.StringUUID(), default=lambda: str(uuid4()), nullable=False),
+        sa.Column('id', models.types.StringUUID(), nullable=False),
         sa.Column('tenant_id', models.types.StringUUID(), nullable=False),
         sa.Column('provider_name', sa.String(length=40), nullable=False),
         sa.Column('model_name', sa.String(length=40), nullable=False),
@@ -72,7 +71,7 @@ def upgrade():
         )
     else:
         op.create_table('tenant_default_models',
-        sa.Column('id', models.types.StringUUID(), default=lambda: str(uuid4()), nullable=False),
+        sa.Column('id', models.types.StringUUID(), nullable=False),
         sa.Column('tenant_id', models.types.StringUUID(), nullable=False),
         sa.Column('provider_name', sa.String(length=40), nullable=False),
         sa.Column('model_name', sa.String(length=40), nullable=False),
@@ -97,7 +96,7 @@ def upgrade():
         )
     else:
         op.create_table('tenant_preferred_model_providers',
-        sa.Column('id', models.types.StringUUID(), default=lambda: str(uuid4()), nullable=False),
+        sa.Column('id', models.types.StringUUID(), nullable=False),
         sa.Column('tenant_id', models.types.StringUUID(), nullable=False),
         sa.Column('provider_name', sa.String(length=40), nullable=False),
         sa.Column('preferred_provider_type', sa.String(length=40), nullable=False),
 
@@ -7,7 +7,6 @@
 """
 import sqlalchemy as sa
 from alembic import op
-from uuid import uuid4
 
 import models as models
 
@@ -41,7 +40,7 @@ def upgrade():
         )
     else:
         op.create_table('tidb_auth_bindings',
-        sa.Column('id', models.types.StringUUID(), default=lambda: str(uuid4()), nullable=False),
+        sa.Column('id', models.types.StringUUID(), nullable=False),
         sa.Column('tenant_id', models.types.StringUUID(), nullable=True),
         sa.Column('cluster_id', sa.String(length=255), nullable=False),
         sa.Column('cluster_name', sa.String(length=255), nullable=False),