pull user-defined model configs and providers if available

nabinchha · nabinchha · commit ebd73b4c6dc4 · 2025-11-10T20:08:14.000-07:00
diff --git a/src/data_designer/config/default_model_settings.py b/src/data_designer/config/default_model_settings.py
@@ -0,0 +1,148 @@
+# SPDX-FileCopyrightText: Copyright (c) 2025 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+# SPDX-License-Identifier: Apache-2.0
+
+import logging
+import os
+from typing import Optional
+
+from data_designer.cli.utils import get_model_config_path, get_model_provider_path, load_config_file
+
+from .models import InferenceParameters, ModelConfig, ModelProvider
+from .utils.constants import (
+    NVIDIA_API_KEY_ENV_VAR_NAME,
+    NVIDIA_PROVIDER_NAME,
+    OPENAI_API_KEY_ENV_VAR_NAME,
+    OPENAI_PROVIDER_NAME,
+)
+
+logger = logging.getLogger(__name__)
+
+
+def get_default_text_alias_inference_parameters() -> InferenceParameters:
+    return InferenceParameters(
+        temperature=0.85,
+        top_p=0.95,
+    )
+
+
+def get_default_reasoning_alias_inference_parameters() -> InferenceParameters:
+    return InferenceParameters(
+        temperature=0.35,
+        top_p=0.95,
+    )
+
+
+def get_default_vision_alias_inference_parameters() -> InferenceParameters:
+    return InferenceParameters(
+        temperature=0.85,
+        top_p=0.95,
+    )
+
+
+def get_default_nvidia_model_configs() -> list[ModelConfig]:
+    if not get_nvidia_api_key():
+        logger.warning(
+            f"🔑 {NVIDIA_API_KEY_ENV_VAR_NAME!r} environment variable is not set. Please set it to your API key from 'https://build.nvidia.com' if you want to use the default NVIDIA model configs."
+        )
+        return []
+    return [
+        ModelConfig(
+            alias=f"{NVIDIA_PROVIDER_NAME}-text",
+            model="nvidia/nvidia-nemotron-nano-9b-v2",
+            provider=NVIDIA_PROVIDER_NAME,
+            inference_parameters=get_default_text_alias_inference_parameters(),
+        ),
+        ModelConfig(
+            alias=f"{NVIDIA_PROVIDER_NAME}-reasoning",
+            model="openai/gpt-oss-20b",
+            provider=NVIDIA_PROVIDER_NAME,
+            inference_parameters=get_default_reasoning_alias_inference_parameters(),
+        ),
+        ModelConfig(
+            alias=f"{NVIDIA_PROVIDER_NAME}-vision",
+            model="nvidia/nemotron-nano-12b-v2-vl",
+            provider=NVIDIA_PROVIDER_NAME,
+            inference_parameters=get_default_vision_alias_inference_parameters(),
+        ),
+    ]
+
+
+def get_default_openai_model_configs() -> list[ModelConfig]:
+    if not get_openai_api_key():
+        logger.warning(
+            f"🔑 {OPENAI_API_KEY_ENV_VAR_NAME!r} environment variable is not set. Please set it to your API key from 'https://platform.openai.com/api-keys' if you want to use the default OpenAI model configs."
+        )
+        return []
+    return [
+        ModelConfig(
+            alias=f"{OPENAI_PROVIDER_NAME}-text",
+            model="gpt-4.1",
+            provider=OPENAI_PROVIDER_NAME,
+            inference_parameters=get_default_text_alias_inference_parameters(),
+        ),
+        ModelConfig(
+            alias=f"{OPENAI_PROVIDER_NAME}-reasoning",
+            model="gpt-5",
+            provider=OPENAI_PROVIDER_NAME,
+            inference_parameters=get_default_reasoning_alias_inference_parameters(),
+        ),
+        ModelConfig(
+            alias=f"{OPENAI_PROVIDER_NAME}-vision",
+            model="gpt-5",
+            provider=OPENAI_PROVIDER_NAME,
+            inference_parameters=get_default_vision_alias_inference_parameters(),
+        ),
+    ]
+
+
+def get_user_defined_default_model_configs() -> list[ModelConfig]:
+    pre_defined_model_config_path = get_model_config_path()
+    if pre_defined_model_config_path.exists():
+        config_dict = load_config_file(pre_defined_model_config_path)
+        if "model_configs" in config_dict:
+            logger.info(f"♻️ Found user-defined default model configs in {str(pre_defined_model_config_path)!r}")
+            return [ModelConfig.model_validate(mc) for mc in config_dict["model_configs"]]
+    return []
+
+
+def get_default_model_configs() -> list[ModelConfig]:
+    user_defined_default_model_configs = get_user_defined_default_model_configs()
+    if len(user_defined_default_model_configs) > 0:
+        return user_defined_default_model_configs
+    return get_default_nvidia_model_configs() + get_default_openai_model_configs()
+
+
+def get_default_providers() -> list[ModelProvider]:
+    user_defined_default_providers = get_user_defined_default_providers()
+    if len(user_defined_default_providers) > 0:
+        return user_defined_default_providers
+    return [
+        ModelProvider(
+            name=NVIDIA_PROVIDER_NAME,
+            endpoint="https://integrate.api.nvidia.com/v1",
+            api_key=NVIDIA_API_KEY_ENV_VAR_NAME,
+        ),
+        ModelProvider(
+            name=OPENAI_PROVIDER_NAME,
+            endpoint="https://api.openai.com/v1",
+            api_key=OPENAI_API_KEY_ENV_VAR_NAME,
+        ),
+    ]
+
+
+def get_user_defined_default_providers() -> list[ModelProvider]:
+    pre_defined_model_provider_path = get_model_provider_path()
+    if pre_defined_model_provider_path.exists():
+        config_dict = load_config_file(pre_defined_model_provider_path)
+        if "providers" in config_dict:
+            logger.info(f"♻️ Found user-defined default model providers in {str(pre_defined_model_provider_path)!r}")
+            return [ModelProvider.model_validate(p) for p in config_dict["providers"]]
+    return []
+
+
+def get_nvidia_api_key() -> Optional[str]:
+    return os.getenv(NVIDIA_API_KEY_ENV_VAR_NAME)
+
+
+def get_openai_api_key() -> Optional[str]:
+    return os.getenv(OPENAI_API_KEY_ENV_VAR_NAME)
diff --git a/src/data_designer/config/models.py b/src/data_designer/config/models.py
@@ -4,7 +4,6 @@
 from abc import ABC, abstractmethod
 from enum import Enum
 import logging
-import os
 from pathlib import Path
 from typing import Any, Generic, List, Optional, TypeVar, Union
 
@@ -19,10 +18,6 @@
     MAX_TOP_P,
     MIN_TEMPERATURE,
     MIN_TOP_P,
-    NVIDIA_API_KEY_ENV_VAR_NAME,
-    NVIDIA_PROVIDER_NAME,
-    OPENAI_API_KEY_ENV_VAR_NAME,
-    OPENAI_PROVIDER_NAME,
 )
 from .utils.io_helpers import smart_load_yaml
 
@@ -233,107 +228,3 @@ def load_model_configs(model_configs: Union[list[ModelConfig], str, Path]) -> li
             "The list of model configs must be provided under model_configs in the configuration file."
         )
     return [ModelConfig.model_validate(mc) for mc in json_config["model_configs"]]
-
-
-def get_default_text_alias_inference_parameters() -> InferenceParameters:
-    return InferenceParameters(
-        temperature=0.85,
-        top_p=0.95,
-    )
-
-
-def get_default_reasoning_alias_inference_parameters() -> InferenceParameters:
-    return InferenceParameters(
-        temperature=0.35,
-        top_p=0.95,
-    )
-
-
-def get_default_vision_alias_inference_parameters() -> InferenceParameters:
-    return InferenceParameters(
-        temperature=0.85,
-        top_p=0.95,
-    )
-
-
-def get_default_nvidia_model_configs() -> list[ModelConfig]:
-    if not get_nvidia_api_key():
-        logger.warning(
-            f"🔑 {NVIDIA_API_KEY_ENV_VAR_NAME!r} environment variable is not set. Please set it to your API key from 'https://build.nvidia.com' if you want to use the default NVIDIA model configs."
-        )
-        return []
-    return [
-        ModelConfig(
-            alias=f"{NVIDIA_PROVIDER_NAME}-text",
-            model="nvidia/nvidia-nemotron-nano-9b-v2",
-            provider=NVIDIA_PROVIDER_NAME,
-            inference_parameters=get_default_text_alias_inference_parameters(),
-        ),
-        ModelConfig(
-            alias=f"{NVIDIA_PROVIDER_NAME}-reasoning",
-            model="openai/gpt-oss-20b",
-            provider=NVIDIA_PROVIDER_NAME,
-            inference_parameters=get_default_reasoning_alias_inference_parameters(),
-        ),
-        ModelConfig(
-            alias=f"{NVIDIA_PROVIDER_NAME}-vision",
-            model="nvidia/nemotron-nano-12b-v2-vl",
-            provider=NVIDIA_PROVIDER_NAME,
-            inference_parameters=get_default_vision_alias_inference_parameters(),
-        ),
-    ]
-
-
-def get_default_openai_model_configs() -> list[ModelConfig]:
-    if not get_openai_api_key():
-        logger.warning(
-            f"🔑 {OPENAI_API_KEY_ENV_VAR_NAME!r} environment variable is not set. Please set it to your API key from 'https://platform.openai.com/api-keys' if you want to use the default OpenAI model configs."
-        )
-        return []
-    return [
-        ModelConfig(
-            alias=f"{OPENAI_PROVIDER_NAME}-text",
-            model="gpt-4.1",
-            provider=OPENAI_PROVIDER_NAME,
-            inference_parameters=get_default_text_alias_inference_parameters(),
-        ),
-        ModelConfig(
-            alias=f"{OPENAI_PROVIDER_NAME}-reasoning",
-            model="gpt-5",
-            provider=OPENAI_PROVIDER_NAME,
-            inference_parameters=get_default_reasoning_alias_inference_parameters(),
-        ),
-        ModelConfig(
-            alias=f"{OPENAI_PROVIDER_NAME}-vision",
-            model="gpt-5",
-            provider=OPENAI_PROVIDER_NAME,
-            inference_parameters=get_default_vision_alias_inference_parameters(),
-        ),
-    ]
-
-
-def get_default_model_configs() -> list[ModelConfig]:
-    return get_default_nvidia_model_configs() + get_default_openai_model_configs()
-
-
-def get_default_providers() -> list[ModelProvider]:
-    return [
-        ModelProvider(
-            name=NVIDIA_PROVIDER_NAME,
-            endpoint="https://integrate.api.nvidia.com/v1",
-            api_key=NVIDIA_API_KEY_ENV_VAR_NAME,
-        ),
-        ModelProvider(
-            name=OPENAI_PROVIDER_NAME,
-            endpoint="https://api.openai.com/v1",
-            api_key=OPENAI_API_KEY_ENV_VAR_NAME,
-        ),
-    ]
-
-
-def get_nvidia_api_key() -> Optional[str]:
-    return os.getenv(NVIDIA_API_KEY_ENV_VAR_NAME)
-
-
-def get_openai_api_key() -> Optional[str]:
-    return os.getenv(OPENAI_API_KEY_ENV_VAR_NAME)
diff --git a/src/data_designer/config/utils/visualization.py b/src/data_designer/config/utils/visualization.py
@@ -22,7 +22,8 @@
 
 from ..base import ConfigBase
 from ..columns import DataDesignerColumnType
-from ..models import ModelConfig, ModelProvider, get_nvidia_api_key, get_openai_api_key
+from ..default_model_settings import get_nvidia_api_key, get_openai_api_key
+from ..models import ModelConfig, ModelProvider
 from ..sampler_params import SamplerType
 from .code_lang import code_lang_to_syntax_lexer
 from .constants import NVIDIA_API_KEY_ENV_VAR_NAME, OPENAI_API_KEY_ENV_VAR_NAME
@@ -296,19 +297,25 @@ def display_model_providers_table(model_providers: list[ModelProvider]) -> None:
         api_key = model_provider.api_key
         if model_provider.api_key == OPENAI_API_KEY_ENV_VAR_NAME:
             if get_openai_api_key() is not None:
-                api_key = get_openai_api_key()[:1] + "********"
+                api_key = mask_api_key(get_openai_api_key())
             else:
                 api_key = f"* {OPENAI_API_KEY_ENV_VAR_NAME!r} not set in environment variables * "
         elif model_provider.api_key == NVIDIA_API_KEY_ENV_VAR_NAME:
             if get_nvidia_api_key() is not None:
-                api_key = get_nvidia_api_key()[:1] + "********"
+                api_key = mask_api_key(get_nvidia_api_key())
             else:
                 api_key = f"* {NVIDIA_API_KEY_ENV_VAR_NAME!r} not set in environment variables *"
+        else:
+            api_key = mask_api_key(model_provider.api_key)
         table_model_providers.add_row(model_provider.name, model_provider.endpoint, api_key)
     group = Group(Rule(title="Model Providers"), table_model_providers)
     console.print(group)
 
 
+def mask_api_key(api_key: str) -> str:
+    return api_key[:1] + "****************"
+
+
 def convert_to_row_element(elem):
     try:
         elem = Pretty(json.loads(elem))
diff --git a/src/data_designer/interface/data_designer.py b/src/data_designer/interface/data_designer.py
@@ -8,12 +8,11 @@
 
 from data_designer.config.analysis.dataset_profiler import DatasetProfilerResults
 from data_designer.config.config_builder import DataDesignerConfigBuilder
+from data_designer.config.default_model_settings import get_default_model_configs, get_default_providers
 from data_designer.config.interface import DataDesignerInterface
 from data_designer.config.models import (
     ModelConfig,
     ModelProvider,
-    get_default_model_configs,
-    get_default_providers,
 )
 from data_designer.config.preview_results import PreviewResults
 from data_designer.config.seed import LocalSeedDatasetReference