From b7d38cf79c462a8cccaa143bf344edb0dc397f4c Mon Sep 17 00:00:00 2001
From: Evzen Gasta <evzen.ml@seznam.cz>
Date: Wed, 16 Apr 2025 16:55:37 +0200
Subject: [PATCH 1/7] feat: added option to select default interferencing
 runtime to preferences

Signed-off-by: Evzen Gasta <evzen.ml@seznam.cz>
---
 packages/backend/package.json                          | 10 ++++++++++
 .../backend/src/registries/ConfigurationRegistry.ts    |  4 +++-
 packages/frontend/src/lib/select/ModelSelect.svelte    | 10 ++++++++++
 packages/shared/src/models/IExtensionConfiguration.ts  |  1 +
 4 files changed, 24 insertions(+), 1 deletion(-)
diff --git a/packages/backend/package.json b/packages/backend/package.json
index 4b763bd8f..6eabc88f6 100644
--- a/packages/backend/package.json
+++ b/packages/backend/package.json
@@ -51,6 +51,16 @@
           "maximum": 65535,
           "description": "Port on which the API is listening (requires restart of extension)"
         },
+        "ai-lab.inferenceRuntime": {
+          "type": "string",
+          "default": "llama-cpp",
+          "enum": [
+            "llama-cpp",
+            "whisper-cpp",
+            "none"
+          ],
+          "description": "Choose the default inferencing runtime for AI Lab"
+        },
         "ai-lab.experimentalTuning": {
           "type": "boolean",
           "default": false,
diff --git a/packages/backend/src/registries/ConfigurationRegistry.ts b/packages/backend/src/registries/ConfigurationRegistry.ts
index 25d4ac057..1008e9ea1 100644
--- a/packages/backend/src/registries/ConfigurationRegistry.ts
+++ b/packages/backend/src/registries/ConfigurationRegistry.ts
@@ -26,6 +26,7 @@ const CONFIGURATION_SECTIONS: string[] = [
   'models.path',
   'experimentalGPU',
   'apiPort',
+  'inferenceRuntime',
   'experimentalTuning',
   'modelUploadDisabled',
   'showGPUPromotion',
@@ -33,7 +34,7 @@ const CONFIGURATION_SECTIONS: string[] = [
 ];
 
 const API_PORT_DEFAULT = 10434;
-
+const INFERENCE_RUNTIME_DEFAULT = 'llama-cpp';
 export class ConfigurationRegistry extends Publisher<ExtensionConfiguration> implements Disposable {
   #configuration: Configuration;
   #configurationPodmanDesktop: Configuration;
@@ -54,6 +55,7 @@ export class ConfigurationRegistry extends Publisher<ExtensionConfiguration> imp
       modelsPath: this.getModelsPath(),
       experimentalGPU: this.#configuration.get<boolean>('experimentalGPU') ?? false,
       apiPort: this.#configuration.get<number>('apiPort') ?? API_PORT_DEFAULT,
+      inferenceRuntime: this.#configuration.get<string>('inferenceRuntime') ?? INFERENCE_RUNTIME_DEFAULT,
       experimentalTuning: this.#configuration.get<boolean>('experimentalTuning') ?? false,
       modelUploadDisabled: this.#configuration.get<boolean>('modelUploadDisabled') ?? false,
       showGPUPromotion: this.#configuration.get<boolean>('showGPUPromotion') ?? true,
diff --git a/packages/frontend/src/lib/select/ModelSelect.svelte b/packages/frontend/src/lib/select/ModelSelect.svelte
index 97483f3a3..9af62d1e7 100644
--- a/packages/frontend/src/lib/select/ModelSelect.svelte
+++ b/packages/frontend/src/lib/select/ModelSelect.svelte
@@ -3,6 +3,8 @@ import { faCheckCircle, faDownload } from '@fortawesome/free-solid-svg-icons';
 import Select from './Select.svelte';
 import Fa from 'svelte-fa';
 import type { ModelInfo } from '@shared/models/IModelInfo';
+import { onMount } from 'svelte';
+import { configuration } from '/@/stores/extensionConfiguration';
 
 interface Props {
   disabled?: boolean;
@@ -44,6 +46,13 @@ let selected: (ModelInfo & { label: string; value: string }) | undefined = $deri
 function handleOnChange(nValue: (ModelInfo & { label: string; value: string }) | undefined): void {
   value = nValue;
 }
+
+let defaultRuntime: string = 'llama-cpp';
+
+onMount(() => {
+  const inferenceRuntime = $configuration?.inferenceRuntime;
+  if (inferenceRuntime) defaultRuntime = inferenceRuntime;
+});
 </script>
 
 <Select
@@ -54,6 +63,7 @@ function handleOnChange(nValue: (ModelInfo & { label: string; value: string }) |
   onchange={handleOnChange}
   placeholder="Select model to use"
   items={models
+    .filter(model => model.backend === defaultRuntime)
     .toSorted((a, b) => getModelSortingScore(a) - getModelSortingScore(b))
     .map(model => ({ ...model, value: model.id, label: model.name }))}>
   <div slot="item" let:item>
diff --git a/packages/shared/src/models/IExtensionConfiguration.ts b/packages/shared/src/models/IExtensionConfiguration.ts
index 0a13505b3..9d3ea6b29 100644
--- a/packages/shared/src/models/IExtensionConfiguration.ts
+++ b/packages/shared/src/models/IExtensionConfiguration.ts
@@ -20,6 +20,7 @@ export interface ExtensionConfiguration {
   experimentalGPU: boolean;
   modelsPath: string;
   apiPort: number;
+  inferenceRuntime: string;
   experimentalTuning: boolean;
   modelUploadDisabled: boolean;
   showGPUPromotion: boolean;

From bfb1d6690b3b5a5c8da62a1c9da09209b6c518b8 Mon Sep 17 00:00:00 2001
From: Evzen Gasta <evzen.ml@seznam.cz>
Date: Fri, 25 Apr 2025 11:29:35 +0200
Subject: [PATCH 2/7] chore(tests): fixed tests

Signed-off-by: Evzen Gasta <evzen.ml@seznam.cz>
---
 .../src/managers/modelsManager.spec.ts        |  2 +
 .../workers/provider/LlamaCppPython.spec.ts   |  9 ++
 .../ContainerConnectionWrapper.spec.ts        |  1 +
 .../src/lib/notification/GPUPromotion.spec.ts |  6 ++
 .../src/lib/select/ModelSelect.spec.ts        | 98 +++++++++++++++++++
 .../src/lib/select/ModelSelect.svelte         |  7 +-
 .../frontend/src/pages/CreateService.spec.ts  |  1 +
 .../src/pages/NewInstructLabSession.spec.ts   | 18 ++++
 .../src/pages/PlaygroundCreate.spec.ts        |  1 +
 packages/frontend/src/pages/Recipes.spec.ts   | 18 ++++
 packages/frontend/src/pages/Recipes.svelte    | 11 +++
 .../server-information/LocalServer.spec.ts    |  1 +
 12 files changed, 171 insertions(+), 2 deletions(-)

diff --git a/packages/backend/src/managers/modelsManager.spec.ts b/packages/backend/src/managers/modelsManager.spec.ts
index 138ebe5ec..a171b7b68 100644
--- a/packages/backend/src/managers/modelsManager.spec.ts
+++ b/packages/backend/src/managers/modelsManager.spec.ts
@@ -141,6 +141,7 @@ beforeEach(() => {
     modelsPath: '~/downloads',
     experimentalTuning: false,
     apiPort: 0,
+    inferenceRuntime: 'llama-cpp',
     experimentalGPU: false,
     showGPUPromotion: false,
     appearance: 'dark',
@@ -1007,6 +1008,7 @@ describe('uploadModelToPodmanMachine', () => {
       modelsPath: '~/downloads',
       experimentalTuning: false,
       apiPort: 0,
+      inferenceRuntime: 'llama-cpp',
       experimentalGPU: false,
       showGPUPromotion: false,
       appearance: 'dark',
diff --git a/packages/backend/src/workers/provider/LlamaCppPython.spec.ts b/packages/backend/src/workers/provider/LlamaCppPython.spec.ts
index badd86026..f4c730e4b 100644
--- a/packages/backend/src/workers/provider/LlamaCppPython.spec.ts
+++ b/packages/backend/src/workers/provider/LlamaCppPython.spec.ts
@@ -97,6 +97,7 @@ beforeEach(() => {
     experimentalGPU: false,
     modelsPath: 'model-path',
     apiPort: 10434,
+    inferenceRuntime: 'llama-cpp',
     experimentalTuning: false,
     modelUploadDisabled: false,
     showGPUPromotion: false,
@@ -278,6 +279,7 @@ describe('perform', () => {
       experimentalGPU: true,
       modelsPath: '',
       apiPort: 10434,
+      inferenceRuntime: 'llama-cpp',
       experimentalTuning: false,
       modelUploadDisabled: false,
       showGPUPromotion: false,
@@ -321,6 +323,7 @@ describe('perform', () => {
       experimentalGPU: true,
       modelsPath: '',
       apiPort: 10434,
+      inferenceRuntime: 'llama-cpp',
       experimentalTuning: false,
       modelUploadDisabled: false,
       showGPUPromotion: false,
@@ -369,6 +372,7 @@ describe('perform', () => {
       experimentalGPU: true,
       modelsPath: '',
       apiPort: 10434,
+      inferenceRuntime: 'llama-cpp',
       experimentalTuning: false,
       modelUploadDisabled: false,
       showGPUPromotion: false,
@@ -417,6 +421,7 @@ describe('perform', () => {
       experimentalGPU: true,
       modelsPath: '',
       apiPort: 10434,
+      inferenceRuntime: 'llama-cpp',
       experimentalTuning: false,
       modelUploadDisabled: false,
       showGPUPromotion: false,
@@ -453,6 +458,7 @@ describe('perform', () => {
       experimentalGPU: true,
       modelsPath: '',
       apiPort: 10434,
+      inferenceRuntime: 'llama-cpp',
       experimentalTuning: false,
       modelUploadDisabled: false,
       showGPUPromotion: false,
@@ -498,6 +504,7 @@ describe('perform', () => {
       experimentalGPU: true,
       modelsPath: '',
       apiPort: 10434,
+      inferenceRuntime: 'llama-cpp',
       experimentalTuning: false,
       modelUploadDisabled: false,
       showGPUPromotion: false,
@@ -537,6 +544,7 @@ describe('perform', () => {
       experimentalGPU: true,
       modelsPath: '',
       apiPort: 10434,
+      inferenceRuntime: 'llama-cpp',
       experimentalTuning: false,
       modelUploadDisabled: false,
       showGPUPromotion: false,
@@ -581,6 +589,7 @@ describe('perform', () => {
       experimentalGPU: true,
       modelsPath: '',
       apiPort: 10434,
+      inferenceRuntime: 'llama-cpp',
       experimentalTuning: false,
       modelUploadDisabled: false,
       showGPUPromotion: false,
diff --git a/packages/frontend/src/lib/notification/ContainerConnectionWrapper.spec.ts b/packages/frontend/src/lib/notification/ContainerConnectionWrapper.spec.ts
index 7555ef05a..c25d8e663 100644
--- a/packages/frontend/src/lib/notification/ContainerConnectionWrapper.spec.ts
+++ b/packages/frontend/src/lib/notification/ContainerConnectionWrapper.spec.ts
@@ -68,6 +68,7 @@ beforeEach(() => {
     apiPort: 0,
     experimentalTuning: false,
     modelsPath: '',
+    inferenceRuntime: 'llama-cpp',
     modelUploadDisabled: false,
     showGPUPromotion: false,
     appearance: 'dark',
diff --git a/packages/frontend/src/lib/notification/GPUPromotion.spec.ts b/packages/frontend/src/lib/notification/GPUPromotion.spec.ts
index 795bac63d..b543e2017 100644
--- a/packages/frontend/src/lib/notification/GPUPromotion.spec.ts
+++ b/packages/frontend/src/lib/notification/GPUPromotion.spec.ts
@@ -45,6 +45,7 @@ const mockConfiguration: Writable<ExtensionConfiguration> = writable({
   experimentalGPU: false,
   modelsPath: '',
   apiPort: -1,
+  inferenceRuntime: 'llama-cpp',
   modelUploadDisabled: false,
   experimentalTuning: false,
   showGPUPromotion: false,
@@ -64,6 +65,7 @@ test('should show banner if gpu support if off and gpu promotion on', async () =
     showGPUPromotion: true,
     modelUploadDisabled: false,
     modelsPath: '',
+    inferenceRuntime: 'llama-cpp',
     experimentalTuning: false,
     apiPort: -1,
     appearance: 'dark',
@@ -85,6 +87,7 @@ test('should not show banner if gpu support if on and gpu promotion on', async (
     showGPUPromotion: true,
     modelUploadDisabled: false,
     modelsPath: '',
+    inferenceRuntime: 'llama-cpp',
     experimentalTuning: false,
     apiPort: -1,
     appearance: 'dark',
@@ -106,6 +109,7 @@ test('should not show banner if gpu support if off and gpu promotion off', async
     showGPUPromotion: false,
     modelUploadDisabled: false,
     modelsPath: '',
+    inferenceRuntime: 'llama-cpp',
     experimentalTuning: false,
     apiPort: -1,
     appearance: 'dark',
@@ -128,6 +132,7 @@ test('click enable should call client', async () => {
     showGPUPromotion: true,
     modelUploadDisabled: false,
     modelsPath: '',
+    inferenceRuntime: 'llama-cpp',
     experimentalTuning: false,
     apiPort: -1,
     appearance: 'dark',
@@ -155,6 +160,7 @@ test('click hide should call client', async () => {
     showGPUPromotion: true,
     modelUploadDisabled: false,
     modelsPath: '',
+    inferenceRuntime: 'llama-cpp',
     experimentalTuning: false,
     apiPort: -1,
     appearance: 'dark',
diff --git a/packages/frontend/src/lib/select/ModelSelect.spec.ts b/packages/frontend/src/lib/select/ModelSelect.spec.ts
index 5068af1bc..22794afd5 100644
--- a/packages/frontend/src/lib/select/ModelSelect.spec.ts
+++ b/packages/frontend/src/lib/select/ModelSelect.spec.ts
@@ -22,6 +22,27 @@ import { render, fireEvent, within } from '@testing-library/svelte';
 import ModelSelect from '/@/lib/select/ModelSelect.svelte';
 import type { ModelInfo } from '@shared/models/IModelInfo';
 import { InferenceType } from '@shared/models/IInference';
+import { writable, type Writable } from 'svelte/store';
+import type { ExtensionConfiguration } from '@shared/models/IExtensionConfiguration';
+import { configuration } from '/@/stores/extensionConfiguration';
+
+vi.mock('../../stores/extensionConfiguration', () => ({
+  configuration: {
+    subscribe: vi.fn(),
+    unsubscribe: vi.fn(),
+  },
+}));
+
+const mockConfiguration: Writable<ExtensionConfiguration> = writable({
+  inferenceRuntime: 'llama-cpp',
+  experimentalGPU: false,
+  showGPUPromotion: false,
+  modelUploadDisabled: false,
+  modelsPath: '',
+  experimentalTuning: false,
+  apiPort: -1,
+  appearance: 'dark',
+});
 
 const fakeRecommendedModel: ModelInfo = {
   id: 'dummy-model-1',
@@ -45,9 +66,39 @@ const fakeRecommendedRemoteModel: ModelInfo = {
   name: 'Dummy Model 3',
 } as unknown as ModelInfo;
 
+const fakeRemoteModelWhisper: ModelInfo = {
+  id: 'dummy-model-4',
+  backend: InferenceType.WHISPER_CPP,
+  name: 'Dummy Model 4',
+} as unknown as ModelInfo;
+
+const fakeRemoteModelNone: ModelInfo = {
+  id: 'dummy-model-5',
+  backend: InferenceType.NONE,
+  name: 'Dummy Model 5',
+} as unknown as ModelInfo;
+
+vi.mock('/@/utils/client', async () => {
+  return {
+    studioClient: {
+      updateExtensionConfiguration: vi.fn(),
+      telemetryLogUsage: vi.fn(),
+    },
+  };
+});
+
+vi.mock('../../stores/extensionConfiguration', () => ({
+  configuration: {
+    subscribe: vi.fn(),
+    unsubscribe: vi.fn(),
+  },
+}));
+
 beforeEach(() => {
+  vi.resetAllMocks();
   // mock scrollIntoView
   window.HTMLElement.prototype.scrollIntoView = vi.fn();
+  vi.mocked(configuration).subscribe.mockImplementation(run => mockConfiguration.subscribe(run));
 });
 
 test('ModelSelect should list all models provided', async () => {
@@ -70,6 +121,26 @@ test('ModelSelect should list all models provided', async () => {
   expect(items[1]).toHaveTextContent(fakeRemoteModel.name);
 });
 
+test('ModelSelect should list all models based on selected runtime', async () => {
+  const { container } = render(ModelSelect, {
+    value: undefined,
+    disabled: undefined,
+    models: [fakeRecommendedModel, fakeRemoteModelWhisper, fakeRemoteModel, fakeRemoteModelNone],
+    recommended: [],
+  });
+
+  // first get the select input
+  const input = within(container).getByLabelText('Select Model');
+  await fireEvent.pointerUp(input); // they are using the pointer up event instead of click.
+
+  // get all options available
+  const items = container.querySelectorAll('div[class~="list-item"]');
+  // ensure we have two options
+  expect(items.length).toBe(2);
+  expect(items[0]).toHaveTextContent(fakeRecommendedModel.name);
+  expect(items[1]).toHaveTextContent(fakeRemoteModel.name);
+});
+
 test('ModelSelect should set star icon next to recommended model', async () => {
   const { container } = render(ModelSelect, {
     value: undefined,
@@ -110,3 +181,30 @@ test('models should be sorted', async () => {
   expect(items[1]).toHaveTextContent(fakeRecommendedRemoteModel.name);
   expect(items[2]).toHaveTextContent(fakeRemoteModel.name);
 });
+
+test('ModelSelect should filter out models based on selected default runtime', async () => {
+  const { container } = render(ModelSelect, {
+    value: undefined,
+    disabled: undefined,
+    models: [
+      fakeRecommendedModel,
+      fakeRemoteModel,
+      fakeRemoteModelNone,
+      fakeRemoteModelWhisper,
+      fakeRecommendedRemoteModel,
+    ],
+    recommended: [],
+  });
+
+  // first get the select input
+  const input = within(container).getByLabelText('Select Model');
+  await fireEvent.pointerUp(input); // they are using the pointer up event instead of click.
+
+  // get all options available
+  const items = container.querySelectorAll('div[class~="list-item"]');
+  // ensure we have two options
+  expect(items.length).toBe(3);
+  expect(items[0]).toHaveTextContent(fakeRecommendedModel.name);
+  expect(items[1]).toHaveTextContent(fakeRemoteModel.name);
+  expect(items[2]).toHaveTextContent(fakeRecommendedRemoteModel.name);
+});
diff --git a/packages/frontend/src/lib/select/ModelSelect.svelte b/packages/frontend/src/lib/select/ModelSelect.svelte
index 9af62d1e7..994ca6e5b 100644
--- a/packages/frontend/src/lib/select/ModelSelect.svelte
+++ b/packages/frontend/src/lib/select/ModelSelect.svelte
@@ -50,8 +50,11 @@ function handleOnChange(nValue: (ModelInfo & { label: string; value: string }) |
 let defaultRuntime: string = 'llama-cpp';
 
 onMount(() => {
-  const inferenceRuntime = $configuration?.inferenceRuntime;
-  if (inferenceRuntime) defaultRuntime = inferenceRuntime;
+  return configuration.subscribe(values => {
+    if (values?.inferenceRuntime) {
+      defaultRuntime = values.inferenceRuntime;
+    }
+  });
 });
 </script>
 
diff --git a/packages/frontend/src/pages/CreateService.spec.ts b/packages/frontend/src/pages/CreateService.spec.ts
index 2c3b90959..6d6891e7e 100644
--- a/packages/frontend/src/pages/CreateService.spec.ts
+++ b/packages/frontend/src/pages/CreateService.spec.ts
@@ -117,6 +117,7 @@ beforeEach(() => {
   vi.mocked(studioClient.getExtensionConfiguration).mockResolvedValue({
     experimentalGPU: false,
     apiPort: 0,
+    inferenceRuntime: 'llama-cpp',
     experimentalTuning: false,
     modelsPath: '',
     modelUploadDisabled: false,
diff --git a/packages/frontend/src/pages/NewInstructLabSession.spec.ts b/packages/frontend/src/pages/NewInstructLabSession.spec.ts
index 4a82d5330..d0deee78b 100644
--- a/packages/frontend/src/pages/NewInstructLabSession.spec.ts
+++ b/packages/frontend/src/pages/NewInstructLabSession.spec.ts
@@ -45,6 +45,14 @@ vi.mock('../utils/client', async () => ({
   studioClient: {
     openURL: vi.fn(),
     openDialog: vi.fn(),
+    getExtensionConfiguration: vi.fn(),
+  },
+  rpcBrowser: {
+    subscribe: (): unknown => {
+      return {
+        unsubscribe: (): void => {},
+      };
+    },
   },
 }));
 
@@ -53,6 +61,16 @@ beforeEach(() => {
 
   const infos: Writable<ModelInfo[]> = writable([]);
   vi.mocked(modelsInfo).subscribe.mockImplementation(run => infos.subscribe(run));
+  vi.mocked(studioClient.getExtensionConfiguration).mockResolvedValue({
+    experimentalGPU: false,
+    apiPort: 0,
+    experimentalTuning: false,
+    modelsPath: '',
+    inferenceRuntime: 'llama-cpp',
+    modelUploadDisabled: false,
+    showGPUPromotion: false,
+    appearance: 'dark',
+  });
 });
 
 test('empty form should have submit disabled', async () => {
diff --git a/packages/frontend/src/pages/PlaygroundCreate.spec.ts b/packages/frontend/src/pages/PlaygroundCreate.spec.ts
index b298be39a..b1e771a59 100644
--- a/packages/frontend/src/pages/PlaygroundCreate.spec.ts
+++ b/packages/frontend/src/pages/PlaygroundCreate.spec.ts
@@ -59,6 +59,7 @@ vi.mock('../utils/client', async () => {
   return {
     studioClient: {
       requestCreatePlayground: vi.fn(),
+      getExtensionConfiguration: vi.fn().mockResolvedValue({}),
     },
     rpcBrowser: {
       subscribe: (): unknown => {
diff --git a/packages/frontend/src/pages/Recipes.spec.ts b/packages/frontend/src/pages/Recipes.spec.ts
index e22d6b581..61aac6089 100644
--- a/packages/frontend/src/pages/Recipes.spec.ts
+++ b/packages/frontend/src/pages/Recipes.spec.ts
@@ -34,6 +34,14 @@ vi.mock('/@/stores/catalog', async () => {
 vi.mock('../utils/client', async () => ({
   studioClient: {
     filterRecipes: vi.fn(),
+    getExtensionConfiguration: vi.fn().mockResolvedValue({}),
+  },
+  rpcBrowser: {
+    subscribe: (): unknown => {
+      return {
+        unsubscribe: (): void => {},
+      };
+    },
   },
 }));
 
@@ -104,6 +112,16 @@ beforeEach(() => {
     filters: {},
     choices: {},
   });
+  vi.mocked(studioClient.getExtensionConfiguration).mockResolvedValue({
+    experimentalGPU: false,
+    apiPort: 0,
+    experimentalTuning: false,
+    modelsPath: '',
+    inferenceRuntime: 'llama-cpp',
+    modelUploadDisabled: false,
+    showGPUPromotion: false,
+    appearance: 'dark',
+  });
 });
 
 test('recipe without category should be visible', async () => {
diff --git a/packages/frontend/src/pages/Recipes.svelte b/packages/frontend/src/pages/Recipes.svelte
index 0592f42d6..dac45b0a0 100644
--- a/packages/frontend/src/pages/Recipes.svelte
+++ b/packages/frontend/src/pages/Recipes.svelte
@@ -8,6 +8,8 @@ import { Fa } from 'svelte-fa';
 import { faGithub } from '@fortawesome/free-brands-svg-icons'; // Import the GitHub icon
 import { studioClient } from '../utils/client';
 import type { CatalogFilterKey, Choice, RecipeChoices, RecipeFilters } from '@shared/models/FilterRecipesResult';
+import { onMount } from 'svelte';
+import { configuration } from '../stores/extensionConfiguration';
 
 // filters available in the dropdowns for the user to select
 let choices: RecipeChoices = $state({});
@@ -100,6 +102,14 @@ const filtersComponents: { label: string; key: CatalogFilterKey }[] = [
 function openContribution(): void {
   studioClient.openURL('https://github.com/containers/ai-lab-recipes/blob/main/CONTRIBUTING.md').catch(console.error);
 }
+
+let defaultRuntime: string = $state('llama-cpp');
+
+onMount(() => {
+  const inferenceRuntime = $configuration?.inferenceRuntime;
+  if (inferenceRuntime) defaultRuntime = inferenceRuntime;
+  onFilterChange('tools', defaultRuntime);
+});
 </script>
 
 <NavPage title="Recipe Catalog" searchEnabled={false}>
@@ -134,6 +144,7 @@ function openContribution(): void {
               <label for={filterComponent.key} class="block mb-2 text-sm font-medium">{filterComponent.label}</label>
               <Dropdown
                 id={filterComponent.key}
+                value={filterComponent.key === 'tools' ? defaultRuntime : undefined}
                 options={choicesToOptions(choices[filterComponent.key])}
                 onChange={(v): void => onFilterChange(filterComponent.key, v)}></Dropdown>
             </div>
diff --git a/packages/frontend/src/pages/server-information/LocalServer.spec.ts b/packages/frontend/src/pages/server-information/LocalServer.spec.ts
index 6468cffdf..f3ec8db90 100644
--- a/packages/frontend/src/pages/server-information/LocalServer.spec.ts
+++ b/packages/frontend/src/pages/server-information/LocalServer.spec.ts
@@ -47,6 +47,7 @@ const mockConfiguration: Writable<ExtensionConfiguration> = writable({
   experimentalGPU: false,
   modelsPath: '',
   apiPort: 10434,
+  inferenceRuntime: 'llama-cpp',
   modelUploadDisabled: false,
   experimentalTuning: false,
   showGPUPromotion: false,

From 68d04b5f8bfa7dec994bd6807f3f2bcfd7091acd Mon Sep 17 00:00:00 2001
From: Evzen Gasta <evzen.ml@seznam.cz>
Date: Wed, 30 Apr 2025 09:15:21 +0200
Subject: [PATCH 3/7] chore: applied suggestions

Signed-off-by: Evzen Gasta <evzen.ml@seznam.cz>
---
 packages/backend/package.json                         |  5 ++---
 .../backend/src/registries/ConfigurationRegistry.ts   |  4 ++--
 packages/frontend/src/lib/select/ModelSelect.svelte   | 11 +++++++++--
 packages/frontend/src/pages/Recipes.svelte            |  4 ++--
 4 files changed, 15 insertions(+), 9 deletions(-)

diff --git a/packages/backend/package.json b/packages/backend/package.json
index 6eabc88f6..a870608c2 100644
--- a/packages/backend/package.json
+++ b/packages/backend/package.json
@@ -53,11 +53,10 @@
         },
         "ai-lab.inferenceRuntime": {
           "type": "string",
-          "default": "llama-cpp",
           "enum": [
             "llama-cpp",
-            "whisper-cpp",
-            "none"
+            "openvino",
+            "vllm"
           ],
           "description": "Choose the default inferencing runtime for AI Lab"
         },
diff --git a/packages/backend/src/registries/ConfigurationRegistry.ts b/packages/backend/src/registries/ConfigurationRegistry.ts
index 1008e9ea1..534f3fdbc 100644
--- a/packages/backend/src/registries/ConfigurationRegistry.ts
+++ b/packages/backend/src/registries/ConfigurationRegistry.ts
@@ -34,7 +34,7 @@ const CONFIGURATION_SECTIONS: string[] = [
 ];
 
 const API_PORT_DEFAULT = 10434;
-const INFERENCE_RUNTIME_DEFAULT = 'llama-cpp';
+
 export class ConfigurationRegistry extends Publisher<ExtensionConfiguration> implements Disposable {
   #configuration: Configuration;
   #configurationPodmanDesktop: Configuration;
@@ -55,7 +55,7 @@ export class ConfigurationRegistry extends Publisher<ExtensionConfiguration> imp
       modelsPath: this.getModelsPath(),
       experimentalGPU: this.#configuration.get<boolean>('experimentalGPU') ?? false,
       apiPort: this.#configuration.get<number>('apiPort') ?? API_PORT_DEFAULT,
-      inferenceRuntime: this.#configuration.get<string>('inferenceRuntime') ?? INFERENCE_RUNTIME_DEFAULT,
+      inferenceRuntime: this.#configuration.get<string>('inferenceRuntime') ?? 'none',
       experimentalTuning: this.#configuration.get<boolean>('experimentalTuning') ?? false,
       modelUploadDisabled: this.#configuration.get<boolean>('modelUploadDisabled') ?? false,
       showGPUPromotion: this.#configuration.get<boolean>('showGPUPromotion') ?? true,
diff --git a/packages/frontend/src/lib/select/ModelSelect.svelte b/packages/frontend/src/lib/select/ModelSelect.svelte
index 994ca6e5b..e98f66542 100644
--- a/packages/frontend/src/lib/select/ModelSelect.svelte
+++ b/packages/frontend/src/lib/select/ModelSelect.svelte
@@ -47,7 +47,7 @@ function handleOnChange(nValue: (ModelInfo & { label: string; value: string }) |
   value = nValue;
 }
 
-let defaultRuntime: string = 'llama-cpp';
+let defaultRuntime: string | undefined = $state();
 
 onMount(() => {
   return configuration.subscribe(values => {
@@ -56,6 +56,13 @@ onMount(() => {
     }
   });
 });
+
+function filterModel(model: ModelInfo): boolean {
+  // If the defaultRuntime is undefined we should not filter any model
+  if (!defaultRuntime) return true;
+
+  return model.backend === defaultRuntime;
+}
 </script>
 
 <Select
@@ -66,7 +73,7 @@ onMount(() => {
   onchange={handleOnChange}
   placeholder="Select model to use"
   items={models
-    .filter(model => model.backend === defaultRuntime)
+    .filter(filterModel)
     .toSorted((a, b) => getModelSortingScore(a) - getModelSortingScore(b))
     .map(model => ({ ...model, value: model.id, label: model.name }))}>
   <div slot="item" let:item>
diff --git a/packages/frontend/src/pages/Recipes.svelte b/packages/frontend/src/pages/Recipes.svelte
index dac45b0a0..61339e189 100644
--- a/packages/frontend/src/pages/Recipes.svelte
+++ b/packages/frontend/src/pages/Recipes.svelte
@@ -103,12 +103,12 @@ function openContribution(): void {
   studioClient.openURL('https://github.com/containers/ai-lab-recipes/blob/main/CONTRIBUTING.md').catch(console.error);
 }
 
-let defaultRuntime: string = $state('llama-cpp');
+let defaultRuntime: string | undefined = $state();
 
 onMount(() => {
   const inferenceRuntime = $configuration?.inferenceRuntime;
   if (inferenceRuntime) defaultRuntime = inferenceRuntime;
-  onFilterChange('tools', defaultRuntime);
+  onFilterChange('tools', defaultRuntime ?? 'all');
 });
 </script>
 

From f701a08950ae3e2d76bdcbe9fa7853819c6997d7 Mon Sep 17 00:00:00 2001
From: Evzen Gasta <evzen.ml@seznam.cz>
Date: Mon, 12 May 2025 15:50:30 +0200
Subject: [PATCH 4/7] chore: fixed tests

Signed-off-by: Evzen Gasta <evzen.ml@seznam.cz>
---
 packages/backend/src/workers/provider/OpenVINO.spec.ts        | 1 +
 .../frontend/src/pages/instructlab/AboutInstructLab.spec.ts   | 4 ++++
 2 files changed, 5 insertions(+)

diff --git a/packages/backend/src/workers/provider/OpenVINO.spec.ts b/packages/backend/src/workers/provider/OpenVINO.spec.ts
index e6a56393c..eac1b1a49 100644
--- a/packages/backend/src/workers/provider/OpenVINO.spec.ts
+++ b/packages/backend/src/workers/provider/OpenVINO.spec.ts
@@ -95,6 +95,7 @@ beforeEach(() => {
     experimentalGPU: false,
     modelsPath: 'model-path',
     apiPort: 10434,
+    inferenceRuntime: 'llama-cpp',
     experimentalTuning: false,
     modelUploadDisabled: false,
     showGPUPromotion: false,
diff --git a/packages/frontend/src/pages/instructlab/AboutInstructLab.spec.ts b/packages/frontend/src/pages/instructlab/AboutInstructLab.spec.ts
index ba4d72008..d8363cc3c 100644
--- a/packages/frontend/src/pages/instructlab/AboutInstructLab.spec.ts
+++ b/packages/frontend/src/pages/instructlab/AboutInstructLab.spec.ts
@@ -59,6 +59,7 @@ const mockConfiguration: Writable<ExtensionConfiguration> = writable({
   modelUploadDisabled: false,
   experimentalTuning: false,
   showGPUPromotion: false,
+  inferenceRuntime: 'llama-cpp',
   appearance: 'dark',
 });
 
@@ -75,6 +76,7 @@ test('renders Start Fine Tuning button if experimentalTuning is true', async ()
     modelUploadDisabled: false,
     modelsPath: '',
     experimentalTuning: true,
+    inferenceRuntime: 'llama-cpp',
     apiPort: -1,
     appearance: 'dark',
   });
@@ -89,6 +91,7 @@ test('does not render Start Fine Tuning button if experimentalTuning is false',
     modelUploadDisabled: false,
     modelsPath: '',
     experimentalTuning: false,
+    inferenceRuntime: 'llama-cpp',
     apiPort: -1,
     appearance: 'dark',
   });
@@ -103,6 +106,7 @@ test('navigates to /tune/start when Start Fine Tuning is clicked', async () => {
     modelUploadDisabled: false,
     modelsPath: '',
     experimentalTuning: true,
+    inferenceRuntime: 'llama-cpp',
     apiPort: -1,
     appearance: 'dark',
   });

From 989601d343a3bc8730cf9fbfc4d8fb1088165a90 Mon Sep 17 00:00:00 2001
From: Evzen Gasta <evzen.ml@seznam.cz>
Date: Mon, 12 May 2025 15:51:55 +0200
Subject: [PATCH 5/7] chore: updated runtimes in preferences

Signed-off-by: Evzen Gasta <evzen.ml@seznam.cz>
---
 packages/backend/package.json | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/packages/backend/package.json b/packages/backend/package.json
index a870608c2..4edde8908 100644
--- a/packages/backend/package.json
+++ b/packages/backend/package.json
@@ -55,8 +55,8 @@
           "type": "string",
           "enum": [
             "llama-cpp",
-            "openvino",
-            "vllm"
+            "whisper-cpp",
+            "none"
           ],
           "description": "Choose the default inferencing runtime for AI Lab"
         },

From 15616c18f7bcc29056fd1223e85bf2c888dac209 Mon Sep 17 00:00:00 2001
From: Evzen Gasta <evzen.ml@seznam.cz>
Date: Wed, 14 May 2025 10:24:09 +0200
Subject: [PATCH 6/7] chore: added all option

Signed-off-by: Evzen Gasta <evzen.ml@seznam.cz>
---
 packages/backend/package.json                            | 1 +
 packages/backend/src/registries/ConfigurationRegistry.ts | 2 +-
 packages/frontend/src/lib/select/ModelSelect.svelte      | 2 +-
 packages/frontend/src/pages/Recipes.svelte               | 4 ++--
 4 files changed, 5 insertions(+), 4 deletions(-)

diff --git a/packages/backend/package.json b/packages/backend/package.json
index 4edde8908..e61604567 100644
--- a/packages/backend/package.json
+++ b/packages/backend/package.json
@@ -54,6 +54,7 @@
         "ai-lab.inferenceRuntime": {
           "type": "string",
           "enum": [
+            "all",
             "llama-cpp",
             "whisper-cpp",
             "none"
diff --git a/packages/backend/src/registries/ConfigurationRegistry.ts b/packages/backend/src/registries/ConfigurationRegistry.ts
index 534f3fdbc..e33ee60de 100644
--- a/packages/backend/src/registries/ConfigurationRegistry.ts
+++ b/packages/backend/src/registries/ConfigurationRegistry.ts
@@ -55,7 +55,7 @@ export class ConfigurationRegistry extends Publisher<ExtensionConfiguration> imp
       modelsPath: this.getModelsPath(),
       experimentalGPU: this.#configuration.get<boolean>('experimentalGPU') ?? false,
       apiPort: this.#configuration.get<number>('apiPort') ?? API_PORT_DEFAULT,
-      inferenceRuntime: this.#configuration.get<string>('inferenceRuntime') ?? 'none',
+      inferenceRuntime: this.#configuration.get<string>('inferenceRuntime') ?? 'all',
       experimentalTuning: this.#configuration.get<boolean>('experimentalTuning') ?? false,
       modelUploadDisabled: this.#configuration.get<boolean>('modelUploadDisabled') ?? false,
       showGPUPromotion: this.#configuration.get<boolean>('showGPUPromotion') ?? true,
diff --git a/packages/frontend/src/lib/select/ModelSelect.svelte b/packages/frontend/src/lib/select/ModelSelect.svelte
index e98f66542..1e9eb8764 100644
--- a/packages/frontend/src/lib/select/ModelSelect.svelte
+++ b/packages/frontend/src/lib/select/ModelSelect.svelte
@@ -59,7 +59,7 @@ onMount(() => {
 
 function filterModel(model: ModelInfo): boolean {
   // If the defaultRuntime is undefined we should not filter any model
-  if (!defaultRuntime) return true;
+  if (!defaultRuntime || defaultRuntime === 'all') return true;
 
   return model.backend === defaultRuntime;
 }
diff --git a/packages/frontend/src/pages/Recipes.svelte b/packages/frontend/src/pages/Recipes.svelte
index 61339e189..2fb9da95e 100644
--- a/packages/frontend/src/pages/Recipes.svelte
+++ b/packages/frontend/src/pages/Recipes.svelte
@@ -108,7 +108,7 @@ let defaultRuntime: string | undefined = $state();
 onMount(() => {
   const inferenceRuntime = $configuration?.inferenceRuntime;
   if (inferenceRuntime) defaultRuntime = inferenceRuntime;
-  onFilterChange('tools', defaultRuntime ?? 'all');
+  if (inferenceRuntime !== 'all') onFilterChange('tools', defaultRuntime ?? '');
 });
 </script>
 
@@ -144,7 +144,7 @@ onMount(() => {
               <label for={filterComponent.key} class="block mb-2 text-sm font-medium">{filterComponent.label}</label>
               <Dropdown
                 id={filterComponent.key}
-                value={filterComponent.key === 'tools' ? defaultRuntime : undefined}
+                value={filterComponent.key === 'tools' ? defaultRuntime : ''}
                 options={choicesToOptions(choices[filterComponent.key])}
                 onChange={(v): void => onFilterChange(filterComponent.key, v)}></Dropdown>
             </div>

From aa62f2913fe4bd4b62673f9f163ee929831d24ee Mon Sep 17 00:00:00 2001
From: Evzen Gasta <evzen.ml@seznam.cz>
Date: Thu, 15 May 2025 15:59:24 +0200
Subject: [PATCH 7/7] chore: removed redundant code

Signed-off-by: Evzen Gasta <evzen.ml@seznam.cz>
---
 .../src/lib/select/ModelSelect.spec.ts        | 98 -------------------
 .../src/lib/select/ModelSelect.svelte         | 20 ----
 2 files changed, 118 deletions(-)

diff --git a/packages/frontend/src/lib/select/ModelSelect.spec.ts b/packages/frontend/src/lib/select/ModelSelect.spec.ts
index 22794afd5..5068af1bc 100644
--- a/packages/frontend/src/lib/select/ModelSelect.spec.ts
+++ b/packages/frontend/src/lib/select/ModelSelect.spec.ts
@@ -22,27 +22,6 @@ import { render, fireEvent, within } from '@testing-library/svelte';
 import ModelSelect from '/@/lib/select/ModelSelect.svelte';
 import type { ModelInfo } from '@shared/models/IModelInfo';
 import { InferenceType } from '@shared/models/IInference';
-import { writable, type Writable } from 'svelte/store';
-import type { ExtensionConfiguration } from '@shared/models/IExtensionConfiguration';
-import { configuration } from '/@/stores/extensionConfiguration';
-
-vi.mock('../../stores/extensionConfiguration', () => ({
-  configuration: {
-    subscribe: vi.fn(),
-    unsubscribe: vi.fn(),
-  },
-}));
-
-const mockConfiguration: Writable<ExtensionConfiguration> = writable({
-  inferenceRuntime: 'llama-cpp',
-  experimentalGPU: false,
-  showGPUPromotion: false,
-  modelUploadDisabled: false,
-  modelsPath: '',
-  experimentalTuning: false,
-  apiPort: -1,
-  appearance: 'dark',
-});
 
 const fakeRecommendedModel: ModelInfo = {
   id: 'dummy-model-1',
@@ -66,39 +45,9 @@ const fakeRecommendedRemoteModel: ModelInfo = {
   name: 'Dummy Model 3',
 } as unknown as ModelInfo;
 
-const fakeRemoteModelWhisper: ModelInfo = {
-  id: 'dummy-model-4',
-  backend: InferenceType.WHISPER_CPP,
-  name: 'Dummy Model 4',
-} as unknown as ModelInfo;
-
-const fakeRemoteModelNone: ModelInfo = {
-  id: 'dummy-model-5',
-  backend: InferenceType.NONE,
-  name: 'Dummy Model 5',
-} as unknown as ModelInfo;
-
-vi.mock('/@/utils/client', async () => {
-  return {
-    studioClient: {
-      updateExtensionConfiguration: vi.fn(),
-      telemetryLogUsage: vi.fn(),
-    },
-  };
-});
-
-vi.mock('../../stores/extensionConfiguration', () => ({
-  configuration: {
-    subscribe: vi.fn(),
-    unsubscribe: vi.fn(),
-  },
-}));
-
 beforeEach(() => {
-  vi.resetAllMocks();
   // mock scrollIntoView
   window.HTMLElement.prototype.scrollIntoView = vi.fn();
-  vi.mocked(configuration).subscribe.mockImplementation(run => mockConfiguration.subscribe(run));
 });
 
 test('ModelSelect should list all models provided', async () => {
@@ -121,26 +70,6 @@ test('ModelSelect should list all models provided', async () => {
   expect(items[1]).toHaveTextContent(fakeRemoteModel.name);
 });
 
-test('ModelSelect should list all models based on selected runtime', async () => {
-  const { container } = render(ModelSelect, {
-    value: undefined,
-    disabled: undefined,
-    models: [fakeRecommendedModel, fakeRemoteModelWhisper, fakeRemoteModel, fakeRemoteModelNone],
-    recommended: [],
-  });
-
-  // first get the select input
-  const input = within(container).getByLabelText('Select Model');
-  await fireEvent.pointerUp(input); // they are using the pointer up event instead of click.
-
-  // get all options available
-  const items = container.querySelectorAll('div[class~="list-item"]');
-  // ensure we have two options
-  expect(items.length).toBe(2);
-  expect(items[0]).toHaveTextContent(fakeRecommendedModel.name);
-  expect(items[1]).toHaveTextContent(fakeRemoteModel.name);
-});
-
 test('ModelSelect should set star icon next to recommended model', async () => {
   const { container } = render(ModelSelect, {
     value: undefined,
@@ -181,30 +110,3 @@ test('models should be sorted', async () => {
   expect(items[1]).toHaveTextContent(fakeRecommendedRemoteModel.name);
   expect(items[2]).toHaveTextContent(fakeRemoteModel.name);
 });
-
-test('ModelSelect should filter out models based on selected default runtime', async () => {
-  const { container } = render(ModelSelect, {
-    value: undefined,
-    disabled: undefined,
-    models: [
-      fakeRecommendedModel,
-      fakeRemoteModel,
-      fakeRemoteModelNone,
-      fakeRemoteModelWhisper,
-      fakeRecommendedRemoteModel,
-    ],
-    recommended: [],
-  });
-
-  // first get the select input
-  const input = within(container).getByLabelText('Select Model');
-  await fireEvent.pointerUp(input); // they are using the pointer up event instead of click.
-
-  // get all options available
-  const items = container.querySelectorAll('div[class~="list-item"]');
-  // ensure we have two options
-  expect(items.length).toBe(3);
-  expect(items[0]).toHaveTextContent(fakeRecommendedModel.name);
-  expect(items[1]).toHaveTextContent(fakeRemoteModel.name);
-  expect(items[2]).toHaveTextContent(fakeRecommendedRemoteModel.name);
-});
diff --git a/packages/frontend/src/lib/select/ModelSelect.svelte b/packages/frontend/src/lib/select/ModelSelect.svelte
index 1e9eb8764..97483f3a3 100644
--- a/packages/frontend/src/lib/select/ModelSelect.svelte
+++ b/packages/frontend/src/lib/select/ModelSelect.svelte
@@ -3,8 +3,6 @@ import { faCheckCircle, faDownload } from '@fortawesome/free-solid-svg-icons';
 import Select from './Select.svelte';
 import Fa from 'svelte-fa';
 import type { ModelInfo } from '@shared/models/IModelInfo';
-import { onMount } from 'svelte';
-import { configuration } from '/@/stores/extensionConfiguration';
 
 interface Props {
   disabled?: boolean;
@@ -46,23 +44,6 @@ let selected: (ModelInfo & { label: string; value: string }) | undefined = $deri
 function handleOnChange(nValue: (ModelInfo & { label: string; value: string }) | undefined): void {
   value = nValue;
 }
-
-let defaultRuntime: string | undefined = $state();
-
-onMount(() => {
-  return configuration.subscribe(values => {
-    if (values?.inferenceRuntime) {
-      defaultRuntime = values.inferenceRuntime;
-    }
-  });
-});
-
-function filterModel(model: ModelInfo): boolean {
-  // If the defaultRuntime is undefined we should not filter any model
-  if (!defaultRuntime || defaultRuntime === 'all') return true;
-
-  return model.backend === defaultRuntime;
-}
 </script>
 
 <Select
@@ -73,7 +54,6 @@ function filterModel(model: ModelInfo): boolean {
   onchange={handleOnChange}
   placeholder="Select model to use"
   items={models
-    .filter(filterModel)
     .toSorted((a, b) => getModelSortingScore(a) - getModelSortingScore(b))
     .map(model => ({ ...model, value: model.id, label: model.name }))}>
   <div slot="item" let:item>