SciSharp
diff --git a/‎.github/workflows/compile.yml
Lines changed: 62 additions & 36 deletions b/‎.github/workflows/compile.yml
Lines changed: 62 additions & 36 deletions
diff --git a/‎.github/workflows/main.yml
Lines changed: 9 additions & 0 deletions b/‎.github/workflows/main.yml
Lines changed: 9 additions & 0 deletions
diff --git a/‎.gitignore
Lines changed: 0 additions & 1 deletion b/‎.gitignore
Lines changed: 0 additions & 1 deletion
diff --git a/‎LLama.Examples/Examples/KernelMemory.cs
Lines changed: 1 addition & 1 deletion b/‎LLama.Examples/Examples/KernelMemory.cs
Lines changed: 1 addition & 1 deletion
diff --git a/‎LLama.Examples/Examples/KernelMemorySaveAndLoad.cs
Lines changed: 1 addition & 1 deletion b/‎LLama.Examples/Examples/KernelMemorySaveAndLoad.cs
Lines changed: 1 addition & 1 deletion
diff --git a/‎LLama.Examples/LLama.Examples.csproj
Lines changed: 6 additions & 6 deletions b/‎LLama.Examples/LLama.Examples.csproj
Lines changed: 6 additions & 6 deletions
diff --git a/‎LLama.KernelMemory/LLamaSharpTextEmbeddingGenerator.cs
Lines changed: 10 additions & 8 deletions b/‎LLama.KernelMemory/LLamaSharpTextEmbeddingGenerator.cs
Lines changed: 10 additions & 8 deletions
diff --git a/‎LLama.KernelMemory/LlamaSharpTextGenerator.cs
Lines changed: 4 additions & 2 deletions b/‎LLama.KernelMemory/LlamaSharpTextGenerator.cs
Lines changed: 4 additions & 2 deletions
diff --git a/‎LLama.SemanticKernel/LLamaSharp.SemanticKernel.csproj
Lines changed: 1 addition & 1 deletion b/‎LLama.SemanticKernel/LLamaSharp.SemanticKernel.csproj
Lines changed: 1 addition & 1 deletion
diff --git a/‎LLama.Unittest/Constants.cs
Lines changed: 2 additions & 2 deletions b/‎LLama.Unittest/Constants.cs
Lines changed: 2 additions & 2 deletions
@@ -28,13 +28,25 @@ jobs:
         include:
           - build: 'noavx'
             defines: '-DGGML_AVX=OFF -DGGML_AVX2=OFF -DGGML_FMA=OFF'
+            os: ubuntu-22.04
+            arch: x64
           - build: 'avx2'
             defines: ''
+            os: ubuntu-22.04
+            arch: x64
           - build: 'avx'
             defines: '-DGGML_AVX2=OFF'
+            os: ubuntu-22.04
+            arch: x64
           - build: 'avx512'
             defines: '-DGGML_AVX512=ON'
-    runs-on: ubuntu-24.04
+            os: ubuntu-22.04
+            arch: x64
+          - build: 'aarch64'
+            defines: '-DGGML_NATIVE=OFF -DGGML_CPU_AARCH64=ON -DGGML_CPU_ARM_ARCH=armv8-a'
+            os: ubuntu-24.04-arm
+            arch: arm64
+    runs-on: ${{ matrix.os }}
     steps:
       - uses: actions/checkout@v4
         with:
@@ -52,28 +64,28 @@ jobs:
       - uses: actions/upload-artifact@v4
         with:
           path: ./build/bin/libllama.so
-          name: llama-bin-linux-${{ matrix.build }}-x64.so
+          name: llama-bin-linux-${{ matrix.build }}-${{ matrix.arch }}.so
           if-no-files-found: error
       - uses: actions/upload-artifact@v4
         with:
           path: ./build/bin/libggml.so
-          name: ggml-bin-linux-${{ matrix.build }}-x64.so
+          name: ggml-bin-linux-${{ matrix.build }}-${{ matrix.arch }}.so
           if-no-files-found: error
       - uses: actions/upload-artifact@v4
         with:
           path: ./build/bin/libggml-base.so
-          name: ggml-base-bin-linux-${{ matrix.build }}-x64.so
+          name: ggml-base-bin-linux-${{ matrix.build }}-${{ matrix.arch }}.so
           if-no-files-found: error
       - uses: actions/upload-artifact@v4
         with:
           path: ./build/bin/libggml-cpu.so
-          name: ggml-cpu-bin-linux-${{ matrix.build }}-x64.so
+          name: ggml-cpu-bin-linux-${{ matrix.build }}-${{ matrix.arch }}.so
           if-no-files-found: error
       - name: Upload Llava
         uses: actions/upload-artifact@v4
         with:
           path: ./build/bin/libllava_shared.so
-          name: llava-bin-linux-${{ matrix.build }}-x64.so
+          name: llava-bin-linux-${{ matrix.build }}-${{ matrix.arch }}.so
           if-no-files-found: error
 
   compile-musl:
@@ -527,19 +539,15 @@ jobs:
           if-no-files-found: error
 
   compile-android:
-    # Disable android build
-    if: false
-
+    name: Compile (Android)
     strategy:
       fail-fast: true
       matrix:
         include:
-          - build: 'x86'
-            defines: '-DANDROID_ABI=x86'
           - build: 'x86_64'
-            defines: '-DANDROID_ABI=x86_64'
+            defines: '-DANDROID_ABI=x86_64 -DCMAKE_C_FLAGS=-march=x86-64 -DCMAKE_CXX_FLAGS=-march=x86-64'
           - build: 'arm64-v8a'
-            defines: '-DANDROID_ABI=arm64-v8a'
+            defines: '-DANDROID_ABI=arm64-v8a -DCMAKE_C_FLAGS=-march=armv8.7a -DCMAKE_C_FLAGS=-march=armv8.7a'
     runs-on: ubuntu-24.04
     steps:
       - uses: actions/checkout@v4
@@ -555,28 +563,39 @@ jobs:
       - name: Build
         id: cmake_build
         env:
-          CMAKE_FLAGS: '-DCMAKE_TOOLCHAIN_FILE=${{ steps.setup-ndk.outputs.ndk-path }}/build/cmake/android.toolchain.cmake -DANDROID_PLATFORM=android-23'
+          CMAKE_FLAGS: '-DCMAKE_TOOLCHAIN_FILE=${{ steps.setup-ndk.outputs.ndk-path }}/build/cmake/android.toolchain.cmake -DANDROID_PLATFORM=android-23 -DGGML_OPENMP=OFF -DGGML_LLAMAFILE=OFF'
         run: |
-          mkdir build
-          cd build
-          cmake .. ${{ env.COMMON_DEFINE }} ${{ env.CMAKE_FLAGS }} ${{ matrix.defines }}
-          cmake --build . --config Release -j ${env:NUMBER_OF_PROCESSORS}
-          cd ..
-          ls -R
+          # export-lora not supported on 32 bit machines hence breaks x86 build
+          sed -i '/add_subdirectory(export-lora)/d' examples/CMakeLists.txt # remove export-lora from examples
+          cmake ${{ env.COMMON_DEFINE }} ${{ env.CMAKE_FLAGS }} ${{ matrix.defines }} -B build
+          cmake --build build --config Release -j ${env:NUMBER_OF_PROCESSORS}
       - name: Upload Llama
         uses: actions/upload-artifact@v4
         with:
-          path: ./build/src/libllama.so
+          path: ./build/bin/libllama.so
           name: llama-bin-android-${{ matrix.build }}.so
-      - uses: actions/upload-artifact@v4
+      - name: Upload GGML
+        uses: actions/upload-artifact@v4
         with:
-          path: ./build/ggml/src/libggml.so
+          path: ./build/bin/libggml.so
           name: ggml-bin-android-${{ matrix.build }}.so
           if-no-files-found: error
+      - name: Upload GGML Base
+        uses: actions/upload-artifact@v4
+        with:
+          path: ./build/bin/libggml-base.so
+          name: ggml-base-bin-android-${{ matrix.build }}.so
+          if-no-files-found: error
+      - name: Upload GGML CPU
+        uses: actions/upload-artifact@v4
+        with:
+          path: ./build/bin/libggml-cpu.so
+          name: ggml-cpu-bin-android-${{ matrix.build }}.so
+          if-no-files-found: error
       - name: Upload Llava
         uses: actions/upload-artifact@v4
         with:
-          path: ./build/examples/llava/libllava_shared.so
+          path: ./build/bin/libllava_shared.so
           name: llava-bin-android-${{ matrix.build }}.so
 
   build-deps:
@@ -601,7 +620,7 @@ jobs:
       - name: Rearrange Files
         run: |
           # Make all directories at once
-          mkdir --parents deps/{noavx,avx,avx2,avx512,musl-noavx,musl-avx,musl-avx2,musl-avx512,osx-arm64,osx-x64,osx-x64-rosetta2,cu11.7.1,cu12.2.0,vulkan,android-arm64-v8a,android-x86,android-x86_64}
+          mkdir --parents deps/{noavx,avx,avx2,avx512,linux-arm64,musl-noavx,musl-avx,musl-avx2,musl-avx512,osx-arm64,osx-x64,osx-x64-rosetta2,cu11.7.1,cu12.2.0,vulkan,android-arm64-v8a,android-x86,android-x86_64}
 
           # Linux
           cp artifacts/ggml-bin-linux-noavx-x64.so/libggml.so           deps/noavx/libggml.so
@@ -628,6 +647,13 @@ jobs:
           cp artifacts/llama-bin-linux-avx512-x64.so/libllama.so         deps/avx512/libllama.so
           cp artifacts/llava-bin-linux-avx512-x64.so/libllava_shared.so  deps/avx512/libllava_shared.so
 
+          # Arm64
+          cp artifacts/ggml-bin-linux-aarch64-arm64.so/libggml.so           deps/linux-arm64/libggml.so
+          cp artifacts/ggml-base-bin-linux-aarch64-arm64.so/libggml-base.so deps/linux-arm64/libggml-base.so
+          cp artifacts/ggml-cpu-bin-linux-aarch64-arm64.so/libggml-cpu.so   deps/linux-arm64/libggml-cpu.so
+          cp artifacts/llama-bin-linux-aarch64-arm64.so/libllama.so         deps/linux-arm64/libllama.so
+          cp artifacts/llava-bin-linux-aarch64-arm64.so/libllava_shared.so  deps/linux-arm64/libllava_shared.so
+
           # Musl
           cp artifacts/ggml-bin-musl-noavx-x64.so/libggml.so           deps/musl-noavx/libggml.so
           cp artifacts/ggml-base-bin-musl-noavx-x64.so/libggml-base.so deps/musl-noavx/libggml-base.so
@@ -703,17 +729,17 @@ jobs:
           cp artifacts/llava-bin-osx-x64-rosetta2.dylib/libllava_shared.dylib  deps/osx-x64-rosetta2/libllava_shared.dylib
 
           # Android
-          #cp artifacts/ggml-bin-android-arm64-v8a.so/libggml.so           deps/android-arm64-v8a/libggml.so
-          #cp artifacts/llama-bin-android-arm64-v8a.so/libllama.so         deps/android-arm64-v8a/libllama.so
-          #cp artifacts/llava-bin-android-arm64-v8a.so/libllava_shared.so  deps/android-arm64-v8a/libllava_shared.so
-
-          #cp artifacts/ggml-bin-android-x86.so/libggml.so                 deps/android-x86/libggml.so
-          #cp artifacts/llama-bin-android-x86.so/libllama.so               deps/android-x86/libllama.so
-          #cp artifacts/llava-bin-android-x86.so/libllava_shared.so        deps/android-x86/libllava_shared.so
-
-          #cp artifacts/ggml-bin-android-x86_64.so/libggml.so              deps/android-x86_64/libggml.so
-          #cp artifacts/llama-bin-android-x86_64.so/libllama.so            deps/android-x86_64/libllama.so
-          #cp artifacts/llava-bin-android-x86_64.so/libllava_shared.so     deps/android-x86_64/libllava_shared.so
+          cp artifacts/ggml-bin-android-arm64-v8a.so/libggml.so               deps/android-arm64-v8a/libggml.so
+          cp artifacts/ggml-base-bin-android-arm64-v8a.so/libggml-base.so     deps/android-arm64-v8a/libggml-base.so
+          cp artifacts/ggml-cpu-bin-android-arm64-v8a.so/libggml-cpu.so       deps/android-arm64-v8a/libggml-cpu.so
+          cp artifacts/llama-bin-android-arm64-v8a.so/libllama.so             deps/android-arm64-v8a/libllama.so
+          cp artifacts/llava-bin-android-arm64-v8a.so/libllava_shared.so      deps/android-arm64-v8a/libllava_shared.so
+                                                                              
+          cp artifacts/ggml-bin-android-x86_64.so/libggml.so                  deps/android-x86_64/libggml.so
+          cp artifacts/ggml-base-bin-android-x86_64.so/libggml-base.so        deps/android-x86_64/libggml-base.so
+          cp artifacts/ggml-cpu-bin-android-x86_64.so/libggml-cpu.so          deps/android-x86_64/libggml-cpu.so
+          cp artifacts/llama-bin-android-x86_64.so/libllama.so                deps/android-x86_64/libllama.so
+          cp artifacts/llava-bin-android-x86_64.so/libllava_shared.so         deps/android-x86_64/libllava_shared.so
 
           # Windows CUDA
           cp artifacts/ggml-bin-win-cublas-cu11.7.1-x64.dll/ggml.dll            deps/cu11.7.1/ggml.dll
 
@@ -38,6 +38,15 @@ jobs:
       with:
         dotnet-version: |
           8.0.x
+    - name: Install Mobile Workloads
+      if: ${{ contains(runner.os, 'windows') }}
+      run: |
+        dotnet workload install android --ignore-failed-sources
+        dotnet workload install maui --ignore-failed-sources
+    - name: Remove Mobile Project
+      if: ${{ !contains(runner.os, 'windows') }}
+      run: |
+        dotnet sln LLamaSharp.sln remove Llama.Mobile
     - name: Cache Packages
       uses: actions/cache@v4
       with:
 
@@ -337,7 +337,6 @@ test/TensorFlowNET.Examples/mnist
 # training model resources
 .resources
 /redist
-*.xml
 *.xsd
 
 # docs
 
@@ -46,7 +46,7 @@ and answer questions about them in an interactive chat prompt.
 
             // Ask a predefined question
             Console.ForegroundColor = ConsoleColor.Green;
-            string question1 = "What formats does KM support";
+            string question1 = "What is Kernel Memory";
             Console.WriteLine($"Question: {question1}");
             await AnswerQuestion(memory, question1);
 
 
@@ -54,7 +54,7 @@ Press ENTER to proceed...
             await IngestDocuments(memory);
         }
 
-        await AskSingleQuestion(memory, "What formats does KM support?");
+        await AskSingleQuestion(memory, "What is Kernel Memory");
         await StartUserChatSession(memory);
     }
 
 
@@ -15,15 +15,15 @@
 
   <ItemGroup>
     <PackageReference Include="Microsoft.Extensions.Logging.Console" Version="9.0.3" />
-    <PackageReference Include="Microsoft.KernelMemory.Core" Version="0.97.250211.1" />
+    <PackageReference Include="Microsoft.KernelMemory.Core" Version="0.98.250323.1" />
     <PackageReference Include="Microsoft.SemanticKernel" Version="1.44.0" />
-    <PackageReference Include="Microsoft.SemanticKernel.Plugins.Memory" Version="1.6.2-alpha" />
+    <PackageReference Include="Microsoft.SemanticKernel.Plugins.Memory" Version="1.44.0-alpha" />
     <PackageReference Include="NAudio" Version="2.2.1" />
     <PackageReference Include="SixLabors.ImageSharp" Version="3.1.7" />
-    <PackageReference Include="Spectre.Console" Version="0.49.1" />
-    <PackageReference Include="Spectre.Console.ImageSharp" Version="0.49.1" />
-    <PackageReference Include="Whisper.net" Version="1.7.4" />
-    <PackageReference Include="Whisper.net.Runtime" Version="1.7.4" />
+    <PackageReference Include="Spectre.Console" Version="0.50.0" />
+    <PackageReference Include="Spectre.Console.ImageSharp" Version="0.50.0" />
+    <PackageReference Include="Whisper.net" Version="1.8.1" />
+    <PackageReference Include="Whisper.net.Runtime" Version="1.8.1" />
     <PackageReference Include="Whisper.net.Runtime.Clblast" Version="1.5.0" />
     <PackageReference Include="Whisper.net.Runtime.CoreML" Version="1.7.4" />
     <PackageReference Include="Whisper.net.Runtime.Cublas" Version="1.5.0" />
 
@@ -31,9 +31,11 @@ public LLamaSharpTextEmbeddingGenerator(LLamaSharpConfig config)
 
             var @params = new ModelParams(config.ModelPath)
             {
-                ContextSize = config.ContextSize,
-                GpuLayerCount = config.GpuLayerCount ?? 20,
-
+                ContextSize = config?.ContextSize ?? 2048,
+                GpuLayerCount = config?.GpuLayerCount ?? 20,
+                //Embeddings = true,
+                MainGpu = config?.MainGpu ?? 0,
+                SplitMode = config?.SplitMode ?? LLama.Native.GPUSplitMode.None,
                 PoolingType = LLamaPoolingType.Mean,
             };
 
@@ -54,11 +56,11 @@ public LLamaSharpTextEmbeddingGenerator(LLamaSharpConfig config, LLamaWeights we
 
             var @params = new ModelParams(config.ModelPath)
             {
-                ContextSize = config.ContextSize ?? 2048,
-                GpuLayerCount = config.GpuLayerCount ?? 20,
-                Embeddings = true,
-                MainGpu = config.MainGpu,
-                SplitMode = config.SplitMode,
+                ContextSize = config?.ContextSize ?? 2048,
+                GpuLayerCount = config?.GpuLayerCount ?? 20,
+                //Embeddings = true,
+                MainGpu = config?.MainGpu ?? 0,
+                SplitMode = config?.SplitMode ?? LLama.Native.GPUSplitMode.None,
                 PoolingType = LLamaPoolingType.Mean,
             };
             _weights = weights;
 
@@ -32,8 +32,10 @@ public LlamaSharpTextGenerator(LLamaSharpConfig config)
         {
             var parameters = new ModelParams(config.ModelPath)
             {
-                ContextSize = config.ContextSize ?? 2048,
-                GpuLayerCount = config.GpuLayerCount ?? 20,
+                ContextSize = config?.ContextSize ?? 2048,
+                GpuLayerCount = config?.GpuLayerCount ?? 20,
+                MainGpu = config?.MainGpu ?? 0,
+                SplitMode = config?.SplitMode ?? LLama.Native.GPUSplitMode.None,
             };
             _weights = LLamaWeights.LoadFromFile(parameters);
             _context = _weights.CreateContext(parameters);
 
@@ -34,7 +34,7 @@
 	</PropertyGroup>
 
 	<ItemGroup>
-		<PackageReference Include="Microsoft.SemanticKernel.Abstractions" Version="1.44.0" />
+		<PackageReference Include="Microsoft.SemanticKernel.Abstractions" Version="1.48.0" />
 	</ItemGroup>
 
 	<ItemGroup Condition="'$(TargetFramework)' == 'netstandard2.0'">
 
@@ -20,15 +20,15 @@ public static int CIGpuLayerCount
         {
             get
             {
-                if (RuntimeInformation.IsOSPlatform(OSPlatform.OSX))
+                //if (RuntimeInformation.IsOSPlatform(OSPlatform.OSX))
                 {
                     #if DEBUG
                       return 20;
                     #else
                       return 0;                      
                     #endif
                 }
-                else return 20;
+                //else return 20;
             }
         }
     }
Original file line number	Diff line number	Diff line change
`@@ -54,7 +54,7 @@ Press ENTER to proceed...`
`54`	`54`	`await IngestDocuments(memory);`
`55`	`55`	`}`
`56`	`56`
`57`		`- await AskSingleQuestion(memory, "What formats does KM support?");`
	`57`	`+ await AskSingleQuestion(memory, "What is Kernel Memory");`
`58`	`58`	`await StartUserChatSession(memory);`
`59`	`59`	`}`
`60`	`60`
Original file line number	Diff line number	Diff line change
`@@ -32,8 +32,10 @@ public LlamaSharpTextGenerator(LLamaSharpConfig config)`
`32`	`32`	`{`
`33`	`33`	`var parameters = new ModelParams(config.ModelPath)`
`34`	`34`	`{`
`35`		`- ContextSize = config.ContextSize ?? 2048,`
`36`		`- GpuLayerCount = config.GpuLayerCount ?? 20,`
	`35`	`+ ContextSize = config?.ContextSize ?? 2048,`
	`36`	`+ GpuLayerCount = config?.GpuLayerCount ?? 20,`
	`37`	`+ MainGpu = config?.MainGpu ?? 0,`
	`38`	`+ SplitMode = config?.SplitMode ?? LLama.Native.GPUSplitMode.None,`
`37`	`39`	`};`
`38`	`40`	`_weights = LLamaWeights.LoadFromFile(parameters);`
`39`	`41`	`_context = _weights.CreateContext(parameters);`
Original file line number	Diff line number	Diff line change
`@@ -20,15 +20,15 @@ public static int CIGpuLayerCount`
`20`	`20`	`{`
`21`	`21`	`get`
`22`	`22`	`{`
`23`		`- if (RuntimeInformation.IsOSPlatform(OSPlatform.OSX))`
	`23`	`+ //if (RuntimeInformation.IsOSPlatform(OSPlatform.OSX))`
`24`	`24`	`{`
`25`	`25`	`#if DEBUG`
`26`	`26`	`return 20;`
`27`	`27`	`#else`
`28`	`28`	`return 0;`
`29`	`29`	`#endif`
`30`	`30`	`}`
`31`		`- else return 20;`
	`31`	`+ //else return 20;`
`32`	`32`	`}`
`33`	`33`	`}`
`34`	`34`	`}`