ggml-org · ggerganov · Mar 14, 2026 · May 20, 2025 · May 22, 2025 · May 29, 2025
@@ -0,0 +1,138 @@
+ARG OPENVINO_VERSION_MAJOR=2026.0
+ARG OPENVINO_VERSION_FULL=2026.0.0.20965.c6d6a13a886
+ARG UBUNTU_VERSION=24.04
+
+# Optional proxy build arguments - empty by default
+ARG http_proxy=
+ARG https_proxy=
+
+## Build Image
+FROM ubuntu:${UBUNTU_VERSION} AS build
+
+# Pass proxy args to build stage
+ARG http_proxy
+ARG https_proxy
+
+RUN apt-get update && \
+    apt-get install -y --no-install-recommends \
+        ca-certificates \
+        gnupg \
+        wget \
+        git \
+        cmake \
+        ninja-build \
+        build-essential \
+        libtbb12 \
+        libssl-dev \
+        ocl-icd-opencl-dev \
+        opencl-headers \
+        opencl-clhpp-headers \
+        intel-opencl-icd && \
+    rm -rf /var/lib/apt/lists/*
+
+# Install OpenVINO for Ubuntu 24.04
+ARG OPENVINO_VERSION_MAJOR
+ARG OPENVINO_VERSION_FULL
+RUN mkdir -p /opt/intel && \
+    wget https://storage.openvinotoolkit.org/repositories/openvino/packages/${OPENVINO_VERSION_MAJOR}/linux/openvino_toolkit_ubuntu24_${OPENVINO_VERSION_FULL}_x86_64.tgz && \
+    tar -xf openvino_toolkit_ubuntu24_${OPENVINO_VERSION_FULL}_x86_64.tgz && \
+    mv openvino_toolkit_ubuntu24_${OPENVINO_VERSION_FULL}_x86_64 /opt/intel/openvino_${OPENVINO_VERSION_MAJOR} && \
+    cd /opt/intel/openvino_${OPENVINO_VERSION_MAJOR} && \
+    echo "Y" | ./install_dependencies/install_openvino_dependencies.sh && \
+    cd - && \
+    ln -s /opt/intel/openvino_${OPENVINO_VERSION_MAJOR} /opt/intel/openvino
+
+ENV OpenVINO_DIR=/opt/intel/openvino
+
+WORKDIR /app
+
+COPY . .
+
+# Build Stage
+RUN bash -c "source ${OpenVINO_DIR}/setupvars.sh && \
+    cmake -B build/ReleaseOV -G Ninja \
+        -DCMAKE_BUILD_TYPE=Release \
+        -DGGML_OPENVINO=ON && \
+    cmake --build build/ReleaseOV -j$(nproc)"
+
+# Copy all necessary libraries
+RUN mkdir -p /app/lib && \
+    find build/ReleaseOV -name '*.so*' -exec cp {} /app/lib \; && \
+    find ${OpenVINO_DIR}/runtime/lib/intel64 -name '*.so*' -exec cp -P {} /app/lib \; 2>/dev/null || \
+    find ${OpenVINO_DIR}/lib/intel64 -name '*.so*' -exec cp -P {} /app/lib \;
+
+# Create runtime directories and copy binaries
+RUN mkdir -p /app/full \
+    && cp build/ReleaseOV/bin/* /app/full/ \
+    && cp *.py /app/full \
+    && cp -r gguf-py /app/full \
+    && cp -r requirements /app/full \
+    && cp requirements.txt /app/full \
+    && cp .devops/tools.sh /app/full/tools.sh
+
+## Base Runtime Image
+FROM ubuntu:${UBUNTU_VERSION} AS base
+
+# Pass proxy args to runtime stage
+ARG http_proxy
+ARG https_proxy
+
+RUN apt-get update \
+    && apt-get install -y libgomp1 libtbb12 curl\
+    && apt autoremove -y \
+    && apt clean -y \
+    && rm -rf /tmp/* /var/tmp/* \
+    && find /var/cache/apt/archives /var/lib/apt/lists -not -name lock -type f -delete \
+    && find /var/cache -type f -delete
+
+COPY --from=build /app/lib/ /app/
+
+### Full (all binaries)
+FROM base AS full
+
+ARG http_proxy
+ARG https_proxy
+
+COPY --from=build /app/full /app/
+
+WORKDIR /app
+
+RUN apt-get update && \
+    apt-get install -y --no-install-recommends \
+    git \
+    python3 \
+    python3-venv \
+    python3-pip && \
+    python3 -m venv /ov-venv && \
+    /ov-venv/bin/pip install --no-cache-dir --upgrade pip setuptools wheel && \
+    /ov-venv/bin/pip install --no-cache-dir -r requirements.txt && \
+    apt-get autoremove -y && \
+    apt-get clean && \
+    rm -rf /tmp/* /var/tmp/* && \
+    find /var/cache/apt/archives /var/lib/apt/lists -not -name lock -type f -delete && \
+    find /var/cache -type f -delete
+
+ENTRYPOINT ["/bin/bash", "-c", "source /ov-venv/bin/activate && exec /app/tools.sh \"$@\"", "--"]
+
+
+### Light, CLI only
+FROM base AS light
+
+COPY --from=build /app/full/llama-cli /app/
+
+WORKDIR /app
+
+ENTRYPOINT [ "/app/llama-cli" ]
+
+### Server, Server only
+FROM base AS server
+
+ENV LLAMA_ARG_HOST=0.0.0.0
+
+COPY --from=build /app/full/llama-server /app/
+
+WORKDIR /app
+
+HEALTHCHECK CMD [ "curl", "-f", "http://localhost:8080/health" ]
+
+ENTRYPOINT [ "/app/llama-server" ]
@@ -0,0 +1,25 @@
+name: "Linux - Setup OpenVINO Toolkit"
+description: "Setup OpenVINO Toolkit for Linux"
+inputs:
+  path:
+    description: "Installation path"
+    required: true
+  version_major:
+    description: "OpenVINO major version (e.g., 2025.3)"
+    required: true
+  version_full:
+    description: "OpenVINO full version (e.g., 2025.3.0.19807.44526285f24)"
+    required: true
+
+runs:
+  using: "composite"
+  steps:
+    - name: Setup OpenVINO Toolkit
+      id: setup
+      uses: ./.github/actions/unarchive-tar
+      with:
+        url: https://storage.openvinotoolkit.org/repositories/openvino/packages/${{ inputs.version_major }}/linux/openvino_toolkit_ubuntu24_${{ inputs.version_full }}_x86_64.tgz
+        path: ${{ inputs.path }}
+        type: z
+        strip: 1
+
@@ -63,6 +63,34 @@ jobs:
           path: ./spacemit_toolchain
           version: ${{ env.SPACEMIT_IME_TOOLCHAIN_VERSION }}
 
+  ubuntu-24-openvino-cache:
+    runs-on: ubuntu-24.04
+
+    env:
+      # Sync versions in build.yml, release.yml, build-cache.yml, .devops/openvino.Dockerfile
+      OPENVINO_VERSION_MAJOR: "2026.0"
+      OPENVINO_VERSION_FULL: "2026.0.0.20965.c6d6a13a886"
+
+    steps:
+      - name: Clone
+        id: checkout
+        uses: actions/checkout@v6
+
+      - name: Setup Cache
+        uses: actions/cache@v5
+        id: cache-openvino
+        with:
+          path: ./openvino_toolkit
+          key: openvino-toolkit-v${{ env.OPENVINO_VERSION_FULL }}-${{ runner.os }}
+
+      - name: Setup OpenVINO Toolkit
+        if: steps.cache-openvino.outputs.cache-hit != 'true'
+        uses: ./.github/actions/linux-setup-openvino
+        with:
+          path: ./openvino_toolkit
+          version_major: ${{ env.OPENVINO_VERSION_MAJOR }}
+          version_full: ${{ env.OPENVINO_VERSION_FULL }}
+
   windows-2022-rocm-cache:
     runs-on: windows-2022
 

@@ -743,6 +743,83 @@ jobs:
             -DGGML_SYCL_F16=ON
           cmake --build build --config Release -j $(nproc)
 
+  ubuntu-24-cmake-openvino:
+      name: ubuntu-24-cmake-openvino-${{ matrix.openvino_device }}
+      strategy:
+        matrix:
+          include:
+            - variant: cpu
+              runner: '"ubuntu-24.04"'
+              openvino_device: "CPU"
+            - variant: gpu
+              runner: '["self-hosted","Linux","X64","Intel"]'
+              openvino_device: "GPU"
+
+      runs-on: ${{ fromJSON(matrix.runner) }}
+
   ggml-ci-x64-cpu-low-perf: 
     runs-on: ubuntu-22.04 
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
       - name: ccache 
         uses: ggml-org/ccache-action@v1.2.16 
         with: 
           key: ggml-ci-x64-cpu-low-perf 
           evict-old-files: 1d 
           save: ${{ github.event_name == 'push' && github.ref == 'refs/heads/master' }} 
       - name: Dependencies 
         id: depends 
         run: | 
           sudo apt-get update 
           sudo apt-get install build-essential 
       - name: Test 
         id: ggml-ci 
         run: | 
           LLAMA_ARG_THREADS=$(nproc) GG_BUILD_LOW_PERF=1 bash ./ci/run.sh ./tmp/results ./tmp/mnt 
   ggml-ci-arm64-cpu-low-perf: 
     runs-on: ubuntu-22.04-arm 
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
       - name: ccache 
         uses: ggml-org/ccache-action@v1.2.16 
         with: 
           key: ggml-ci-arm64-cpu-low-perf 
           evict-old-files: 1d 
           save: ${{ github.event_name == 'push' && github.ref == 'refs/heads/master' }} 
       - name: Dependencies 
         id: depends 
         run: | 
           sudo apt-get update 
           sudo apt-get install build-essential 
       - name: Test 
         id: ggml-ci 
         run: | 
           LLAMA_ARG_THREADS=$(nproc) GG_BUILD_LOW_PERF=1 bash ./ci/run.sh ./tmp/results ./tmp/mnt 
   ggml-ci-x64-cpu-high-perf: 
     runs-on: ubuntu-22.04 
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
       - name: ccache 
         uses: ggml-org/ccache-action@v1.2.16 
         with: 
           key: ggml-ci-x64-cpu-high-perf 
           evict-old-files: 1d 
           save: ${{ github.event_name == 'push' && github.ref == 'refs/heads/master' }} 
       - name: Dependencies 
         id: depends 
         run: | 
           sudo apt-get update 
           sudo apt-get install build-essential 
       - name: Test 
         id: ggml-ci 
         run: | 
           LLAMA_ARG_THREADS=$(nproc) GG_BUILD_HIGH_PERF=1 bash ./ci/run.sh ./tmp/results ./tmp/mnt 
   ggml-ci-arm64-cpu-high-perf: 
     runs-on: ubuntu-22.04-arm 
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
       - name: ccache 
         uses: ggml-org/ccache-action@v1.2.16 
         with: 
           key: ggml-ci-arm64-cpu-high-perf 
           evict-old-files: 1d 
           save: ${{ github.event_name == 'push' && github.ref == 'refs/heads/master' }} 
       - name: Dependencies 
         id: depends 
         run: | 
           sudo apt-get update 
           sudo apt-get install build-essential 
       - name: Test 
         id: ggml-ci 
         run: | 
           LLAMA_ARG_THREADS=$(nproc) GG_BUILD_HIGH_PERF=1 GG_BUILD_NO_SVE=1 GG_BUILD_NO_BF16=1 GG_BUILD_EXTRA_TESTS_0=1 bash ./ci/run.sh ./tmp/results ./tmp/mnt 
   ggml-ci-arm64-cpu-high-perf-sve: 
     runs-on: ubuntu-22.04-arm 
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
       - name: ccache 
         uses: ggml-org/ccache-action@v1.2.16 
         with: 
           key: ggml-ci-arm64-cpu-high-perf-sve 
           evict-old-files: 1d 
           save: ${{ github.event_name == 'push' && github.ref == 'refs/heads/master' }} 
       - name: Dependencies 
         id: depends 
         run: | 
           sudo apt-get update 
           sudo apt-get install build-essential 
       - name: Test 
         id: ggml-ci 
         run: | 
           LLAMA_ARG_THREADS=$(nproc) GG_BUILD_NO_BF16=1 GG_BUILD_EXTRA_TESTS_0=1 bash ./ci/run.sh ./tmp/results ./tmp/mnt 
   ggml-ci-x64-nvidia-cuda: 
     runs-on: [self-hosted, Linux, X64, NVIDIA] 
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
       - name: Test 
         id: ggml-ci 
         run: | 
           nvidia-smi 
           GG_BUILD_CUDA=1 bash ./ci/run.sh ~/results/llama.cpp /mnt/llama.cpp 
   ggml-ci-x64-nvidia-vulkan-cm: 
     runs-on: [self-hosted, Linux, X64, NVIDIA] 
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
       - name: Test 
         id: ggml-ci 
         run: | 
           vulkaninfo --summary 
           GG_BUILD_VULKAN=1 GGML_VK_DISABLE_COOPMAT2=1 bash ./ci/run.sh ~/results/llama.cpp /mnt/llama.cpp 
   ggml-ci-x64-nvidia-vulkan-cm2: 
     runs-on: [self-hosted, Linux, X64, NVIDIA, COOPMAT2] 
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
       - name: Test 
         id: ggml-ci 
         run: | 
           vulkaninfo --summary 
           GG_BUILD_VULKAN=1 bash ./ci/run.sh ~/results/llama.cpp /mnt/llama.cpp 
   ggml-ci-x64-cpu-amx: 
     runs-on: [self-hosted, Linux, X64, CPU, AMX] 
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
       - name: Test 
         id: ggml-ci 
         run: | 
           bash ./ci/run.sh ~/results/llama.cpp /mnt/llama.cpp 
   # ggml-ci-x64-amd-vulkan: 
   #   runs-on: [self-hosted, Linux, X64, AMD] 
   #   steps: 
   #     - name: Clone 
   #       id: checkout 
   #       uses: actions/checkout@v6 
   #     - name: Test 
   #       id: ggml-ci 
   #       run: | 
   #         vulkaninfo --summary 
   #         GG_BUILD_VULKAN=1 bash ./ci/run.sh ~/results/llama.cpp /mnt/llama.cpp 
   # ggml-ci-x64-amd-rocm: 
   #   runs-on: [self-hosted, Linux, X64, AMD] 
   #   steps: 
   #     - name: Clone 
   #       id: checkout 
   #       uses: actions/checkout@v6 
   #     - name: Test 
   #       id: ggml-ci 
   #       run: | 
   #         amd-smi static 
   #         GG_BUILD_ROCM=1 GG_BUILD_AMDGPU_TARGETS="gfx1101" bash ./ci/run.sh ~/results/llama.cpp /mnt/llama.cpp 
   ggml-ci-mac-metal: 
     runs-on: [self-hosted, macOS, ARM64] 
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
       - name: Test 
         id: ggml-ci 
         run: | 
           GG_BUILD_METAL=1 bash ./ci/run.sh ~/results/llama.cpp ~/mnt/llama.cpp 
   ggml-ci-mac-webgpu: 
     runs-on: [self-hosted, macOS, ARM64] 
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
       - name: Dawn Dependency 
         id: dawn-depends 
         run: | 
           DAWN_VERSION="v2.0.0" 
           DAWN_OWNER="reeselevine" 
           DAWN_REPO="dawn" 
           DAWN_ASSET_NAME="Dawn-5e9a4865b1635796ccc77dd30057f2b4002a1355-macos-latest-Release" 
           echo "Fetching release asset from https://github.com/${DAWN_OWNER}/${DAWN_REPO}/releases/download/${DAWN_VERSION}/${DAWN_ASSET_NAME}.zip" 
           curl -L -o artifact.zip \ 
             "https://github.com/${DAWN_OWNER}/${DAWN_REPO}/releases/download/${DAWN_VERSION}/${DAWN_ASSET_NAME}.zip" 
           mkdir dawn 
           unzip artifact.zip 
           tar -xvf ${DAWN_ASSET_NAME}.tar.gz -C dawn --strip-components=1 
       - name: Test 
         id: ggml-ci 
         run: | 
           GG_BUILD_WEBGPU=1 GG_BUILD_WEBGPU_DAWN_PREFIX="$GITHUB_WORKSPACE/dawn" \ 
             bash ./ci/run.sh ~/results/llama.cpp ~/mnt/llama.cpp 
   ggml-ci-mac-vulkan: 
     runs-on: [self-hosted, macOS, ARM64] 
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
       - name: Test 
         id: ggml-ci 
         run: | 
           vulkaninfo --summary 
           GG_BUILD_VULKAN=1 bash ./ci/run.sh ~/results/llama.cpp ~/mnt/llama.cpp 
   ggml-ci-arm64-cpu-kleidiai: 
      runs-on: ubuntu-22.04-arm 
      steps: 
        - name: Clone 
          id: checkout 
          uses: actions/checkout@v6 
        - name: ccache 
          uses: ggml-org/ccache-action@v1.2.16 
          with: 
            key: ggml-ci-arm64-cpu-kleidiai 
            evict-old-files: 1d 
            save: ${{ github.event_name == 'push' && github.ref == 'refs/heads/master' }} 
        - name: Dependencies 
          id: depends 
          run: | 
            sudo apt-get update 
            sudo apt-get install -y build-essential 
        - name: Test 
          id: ggml-ci 
          run: | 
            GG_BUILD_KLEIDIAI=1 GG_BUILD_EXTRA_TESTS_0=1 bash ./ci/run.sh ./tmp/results ./tmp/mnt 
   ggml-ci-x64-cpu-low-perf: 
     runs-on: ubuntu-22.04 
  
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
  
       - name: ccache 
         uses: ggml-org/ccache-action@v1.2.16 
         with: 
           key: ggml-ci-x64-cpu-low-perf 
           evict-old-files: 1d 
           save: ${{ github.event_name == 'push' && github.ref == 'refs/heads/master' }} 
  
       - name: Dependencies 
         id: depends 
         run: | 
           sudo apt-get update 
           sudo apt-get install build-essential 
  
       - name: Test 
         id: ggml-ci 
         run: | 
           LLAMA_ARG_THREADS=$(nproc) GG_BUILD_LOW_PERF=1 bash ./ci/run.sh ./tmp/results ./tmp/mnt 
  
   ggml-ci-arm64-cpu-low-perf: 
     runs-on: ubuntu-22.04-arm 
  
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
  
       - name: ccache 
         uses: ggml-org/ccache-action@v1.2.16 
         with: 
           key: ggml-ci-arm64-cpu-low-perf 
           evict-old-files: 1d 
           save: ${{ github.event_name == 'push' && github.ref == 'refs/heads/master' }} 
  
       - name: Dependencies 
         id: depends 
         run: | 
           sudo apt-get update 
           sudo apt-get install build-essential 
  
       - name: Test 
         id: ggml-ci 
         run: | 
           LLAMA_ARG_THREADS=$(nproc) GG_BUILD_LOW_PERF=1 bash ./ci/run.sh ./tmp/results ./tmp/mnt 
  
   ggml-ci-x64-cpu-high-perf: 
     runs-on: ubuntu-22.04 
  
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
  
       - name: ccache 
         uses: ggml-org/ccache-action@v1.2.16 
         with: 
           key: ggml-ci-x64-cpu-high-perf 
           evict-old-files: 1d 
           save: ${{ github.event_name == 'push' && github.ref == 'refs/heads/master' }} 
  
       - name: Dependencies 
         id: depends 
         run: | 
           sudo apt-get update 
           sudo apt-get install build-essential 
  
       - name: Test 
         id: ggml-ci 
         run: | 
           LLAMA_ARG_THREADS=$(nproc) GG_BUILD_HIGH_PERF=1 bash ./ci/run.sh ./tmp/results ./tmp/mnt 
  
   ggml-ci-arm64-cpu-high-perf: 
     runs-on: ubuntu-22.04-arm 
  
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
  
       - name: ccache 
         uses: ggml-org/ccache-action@v1.2.16 
         with: 
           key: ggml-ci-arm64-cpu-high-perf 
           evict-old-files: 1d 
           save: ${{ github.event_name == 'push' && github.ref == 'refs/heads/master' }} 
  
       - name: Dependencies 
         id: depends 
         run: | 
           sudo apt-get update 
           sudo apt-get install build-essential 
  
       - name: Test 
         id: ggml-ci 
         run: | 
           LLAMA_ARG_THREADS=$(nproc) GG_BUILD_HIGH_PERF=1 GG_BUILD_NO_SVE=1 GG_BUILD_NO_BF16=1 GG_BUILD_EXTRA_TESTS_0=1 bash ./ci/run.sh ./tmp/results ./tmp/mnt 
  
   ggml-ci-arm64-cpu-high-perf-sve: 
     runs-on: ubuntu-22.04-arm 
  
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
  
       - name: ccache 
         uses: ggml-org/ccache-action@v1.2.16 
         with: 
           key: ggml-ci-arm64-cpu-high-perf-sve 
           evict-old-files: 1d 
           save: ${{ github.event_name == 'push' && github.ref == 'refs/heads/master' }} 
  
       - name: Dependencies 
         id: depends 
         run: | 
           sudo apt-get update 
           sudo apt-get install build-essential 
  
       - name: Test 
         id: ggml-ci 
         run: | 
           LLAMA_ARG_THREADS=$(nproc) GG_BUILD_NO_BF16=1 GG_BUILD_EXTRA_TESTS_0=1 bash ./ci/run.sh ./tmp/results ./tmp/mnt 
  
   ggml-ci-x64-nvidia-cuda: 
     runs-on: [self-hosted, Linux, X64, NVIDIA] 
  
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
  
       - name: Test 
         id: ggml-ci 
         run: | 
           nvidia-smi 
           GG_BUILD_CUDA=1 bash ./ci/run.sh ~/results/llama.cpp /mnt/llama.cpp 
  
   ggml-ci-x64-nvidia-vulkan-cm: 
     runs-on: [self-hosted, Linux, X64, NVIDIA] 
  
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
  
       - name: Test 
         id: ggml-ci 
         run: | 
           vulkaninfo --summary 
           GG_BUILD_VULKAN=1 GGML_VK_DISABLE_COOPMAT2=1 bash ./ci/run.sh ~/results/llama.cpp /mnt/llama.cpp 
  
   ggml-ci-x64-nvidia-vulkan-cm2: 
     runs-on: [self-hosted, Linux, X64, NVIDIA, COOPMAT2] 
  
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
  
       - name: Test 
         id: ggml-ci 
         run: | 
           vulkaninfo --summary 
           GG_BUILD_VULKAN=1 bash ./ci/run.sh ~/results/llama.cpp /mnt/llama.cpp 
  
   ggml-ci-x64-cpu-amx: 
     runs-on: [self-hosted, Linux, X64, CPU, AMX] 
  
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
  
       - name: Test 
         id: ggml-ci 
         run: | 
           bash ./ci/run.sh ~/results/llama.cpp /mnt/llama.cpp 
  
   # ggml-ci-x64-amd-vulkan: 
   #   runs-on: [self-hosted, Linux, X64, AMD] 
  
   #   steps: 
   #     - name: Clone 
   #       id: checkout 
   #       uses: actions/checkout@v6 
  
   #     - name: Test 
   #       id: ggml-ci 
   #       run: | 
   #         vulkaninfo --summary 
   #         GG_BUILD_VULKAN=1 bash ./ci/run.sh ~/results/llama.cpp /mnt/llama.cpp 
  
   # ggml-ci-x64-amd-rocm: 
   #   runs-on: [self-hosted, Linux, X64, AMD] 
  
   #   steps: 
   #     - name: Clone 
   #       id: checkout 
   #       uses: actions/checkout@v6 
  
   #     - name: Test 
   #       id: ggml-ci 
   #       run: | 
   #         amd-smi static 
   #         GG_BUILD_ROCM=1 GG_BUILD_AMDGPU_TARGETS="gfx1101" bash ./ci/run.sh ~/results/llama.cpp /mnt/llama.cpp 
  
   ggml-ci-mac-metal: 
     runs-on: [self-hosted, macOS, ARM64] 
  
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
  
       - name: Test 
         id: ggml-ci 
         run: | 
           GG_BUILD_METAL=1 bash ./ci/run.sh ~/results/llama.cpp ~/mnt/llama.cpp 
  
   ggml-ci-mac-webgpu: 
     runs-on: [self-hosted, macOS, ARM64] 
  
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
  
       - name: Dawn Dependency 
         id: dawn-depends 
         run: | 
           DAWN_VERSION="v2.0.0" 
           DAWN_OWNER="reeselevine" 
           DAWN_REPO="dawn" 
           DAWN_ASSET_NAME="Dawn-5e9a4865b1635796ccc77dd30057f2b4002a1355-macos-latest-Release" 
           echo "Fetching release asset from https://github.com/${DAWN_OWNER}/${DAWN_REPO}/releases/download/${DAWN_VERSION}/${DAWN_ASSET_NAME}.zip" 
           curl -L -o artifact.zip \ 
             "https://github.com/${DAWN_OWNER}/${DAWN_REPO}/releases/download/${DAWN_VERSION}/${DAWN_ASSET_NAME}.zip" 
           mkdir dawn 
           unzip artifact.zip 
           tar -xvf ${DAWN_ASSET_NAME}.tar.gz -C dawn --strip-components=1 
  
       - name: Test 
         id: ggml-ci 
         run: | 
           GG_BUILD_WEBGPU=1 GG_BUILD_WEBGPU_DAWN_PREFIX="$GITHUB_WORKSPACE/dawn" \ 
             bash ./ci/run.sh ~/results/llama.cpp ~/mnt/llama.cpp 
  
   ggml-ci-mac-vulkan: 
     runs-on: [self-hosted, macOS, ARM64] 
  
     steps: 
       - name: Clone 
         id: checkout 
         uses: actions/checkout@v6 
  
       - name: Test 
         id: ggml-ci 
         run: | 
           vulkaninfo --summary 
           GG_BUILD_VULKAN=1 bash ./ci/run.sh ~/results/llama.cpp ~/mnt/llama.cpp 
  
   ggml-ci-arm64-cpu-kleidiai: 
      runs-on: ubuntu-22.04-arm 
  
      steps: 
        - name: Clone 
          id: checkout 
          uses: actions/checkout@v6 
  
        - name: ccache 
          uses: ggml-org/ccache-action@v1.2.16 
          with: 
            key: ggml-ci-arm64-cpu-kleidiai 
            evict-old-files: 1d 
            save: ${{ github.event_name == 'push' && github.ref == 'refs/heads/master' }} 
  
        - name: Dependencies 
          id: depends 
          run: | 
            sudo apt-get update 
            sudo apt-get install -y build-essential 
  
        - name: Test 
          id: ggml-ci 
          run: | 
            GG_BUILD_KLEIDIAI=1 GG_BUILD_EXTRA_TESTS_0=1 bash ./ci/run.sh ./tmp/results ./tmp/mnt 
  
+      env:
+        # Sync versions in build.yml, release.yml, build-cache.yml, .devops/openvino.Dockerfile
+        OPENVINO_VERSION_MAJOR: "2026.0"
+        OPENVINO_VERSION_FULL: "2026.0.0.20965.c6d6a13a886"
+
+      steps:
+        - name: Clone
+          id: checkout
+          uses: actions/checkout@v6
+
+        - name: ccache
+          uses: ggml-org/ccache-action@v1.2.16
+          with:
+            key: ubuntu-24-cmake-openvino-${{ matrix.variant }}-no-preset-v1
+            evict-old-files: 1d
+
+        - name: Dependencies
+          id: depends
+          run: |
+            sudo apt-get update
+            sudo apt-get install -y build-essential libssl-dev libtbb12 cmake ninja-build python3-pip
+            sudo apt-get install -y ocl-icd-opencl-dev opencl-headers opencl-clhpp-headers intel-opencl-icd
+
+        - name: Use OpenVINO Toolkit Cache
+          uses: actions/cache@v5
+          id: cache-openvino
+          with:
+            path: ./openvino_toolkit
+            key: openvino-toolkit-v${{ env.OPENVINO_VERSION_FULL }}-${{ runner.os }}
+
+        - name: Setup OpenVINO Toolkit
+          if: steps.cache-openvino.outputs.cache-hit != 'true'
+          uses: ./.github/actions/linux-setup-openvino
+          with:
+            path: ./openvino_toolkit
+            version_major: ${{ env.OPENVINO_VERSION_MAJOR }}
+            version_full: ${{ env.OPENVINO_VERSION_FULL }}
+
+        - name: Install OpenVINO dependencies
+          run: |
+            cd ./openvino_toolkit
+            chmod +x ./install_dependencies/install_openvino_dependencies.sh
+            echo "Y" | sudo -E ./install_dependencies/install_openvino_dependencies.sh
+
+        - name: Build
+          id: cmake_build
+          run: |
+            source ./openvino_toolkit/setupvars.sh
+            cmake -B build/ReleaseOV -G Ninja \
+              -DCMAKE_BUILD_TYPE=Release \
+              -DGGML_OPENVINO=ON
+            cmake --build build/ReleaseOV --config Release -j $(nproc)
+
+        - name: Test
+          id: cmake_test
+          # TODO: fix and re-enable the `test-llama-archs` test below
+          run: |
+            cd ${{ github.workspace }}
+            if [ "${{ matrix.openvino_device }}" = "GPU" ]; then
+              export GGML_OPENVINO_DEVICE=GPU
+            fi
+            ctest --test-dir build/ReleaseOV -L main -E "test-llama-archs" --verbose --timeout 2000
+
   build-linux-cross:
     uses: ./.github/workflows/build-linux-cross.yml
 
@@ -1752,6 +1829,46 @@ jobs:
          run: |
            GG_BUILD_KLEIDIAI=1 GG_BUILD_EXTRA_TESTS_0=1 bash ./ci/run.sh ./tmp/results ./tmp/mnt
 
+  ggml-ci-x64-intel-openvino-gpu-low-perf:
+    runs-on: [self-hosted, Linux, X64, Intel, OpenVINO]
+
+    env:
+      # Sync versions in build.yml, release.yml, build-cache.yml, .devops/openvino.Dockerfile
+      OPENVINO_VERSION_MAJOR: "2026.0"
+      OPENVINO_VERSION_FULL: "2026.0.0.20965.c6d6a13a886"
+
+    steps:
+      - name: Clone
+        id: checkout
+        uses: actions/checkout@v6
+
+      - name: Use OpenVINO Toolkit Cache
+        uses: actions/cache@v5
+        id: cache-openvino
+        with:
+          path: ./openvino_toolkit
+          key: openvino-toolkit-v${{ env.OPENVINO_VERSION_FULL }}-${{ runner.os }}
+
+      - name: Setup OpenVINO Toolkit
+        if: steps.cache-openvino.outputs.cache-hit != 'true'
+        uses: ./.github/actions/linux-setup-openvino
+        with:
+          path: ./openvino_toolkit
+          version_major: ${{ env.OPENVINO_VERSION_MAJOR }}
+          version_full: ${{ env.OPENVINO_VERSION_FULL }}
+
+      - name: Install OpenVINO dependencies
+        run: |
+          cd ./openvino_toolkit
+          chmod +x ./install_dependencies/install_openvino_dependencies.sh
+          echo "Y" | sudo -E ./install_dependencies/install_openvino_dependencies.sh
+
+      - name: Test
+        id: ggml-ci
+        run: |
+          source ./openvino_toolkit/setupvars.sh
+          GG_BUILD_OPENVINO=1 GGML_OPENVINO_DEVICE=GPU GG_BUILD_LOW_PERF=1 bash ./ci/run.sh ./tmp/results ./tmp/mnt
+
   ubuntu-cpu-cmake-riscv64-native:
     runs-on: RISCV64
 

@@ -47,6 +47,7 @@ jobs:
           - { tag: "vulkan", dockerfile: ".devops/vulkan.Dockerfile", platforms: "linux/amd64", full: true, light: true, server: true, free_disk_space: false, runs_on: "ubuntu-22.04" }
           - { tag: "s390x",  dockerfile: ".devops/s390x.Dockerfile",  platforms: "linux/s390x", full: true, light: true, server: true, free_disk_space: false, runs_on: "ubuntu-22.04-s390x" }
           - { tag: "rocm",   dockerfile: ".devops/rocm.Dockerfile",   platforms: "linux/amd64", full: true, light: true, server: true, free_disk_space: true,  runs_on: "ubuntu-22.04" }
+          - { tag: "openvino", dockerfile: ".devops/openvino.Dockerfile", platforms: "linux/amd64", full: true, light: true, server: true, free_disk_space: false, runs_on: "ubuntu-22.04" }
     steps:
       - name: Check out the repo
         uses: actions/checkout@v6