server: (router) expose child model info from router's /v1/models by ngxson · Pull Request #22683 · ggml-org/llama.cpp

ngxson · 2026-05-04T15:59:18Z

Overview

Allow server router instance to reflect the child instance's /v1/models info in the list of all models. This is possible for loaded models only.

For example:

{
    "data": [
        {
            "id": "ggml-org/GLM-OCR-GGUF:Q8_0",
            "aliases": [],
            "tags": [],
            "object": "model",
            "owned_by": "llamacpp",
            "created": 1777909820,
            "status": {
                "value": "loaded",
                "args": [
                    ....
                ],
                "preset": "[ggml-org/GLM-OCR-GGUF:Q8_0]\nhf-repo = ggml-org/GLM-OCR-GGUF:Q8_0\n\n"
            },
            "meta": {
                "vocab_type": 2,
                "n_vocab": 59392,
                "n_ctx": 131072,
                "n_ctx_train": 131072,
                "n_embd": 1536,
                "n_params": 891138048,
                "size": 947159040
            }
        }
    }
}

Requirements

I have read and agree with the contributing guidelines
AI usage disclosure: no

ggerganov · 2026-05-04T18:06:21Z

            // also handle status report from child process
            if (stdout_file) {
-                char buffer[4096];
+                char buffer[128 * 1024]; // large buffer for storing info


Better allocate this on the heap

…ml-org#22683) * server: (router) expose child model info from router's /v1/models * update docs

…ml-org#22683) * server: (router) expose child model info from router's /v1/models * update docs (cherry picked from commit 9dcf835)

…ml-org#22683) * server: (router) expose child model info from router's /v1/models * update docs

ngxson added 2 commits May 4, 2026 17:55

server: (router) expose child model info from router's /v1/models

60f43d2

update docs

2fb3b2e

ngxson requested a review from a team as a code owner May 4, 2026 15:59

ServeurpersoCom approved these changes May 4, 2026

View reviewed changes

ggerganov reviewed May 4, 2026

View reviewed changes

ggerganov approved these changes May 4, 2026

View reviewed changes

github-actions Bot added examples server labels May 4, 2026

ngxson merged commit 9dcf835 into ggml-org:master May 8, 2026
45 of 46 checks passed

cetarthoriphros pushed a commit to cetarthoriphros/llama.cpp that referenced this pull request May 9, 2026

server: (router) expose child model info from router's /v1/models (gg…

77f63fc

…ml-org#22683) * server: (router) expose child model info from router's /v1/models * update docs

meh pushed a commit to meh/llama.cpp that referenced this pull request May 10, 2026

server: (router) expose child model info from router's /v1/models (gg…

6286dab

…ml-org#22683) * server: (router) expose child model info from router's /v1/models * update docs

ngxson mentioned this pull request May 16, 2026

server: (router) alloc tmp buffer on heap #23159

Merged

rsenthilkumar6 pushed a commit to rsenthilkumar6/llama.cpp that referenced this pull request May 19, 2026

server: (router) expose child model info from router's /v1/models (gg…

3520190

…ml-org#22683) * server: (router) expose child model info from router's /v1/models * update docs

baramofme pushed a commit to baramofme/llama-cpp-turboquant that referenced this pull request May 23, 2026

server: (router) expose child model info from router's /v1/models (gg…

f225a61

…ml-org#22683) * server: (router) expose child model info from router's /v1/models * update docs

winstonma pushed a commit to winstonma/llama.cpp that referenced this pull request May 27, 2026

server: (router) expose child model info from router's /v1/models (gg…

21e68f8

…ml-org#22683) * server: (router) expose child model info from router's /v1/models * update docs

fewtarius pushed a commit to fewtarius/llama.cpp that referenced this pull request May 30, 2026

server: (router) expose child model info from router's /v1/models (gg…

3dfddbc

…ml-org#22683) * server: (router) expose child model info from router's /v1/models * update docs

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

server: (router) expose child model info from router's /v1/models#22683

server: (router) expose child model info from router's /v1/models#22683
ngxson merged 2 commits into
ggml-org:masterfrom
ngxson:xsn/router_models_more_info

ngxson commented May 4, 2026

Uh oh!

ggerganov May 4, 2026

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Conversation

ngxson commented May 4, 2026

Overview

Requirements

Uh oh!

ggerganov May 4, 2026

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants