ray-project
diff --git a/‎python/ray/llm/_internal/common/callbacks/base.py‎
Lines changed: 1 addition & 1 deletion b/‎python/ray/llm/_internal/common/callbacks/base.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎python/ray/llm/_internal/common/callbacks/cloud_downloader.py‎
Lines changed: 1 addition & 1 deletion b/‎python/ray/llm/_internal/common/callbacks/cloud_downloader.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎python/ray/llm/_internal/serve/config_generator/utils/constants.py‎
Lines changed: 1 addition & 1 deletion b/‎python/ray/llm/_internal/serve/config_generator/utils/constants.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎python/ray/llm/_internal/serve/config_generator/utils/gpu.py‎
Lines changed: 1 addition & 1 deletion b/‎python/ray/llm/_internal/serve/config_generator/utils/gpu.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎python/ray/llm/_internal/serve/config_generator/utils/text_completion.py‎
Lines changed: 1 addition & 1 deletion b/‎python/ray/llm/_internal/serve/config_generator/utils/text_completion.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎python/ray/llm/_internal/serve/configs/constants.py‎ renamed to ‎python/ray/llm/_internal/serve/constants.py‎ b/‎python/ray/llm/_internal/serve/configs/constants.py‎ renamed to ‎python/ray/llm/_internal/serve/constants.py‎
diff --git a/‎python/ray/llm/_internal/serve/configs/__init__.py‎ renamed to ‎python/ray/llm/_internal/serve/core/__init__.py‎ b/‎python/ray/llm/_internal/serve/configs/__init__.py‎ renamed to ‎python/ray/llm/_internal/serve/core/__init__.py‎
diff --git a/‎python/ray/llm/_internal/serve/deployments/__init__.py‎ renamed to ‎python/ray/llm/_internal/serve/core/configs/__init__.py‎ b/‎python/ray/llm/_internal/serve/deployments/__init__.py‎ renamed to ‎python/ray/llm/_internal/serve/core/configs/__init__.py‎
diff --git a/‎python/ray/llm/_internal/serve/configs/server_models.py‎ renamed to ‎python/ray/llm/_internal/serve/core/configs/llm_config.py‎
Lines changed: 3 additions & 3 deletions b/‎python/ray/llm/_internal/serve/configs/server_models.py‎ renamed to ‎python/ray/llm/_internal/serve/core/configs/llm_config.py‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎python/ray/llm/_internal/serve/configs/openai_api_models.py‎ renamed to ‎python/ray/llm/_internal/serve/core/configs/openai_api_models.py‎
Lines changed: 4 additions & 1 deletion b/‎python/ray/llm/_internal/serve/configs/openai_api_models.py‎ renamed to ‎python/ray/llm/_internal/serve/core/configs/openai_api_models.py‎
Lines changed: 4 additions & 1 deletion
@@ -6,7 +6,7 @@
 
 if TYPE_CHECKING:
     from ray.llm._internal.common.utils.download_utils import NodeModelDownloadable
-    from ray.llm._internal.serve.configs.server_models import LLMConfig
+    from ray.llm._internal.serve.core.configs.llm_config import LLMConfig
 
 logger = logging.getLogger(__name__)
 
 
@@ -39,7 +39,7 @@ class CloudDownloader(CallbackBase):
     Example:
         ```
         from ray.llm._internal.common.callbacks.cloud_downloader import CloudDownloader
-        from ray.llm._internal.serve.configs.server_models import LLMConfig
+        from ray.llm._internal.serve.core.configs.llm_config import LLMConfig
         config = LLMConfig(
             ...
             callback_config={
 
@@ -1,6 +1,6 @@
 import os
 
-from ray.llm._internal.serve.configs.constants import RAYLLM_HOME_DIR
+from ray.llm._internal.serve.constants import RAYLLM_HOME_DIR
 
 TEMPLATE_DIR = os.path.normpath(
     os.path.join(
 
@@ -7,7 +7,7 @@
     DEFAULT_DEPLOYMENT_CONFIGS_FILE,
     TEMPLATE_DIR,
 )
-from ray.llm._internal.serve.configs.server_models import GPUType
+from ray.llm._internal.serve.core.configs.llm_config import GPUType
 
 # All practical GPUs
 ALL_GPU_TYPES = [
 
@@ -15,7 +15,7 @@
 from ray.llm._internal.serve.config_generator.utils.models import (
     TextCompletionModelConfig,
 )
-from ray.llm._internal.serve.configs.server_models import LLMConfig
+from ray.llm._internal.serve.core.configs.llm_config import LLMConfig
 
 
 def get_model_default_config(model_id: str) -> Dict[str, Any]:
 
@@ -28,12 +28,12 @@
 )
 from ray.llm._internal.common.utils.download_utils import NodeModelDownloadable
 from ray.llm._internal.common.utils.import_utils import load_class, try_import
-from ray.llm._internal.serve.configs.constants import (
+from ray.llm._internal.serve.constants import (
     DEFAULT_MULTIPLEX_DOWNLOAD_TIMEOUT_S,
     DEFAULT_MULTIPLEX_DOWNLOAD_TRIES,
     MODEL_RESPONSE_BATCH_TIMEOUT_MS,
 )
-from ray.llm._internal.serve.deployments.llm.vllm.kv_transfer_backends import (
+from ray.llm._internal.serve.engines.vllm.kv_transfer import (
     SUPPORTED_BACKENDS as SUPPORTED_KV_CONNECTOR_BACKENDS,
 )
 from ray.llm._internal.serve.observability.logging import get_logger
@@ -455,7 +455,7 @@ def get_engine_config(self) -> EngineConfigType:
             return self._engine_config
 
         if self.llm_engine == LLMEngine.vLLM:
-            from ray.llm._internal.serve.deployments.llm.vllm.vllm_models import (
+            from ray.llm._internal.serve.engines.vllm.vllm_models import (
                 VLLMEngineConfig,
             )
 
 
@@ -29,7 +29,7 @@
 from vllm.utils import random_uuid
 
 if TYPE_CHECKING:
-    from ray.llm._internal.serve.configs.server_models import LLMConfig
+    from ray.llm._internal.serve.core.configs.llm_config import LLMConfig
 
 
 class ChatCompletionRequest(vLLMChatCompletionRequest):
@@ -177,6 +177,9 @@ def to_model_metadata(
         model_config: The model's YAML config.
         overrides: should only be set for LoRA fine-tuned models. The
             overrides of the fine-tuned model metadata.
+
+    Returns:
+        A ModelCard object.
     """
     metadata = {
         "model_id": model_config.model_id,
Original file line number	Diff line number	Diff line change
`@@ -7,7 +7,7 @@`
`7`	`7`	`DEFAULT_DEPLOYMENT_CONFIGS_FILE,`
`8`	`8`	`TEMPLATE_DIR,`
`9`	`9`	`)`
`10`		`-from ray.llm._internal.serve.configs.server_models import GPUType`
	`10`	`+from ray.llm._internal.serve.core.configs.llm_config import GPUType`
`11`	`11`
`12`	`12`	`# All practical GPUs`
`13`	`13`	`ALL_GPU_TYPES = [`
Original file line number	Diff line number	Diff line change
`@@ -15,7 +15,7 @@`
`15`	`15`	`from ray.llm._internal.serve.config_generator.utils.models import (`
`16`	`16`	`TextCompletionModelConfig,`
`17`	`17`	`)`
`18`		`-from ray.llm._internal.serve.configs.server_models import LLMConfig`
	`18`	`+from ray.llm._internal.serve.core.configs.llm_config import LLMConfig`
`19`	`19`
`20`	`20`
`21`	`21`	`def get_model_default_config(model_id: str) -> Dict[str, Any]:`
Original file line number	Diff line number	Diff line change
`@@ -28,12 +28,12 @@`
`28`	`28`	`)`
`29`	`29`	`from ray.llm._internal.common.utils.download_utils import NodeModelDownloadable`
`30`	`30`	`from ray.llm._internal.common.utils.import_utils import load_class, try_import`
`31`		`-from ray.llm._internal.serve.configs.constants import (`
	`31`	`+from ray.llm._internal.serve.constants import (`
`32`	`32`	`DEFAULT_MULTIPLEX_DOWNLOAD_TIMEOUT_S,`
`33`	`33`	`DEFAULT_MULTIPLEX_DOWNLOAD_TRIES,`
`34`	`34`	`MODEL_RESPONSE_BATCH_TIMEOUT_MS,`
`35`	`35`	`)`
`36`		`-from ray.llm._internal.serve.deployments.llm.vllm.kv_transfer_backends import (`
	`36`	`+from ray.llm._internal.serve.engines.vllm.kv_transfer import (`
`37`	`37`	`SUPPORTED_BACKENDS as SUPPORTED_KV_CONNECTOR_BACKENDS,`
`38`	`38`	`)`
`39`	`39`	`from ray.llm._internal.serve.observability.logging import get_logger`
`@@ -455,7 +455,7 @@ def get_engine_config(self) -> EngineConfigType:`
`455`	`455`	`return self._engine_config`
`456`	`456`
`457`	`457`	`if self.llm_engine == LLMEngine.vLLM:`
`458`		`- from ray.llm._internal.serve.deployments.llm.vllm.vllm_models import (`
	`458`	`+ from ray.llm._internal.serve.engines.vllm.vllm_models import (`
`459`	`459`	`VLLMEngineConfig,`
`460`	`460`	`)`
`461`	`461`