elie222 · elie222 · Jul 18, 2025 · Jul 17, 2025 · Jul 17, 2025 · Jul 17, 2025
diff --git a/apps/web/env.ts b/apps/web/env.ts
@@ -2,6 +2,16 @@
 import { createEnv } from "@t3-oss/env-nextjs";
 import { z } from "zod";
 
+const llmProviderEnum = z.enum([
+  "anthropic",
+  "google",
+  "openai",
+  "bedrock",
+  "openrouter",
+  "groq",
+  "ollama",
+]);
+
 export const env = createEnv({
   server: {
     NODE_ENV: z.enum(["development", "production", "test"]),
@@ -12,36 +22,21 @@ export const env = createEnv({
     GOOGLE_CLIENT_SECRET: z.string().min(1),
     GOOGLE_ENCRYPT_SECRET: z.string(),
     GOOGLE_ENCRYPT_SALT: z.string(),
+
     DEFAULT_LLM_PROVIDER: z
-      .enum([
-        "anthropic",
-        // "bedrock",
-        "google",
-        "openai",
-        "openrouter",
-        "groq",
-        "ollama",
-        "custom",
-      ])
+      .enum([...llmProviderEnum.options, "custom"])
       .default("anthropic"),
     DEFAULT_LLM_MODEL: z.string().optional(),
-    // Economy LLM configuration (for large context windows where cost efficiency matters)
-    ECONOMY_LLM_PROVIDER: z
-      .enum([
-        "anthropic",
-        "google",
-        "openai",
-        "bedrock",
-        "openrouter",
-        "groq",
-        "ollama",
-      ])
-      .optional()
-      .default("openrouter"),
-    ECONOMY_LLM_MODEL: z
-      .string()
-      .optional()
-      .default("google/gemini-2.5-flash-preview-05-20"),
+    DEFAULT_OPENROUTER_PROVIDERS: z.string().optional(), // Comma-separated list of OpenRouter providers for default model (e.g., "Google Vertex,Anthropic")
+    // Set this to a cheaper model like Gemini Flash
+    ECONOMY_LLM_PROVIDER: llmProviderEnum.optional(),
+    ECONOMY_LLM_MODEL: z.string().optional(),
+    ECONOMY_OPENROUTER_PROVIDERS: z.string().optional(), // Comma-separated list of OpenRouter providers for economy model (e.g., "Google Vertex,Anthropic")
+    // Set this to a fast but strong model like Groq Kimi K2. Leaving blank will fallback to default which is also fine.
+    CHAT_LLM_PROVIDER: llmProviderEnum.optional(),
+    CHAT_LLM_MODEL: z.string().optional(),
+    CHAT_OPENROUTER_PROVIDERS: z.string().optional(), // Comma-separated list of OpenRouter providers for chat (e.g., "Google Vertex,Anthropic")
+
     OPENAI_API_KEY: z.string().optional(),
     ANTHROPIC_API_KEY: z.string().optional(),
     BEDROCK_ACCESS_KEY: z.string().optional(),

diff --git a/apps/web/utils/ai/assistant/chat.ts b/apps/web/utils/ai/assistant/chat.ts
@@ -432,6 +432,7 @@ Examples:
   const result = chatCompletionStream({
     userAi: user.user,
     userEmail: user.email,
+    modelType: "chat",
     usageLabel: "assistant-chat",
     system,
     messages,

diff --git a/apps/web/utils/ai/assistant/process-user-request.ts b/apps/web/utils/ai/assistant/process-user-request.ts
@@ -200,6 +200,7 @@ ${senderCategory || "No category"}
 
   const result = await chatCompletionTools({
     userAi: emailAccount.user,
+    modelType: "chat",
     messages: allMessages,
     tools: {
       update_conditional_operator: tool({

diff --git a/apps/web/utils/ai/knowledge/extract-from-email-history.ts b/apps/web/utils/ai/knowledge/extract-from-email-history.ts
@@ -103,7 +103,7 @@ export async function aiExtractFromEmailHistory({
       usageLabel: "Email history extraction",
       userAi: emailAccount.user,
       userEmail: emailAccount.email,
-      useEconomyModel: true,
+      modelType: "economy",
     });
 
     logger.trace("Output", result.object);

diff --git a/apps/web/utils/ai/knowledge/extract.ts b/apps/web/utils/ai/knowledge/extract.ts
@@ -105,7 +105,7 @@ export async function aiExtractRelevantKnowledge({
       usageLabel: "Knowledge extraction",
       userAi: emailAccount.user,
       userEmail: emailAccount.email,
-      useEconomyModel: true,
+      modelType: "economy",
     });
 
     logger.trace("Output", result.object);

diff --git a/apps/web/utils/llms/config.ts b/apps/web/utils/llms/config.ts
@@ -32,6 +32,7 @@ export const Model = {
   GEMINI_2_0_FLASH_OPENROUTER: "google/gemini-2.0-flash-001",
   GEMINI_2_5_PRO_OPENROUTER: "google/gemini-2.5-pro-preview-03-25",
   GROQ_LLAMA_3_3_70B: "llama-3.3-70b-versatile",
+  KIMI_K2_OPENROUTER: "moonshotai/kimi-k2",
   ...(supportsOllama ? { OLLAMA: env.NEXT_PUBLIC_OLLAMA_MODEL } : {}),
 };
 

diff --git a/apps/web/utils/llms/index.ts b/apps/web/utils/llms/index.ts
@@ -28,7 +28,7 @@ import {
   isServiceUnavailableError,
 } from "@/utils/error";
 import { sleep } from "@/utils/sleep";
-import { getModel } from "@/utils/llms/model";
+import { getModel, type ModelType } from "@/utils/llms/model";
 import { createScopedLogger } from "@/utils/logger";
 
 const logger = createScopedLogger("llms");
@@ -41,14 +41,14 @@ const commonOptions: {
 
 export async function chatCompletion({
   userAi,
-  useEconomyModel,
+  modelType = "default",
   prompt,
   system,
   userEmail,
   usageLabel,
 }: {
   userAi: UserAIFields;
-  useEconomyModel?: boolean;
+  modelType?: ModelType;
   prompt: string;
   system?: string;
   userEmail: string;
@@ -57,7 +57,7 @@ export async function chatCompletion({
   try {
     const { provider, model, llmModel, providerOptions } = getModel(
       userAi,
-      useEconomyModel,
+      modelType,
     );
 
     const result = await generateText({
@@ -87,7 +87,7 @@ export async function chatCompletion({
 
 type ChatCompletionObjectArgs<T> = {
   userAi: UserAIFields;
-  useEconomyModel?: boolean;
+  modelType?: ModelType;
   schema: z.Schema<T>;
   userEmail: string;
   usageLabel: string;
@@ -112,7 +112,7 @@ export async function chatCompletionObject<T>(
 
 async function chatCompletionObjectInternal<T>({
   userAi,
-  useEconomyModel,
+  modelType,
   system,
   prompt,
   messages,
@@ -123,7 +123,7 @@ async function chatCompletionObjectInternal<T>({
   try {
     const { provider, model, llmModel, providerOptions } = getModel(
       userAi,
-      useEconomyModel,
+      modelType,
     );
 
     const result = await generateObject({
@@ -155,7 +155,7 @@ async function chatCompletionObjectInternal<T>({
 
 export async function chatCompletionStream({
   userAi,
-  useEconomyModel,
+  modelType,
   system,
   prompt,
   messages,
@@ -167,7 +167,7 @@ export async function chatCompletionStream({
   onStepFinish,
 }: {
   userAi: UserAIFields;
-  useEconomyModel?: boolean;
+  modelType?: ModelType;
   system?: string;
   prompt?: string;
   messages?: Message[];
@@ -184,7 +184,7 @@ export async function chatCompletionStream({
 }) {
   const { provider, model, llmModel, providerOptions } = getModel(
     userAi,
-    useEconomyModel,
+    modelType,
   );
 
   const result = streamText({
@@ -229,7 +229,7 @@ export async function chatCompletionStream({
 
 type ChatCompletionToolsArgs = {
   userAi: UserAIFields;
-  useEconomyModel?: boolean;
+  modelType?: ModelType;
   tools: Record<string, Tool>;
   maxSteps?: number;
   label: string;
@@ -253,7 +253,7 @@ export async function chatCompletionTools(options: ChatCompletionToolsArgs) {
 
 async function chatCompletionToolsInternal({
   userAi,
-  useEconomyModel,
+  modelType,
   system,
   prompt,
   messages,
@@ -265,7 +265,7 @@ async function chatCompletionToolsInternal({
   try {
     const { provider, model, llmModel, providerOptions } = getModel(
       userAi,
-      useEconomyModel,
+      modelType,
     );
 
     const result = await generateText({
@@ -300,7 +300,7 @@ async function chatCompletionToolsInternal({
 // not in use atm
 async function streamCompletionTools({
   userAi,
-  useEconomyModel,
+  modelType,
   prompt,
   system,
   tools,
@@ -310,7 +310,7 @@ async function streamCompletionTools({
   onFinish,
 }: {
   userAi: UserAIFields;
-  useEconomyModel?: boolean;
+  modelType?: ModelType;
   prompt: string;
   system?: string;
   tools: Record<string, Tool>;
@@ -321,7 +321,7 @@ async function streamCompletionTools({
 }) {
   const { provider, model, llmModel, providerOptions } = getModel(
     userAi,
-    useEconomyModel,
+    modelType,
   );
 
   const result = await streamText({