opensearch-project · fen-qin · Nov 20, 2025 · Nov 20, 2025 · Nov 21, 2025 · Nov 22, 2025
@@ -9,6 +9,7 @@ Inspired from [Keep a Changelog](https://keepachangelog.com/en/1.0.0/)
 ### Features
 - adds version-based index mapping update support to the Search Relevance plugin [#344](https://github.com/opensearch-project/search-relevance/pull/344)
 * LLM Judgement Customized Prompt Template Implementation  [#264](https://github.com/opensearch-project/search-relevance/pull/264)
+* Support multiple LLM providers with proper rate limit [#285](https://github.com/opensearch-project/search-relevance/pull/285)
 
 ### Enhancements
 

@@ -0,0 +1,43 @@
+# Claude 3.5 Haiku OpenSearch ML Connector
+
+This directory contains the setup and validation scripts for integrating Claude 3.5 Haiku with OpenSearch ML for search relevance rating.
+
+## Prerequisites
+
+- OpenSearch running on `http://localhost:9200`
+- AWS credentials configured (`aws configure`)
+- `jq` installed for JSON parsing
+
+## Quick Start
+
+```bash
+chmod +x connector_validate.sh
+./connector_validate.sh
+```
+
+## Configuration
+
+### Model Details
+- **Model**: `us.anthropic.claude-3-5-haiku-20241022-v1:0` (inference profile)
+- **Region**: `us-east-1`
+- **Max Tokens**: 4000
+- **Protocol**: AWS SigV4
+
+### Message Format
+```json
+{
+  "parameters": {
+    "messages": [
+      {
+        "role": "user",
+        "content": [
+          {
+            "type": "text",
+            "text": "Your prompt here"
+          }
+        ]
+      }
+    ]
+  }
+}
+```
@@ -0,0 +1,102 @@
+#!/bin/bash
+
+# Claude 3.5 Haiku Connector Validation Script
+set -e
+
+OPENSEARCH_URL="http://localhost:9200"
+CONNECTOR_NAME="claude-3-5-haiku-working"
+MODEL_NAME="claude-3-5-haiku-working-model"
+
+# Get AWS credentials
+export AWS_ACCESS_KEY_ID=$(aws configure get aws_access_key_id)
+export AWS_SECRET_ACCESS_KEY=$(aws configure get aws_secret_access_key)
+export AWS_SESSION_TOKEN=$(aws configure get aws_session_token)
+
+echo "Creating Claude 3.5 Haiku connector..."
+
+# Create connector
+CONNECTOR_RESPONSE=$(curl -s -X POST "${OPENSEARCH_URL}/_plugins/_ml/connectors/_create" \
+-H "Content-Type: application/json" \
+-d '{
+  "name": "'${CONNECTOR_NAME}'",
+  "description": "Claude 3.5 Haiku connector for search relevance rating",
+  "version": 1,
+  "protocol": "aws_sigv4",
+  "credential": {
+    "access_key": "'$AWS_ACCESS_KEY_ID'",
+    "secret_key": "'$AWS_SECRET_ACCESS_KEY'",
+    "session_token": "'$AWS_SESSION_TOKEN'"
+  },
+  "parameters": {
+    "region": "us-east-1",
+    "service_name": "bedrock",
+    "model": "us.anthropic.claude-3-5-haiku-20241022-v1:0"
+  },
+  "client_config": {
+    "max_connection": 2,
+    "connection_timeout": 60000,
+    "read_timeout": 60000,
+    "retry_backoff_millis": 3000,
+    "retry_timeout_seconds": 60,
+    "max_retry_times": 2
+  },
+  "actions": [
+    {
+      "action_type": "predict",
+      "method": "POST",
+      "headers": {
+        "content-type": "application/json"
+      },
+      "url": "https://bedrock-runtime.${parameters.region}.amazonaws.com/model/${parameters.model}/invoke",
+      "request_body": "{\"anthropic_version\": \"bedrock-2023-05-31\", \"max_tokens\": 2000, \"messages\": ${parameters.messages}}"
+    }
+  ]
+}')
+
+CONNECTOR_ID=$(echo $CONNECTOR_RESPONSE | jq -r '.connector_id')
+echo "Connector created with ID: $CONNECTOR_ID"
+
+# Register model
+echo "Registering model..."
+MODEL_RESPONSE=$(curl -s -X POST "${OPENSEARCH_URL}/_plugins/_ml/models/_register" \
+-H "Content-Type: application/json" \
+-d '{
+  "name": "'${MODEL_NAME}'",
+  "function_name": "remote",
+  "description": "Claude 3.5 Haiku model for search relevance rating",
+  "connector_id": "'$CONNECTOR_ID'"
+}')
+
+MODEL_ID=$(echo $MODEL_RESPONSE | jq -r '.model_id')
+echo "Model registered with ID: $MODEL_ID"
+
+# Deploy model
+echo "Deploying model..."
+curl -s -X POST "${OPENSEARCH_URL}/_plugins/_ml/models/${MODEL_ID}/_deploy" > /dev/null
+echo "Model deployed successfully"
+
+# Test prediction
+echo "Testing prediction..."
+TEST_RESPONSE=$(curl -s -X POST "${OPENSEARCH_URL}/_plugins/_ml/models/${MODEL_ID}/_predict" \
+-H "Content-Type: application/json" \
+-d '{
+  "parameters": {
+    "messages": [
+      {
+        "role": "user",
+        "content": [
+          {
+            "type": "text",
+            "text": "Rate search relevance 0.0-1.0. Return JSON only: [{\"id\":\"001\",\"rating_score\":0.9}]. Rate ALL hits.\n\nSearchText - banana; Reference - banana smoothie; Hits - [{\"_index\": \"sample_index03\", \"_source\": {\"name\": \"banana\", \"price\": 1.99, \"description\": \"this is a banana\"}, \"_id\": \"003\"}, {\"_index\": \"sample_index03\", \"_source\": {\"name\": \"apple\", \"price\": 0.99, \"description\": \"fresh apple\"}, \"_id\": \"004\"}, {\"_index\": \"sample_index03\", \"_source\": {\"name\": \"banana smoothie\", \"price\": 3.99, \"description\": \"fresh banana smoothie\"}, \"_id\": \"005\"}]"
+          }
+        ]
+      }
+    ]
+  }
+}')
+
+echo "Test completed successfully!"
+echo "Response: $(echo $TEST_RESPONSE | jq -r '.inference_results[0].output[0].dataAsMap.content[0].text')"
+echo ""
+echo "Connector ID: $CONNECTOR_ID"
+echo "Model ID: $MODEL_ID"
@@ -0,0 +1,68 @@
+# Cohere Command R OpenSearch ML Connector
+
+This directory contains the setup and validation scripts for integrating Cohere Command R with OpenSearch ML via AWS Bedrock.
+
+## Prerequisites
+
+- OpenSearch running on `http://localhost:9200`
+- AWS credentials configured (`aws configure`)
+- `jq` installed for JSON parsing
+
+## Quick Start
+
+```bash
+chmod +x connector_validate.sh
+./connector_validate.sh
+```
+
+## Configuration
+
+### Model Details
+- **Model**: `cohere.command-r-v1:0` (via Bedrock)
+- **Region**: `us-east-1`
+- **Max Tokens**: 1000
+- **Protocol**: AWS SigV4
+- **Streaming**: Supported
+
+### Message Format
+```json
+{
+  "parameters": {
+    "message": "Your message here"
+  }
+}
+```
+
+## Available Cohere Models
+
+### Chat Models (via Bedrock)
+- `cohere.command-r-v1:0` - Command R
+- `cohere.command-r-plus-v1:0` - Command R+ (more capable)
+
+### Embedding Models
+- `cohere.embed-v4:0` - Embed v4 (multimodal)
+- `cohere.embed-english-v3` - English embeddings
+- `cohere.embed-multilingual-v3` - Multilingual embeddings
+
+### Rerank Model
+- `cohere.rerank-v3-5:0` - Rerank 3.5
+
+## Response Format
+
+```json
+{
+  "inference_results": [{
+    "output": [{
+      "name": "response",
+      "dataAsMap": {
+        "response_id": "...",
+        "text": "Model response here",
+        "generation_id": "...",
+        "chat_history": [...],
+        "finish_reason": "COMPLETE"
+      }
+    }],
+    "status_code": 200
+  }]
+}
+```
@@ -0,0 +1,105 @@
+#!/bin/bash
+
+# Cohere Command R Connector Validation Script
+set -e
+
+OPENSEARCH_URL="http://localhost:9200"
+CONNECTOR_NAME="cohere-command-r-bedrock"
+MODEL_NAME="cohere-command-r-bedrock-model"
+
+# Get AWS credentials
+export AWS_ACCESS_KEY_ID=$(aws configure get aws_access_key_id)
+export AWS_SECRET_ACCESS_KEY=$(aws configure get aws_secret_access_key)
+export AWS_SESSION_TOKEN=$(aws configure get aws_session_token)
+
+echo "Creating Cohere Command R connector via Bedrock..."
+
+# Create connector
+CONNECTOR_RESPONSE=$(curl -s -X POST "${OPENSEARCH_URL}/_plugins/_ml/connectors/_create" \
+-H "Content-Type: application/json" \
+-d '{
+  "name": "'${CONNECTOR_NAME}'",
+  "description": "Cohere Command R via Bedrock for chat",
+  "version": 1,
+  "protocol": "aws_sigv4",
+  "credential": {
+    "access_key": "'$AWS_ACCESS_KEY_ID'",
+    "secret_key": "'$AWS_SECRET_ACCESS_KEY'",
+    "session_token": "'$AWS_SESSION_TOKEN'"
+  },
+  "parameters": {
+    "region": "us-east-1",
+    "service_name": "bedrock",
+    "model": "cohere.command-r-v1:0"
+  },
+  "client_config": {
+    "max_connection": 2,
+    "connection_timeout": 60000,
+    "read_timeout": 60000,
+    "retry_backoff_millis": 3000,
+    "retry_timeout_seconds": 60,
+    "max_retry_times": 2
+  },
+  "actions": [
+    {
+      "action_type": "predict",
+      "method": "POST",
+      "headers": {
+        "content-type": "application/json"
+      },
+      "url": "https://bedrock-runtime.${parameters.region}.amazonaws.com/model/${parameters.model}/invoke",
+      "request_body": "{\"message\": \"${parameters.message}\", \"max_tokens\": 1000}"
+    }
+  ]
+}')
+
+CONNECTOR_ID=$(echo $CONNECTOR_RESPONSE | jq -r '.connector_id')
+echo "Connector created with ID: $CONNECTOR_ID"
+
+# Register model
+echo "Registering model..."
+MODEL_RESPONSE=$(curl -s -X POST "${OPENSEARCH_URL}/_plugins/_ml/models/_register" \
+-H "Content-Type: application/json" \
+-d '{
+  "name": "'${MODEL_NAME}'",
+  "function_name": "remote",
+  "description": "Cohere Command R model via Bedrock",
+  "connector_id": "'$CONNECTOR_ID'"
+}')
+
+MODEL_ID=$(echo $MODEL_RESPONSE | jq -r '.model_id')
+echo "Model registered with ID: $MODEL_ID"
+
+# Deploy model
+echo "Deploying model..."
+curl -s -X POST "${OPENSEARCH_URL}/_plugins/_ml/models/${MODEL_ID}/_deploy" > /dev/null
+echo "Model deployed successfully"
+
+# Test basic chat
+echo "Testing basic chat..."
+CHAT_RESPONSE=$(curl -s -X POST "${OPENSEARCH_URL}/_plugins/_ml/models/${MODEL_ID}/_predict" \
+-H "Content-Type: application/json" \
+-d '{
+  "parameters": {
+    "message": "Hello, respond with just the word success"
+  }
+}')
+
+echo "Basic chat test completed!"
+echo "Response: $(echo $CHAT_RESPONSE | jq -r '.inference_results[0].output[0].dataAsMap.text')"
+
+# Test search relevance rating
+echo "Testing search relevance rating..."
+RATING_RESPONSE=$(curl -s -X POST "${OPENSEARCH_URL}/_plugins/_ml/models/${MODEL_ID}/_predict" \
+-H "Content-Type: application/json" \
+-d '{
+  "parameters": {
+    "message": "Rate search relevance 0.0-1.0. Return JSON only: [{\"id\":\"001\",\"rating_score\":0.9}]. Rate ALL hits.\n\nSearchText - banana; Reference - banana smoothie; Hits - [{\"_index\": \"sample_index03\", \"_source\": {\"name\": \"banana\", \"price\": 1.99, \"description\": \"this is a banana\"}, \"_id\": \"003\"}, {\"_index\": \"sample_index03\", \"_source\": {\"name\": \"apple\", \"price\": 0.99, \"description\": \"fresh apple\"}, \"_id\": \"004\"}, {\"_index\": \"sample_index03\", \"_source\": {\"name\": \"banana smoothie\", \"price\": 3.99, \"description\": \"fresh banana smoothie\"}, \"_id\": \"005\"}]"
+  }
+}')
+
+echo "Search relevance rating test completed!"
+echo "Response: $(echo $RATING_RESPONSE | jq -r '.inference_results[0].output[0].dataAsMap.text')"
+echo ""
+echo "Connector ID: $CONNECTOR_ID"
+echo "Model ID: $MODEL_ID"