🚀 Multiplexing MCP Servers For Agentic Specialization


Tanggal artikel: 20 Desember 2025

📝 Deskripsi Ringkas
Artikel ini membahas tantangan teknis dalam menyediakan alat yang tepat bagi Agen AI yang semakin terspesialisasi (seperti Agen SRE atau DevOps). Michael Levan mendemonstrasikan cara melakukan multiplexing (penggabungan jalur) beberapa Model Context Protocol (MCP) Servers melalui satu gateway berbasis Kubernetes, memungkinkan agen mengakses berbagai alat sekaligus secara aman dan efisien tanpa koneksi satu-per-satu yang rumit.

1. ⚠️ Problem Statement
Generalisasi LLM: LLM dilatih pada data umum; untuk tugas spesifik (misal: SRE), mereka membutuhkan akses ke alat khusus yang terisolasi di berbagai MCP Server berbeda.

Fragmentasi Alat: Ada ribuan MCP Server. Menghubungkan agen ke setiap server secara individual sangat tidak efisien dan rumit.

Risiko Eksekusi Lokal: Menjalankan MCP Server secara lokal (metode standar saat ini) sulit dikelola dalam tim dan minim fitur keamanan/audit dibandingkan menjalankannya sebagai layanan terpusat.

2. 🛠️ Solusi / Approach
Penulis mengajukan arsitektur berbasis gateway menggunakan kgateway/agentgateway:

Multiplexing: Mengonfigurasi satu backend di gateway yang merutekan permintaan ke beberapa MCP Server target sekaligus.

Protokol Streamable HTTP: Beralih dari koneksi lokal (stdio) ke protokol HTTP yang memungkinkan MCP Server dijalankan sebagai layanan jarak jauh (remote services) di Kubernetes.

Sentralisasi Akses: Menggunakan AI Gateway untuk mengelola autentikasi dan pemilihan alat, sehingga agen hanya perlu terhubung ke satu titik akhir (endpoint).

3. 📊 Findings / Results / Impact
Akses Terpadu: Dengan konfigurasi ini, agen dapat mengakses alat dari "Math Server" dan "Date Server" secara bersamaan melalui satu koneksi.

Keamanan Enterprise: Memindahkan MCP ke server memungkinkan penerapan autentikasi stateless (seperti JWT) dan mekanisme On Behalf Of (OBO), yang sulit dilakukan jika server berjalan di laptop pengembang.

Efisiensi Operasional: Tim tidak perlu mengonfigurasi rute atau gateway terpisah untuk setiap alat baru; cukup tambahkan ke daftar target backend.

4. ⚙️ How to Implement (General Pattern)
Langkah-langkah implementasi teknis di Kubernetes:

Deploy MCP Servers: Buat Deployment dan Service untuk setiap MCP Server (contoh: Math dan Date) menggunakan Python dan Streamable HTTP.

Konfigurasi Gateway: Deploy agentgateway di cluster.

Buat Backend Multiplex: Definisi objek Backend yang mencantumkan kedua server sebagai target:

YAML

spec:
type: MCP
mcp:
targets:
- name: math-mcp-server
static: {host: ..., protocol: StreamableHTTP}
- name: date-mcp-server
static: {host: ..., protocol: StreamableHTTP}
Verifikasi: Gunakan MCP Inspector untuk memastikan semua alat dari kedua server muncul dan dapat digunakan.

5. 💡 Key Takeaways
Spesialisasi Butuh Banyak Alat: Agen yang cerdas membutuhkan akses ke berbagai stack teknologi yang berbeda, sehingga satu MCP Server saja tidak cukup.

Remote > Local: Untuk skala perusahaan, MCP Server harus diperlakukan sebagai layanan mikro (microservices), bukan skrip lokal.

Gateway sebagai Pengendali: Multiplexing di lapisan gateway menyederhanakan interaksi agen sekaligus memperkuat postur keamanan.

🗣️ Apakah Anda saat ini menjalankan alat agen AI (seperti MCP) secara lokal di mesin dev Anda, atau sudah mulai memindahkannya ke infrastruktur cloud terpusat?

Sumber:
https://www.cloudnativedeepdive.com/multiplexing-mcp-servers-for-agentic-specialization/

🏷️ #MCPServer #AIAgents #Kubernetes #CloudNative #DevOps #AIInfrastructure #ModelContextProtocol #AgentGateway #CyberSecurity #SRE

Leave a Comment