Respan Gateway
Respan Gateway: Die ultimative AI-Gateway-Lösung für produktives LLM-Routing und Failover
Respan Gateway bietet eine hochverfügbare Infrastruktur für das Routing von über 500 KI-Modellen. Mit Funktionen wie intelligentem Failover, Response-Caching, präzisen Spend-Limits und umfassender Observability optimiert Respan Gateway die Zuverlässigkeit und Kosteneffizienz Ihrer LLM-Anwendungen. Die Plattform ist ISO 27001, SOC 2 und DSGVO-konform und lässt sich nahtlos in bestehende Workflows integrieren.
2026-06-13
--K
Respan Gateway Produktinformationen
Respan Gateway: Die Komplettlösung für Enterprise LLM Routing und AI-Infrastruktur
In der dynamischen Welt der künstlichen Intelligenz ist die Stabilität und Effizienz von Large Language Model (LLM) Aufrufen entscheidend für den Produkterfolg. Das Respan Gateway fungiert als zentrale Schnittstelle und intelligenter Router für über 500 verschiedene KI-Modelle. Ob Sie nun ein Unified Routing bevorzugen oder einen Provider-Passthrough nutzen möchten – das Respan Gateway bietet die notwendige Infrastruktur, um Ausfallzeiten zu minimieren, Kosten zu kontrollieren und jeden Request lückenlos zu überwachen.
Was ist Respan Gateway?
Respan Gateway ist ein produktionsreifes KI-Gateway, das als einzelner Endpunkt für den Zugriff auf eine Vielzahl von LLMs dient. Es ermöglicht Entwicklern, OpenAI-ähnliche Aufrufe an über 500 Modelle zu senden oder die nativen SDKs der jeweiligen Provider (wie Anthropic oder Gemini) über einen Passthrough-Endpunkt beizubehalten. Dabei wird jeder Request protokolliert und mit Metadaten angereichert.
Das Respan Gateway löst die typischen Probleme beim direkten Aufruf von Provider-APIs, wie etwa unvorhersehbare Rate-Limits, Modell-Ausfälle oder mangelnde Transparenz bei den Kosten. Durch die Implementierung des Respan Gateways schaffen Unternehmen eine robuste Abstraktionsschicht zwischen ihrer Anwendung und den KI-Modellanbietern.
Herausragende Features von Respan Gateway
Das Respan Gateway wurde entwickelt, um die Lücken zu schließen, die entstehen, wenn Teams Provider direkt ansprechen. Hier sind die Kernfunktionen im Überblick:
1. Intelligentes Modell-Failover und Redundanz
Einer der größten Vorteile des Respan Gateway ist die Fähigkeit, die Betriebszeit aufrechtzuerhalten, selbst wenn primäre Modelle ausfallen oder in Rate-Limits laufen. Sie können eine Liste von fallback_models definieren. Sollte das Hauptmodell (z. B. GPT-5.4) einen Fehler zurückgeben, versucht das Gateway automatisch das nächste Modell in Ihrer Fallback-Liste (z. B. Claude Sonnet 4).
2. Präzise Kostenkontrolle und Spend Limits
Mit dem Respan Gateway behalten Sie die volle Kontrolle über Ihre Ausgaben. Sie können pro API-Key Warnschwellen (Soft Warn) oder harte Obergrenzen (Hard Cap) festlegen. Bei Erreichen dieser Schwellen versendet das System Benachrichtigungen via Slack oder E-Mail, um böse Überraschungen bei der Abrechnung zu vermeiden.
3. Effizientes Response Caching
Um Latenzen zu verringern und Kosten zu sparen, bietet das Respan Gateway ein integriertes Caching für wiederkehrende Prompts.
- cache_by_customer: Stellt sicher, dass Antworten nicht fälschlicherweise zwischen verschiedenen Kunden geteilt werden.
- cache_ttl: Ermöglicht die Festlegung der Gültigkeitsdauer von Cache-Einträgen.
4. Unified Logging und Observability
Jeder Call über das Respan Gateway wird automatisch in einem Trace-Tree erfasst. Dies beinhaltet Latenzzeiten für jeden einzelnen Span. Durch das Hinzufügen von Parametern wie customer_identifier und benutzerdefinierten Metadaten können Logs und Traces effizient nach Features, Mandanten oder Threads gefiltert werden.
5. Enterprise-Sicherheit und Compliance
Respan verpflichtet sich zur Einhaltung höchster internationaler Sicherheitsstandards:
- ISO 27001: International anerkannter Standard für Informationssicherheitsmanagement.
- SOC 2: Gewährleistet ein sicheres Datenmanagement.
- GDPR / DSGVO: Volle Konformität mit den strengen europäischen Datenschutzrichtlinien.
- HIPAA: Unterstützung für Organisationen im Gesundheitswesen durch verfügbare Business Associate Agreements (BAA).
Anwendungsbereiche (Use Cases)
Das Respan Gateway ist für verschiedene Szenarien in der KI-Entwicklung optimiert:
- KI-Agenten in Produktion: Für Agenten, die eine hohe Zuverlässigkeit benötigen, bietet das Gateway die nötige Stabilität durch Retries und Fallbacks.
- Multi-Provider-Strategien: Unternehmen, die nicht von einem einzelnen Anbieter abhängig sein wollen (Vendor Lock-in vermeiden), nutzen Respan als einheitliche Schnittstelle.
- Skalierbare SaaS-Anwendungen: Durch die Nutzung von
customer_identifierkönnen SaaS-Anbieter den KI-Verbrauch exakt pro Endnutzer tracken und limitieren. - Entwicklungs- und Staging-Umgebungen: Separate API-Keys pro Umgebung mit individuellen Limits verhindern, dass Test-Workloads das Produktionsbudget aufzehren.
Wie man das Respan Gateway verwendet
Die Integration des Respan Gateway in Ihren bestehenden Code ist unkompliziert. Sie müssen lediglich den Base-URL Ihres Clients anpassen und Ihre Provider-Keys im Respan-Dashboard hinterlegen.
Schritte zur Einrichtung:
- Respan API-Key erhalten: Registrieren Sie sich und erstellen Sie Ihren ersten Key auf der API-Keys-Seite.
- Provider-Credentials hinzufügen: Verbinden Sie Ihre Anbieter (OpenAI, Anthropic, Groq etc.) unter "Integrations".
- Router oder Passthrough wählen: Nutzen Sie die OpenAI-kompatible URL oder native Provider-URLs.
- Parameter senden: Übergeben Sie zusätzliche Informationen im
extra_body, um Features wie Caching oder Fallbacks zu aktivieren.
Code-Beispiel (Python)
Hier ist ein Beispiel, wie Sie das Respan Gateway mit der OpenAI-Library ansprechen:
from openai import OpenAI
client = OpenAI(
base_url="https://api.respan.ai/api/",
api_key="IHR_RESPAN_API_KEY",
)
response = client.chat.completions.create(
model="gpt-5.4",
messages=[{"role": "user", "content": "Hallo Respan!"}],
extra_body={
"customer_identifier": "user_123",
"metadata": {"feature": "chatbot", "environment": "production"},
"fallback_models": ["claude-sonnet-4-20250514", "gemini-2.5-flash"],
"cache_enabled": True,
"cache_ttl": 600,
"cache_options": {"cache_by_customer": True},
},
)
print(response.choices[0].message.content)
Häufig gestellte Fragen (FAQ)
Was passiert bei kaskadierenden Retries?
Das Gateway verfügt über retry_params, die Upstream-Retries verwalten. Es wird empfohlen, die Retries in Ihrer eigenen Anwendung zu begrenzen, damit sich die Versuche nicht über mehrere Ebenen hinweg stapeln.
Wie vermeide ich veraltete Antworten im Cache?
Nutzen Sie eine angemessene cache_ttl und aktivieren Sie is_cached_by_model in den cache_options, wenn Sie zwischen Modellen wechseln. So wird verhindert, dass eine Antwort eines Modells fälschlicherweise für ein anderes Modell zurückgegeben wird.
Was ist der Unterschied zwischen disable_log und omit_log?
disable_log: Es werden nur Metriken aufgezeichnet, keine Request/Response-Inhalte (Payloads).omit_log: Verhindert die Erstellung eines neuen Logs bei einem Cache-Treffer. Diese Optionen sind nützlich, wenn Sie Kosten und Latenz optimieren wollen, ohne große Datenmengen zu speichern.
Mit welchen Frameworks ist Respan kompatibel? Das Respan Gateway arbeitet nahtlos mit Ihrem gesamten Stack zusammen, einschließlich Vercel AI SDK, LangChain, LlamaIndex, Mastra und nativen SDKs von OpenAI, Google GenAI und Anthropic.
Hinweis: Respan Gateway ist für AI-Agenten gebaut, um weniger Systembrüche zu erleben und schneller zu deployen. Starten Sie noch heute kostenlos und verbessern Sie Ihre KI-Infrastruktur.








