BTP AI Hub – verwalteter Modell-Zugriff
Worum es geht
Vor zwei Jahren hiess GenAI im SAP-Kontext: einen Provider auswählen, eine Library einbinden, Token-Kosten manuell tracken, beim Modellwechsel Code anfassen. Mit dem BTP AI Hub ist das vorbei – SAP stellt eine einheitliche Schicht bereit, die mehrere Provider transparent zugänglich macht und den Lebenszyklus operationalisiert.
Was der AI Hub liefert
Modell-Katalog
Stand 2026 verfügbar (Auswahl):
| Provider | Modelle | Stärken |
|---|---|---|
| Anthropic | Claude Sonnet 4.5, Claude Opus 4.7 | Lange Kontexte, Reasoning |
| OpenAI | GPT-5.4, GPT-5.4 Mini, GPT-5 | Tool-Use, multimodal |
| Mistral | Mistral Large, Mixtral, Codestral | Code, EU-Hosting |
| Meta | Llama 4 (70B, 405B) | Selbst-hostbar, offen |
| Gemini 2.5 Pro | Long-Context, Vision | |
| SAP | SAP-eigenes Joule-Modell | SAP-Daten-affin |
Operations-Layer
- Routing-Regeln: Sensitive Daten → EU- oder Schweizer Region; einfache Klassifikation → günstiges Modell; Reasoning-Tasks → Premium-Modell
- Quotas pro Use-Case und Mandant: keine Kosten-Explosion durch Endlos-Schleifen
- Cost-Tracking: Token-Verbrauch nach Use-Case, App, User kategorisiert; CSV-Export für FinOps
- Audit-Trail: jeder Call mit Eingabe, Ausgabe, Modell, Latency und Kosten
Architektur – wie sich AI Hub einfügt
mermaid
flowchart TD
A[Fiori App<br/>oder Side-by-Side]
H[BTP AI Hub]
R[Routing + Guardrails]
Q[Quotas + Cost-Tracking]
Au[Audit-Logging]
P1[Anthropic]
P2[OpenAI]
P3[Mistral]
P4[Llama]
P5[SAP-eigen]
V[HANA Cloud Vector Engine]
S[S/4HANA APIs]
A -->|Joule SDK / HTTP| H
H --> R
H --> Q
H --> Au
R --> P1
R --> P2
R --> P3
R --> P4
R --> P5
P1 -.->|RAG-Kontext| V
P2 -.->|RAG-Kontext| V
P3 -.->|RAG-Kontext| V
V --> S
click A call mmdInfo() "Die Endanwendung – eine Fiori-App, ein Joule-Skill oder eine Side-by-Side-Eigenentwicklung auf der BTP. Sie ruft den AI Hub via Joule SDK oder direktem HTTP auf. Der Aufrufer kennt nur den Hub, nie das konkrete Modell – Provider-Wechsel ohne Anwendungs-Refactoring."
click H call mmdInfo() "Der BTP AI Hub ist die zentrale Schaltstelle für alle GenAI-Aufrufe in der SAP-Welt. Er abstrahiert Foundation-Models, regelt Zugriffe, dokumentiert jeden Call und verteilt Last und Kosten transparent. Aus Sicht der Anwendung ist es eine API – aus Sicht der Plattform ist es ein Compliance-Anker."
click R call mmdInfo() "Routing und Guardrails entscheiden, welches Modell für welchen Use Case läuft, mit welchem System-Prompt und welchen Sicherheits-Filtern. Prompt Injection wird hier abgefangen, nicht im Provider. Modelle können pro Mandant oder pro App-Kontext gewechselt werden, ohne den Aufrufer zu ändern."
click Q call mmdInfo() "Quotas und Cost-Tracking laufen pro App, pro Modell und pro User. Sie sehen sofort, wer wie viele Tokens verbraucht, mit welchen Kosten. Limits werden vor dem Provider-Call durchgesetzt – ein einzelner Anwendungsfehler kann das Budget nicht sprengen."
click Au call mmdInfo() "Jeder Call wird mit Eingabe, Ausgabe, genutztem Modell und Latenz im Audit-Log persistiert. Bei Compliance-Anfragen – FINMA, nDSG, interne Revisionen – können Sie jeden GenAI-Vorgang nachvollziehen. Halluzinationen werden retroaktiv analysierbar."
click P1 call mmdInfo() "Anthropic Claude – stark bei langen Kontexten, präzisem Code-Verständnis und sicherheitsbewusstem Antwortverhalten. Wird typischerweise für Wissensbots, Code-Generierung und sensitive Compliance-Themen routet."
click P2 call mmdInfo() "OpenAI GPT-Familie – hohe Geschwindigkeit, breites Allgemein-Wissen, ausgereiftes Function-Calling. Häufig für Klassifikations-Tasks und Hochvolumen-Workloads gewählt. Auch im AI Hub mit Schweizer Datenresidenz verfügbar."
click P3 call mmdInfo() "Mistral – europäisches Open-Source-Foundation-Model. Wird gewählt, wenn Datenresidenz in der EU oder On-Premise-Hosting Pflicht ist, oder wenn Modell-Gewichte transparent sein müssen. Auch im AI Hub als gemanagter Service verfügbar."
click P4 call mmdInfo() "Llama – Meta Open-Source – wird typischerweise für Workloads gewählt, die Modell-Anpassung oder Self-Hosting verlangen. Im AI Hub auch als Hosted-Variante mit SAP-eigener Infrastruktur erreichbar."
click P5 call mmdInfo() "SAP-eigene Modelle – speziell trainiert auf SAP-Daten und SAP-Prozesse. Stark bei domänen-spezifischen Aufgaben wie Stammdaten-Klassifikation, S4HANA-Customizing-Hilfe oder ABAP-Code-Verständnis."
click V call mmdInfo() "Die HANA Cloud Vector Engine speichert Embeddings Ihrer Dokumente und Daten. Im RAG-Pfad liefert sie semantische Treffer, die als Kontext in den LLM-Call gehen. Schweizer Region wählbar – Daten verlassen die SAP-Cloud nicht."
click S call mmdInfo() "S4HANA-APIs liefern Live-Daten für RAG-Anwendungen – Bestände, Aufträge, Kunden, Stammdaten. CDS-Views werden konsumiert, OData-APIs werden via BTP-Destination zugegriffen. Wissens-Antworten basieren auf aktuellen Daten, nicht auf Embedding-Snapshots."
Was wir liefern
- Provider-Auswahl – entlang Datenschutz-Anforderungen, Use-Case-Anspruch und Budget
- Routing-Setup – Welche Daten gehen wohin, mit welcher Eskalation
- Erste 2 Skills – Reference-Implementation mit Cost-Tracking
- Übergabe an Ihr Team mit Dokumentation und Run-Book
Was wir nicht versprechen
- Halluzinations-Eliminierung (das geht nur mit RAG + Guardrails; auch dann mit Restrisiko)
- Kostenstabilität ohne Quotas (Token-Preise sind volatil; ohne Quotas droht Überraschung)
- Provider-Loyalität – Modelle werden wir entlang Ihrem Bedarf wechseln
Stand: 2026-05-10
