BTP AI Hub – verwalteter Modell-Zugriff

Worum es geht

Vor zwei Jahren hiess GenAI im SAP-Kontext: einen Provider auswählen, eine Library einbinden, Token-Kosten manuell tracken, beim Modellwechsel Code anfassen. Mit dem BTP AI Hub ist das vorbei – SAP stellt eine einheitliche Schicht bereit, die mehrere Provider transparent zugänglich macht und den Lebenszyklus operationalisiert.

Was der AI Hub liefert

Modell-Katalog

Stand 2026 verfügbar (Auswahl):

Provider	Modelle	Stärken
Anthropic	Claude Sonnet 4.5, Claude Opus 4.7	Lange Kontexte, Reasoning
OpenAI	GPT-5.4, GPT-5.4 Mini, GPT-5	Tool-Use, multimodal
Mistral	Mistral Large, Mixtral, Codestral	Code, EU-Hosting
Meta	Llama 4 (70B, 405B)	Selbst-hostbar, offen
Google	Gemini 2.5 Pro	Long-Context, Vision
SAP	SAP-eigenes Joule-Modell	SAP-Daten-affin

Operations-Layer

Routing-Regeln: Sensitive Daten → EU- oder Schweizer Region; einfache Klassifikation → günstiges Modell; Reasoning-Tasks → Premium-Modell
Quotas pro Use-Case und Mandant: keine Kosten-Explosion durch Endlos-Schleifen
Cost-Tracking: Token-Verbrauch nach Use-Case, App, User kategorisiert; CSV-Export für FinOps
Audit-Trail: jeder Call mit Eingabe, Ausgabe, Modell, Latency und Kosten

Architektur – wie sich AI Hub einfügt

mermaid flowchart TD A[Fiori App<br/>oder Side-by-Side] H[BTP AI Hub] R[Routing + Guardrails] Q[Quotas + Cost-Tracking] Au[Audit-Logging] P1[Anthropic] P2[OpenAI] P3[Mistral] P4[Llama] P5[SAP-eigen] V[HANA Cloud Vector Engine] S[S/4HANA APIs] A -->|Joule SDK / HTTP| H H --> R H --> Q H --> Au R --> P1 R --> P2 R --> P3 R --> P4 R --> P5 P1 -.->|RAG-Kontext| V P2 -.->|RAG-Kontext| V P3 -.->|RAG-Kontext| V V --> S click A call mmdInfo() "Die Endanwendung – eine Fiori-App, ein Joule-Skill oder eine Side-by-Side-Eigenentwicklung auf der BTP. Sie ruft den AI Hub via Joule SDK oder direktem HTTP auf. Der Aufrufer kennt nur den Hub, nie das konkrete Modell – Provider-Wechsel ohne Anwendungs-Refactoring." click H call mmdInfo() "Der BTP AI Hub ist die zentrale Schaltstelle für alle GenAI-Aufrufe in der SAP-Welt. Er abstrahiert Foundation-Models, regelt Zugriffe, dokumentiert jeden Call und verteilt Last und Kosten transparent. Aus Sicht der Anwendung ist es eine API – aus Sicht der Plattform ist es ein Compliance-Anker." click R call mmdInfo() "Routing und Guardrails entscheiden, welches Modell für welchen Use Case läuft, mit welchem System-Prompt und welchen Sicherheits-Filtern. Prompt Injection wird hier abgefangen, nicht im Provider. Modelle können pro Mandant oder pro App-Kontext gewechselt werden, ohne den Aufrufer zu ändern." click Q call mmdInfo() "Quotas und Cost-Tracking laufen pro App, pro Modell und pro User. Sie sehen sofort, wer wie viele Tokens verbraucht, mit welchen Kosten. Limits werden vor dem Provider-Call durchgesetzt – ein einzelner Anwendungsfehler kann das Budget nicht sprengen." click Au call mmdInfo() "Jeder Call wird mit Eingabe, Ausgabe, genutztem Modell und Latenz im Audit-Log persistiert. Bei Compliance-Anfragen – FINMA, nDSG, interne Revisionen – können Sie jeden GenAI-Vorgang nachvollziehen. Halluzinationen werden retroaktiv analysierbar." click P1 call mmdInfo() "Anthropic Claude – stark bei langen Kontexten, präzisem Code-Verständnis und sicherheitsbewusstem Antwortverhalten. Wird typischerweise für Wissensbots, Code-Generierung und sensitive Compliance-Themen routet." click P2 call mmdInfo() "OpenAI GPT-Familie – hohe Geschwindigkeit, breites Allgemein-Wissen, ausgereiftes Function-Calling. Häufig für Klassifikations-Tasks und Hochvolumen-Workloads gewählt. Auch im AI Hub mit Schweizer Datenresidenz verfügbar." click P3 call mmdInfo() "Mistral – europäisches Open-Source-Foundation-Model. Wird gewählt, wenn Datenresidenz in der EU oder On-Premise-Hosting Pflicht ist, oder wenn Modell-Gewichte transparent sein müssen. Auch im AI Hub als gemanagter Service verfügbar." click P4 call mmdInfo() "Llama – Meta Open-Source – wird typischerweise für Workloads gewählt, die Modell-Anpassung oder Self-Hosting verlangen. Im AI Hub auch als Hosted-Variante mit SAP-eigener Infrastruktur erreichbar." click P5 call mmdInfo() "SAP-eigene Modelle – speziell trainiert auf SAP-Daten und SAP-Prozesse. Stark bei domänen-spezifischen Aufgaben wie Stammdaten-Klassifikation, S4HANA-Customizing-Hilfe oder ABAP-Code-Verständnis." click V call mmdInfo() "Die HANA Cloud Vector Engine speichert Embeddings Ihrer Dokumente und Daten. Im RAG-Pfad liefert sie semantische Treffer, die als Kontext in den LLM-Call gehen. Schweizer Region wählbar – Daten verlassen die SAP-Cloud nicht." click S call mmdInfo() "S4HANA-APIs liefern Live-Daten für RAG-Anwendungen – Bestände, Aufträge, Kunden, Stammdaten. CDS-Views werden konsumiert, OData-APIs werden via BTP-Destination zugegriffen. Wissens-Antworten basieren auf aktuellen Daten, nicht auf Embedding-Snapshots."

Was wir liefern

Provider-Auswahl – entlang Datenschutz-Anforderungen, Use-Case-Anspruch und Budget
Routing-Setup – Welche Daten gehen wohin, mit welcher Eskalation
Erste 2 Skills – Reference-Implementation mit Cost-Tracking
Übergabe an Ihr Team mit Dokumentation und Run-Book

Was wir nicht versprechen

Halluzinations-Eliminierung (das geht nur mit RAG + Guardrails; auch dann mit Restrisiko)
Kostenstabilität ohne Quotas (Token-Preise sind volatil; ohne Quotas droht Überraschung)
Provider-Loyalität – Modelle werden wir entlang Ihrem Bedarf wechseln

Stand: 2026-05-10

SFOUR Consulting — Übersicht · Kontakt