{
"version": "a2-live",
"note": "Phase A2 live catalog — prices from product.product (PAI-* records). Phase B entries (STACKIT, OTC, IONOS, OVH, Scaleway, Equinix, api-mistral, api-cohere, api-alephalpha, qdrant-cloud, weaviate-self, pgvector, vespa, haystack-rag, Compliance, Orchestration L4) are stubs without product_id — awaiting Phase B.",
"hosting": {
"api-anthropic": {
"label": "API · Anthropic (Claude)",
"descKey": "h_anthropic_desc",
"monthly": 0,
"currency": "CAD",
"tags": [
"API",
"Cloud",
"US"
],
"product_id": 153,
"product_code": "PAI-HST-API-ANT",
"detail_de": "Beste Modellqualität am Markt: Anthropic Claude und OpenAI GPT-4 setzen den Reasoning- und Code-Standard. Aber: vollständig US-rechtlich, CLOUD Act unterworfen, Daten verlassen die EU. Höchste Token-Preise im Vergleich — die Premium-Qualität hat ihren Preis.",
"decision_de": "Akzeptiert ihr US-Datenschutzlage für Premium-Modellqualität, oder ist EU-Datenresidenz unverhandelbar?"
},
"api-openai": {
"label": "API · OpenAI",
"descKey": "h_openai_desc",
"monthly": 0,
"currency": "CAD",
"tags": [
"API",
"Cloud",
"US"
],
"product_id": 154,
"product_code": "PAI-HST-API-OAI",
"detail_de": "OpenAI GPT-4o und o3 setzen den Standard bei Code-Completion, Function Calling und strukturiertem Output. US-amerikanischer Anbieter, CLOUD Act unterworfen — Daten verlassen die EU, kein Adequacy-Status. Token-Preise leicht unter Anthropic, Modellstärken ergänzen sich gut für hybride Multi-Anbieter-Setups.",
"decision_de": "Ist das US-Rechtsrisiko akzeptabel, oder soll der primäre LLM-Stack EU-souverän sein?"
},
"api-mistral": {
"label": "API · Mistral La Plateforme (FR)",
"monthly": 0,
"currency": "EUR",
"tags": [
"API",
"EU",
"Sovereign"
],
"phase": "B",
"detail_de": "Französischer Anbieter, DSGVO-konform out-of-the-box, Datenresidenz in Paris oder Frankfurt. Mistral Large erreicht GPT-4-Niveau bei Code, RAG und mehrsprachigen Aufgaben. Token-Preis rund 40 % unter US-Hyperscalern — günstigste Y1-TCO im Sovereign-Lager.",
"decision_de": "Reicht Modellqualität auf GPT-4-Niveau, oder braucht ihr absolute Spitzenleistung über alle Domänen?"
},
"api-cohere": {
"label": "API · Cohere North (CA)",
"monthly": 0,
"currency": "CAD",
"tags": [
"API",
"NATO",
"Sovereign"
],
"phase": "B",
"detail_de": "Kanadischer Anbieter, NATO-aligned, RAG-optimierte Modelle. Command R+ liegt branchenweit vorn bei Retrieval-Augmented Generation und Multi-Step-Reasoning. Datenresidenz in Toronto-Region („North“). Kanada gilt für die meisten EU-Compliance-Frameworks als adäquates Drittland (DSGVO Adequacy Decision).",
"decision_de": "Ist Kanada als „sicheres Drittland“ für eure Compliance-Linie akzeptabel?"
},
"api-alephalpha": {
"label": "API · Aleph Alpha (DE)",
"monthly": 0,
"currency": "EUR",
"tags": [
"API",
"DE",
"BSI",
"Sovereign"
],
"phase": "B",
"detail_de": "Deutscher Anbieter aus Heidelberg, Pharia-1 als gehärtetes Enterprise-Modell. BSI-zertifizierter Betrieb, IT-Grundschutz-konform. Speziell für regulierte Branchen — Finance, Healthcare, Public Sector. Premium-Pricing, aber Compliance ist eingebaut, nicht nachträglich nachgewiesen.",
"decision_de": "Müsst ihr BSI-Konformität oder C5-Testat nachweisen? Dann ist Aleph Alpha die schnellste Compliance-Story."
},
"stackit": {
"label": "STACKIT (DE · Schwarz Group)",
"monthly": 600,
"currency": "EUR",
"tags": [
"EU",
"DE",
"BSI-C5",
"KRITIS",
"Sovereign"
],
"phase": "B",
"detail_de": "STACKIT ist die Cloud-Plattform der Schwarz Gruppe (Lidl, Kaufland) — BSI C5-attestiert, KRITIS-tauglich, vollständig in deutschen Rechenzentren. Höchste Souveränitätsgarantien im Markt, geeignet für kritische Infrastruktur und regulierte Branchen. Premium-Preisniveau um ca. 600 EUR/Monat für eine vollständig managed GPU-Instanz.",
"decision_de": "Ist BSI C5 oder KRITIS-Konformität eine harte Anforderung, die den Premium-Preis rechtfertigt?"
},
"otc": {
"label": "Open Telekom Cloud (DE · T-Systems)",
"monthly": 550,
"currency": "EUR",
"tags": [
"EU",
"DE",
"G-Cloud",
"Sovereign"
],
"phase": "B",
"detail_de": "Open Telekom Cloud (T-Systems) ist die souveräne Cloud der Deutschen Telekom — G-Cloud-zertifiziert, vollständig in Deutschland, für Behörden und stark regulierte Branchen ausgelegt. DSGVO-konform out-of-the-box, Datenresidenz in Frankfurt und Biere. Preisniveau bei ca. 550 EUR/Monat für GPU-Workloads, vergleichbar mit STACKIT.",
"decision_de": "Braucht ihr G-Cloud-Zertifizierung oder öffentlichen Sektor als Referenz, oder reicht BSI C5?"
},
"ionos-cloud": {
"label": "IONOS Cloud (DE)",
"monthly": 450,
"currency": "EUR",
"tags": [
"EU",
"DE",
"Sovereign"
],
"phase": "B",
"detail_de": "IONOS Cloud ist ein deutsches Unternehmen mit EU-Hauptsitz, DSGVO-konform und zu deutlich günstigeren Preisen als die großen Sovereign-Anbieter (~ 450 EUR/Monat). Solide Datenschutzkonformität, breites EU-Rechenzentrumsangebot, aber keine BSI C5- oder G-Cloud-Zertifizierung. Gute Wahl wenn Souveränität wichtig ist, aber kein formelles Zertifikat vorgeschrieben wird.",
"decision_de": "Reicht EU-Datenschutzkonformität ohne formelles Zertifikat, oder ist BSI C5 eine Muss-Anforderung?"
},
"ovhcloud": {
"label": "OVHcloud (FR · SecNumCloud)",
"monthly": 500,
"currency": "EUR",
"tags": [
"EU",
"FR",
"SecNumCloud",
"Sovereign"
],
"phase": "B",
"detail_de": "OVHcloud ist ein französischer Anbieter mit SecNumCloud-Zertifizierung — der strengsten französischen Souveränitätsnorm, die auch EU-Behörden akzeptieren. Datenresidenz in Frankreich oder Deutschland, ~ 500 EUR/Monat für GPU-Instanzen. Geeignet für Organisationen, die Compliance mit französischem oder europäischem öffentlichem Sektor nachweisen müssen.",
"decision_de": "Ist SecNumCloud-Zertifizierung oder Frankreich als Rechtsraum eine Anforderung eurer Kunden oder Auditoren?"
},
"scaleway": {
"label": "Scaleway (FR)",
"monthly": 480,
"currency": "EUR",
"tags": [
"EU",
"FR",
"Sovereign"
],
"phase": "B",
"detail_de": "Scaleway ist ein französischer Developer-Cloud-Anbieter mit EU-souveränem Betrieb und transparentem Open-Source-Ethos. Datenresidenz in Paris, Amsterdam und Warschau, DSGVO-konform, ~ 480 EUR/Monat. Keine SecNumCloud-Zertifizierung, aber günstigeres Preisniveau und sehr entwicklerfreundliche API — ideal für iterative Deployments.",
"decision_de": "Ist die Developer-Erfahrung und schnelle Iteration wichtiger als formelle Souveränitätszertifizierung?"
},
"hetzner-gex44": {
"label": "Hetzner GEX44",
"descKey": "h_gex44_desc",
"monthly": 200,
"currency": "CAD",
"tags": [
"EU",
"DE",
"Hetzner"
],
"product_id": 155,
"product_code": "PAI-HST-HZN-GEX44",
"detail_de": "Hetzner GEX44 ist der Einstiegstier im Hetzner-GPU-Portfolio — geeignet für Entwicklung, Tests und low-volume Inference mit kleineren Modellen (7B–13B). Vollständig in Deutschland, DSGVO-konform, kein Vendor-Lock-in, ~ 200 CAD/Monat. Für Produktionslast bei größeren Modellen nicht ausreichend dimensioniert.",
"decision_de": "Ist dieser Server für Produktion oder nur für Entwicklung und Tests gedacht?"
},
"hetzner-gex130": {
"label": "Hetzner GEX130",
"descKey": "h_gex130_desc",
"monthly": 880,
"currency": "CAD",
"tags": [
"EU",
"DE",
"Hetzner"
],
"product_id": 156,
"product_code": "PAI-HST-HZN-GEX130",
"detail_de": "Hetzner GEX130 ist der produktionsreife GPU-Server im Hetzner-Portfolio — trägt Llama 3.3 70B, Qwen 2.5 oder Mistral 7B für mittlere Produktionslast. Vollständige Datenresidenz in Deutschland, reines OpEx-Modell, kündbar pro Monat, ~ 880 CAD/Monat. Hardware-Konfiguration und Modell-Updates verantwortet ihr selbst oder über einen verwalteten Dienstleister.",
"decision_de": "Habt ihr DevOps-Kapazität für GPU-Server-Betrieb, oder soll die Infrastruktur vollständig managed sein?"
},
"hetzner-ax102": {
"label": "Hetzner AX102 CPU",
"descKey": "h_ax102_desc",
"monthly": 132,
"currency": "CAD",
"tags": [
"EU",
"DE",
"Hetzner"
],
"product_id": 157,
"product_code": "PAI-HST-HZN-AX102",
"detail_de": "Hetzner AX102 ist ein CPU-only-Dedicated-Server — der günstigste Einstieg in Self-Hosting, ~ 132 CAD/Monat. Ohne GPU sind nur sehr kleine Modelle (≤3B) oder CPU-optimierte Quantisierungen praxistauglich. Geeignet für Experimente, Embeddings oder leichte Inference — nicht für produktiven LLM-Betrieb mit 7B+-Modellen.",
"decision_de": "Reicht CPU-Inference für euren Anwendungsfall, oder ist GPU-Leistung für akzeptable Latenz erforderlich?"
},
"equinix-colo": {
"label": "Equinix / Interxion Colocation",
"monthly": 800,
"currency": "EUR",
"tags": [
"EU",
"Colo",
"BYO-HW"
],
"phase": "B",
"detail_de": "Eigene Hardware (~ 80.000 EUR CapEx) in einem Equinix- oder Interxion-Rechenzentrum — Colocation und Power bei rund 800 EUR/Monat. Volle Hardware-Kontrolle, carrier-neutrale Anbindung, Tier-III+-Verfügbarkeit. Höchste Einstiegskosten, aber beste Verfügbarkeitsgarantien. Break-even gegenüber Cloud nach ca. 5 Jahren bei konstanter Last.",
"decision_de": "Habt ihr 80.000 EUR CapEx im Budget und einen 5-Jahres-Horizont, oder bevorzugt ihr reine OpEx-Modelle?"
},
"runpod-h100": {
"label": "RunPod H100 (spot)",
"descKey": "h_runpod_desc",
"monthly": 800,
"currency": "USD",
"tags": [
"Spot",
"GPU",
"US"
],
"product_id": 158,
"product_code": "PAI-HST-RPD-H100",
"detail_de": "RunPod bietet Spot- und On-Demand-H100-GPUs zu ~ 2 EUR/Stunde — ideal für burstfähige Workloads oder kurze Entwicklungszyklen. US-amerikanische Plattform, kein Sovereign-Claim, keine EU-Datenresidenz. Günstigste absolute Kosten für intermittierende GPU-Nutzung, aber Spot-Instanzen können jederzeit unterbrochen werden.",
"decision_de": "Ist Verfügbarkeitsgarantie kritisch, oder sind Unterbrechungen durch Spot-Pricing für euren Workload tolerierbar?"
},
"lambda-h100": {
"label": "Lambda H100 24x7",
"descKey": "h_lambda_desc",
"monthly": 1600,
"currency": "USD",
"tags": [
"Cloud",
"GPU",
"US"
],
"product_id": 159,
"product_code": "PAI-HST-LMB-H100",
"detail_de": "Lambda Labs bietet dedizierte H100-Instanzen im 24/7-Betrieb ohne Spot-Risiko — ~ 1.600 USD/Monat pro GPU. US-amerikanische Plattform, kein EU-Sovereign-Status, aber stabile Verfügbarkeit für Produktions-Inference. Alternative zu RunPod wenn Uptime-Garantie wichtiger ist als minimale Kosten.",
"decision_de": "Ist Verfügbarkeit rund um die Uhr wichtiger als der Kostenunterschied zu Spot-GPUs, und ist US-Hosting akzeptabel?"
},
"multi-h100": {
"label": "Multi-GPU (2× H100)",
"descKey": "h_multi_desc",
"monthly": 3200,
"currency": "USD",
"tags": [
"Cluster",
"GPU"
],
"product_id": 160,
"product_code": "PAI-HST-MUL-H100",
"detail_de": "Multi-GPU-Cluster mit zwei oder mehr H100 — für hochvolumige Self-Hosted-Inference, parallele Modellinstanzen oder sehr große Modelle (>70B). ~ 3.200 USD/Monat für 2× H100. Maximale Leistung und Kontrolle, aber erfordert GPU-Cluster-Management, Lastverteilung und eigene MLOps-Kompetenz.",
"decision_de": "Habt ihr das Volumen und die MLOps-Kapazität, die einen Multi-GPU-Cluster wirtschaftlich und operativ rechtfertigen?"
},
"client-cloud": {
"labelKey": "h_client_label",
"descKey": "h_client_desc",
"monthly": 0,
"currency": "CAD",
"tags": [
"BYOC",
"Sovereign"
],
"product_id": 161,
"product_code": "PAI-HST-CLT-CLOUD"
},
"on-prem": {
"labelKey": "h_onprem_label",
"descKey": "h_onprem_desc",
"monthly": 0,
"currency": "CAD",
"tags": [
"On-prem",
"Sovereign"
],
"product_id": 162,
"product_code": "PAI-HST-CLT-ONPREM"
}
},
"integration_types": {
"std": {
"labelKey": "i_std",
"setupHrs": 4,
"monthlyShare": 25,
"setup_product_id": 163,
"setup_product_code": "PAI-INT-STD-SETUP",
"maint_product_id": 164,
"maint_product_code": "PAI-INT-STD-MAINT"
},
"crm": {
"labelKey": "i_crm",
"setupHrs": 6,
"monthlyShare": 40,
"setup_product_id": 165,
"setup_product_code": "PAI-INT-CRM-SETUP",
"maint_product_id": 166,
"maint_product_code": "PAI-INT-CRM-MAINT"
},
"erp": {
"labelKey": "i_erp",
"setupHrs": 12,
"monthlyShare": 80,
"setup_product_id": 167,
"setup_product_code": "PAI-INT-ERP-SETUP",
"maint_product_id": 168,
"maint_product_code": "PAI-INT-ERP-MAINT"
},
"sharepoint": {
"labelKey": "i_sharepoint",
"setupHrs": 5,
"monthlyShare": 35,
"setup_product_id": 169,
"setup_product_code": "PAI-INT-SHAREPOINT-SETUP",
"maint_product_id": 170,
"maint_product_code": "PAI-INT-SHAREPOINT-MAINT"
},
"custom-db": {
"labelKey": "i_custom_db",
"setupHrs": 6,
"monthlyShare": 40,
"setup_product_id": 171,
"setup_product_code": "PAI-INT-CUSTOMDB-SETUP",
"maint_product_id": 172,
"maint_product_code": "PAI-INT-CUSTOMDB-MAINT"
},
"mes": {
"labelKey": "i_mes",
"setupHrs": 16,
"monthlyShare": 100,
"setup_product_id": 173,
"setup_product_code": "PAI-INT-MES-SETUP",
"maint_product_id": 174,
"maint_product_code": "PAI-INT-MES-MAINT"
},
"voice": {
"labelKey": "i_voice",
"setupHrs": 8,
"monthlyShare": 60,
"setup_product_id": 175,
"setup_product_code": "PAI-INT-VOICE-SETUP",
"maint_product_id": 176,
"maint_product_code": "PAI-INT-VOICE-MAINT"
}
},
"skill_types": {
"rag": {
"labelKey": "sk_rag",
"setupHrs": 4,
"monthlyShare": 20,
"setup_product_id": 177,
"setup_product_code": "PAI-SKL-RAG-SETUP",
"maint_product_id": 178,
"maint_product_code": "PAI-SKL-RAG-MAINT"
},
"workflow": {
"labelKey": "sk_workflow",
"setupHrs": 6,
"monthlyShare": 30,
"setup_product_id": 179,
"setup_product_code": "PAI-SKL-WORKFLOW-SETUP",
"maint_product_id": 180,
"maint_product_code": "PAI-SKL-WORKFLOW-MAINT"
},
"multistep": {
"labelKey": "sk_multistep",
"setupHrs": 12,
"monthlyShare": 60,
"setup_product_id": 181,
"setup_product_code": "PAI-SKL-MULTISTEP-SETUP",
"maint_product_id": 182,
"maint_product_code": "PAI-SKL-MULTISTEP-MAINT"
},
"finetune": {
"labelKey": "sk_finetune",
"setupHrs": 28,
"monthlyShare": 90,
"setup_product_id": 183,
"setup_product_code": "PAI-SKL-FINETUNE-SETUP",
"maint_product_id": 184,
"maint_product_code": "PAI-SKL-FINETUNE-MAINT"
},
"voice": {
"labelKey": "sk_voice",
"setupHrs": 12,
"monthlyShare": 60,
"setup_product_id": 185,
"setup_product_code": "PAI-SKL-VOICE-SETUP",
"maint_product_id": 186,
"maint_product_code": "PAI-SKL-VOICE-MAINT"
},
"classifier": {
"labelKey": "sk_classifier",
"setupHrs": 4,
"monthlyShare": 20,
"setup_product_id": 187,
"setup_product_code": "PAI-SKL-CLASSIFIER-SETUP",
"maint_product_id": 188,
"maint_product_code": "PAI-SKL-CLASSIFIER-MAINT"
},
"summary": {
"labelKey": "sk_summary",
"setupHrs": 4,
"monthlyShare": 20,
"setup_product_id": 189,
"setup_product_code": "PAI-SKL-SUMMARY-SETUP",
"maint_product_id": 190,
"maint_product_code": "PAI-SKL-SUMMARY-MAINT"
}
},
"volume_tiers": {
"v1": {
"label": "V1",
"midM": 2.5,
"product_id": 191,
"product_code": "PAI-VOL-V1"
},
"v2": {
"label": "V2",
"midM": 15,
"product_id": 192,
"product_code": "PAI-VOL-V2"
},
"v3": {
"label": "V3",
"midM": 60,
"product_id": 193,
"product_code": "PAI-VOL-V3"
},
"v4": {
"label": "V4",
"midM": 150,
"product_id": 194,
"product_code": "PAI-VOL-V4"
}
},
"maintenance": {
"light": {
"hrs": 2,
"cost": 300,
"currency": "CAD",
"product_id": 195,
"product_code": "PAI-MNT-LIGHT"
},
"standard": {
"hrs": 6,
"cost": 900,
"currency": "CAD",
"product_id": 196,
"product_code": "PAI-MNT-STD"
},
"heavy": {
"hrs": 12,
"cost": 1800,
"currency": "CAD",
"product_id": 197,
"product_code": "PAI-MNT-HEAVY"
},
"sla": {
"label": "SLA — 4hr P1 response",
"cost": 500,
"currency": "CAD",
"product_id": 198,
"product_code": "PAI-MNT-SLA"
},
"named": {
"label": "Named lead engineer",
"cost": 1500,
"currency": "CAD",
"product_id": 199,
"product_code": "PAI-MNT-NAMED"
}
},
"vectordb": {
"qdrant-self": {
"label": "Qdrant self-hosted (DE/Berlin)",
"monthly": 5,
"currency": "EUR",
"product_id": 200,
"product_code": "PAI-VDB-QDRT"
},
"qdrant-cloud": {
"label": "Qdrant Cloud (DE)",
"monthly": 120,
"currency": "EUR",
"phase": "B"
},
"weaviate-self": {
"label": "Weaviate self-hosted (NL)",
"monthly": 5,
"currency": "EUR",
"phase": "B"
},
"weaviate-cloud": {
"label": "Weaviate Cloud",
"monthly": 135,
"currency": "USD",
"product_id": 203,
"product_code": "PAI-VDB-WEAV"
},
"pgvector": {
"label": "pgvector (Postgres)",
"monthly": 0,
"currency": "EUR",
"phase": "B"
},
"vespa": {
"label": "Vespa (NO · Open)",
"monthly": 0,
"currency": "EUR",
"phase": "B"
},
"haystack-rag": {
"label": "Haystack RAG Stack (DE)",
"monthly": 0,
"currency": "EUR",
"phase": "B"
},
"pinecone-s1": {
"label": "Pinecone S1",
"monthly": 70,
"currency": "USD",
"product_id": 201,
"product_code": "PAI-VDB-PIN-S1"
},
"pinecone-std": {
"label": "Pinecone Standard",
"monthly": 200,
"currency": "USD",
"product_id": 202,
"product_code": "PAI-VDB-PIN-STD"
},
"none": {
"labelKey": "vdb_none",
"monthly": 0,
"currency": "CAD",
"product_id": 204,
"product_code": "PAI-VDB-NONE"
}
},
"observability": {
"langfuse-free": {
"labelKey": "obs_langfuse_free",
"monthly": 0,
"currency": "USD",
"product_id": 205,
"product_code": "PAI-OBS-LFUSE-FREE"
},
"langfuse-pro": {
"label": "Langfuse Pro",
"monthly": 99,
"currency": "USD",
"product_id": 206,
"product_code": "PAI-OBS-LFUSE-PRO"
},
"helicone": {
"label": "Helicone",
"monthly": 20,
"currency": "USD",
"product_id": 207,
"product_code": "PAI-OBS-HELI"
},
"custom": {
"labelKey": "obs_custom",
"monthly": 0,
"currency": "USD",
"product_id": 208,
"product_code": "PAI-OBS-CUSTOM"
}
},
"model_tokens_per_m": {
"claude-sonnet": {
"rate": 9,
"product_id": 209,
"product_code": "PAI-MDL-CLS"
},
"claude-haiku": {
"rate": 1.25,
"product_id": 210,
"product_code": "PAI-MDL-CLH"
},
"gpt4o": {
"rate": 6.25,
"product_id": 211,
"product_code": "PAI-MDL-GPT4O"
},
"gpt4o-mini": {
"rate": 0.45,
"product_id": 212,
"product_code": "PAI-MDL-GPT4OMINI"
},
"mistral-large": {
"rate": 5,
"product_id": 213,
"product_code": "PAI-MDL-MSTRL"
},
"llama8b": {
"rate": 0,
"product_id": 214,
"product_code": "PAI-MDL-LLM8B"
},
"llama70b": {
"rate": 0,
"product_id": 215,
"product_code": "PAI-MDL-LLM70B"
},
"mixtral": {
"rate": 0,
"product_id": 216,
"product_code": "PAI-MDL-MIXT"
},
"qwen32b": {
"rate": 0,
"product_id": 217,
"product_code": "PAI-MDL-QWEN32B"
},
"custom-finetune": {
"rate": 0,
"product_id": 218,
"product_code": "PAI-MDL-CFTUNE"
}
},
"one_time_engineering": {
"discovery": {
"label": "Discovery & architecture",
"rate_per_hr": 150,
"product_id": 219,
"product_code": "PAI-OTE-DISC"
},
"hardening": {
"label": "Hardening & security",
"rate_per_hr": 150,
"product_id": 220,
"product_code": "PAI-OTE-HARD"
},
"docs": {
"label": "Documentation & handover",
"rate_per_hr": 150,
"product_id": 221,
"product_code": "PAI-OTE-DOCS"
}
}
}