{ "version": "a2-live", "note": "Phase A2 live catalog — prices from product.product (PAI-* records). Phase B entries (STACKIT, OTC, IONOS, OVH, Scaleway, Equinix, api-mistral, api-cohere, api-alephalpha, qdrant-cloud, weaviate-self, pgvector, vespa, haystack-rag, Compliance, Orchestration L4) are stubs without product_id — awaiting Phase B.", "hosting": { "api-anthropic": { "label": "API · Anthropic (Claude)", "descKey": "h_anthropic_desc", "monthly": 0, "currency": "CAD", "tags": [ "API", "Cloud", "US" ], "product_id": 153, "product_code": "PAI-HST-API-ANT", "detail_de": "Beste Modellqualität am Markt: Anthropic Claude und OpenAI GPT-4 setzen den Reasoning- und Code-Standard. Aber: vollständig US-rechtlich, CLOUD Act unterworfen, Daten verlassen die EU. Höchste Token-Preise im Vergleich — die Premium-Qualität hat ihren Preis.", "decision_de": "Akzeptiert ihr US-Datenschutzlage für Premium-Modellqualität, oder ist EU-Datenresidenz unverhandelbar?" }, "api-openai": { "label": "API · OpenAI", "descKey": "h_openai_desc", "monthly": 0, "currency": "CAD", "tags": [ "API", "Cloud", "US" ], "product_id": 154, "product_code": "PAI-HST-API-OAI", "detail_de": "OpenAI GPT-4o und o3 setzen den Standard bei Code-Completion, Function Calling und strukturiertem Output. US-amerikanischer Anbieter, CLOUD Act unterworfen — Daten verlassen die EU, kein Adequacy-Status. Token-Preise leicht unter Anthropic, Modellstärken ergänzen sich gut für hybride Multi-Anbieter-Setups.", "decision_de": "Ist das US-Rechtsrisiko akzeptabel, oder soll der primäre LLM-Stack EU-souverän sein?" }, "api-mistral": { "label": "API · Mistral La Plateforme (FR)", "monthly": 0, "currency": "EUR", "tags": [ "API", "EU", "Sovereign" ], "phase": "B", "detail_de": "Französischer Anbieter, DSGVO-konform out-of-the-box, Datenresidenz in Paris oder Frankfurt. Mistral Large erreicht GPT-4-Niveau bei Code, RAG und mehrsprachigen Aufgaben. Token-Preis rund 40 % unter US-Hyperscalern — günstigste Y1-TCO im Sovereign-Lager.", "decision_de": "Reicht Modellqualität auf GPT-4-Niveau, oder braucht ihr absolute Spitzenleistung über alle Domänen?" }, "api-cohere": { "label": "API · Cohere North (CA)", "monthly": 0, "currency": "CAD", "tags": [ "API", "NATO", "Sovereign" ], "phase": "B", "detail_de": "Kanadischer Anbieter, NATO-aligned, RAG-optimierte Modelle. Command R+ liegt branchenweit vorn bei Retrieval-Augmented Generation und Multi-Step-Reasoning. Datenresidenz in Toronto-Region („North“). Kanada gilt für die meisten EU-Compliance-Frameworks als adäquates Drittland (DSGVO Adequacy Decision).", "decision_de": "Ist Kanada als „sicheres Drittland“ für eure Compliance-Linie akzeptabel?" }, "api-alephalpha": { "label": "API · Aleph Alpha (DE)", "monthly": 0, "currency": "EUR", "tags": [ "API", "DE", "BSI", "Sovereign" ], "phase": "B", "detail_de": "Deutscher Anbieter aus Heidelberg, Pharia-1 als gehärtetes Enterprise-Modell. BSI-zertifizierter Betrieb, IT-Grundschutz-konform. Speziell für regulierte Branchen — Finance, Healthcare, Public Sector. Premium-Pricing, aber Compliance ist eingebaut, nicht nachträglich nachgewiesen.", "decision_de": "Müsst ihr BSI-Konformität oder C5-Testat nachweisen? Dann ist Aleph Alpha die schnellste Compliance-Story." }, "stackit": { "label": "STACKIT (DE · Schwarz Group)", "monthly": 600, "currency": "EUR", "tags": [ "EU", "DE", "BSI-C5", "KRITIS", "Sovereign" ], "phase": "B", "detail_de": "STACKIT ist die Cloud-Plattform der Schwarz Gruppe (Lidl, Kaufland) — BSI C5-attestiert, KRITIS-tauglich, vollständig in deutschen Rechenzentren. Höchste Souveränitätsgarantien im Markt, geeignet für kritische Infrastruktur und regulierte Branchen. Premium-Preisniveau um ca. 600 EUR/Monat für eine vollständig managed GPU-Instanz.", "decision_de": "Ist BSI C5 oder KRITIS-Konformität eine harte Anforderung, die den Premium-Preis rechtfertigt?" }, "otc": { "label": "Open Telekom Cloud (DE · T-Systems)", "monthly": 550, "currency": "EUR", "tags": [ "EU", "DE", "G-Cloud", "Sovereign" ], "phase": "B", "detail_de": "Open Telekom Cloud (T-Systems) ist die souveräne Cloud der Deutschen Telekom — G-Cloud-zertifiziert, vollständig in Deutschland, für Behörden und stark regulierte Branchen ausgelegt. DSGVO-konform out-of-the-box, Datenresidenz in Frankfurt und Biere. Preisniveau bei ca. 550 EUR/Monat für GPU-Workloads, vergleichbar mit STACKIT.", "decision_de": "Braucht ihr G-Cloud-Zertifizierung oder öffentlichen Sektor als Referenz, oder reicht BSI C5?" }, "ionos-cloud": { "label": "IONOS Cloud (DE)", "monthly": 450, "currency": "EUR", "tags": [ "EU", "DE", "Sovereign" ], "phase": "B", "detail_de": "IONOS Cloud ist ein deutsches Unternehmen mit EU-Hauptsitz, DSGVO-konform und zu deutlich günstigeren Preisen als die großen Sovereign-Anbieter (~ 450 EUR/Monat). Solide Datenschutzkonformität, breites EU-Rechenzentrumsangebot, aber keine BSI C5- oder G-Cloud-Zertifizierung. Gute Wahl wenn Souveränität wichtig ist, aber kein formelles Zertifikat vorgeschrieben wird.", "decision_de": "Reicht EU-Datenschutzkonformität ohne formelles Zertifikat, oder ist BSI C5 eine Muss-Anforderung?" }, "ovhcloud": { "label": "OVHcloud (FR · SecNumCloud)", "monthly": 500, "currency": "EUR", "tags": [ "EU", "FR", "SecNumCloud", "Sovereign" ], "phase": "B", "detail_de": "OVHcloud ist ein französischer Anbieter mit SecNumCloud-Zertifizierung — der strengsten französischen Souveränitätsnorm, die auch EU-Behörden akzeptieren. Datenresidenz in Frankreich oder Deutschland, ~ 500 EUR/Monat für GPU-Instanzen. Geeignet für Organisationen, die Compliance mit französischem oder europäischem öffentlichem Sektor nachweisen müssen.", "decision_de": "Ist SecNumCloud-Zertifizierung oder Frankreich als Rechtsraum eine Anforderung eurer Kunden oder Auditoren?" }, "scaleway": { "label": "Scaleway (FR)", "monthly": 480, "currency": "EUR", "tags": [ "EU", "FR", "Sovereign" ], "phase": "B", "detail_de": "Scaleway ist ein französischer Developer-Cloud-Anbieter mit EU-souveränem Betrieb und transparentem Open-Source-Ethos. Datenresidenz in Paris, Amsterdam und Warschau, DSGVO-konform, ~ 480 EUR/Monat. Keine SecNumCloud-Zertifizierung, aber günstigeres Preisniveau und sehr entwicklerfreundliche API — ideal für iterative Deployments.", "decision_de": "Ist die Developer-Erfahrung und schnelle Iteration wichtiger als formelle Souveränitätszertifizierung?" }, "hetzner-gex44": { "label": "Hetzner GEX44", "descKey": "h_gex44_desc", "monthly": 200, "currency": "CAD", "tags": [ "EU", "DE", "Hetzner" ], "product_id": 155, "product_code": "PAI-HST-HZN-GEX44", "detail_de": "Hetzner GEX44 ist der Einstiegstier im Hetzner-GPU-Portfolio — geeignet für Entwicklung, Tests und low-volume Inference mit kleineren Modellen (7B–13B). Vollständig in Deutschland, DSGVO-konform, kein Vendor-Lock-in, ~ 200 CAD/Monat. Für Produktionslast bei größeren Modellen nicht ausreichend dimensioniert.", "decision_de": "Ist dieser Server für Produktion oder nur für Entwicklung und Tests gedacht?" }, "hetzner-gex130": { "label": "Hetzner GEX130", "descKey": "h_gex130_desc", "monthly": 880, "currency": "CAD", "tags": [ "EU", "DE", "Hetzner" ], "product_id": 156, "product_code": "PAI-HST-HZN-GEX130", "detail_de": "Hetzner GEX130 ist der produktionsreife GPU-Server im Hetzner-Portfolio — trägt Llama 3.3 70B, Qwen 2.5 oder Mistral 7B für mittlere Produktionslast. Vollständige Datenresidenz in Deutschland, reines OpEx-Modell, kündbar pro Monat, ~ 880 CAD/Monat. Hardware-Konfiguration und Modell-Updates verantwortet ihr selbst oder über einen verwalteten Dienstleister.", "decision_de": "Habt ihr DevOps-Kapazität für GPU-Server-Betrieb, oder soll die Infrastruktur vollständig managed sein?" }, "hetzner-ax102": { "label": "Hetzner AX102 CPU", "descKey": "h_ax102_desc", "monthly": 132, "currency": "CAD", "tags": [ "EU", "DE", "Hetzner" ], "product_id": 157, "product_code": "PAI-HST-HZN-AX102", "detail_de": "Hetzner AX102 ist ein CPU-only-Dedicated-Server — der günstigste Einstieg in Self-Hosting, ~ 132 CAD/Monat. Ohne GPU sind nur sehr kleine Modelle (≤3B) oder CPU-optimierte Quantisierungen praxistauglich. Geeignet für Experimente, Embeddings oder leichte Inference — nicht für produktiven LLM-Betrieb mit 7B+-Modellen.", "decision_de": "Reicht CPU-Inference für euren Anwendungsfall, oder ist GPU-Leistung für akzeptable Latenz erforderlich?" }, "equinix-colo": { "label": "Equinix / Interxion Colocation", "monthly": 800, "currency": "EUR", "tags": [ "EU", "Colo", "BYO-HW" ], "phase": "B", "detail_de": "Eigene Hardware (~ 80.000 EUR CapEx) in einem Equinix- oder Interxion-Rechenzentrum — Colocation und Power bei rund 800 EUR/Monat. Volle Hardware-Kontrolle, carrier-neutrale Anbindung, Tier-III+-Verfügbarkeit. Höchste Einstiegskosten, aber beste Verfügbarkeitsgarantien. Break-even gegenüber Cloud nach ca. 5 Jahren bei konstanter Last.", "decision_de": "Habt ihr 80.000 EUR CapEx im Budget und einen 5-Jahres-Horizont, oder bevorzugt ihr reine OpEx-Modelle?" }, "runpod-h100": { "label": "RunPod H100 (spot)", "descKey": "h_runpod_desc", "monthly": 800, "currency": "USD", "tags": [ "Spot", "GPU", "US" ], "product_id": 158, "product_code": "PAI-HST-RPD-H100", "detail_de": "RunPod bietet Spot- und On-Demand-H100-GPUs zu ~ 2 EUR/Stunde — ideal für burstfähige Workloads oder kurze Entwicklungszyklen. US-amerikanische Plattform, kein Sovereign-Claim, keine EU-Datenresidenz. Günstigste absolute Kosten für intermittierende GPU-Nutzung, aber Spot-Instanzen können jederzeit unterbrochen werden.", "decision_de": "Ist Verfügbarkeitsgarantie kritisch, oder sind Unterbrechungen durch Spot-Pricing für euren Workload tolerierbar?" }, "lambda-h100": { "label": "Lambda H100 24x7", "descKey": "h_lambda_desc", "monthly": 1600, "currency": "USD", "tags": [ "Cloud", "GPU", "US" ], "product_id": 159, "product_code": "PAI-HST-LMB-H100", "detail_de": "Lambda Labs bietet dedizierte H100-Instanzen im 24/7-Betrieb ohne Spot-Risiko — ~ 1.600 USD/Monat pro GPU. US-amerikanische Plattform, kein EU-Sovereign-Status, aber stabile Verfügbarkeit für Produktions-Inference. Alternative zu RunPod wenn Uptime-Garantie wichtiger ist als minimale Kosten.", "decision_de": "Ist Verfügbarkeit rund um die Uhr wichtiger als der Kostenunterschied zu Spot-GPUs, und ist US-Hosting akzeptabel?" }, "multi-h100": { "label": "Multi-GPU (2× H100)", "descKey": "h_multi_desc", "monthly": 3200, "currency": "USD", "tags": [ "Cluster", "GPU" ], "product_id": 160, "product_code": "PAI-HST-MUL-H100", "detail_de": "Multi-GPU-Cluster mit zwei oder mehr H100 — für hochvolumige Self-Hosted-Inference, parallele Modellinstanzen oder sehr große Modelle (>70B). ~ 3.200 USD/Monat für 2× H100. Maximale Leistung und Kontrolle, aber erfordert GPU-Cluster-Management, Lastverteilung und eigene MLOps-Kompetenz.", "decision_de": "Habt ihr das Volumen und die MLOps-Kapazität, die einen Multi-GPU-Cluster wirtschaftlich und operativ rechtfertigen?" }, "client-cloud": { "labelKey": "h_client_label", "descKey": "h_client_desc", "monthly": 0, "currency": "CAD", "tags": [ "BYOC", "Sovereign" ], "product_id": 161, "product_code": "PAI-HST-CLT-CLOUD" }, "on-prem": { "labelKey": "h_onprem_label", "descKey": "h_onprem_desc", "monthly": 0, "currency": "CAD", "tags": [ "On-prem", "Sovereign" ], "product_id": 162, "product_code": "PAI-HST-CLT-ONPREM" } }, "integration_types": { "std": { "labelKey": "i_std", "setupHrs": 4, "monthlyShare": 25, "setup_product_id": 163, "setup_product_code": "PAI-INT-STD-SETUP", "maint_product_id": 164, "maint_product_code": "PAI-INT-STD-MAINT" }, "crm": { "labelKey": "i_crm", "setupHrs": 6, "monthlyShare": 40, "setup_product_id": 165, "setup_product_code": "PAI-INT-CRM-SETUP", "maint_product_id": 166, "maint_product_code": "PAI-INT-CRM-MAINT" }, "erp": { "labelKey": "i_erp", "setupHrs": 12, "monthlyShare": 80, "setup_product_id": 167, "setup_product_code": "PAI-INT-ERP-SETUP", "maint_product_id": 168, "maint_product_code": "PAI-INT-ERP-MAINT" }, "sharepoint": { "labelKey": "i_sharepoint", "setupHrs": 5, "monthlyShare": 35, "setup_product_id": 169, "setup_product_code": "PAI-INT-SHAREPOINT-SETUP", "maint_product_id": 170, "maint_product_code": "PAI-INT-SHAREPOINT-MAINT" }, "custom-db": { "labelKey": "i_custom_db", "setupHrs": 6, "monthlyShare": 40, "setup_product_id": 171, "setup_product_code": "PAI-INT-CUSTOMDB-SETUP", "maint_product_id": 172, "maint_product_code": "PAI-INT-CUSTOMDB-MAINT" }, "mes": { "labelKey": "i_mes", "setupHrs": 16, "monthlyShare": 100, "setup_product_id": 173, "setup_product_code": "PAI-INT-MES-SETUP", "maint_product_id": 174, "maint_product_code": "PAI-INT-MES-MAINT" }, "voice": { "labelKey": "i_voice", "setupHrs": 8, "monthlyShare": 60, "setup_product_id": 175, "setup_product_code": "PAI-INT-VOICE-SETUP", "maint_product_id": 176, "maint_product_code": "PAI-INT-VOICE-MAINT" } }, "skill_types": { "rag": { "labelKey": "sk_rag", "setupHrs": 4, "monthlyShare": 20, "setup_product_id": 177, "setup_product_code": "PAI-SKL-RAG-SETUP", "maint_product_id": 178, "maint_product_code": "PAI-SKL-RAG-MAINT" }, "workflow": { "labelKey": "sk_workflow", "setupHrs": 6, "monthlyShare": 30, "setup_product_id": 179, "setup_product_code": "PAI-SKL-WORKFLOW-SETUP", "maint_product_id": 180, "maint_product_code": "PAI-SKL-WORKFLOW-MAINT" }, "multistep": { "labelKey": "sk_multistep", "setupHrs": 12, "monthlyShare": 60, "setup_product_id": 181, "setup_product_code": "PAI-SKL-MULTISTEP-SETUP", "maint_product_id": 182, "maint_product_code": "PAI-SKL-MULTISTEP-MAINT" }, "finetune": { "labelKey": "sk_finetune", "setupHrs": 28, "monthlyShare": 90, "setup_product_id": 183, "setup_product_code": "PAI-SKL-FINETUNE-SETUP", "maint_product_id": 184, "maint_product_code": "PAI-SKL-FINETUNE-MAINT" }, "voice": { "labelKey": "sk_voice", "setupHrs": 12, "monthlyShare": 60, "setup_product_id": 185, "setup_product_code": "PAI-SKL-VOICE-SETUP", "maint_product_id": 186, "maint_product_code": "PAI-SKL-VOICE-MAINT" }, "classifier": { "labelKey": "sk_classifier", "setupHrs": 4, "monthlyShare": 20, "setup_product_id": 187, "setup_product_code": "PAI-SKL-CLASSIFIER-SETUP", "maint_product_id": 188, "maint_product_code": "PAI-SKL-CLASSIFIER-MAINT" }, "summary": { "labelKey": "sk_summary", "setupHrs": 4, "monthlyShare": 20, "setup_product_id": 189, "setup_product_code": "PAI-SKL-SUMMARY-SETUP", "maint_product_id": 190, "maint_product_code": "PAI-SKL-SUMMARY-MAINT" } }, "volume_tiers": { "v1": { "label": "V1", "midM": 2.5, "product_id": 191, "product_code": "PAI-VOL-V1" }, "v2": { "label": "V2", "midM": 15, "product_id": 192, "product_code": "PAI-VOL-V2" }, "v3": { "label": "V3", "midM": 60, "product_id": 193, "product_code": "PAI-VOL-V3" }, "v4": { "label": "V4", "midM": 150, "product_id": 194, "product_code": "PAI-VOL-V4" } }, "maintenance": { "light": { "hrs": 2, "cost": 300, "currency": "CAD", "product_id": 195, "product_code": "PAI-MNT-LIGHT" }, "standard": { "hrs": 6, "cost": 900, "currency": "CAD", "product_id": 196, "product_code": "PAI-MNT-STD" }, "heavy": { "hrs": 12, "cost": 1800, "currency": "CAD", "product_id": 197, "product_code": "PAI-MNT-HEAVY" }, "sla": { "label": "SLA — 4hr P1 response", "cost": 500, "currency": "CAD", "product_id": 198, "product_code": "PAI-MNT-SLA" }, "named": { "label": "Named lead engineer", "cost": 1500, "currency": "CAD", "product_id": 199, "product_code": "PAI-MNT-NAMED" } }, "vectordb": { "qdrant-self": { "label": "Qdrant self-hosted (DE/Berlin)", "monthly": 5, "currency": "EUR", "product_id": 200, "product_code": "PAI-VDB-QDRT" }, "qdrant-cloud": { "label": "Qdrant Cloud (DE)", "monthly": 120, "currency": "EUR", "phase": "B" }, "weaviate-self": { "label": "Weaviate self-hosted (NL)", "monthly": 5, "currency": "EUR", "phase": "B" }, "weaviate-cloud": { "label": "Weaviate Cloud", "monthly": 135, "currency": "USD", "product_id": 203, "product_code": "PAI-VDB-WEAV" }, "pgvector": { "label": "pgvector (Postgres)", "monthly": 0, "currency": "EUR", "phase": "B" }, "vespa": { "label": "Vespa (NO · Open)", "monthly": 0, "currency": "EUR", "phase": "B" }, "haystack-rag": { "label": "Haystack RAG Stack (DE)", "monthly": 0, "currency": "EUR", "phase": "B" }, "pinecone-s1": { "label": "Pinecone S1", "monthly": 70, "currency": "USD", "product_id": 201, "product_code": "PAI-VDB-PIN-S1" }, "pinecone-std": { "label": "Pinecone Standard", "monthly": 200, "currency": "USD", "product_id": 202, "product_code": "PAI-VDB-PIN-STD" }, "none": { "labelKey": "vdb_none", "monthly": 0, "currency": "CAD", "product_id": 204, "product_code": "PAI-VDB-NONE" } }, "observability": { "langfuse-free": { "labelKey": "obs_langfuse_free", "monthly": 0, "currency": "USD", "product_id": 205, "product_code": "PAI-OBS-LFUSE-FREE" }, "langfuse-pro": { "label": "Langfuse Pro", "monthly": 99, "currency": "USD", "product_id": 206, "product_code": "PAI-OBS-LFUSE-PRO" }, "helicone": { "label": "Helicone", "monthly": 20, "currency": "USD", "product_id": 207, "product_code": "PAI-OBS-HELI" }, "custom": { "labelKey": "obs_custom", "monthly": 0, "currency": "USD", "product_id": 208, "product_code": "PAI-OBS-CUSTOM" } }, "model_tokens_per_m": { "claude-sonnet": { "rate": 9, "product_id": 209, "product_code": "PAI-MDL-CLS" }, "claude-haiku": { "rate": 1.25, "product_id": 210, "product_code": "PAI-MDL-CLH" }, "gpt4o": { "rate": 6.25, "product_id": 211, "product_code": "PAI-MDL-GPT4O" }, "gpt4o-mini": { "rate": 0.45, "product_id": 212, "product_code": "PAI-MDL-GPT4OMINI" }, "mistral-large": { "rate": 5, "product_id": 213, "product_code": "PAI-MDL-MSTRL" }, "llama8b": { "rate": 0, "product_id": 214, "product_code": "PAI-MDL-LLM8B" }, "llama70b": { "rate": 0, "product_id": 215, "product_code": "PAI-MDL-LLM70B" }, "mixtral": { "rate": 0, "product_id": 216, "product_code": "PAI-MDL-MIXT" }, "qwen32b": { "rate": 0, "product_id": 217, "product_code": "PAI-MDL-QWEN32B" }, "custom-finetune": { "rate": 0, "product_id": 218, "product_code": "PAI-MDL-CFTUNE" } }, "one_time_engineering": { "discovery": { "label": "Discovery & architecture", "rate_per_hr": 150, "product_id": 219, "product_code": "PAI-OTE-DISC" }, "hardening": { "label": "Hardening & security", "rate_per_hr": 150, "product_id": 220, "product_code": "PAI-OTE-HARD" }, "docs": { "label": "Documentation & handover", "rate_per_hr": 150, "product_id": 221, "product_code": "PAI-OTE-DOCS" } } }