Dedizierter GPU-Server im deutschen Rechenzentrum, lokales Llama-3.1-Modell, Zugriff auf Cubicle's kuratierten Rechts-Korpus (116k+ deutsche Gesetze, Urteile, BMF-Schreiben). Mandanten-Daten bleiben isoliert auf Ihrem Server — kein externer LLM-Aufruf, keine US-Cloud.
Der Alltag einer Kanzlei ist kein Chatbot-Spielzeug. Cubicle Sovereign arbeitet mit Ihren echten Mandate-Daten — lokal, durchsuchbar, vergleichbar.
Ihre Akten, E-Mails und Dokumente werden durchsuchbar. Fragen Sie in natürlicher Sprache statt Ordner zu durchwühlen.
Vom Risiko-Check bis zur Neu-Erstellung — Vertragsarbeit in Minuten statt Stunden, mit Quellen belegt.
Zugriff auf Cubicle's kuratierten Korpus von 116.000+ deutschen Rechtsquellen — täglich aktualisiert, mit Stellen-genauer Zitation.
Wichtig: Mandanten-Daten-Arbeit (Punkt 1 + 2) passiert vollständig lokal auf Ihrem Server — das lokale Llama-Modell verarbeitet Ihre Akten. Nur für die Rechtsrecherche (Punkt 3) wird Cubicle's Knowledge-API kontaktiert — mit generischen Rechtsfragen, ohne Mandanten-Daten.
Drei Stufen Datenhoheit, drei Preispunkte. Für 90% der Kanzleien reicht Cloud oder Inhouse. Sovereign ist für die 10% mit absoluter Daten-Abgeschiedenheit-Anforderung.
Nicht jede Kanzlei braucht lokale Inferenz. Diese vier Konstellationen rechtfertigen den Aufpreis.
§ 160a StPO bietet Schutz vor Beschlagnahme — der nur greift wenn Daten nachweisbar nicht außerhalb der Kanzlei waren. Sovereign macht den Nachweis trivial: kein API-Call nach außen, der protokolliert werden könnte.
Großmandanten verlangen oft, dass sämtliche eingesetzten Tools in der Kanzlei-Infrastruktur laufen und im Audit-Scope der Kanzlei (nicht eines externen Sub-Auftragsverarbeiters) sind. Sovereign erfüllt das ohne Kompromiss.
Bei börsennotierten Mandanten gelten besondere Sorgfaltspflichten für kurspreisrelevante Daten. WPK empfiehlt 2025 explizit On-Premise inkl. lokaler KI-Inferenz für Mandate mit Insider-Risiko.
Manche internationale Mandanten verbieten in ihrem AVV explizit jegliche Übermittlung an US-Tech-Konzerne — auch anonymisiert. Sovereign nutzt ausschließlich Open-Source-Modelle (Llama) auf Kanzlei-Hardware, kein US-API-Call.
Sie erhalten einen dedizierten GPU-Server in einem zertifizierten deutschen Rechenzentrum (ISO 27001). Wir installieren den kompletten Cubicle-Stack inkl. lokalem LLM. Für rechtliches Wissen ruft Ihr Server die Cubicle Knowledge-API auf — generische Rechtsfragen, keine Mandanten-Daten.
Einmaliges Setup + Monats-Pauschale. Hardware kauft die Kanzlei separat (wir empfehlen Lieferanten).
Einstieg für kleine Kanzleien (1-3 Anwälte).
Cubicle-Pauschale (Llama-Pflege + Knowledge-API + Maintenance)
+ Server-Miete im DE-RZ (~250 €/Mo, separat)
Total ~549 €/Mo
Beste Qualität für deutsche Rechtsaufgaben (5-15 Anwälte).
Cubicle-Pauschale (Llama-70B-Pflege + Knowledge-API + Maintenance)
+ Server-Miete im DE-RZ (~900 €/Mo, separat)
Total ~1.399 €/Mo
Große Kanzleien (20+ Anwälte), 24/7-Anforderungen.
Cubicle-Pauschale (alles + 24/7-Support + Fine-Tuning)
+ Server-Miete im DE-RZ (~900 €/Mo, ggf. 2× redundant)
Total ~1.790 €/Mo
Den Server stellen wir in einem zertifizierten deutschen Rechenzentrum bereit (ISO 27001). Monatlich kündbar, keine Hardware-Investition.
Add-on: +5.000 Knowledge-Queries = 39 €/Mo · 24/7-Support (Standard-Tier) = +199 €/Mo
Wir antworten innerhalb von einem Werktag mit Terminvorschlägen für ein 30-Min-Beratungsgespräch. Im Gespräch klären wir Hardware-Anforderungen, Zeitplan und individuelles Angebot.