Der KI-Stack
SignPilot nutzt nicht ein KI-Modell für alles, sondern spezialisierte Modelle für jede Aufgabe. Das Ergebnis ist besser als ein Alleskönner — und die Kosten sind kontrollierbar.
Sprache: Claude + Groq
Claude (Anthropic) ist das Hauptmodell für alle textbasierten Aufgaben: Kalkulation, Preisbegründung, Business-Chat, Briefing. Claude ist besonders stark bei strukturierten Ausgaben (JSON), Zahlenverständnis und branchenspezifischen Anweisungen.
Groq dient als Fallback. Wenn Claude nicht erreichbar ist (Rate-Limit, Wartung), übernimmt Groq mit dem Llama-Modell. Die Qualität ist etwas geringer, aber die Verfügbarkeit steigt auf 99.9%+. Der Wechsel passiert automatisch — der Nutzer merkt nichts.
Kosten: 2 Credits pro Kalkulation, 1 Credit pro Chat-Nachricht, 2 Credits pro Briefing.
Vision: DINO + Gemini + SAM 3
Für das KI-Aufmaß nutzt SignPilot eine Multi-Modell-Kaskade — vier Modelle die nacheinander arbeiten:
DINO 1.5 Pro erkennt Objekte auf dem Foto und liefert Bounding Boxes. "Da ist ein Fenster, da ist eine Tür, da ist ein Schild."
Grounding DINO v1 lokalisiert Objekte basierend auf Text-Prompts. "Finde alle Glasflächen" — präziser als die generische Erkennung.
Gemini 2.5 Flash (Google) analysiert den Kontext: Fenstertyp, Verglasung, Umgebung. Diese Metadaten fließen in die Materialempfehlung.
SAM 3 (Segment Anything Model, Meta) erzeugt pixelgenaue Polygone. Nicht Rechtecke — echte Konturen. Ein Fenster mit Rundbogen hat 30+ Polygon-Punkte. Die Fläche wird auf den Quadratzentimeter genau berechnet.
Die Kaskade braucht 5-15 Sekunden pro Foto. Bilder werden vor der Verarbeitung auf max. 2048px komprimiert. Kosten: 3 Credits pro Aufmaß.
Audio: Whisper
Whisper (OpenAI, gehostet via Groq) transkribiert Sprache in Text. 95%+ Genauigkeit, auch bei Hintergrundlärm auf der Baustelle. Unterstützt alle 17 Sprachen. Die Transkription dauert ca. 2-5 Sekunden für 1 Minute Audio.
Der Output ist nicht nur Text — SignPilot extrahiert automatisch Materialien, Maße, Kundennamen und Termininfos aus dem Transkript. Kosten: 1 Credit pro Transkription.
Produktion: Physik statt KI
Für die Produktionsplanung setzt SignPilot bewusst keine KI ein. Maschinenzeiten sind deterministische Berechnungen: ein Roland TrueVIS druckt X m²/h, ein Zünd Cutter schneidet Y m/min, ein Laminator verarbeitet Z m²/h. Rüstzeiten pro Materialwechsel, Deadline-Priorisierung, Materialgruppen-Sortierung — das sind Physik und Logik, keine Mustererkennung.
Vorteil: Keine API-Kosten, keine Latenzen, deterministische Ergebnisse. Die Produktionsplanung läuft lokal auf dem Server. Ein KI-Modell würde hier nur Unvorhersagbarkeit einführen — bei einem Prozess der Verlässlichkeit braucht.