Hinfahren. Leiter aufstellen. Zollstock anlegen. Maße auf einen Zettel schreiben. Zurückfahren. Maße in Excel eintippen. Feststellen dass ein Maß fehlt. Nochmal hinfahren. Das ist die Realität von Aufmaß in der Werbetechnik — seit Jahrzehnten unverändert.
Mit KI-gestützter Fotoerkennung geht es anders. Ein Foto, ein Klick, alle Maße. Hier erkläre ich wie das technisch funktioniert und wo die Grenzen liegen.
Das Grundprinzip
Ein Foto einer Fassade enthält alle geometrischen Informationen — aber in Pixeln, nicht in Metern. Um von Pixeln auf echte Maße zu kommen, brauchst du zwei Dinge: eine KI die einzelne Elemente erkennt und voneinander trennt, und ein Referenzmaß das die Umrechnung ermöglicht.
Das Referenzmaß ist der Schlüssel. Wenn du weißt dass eine Standardtür 2,10m hoch ist, und die Tür im Foto 400 Pixel hoch ist, dann ist 1 Pixel = 5,25mm. Von dort aus kannst du jedes andere Element im Foto berechnen.
Die Multi-Modell-Kaskade
SignPilot nutzt nicht ein KI-Modell sondern vier — hintereinander geschaltet. Jedes Modell hat eine Aufgabe:
DINO 1.5 Pro erkennt was auf dem Foto ist: Fenster, Türen, Schilder, Wände. Es liefert Bounding Boxes — Rechtecke die ungefähr zeigen wo ein Objekt ist.
Grounding DINO verfeinert die Lokalisierung. Es versteht Text-Prompts wie "alle Glasflächen" und findet die exakten Positionen.
Gemini 2.5 Flash analysiert den Kontext: Ist das ein Schaufenster oder eine Haustür? Einscheibenverglasung oder Mehrfachverglasung? Diese Information fließt in die Materialempfehlung.
SAM 3 (Segment Anything Model) ist das Herzstück. Es erzeugt pixelgenaue Polygone — keine Rechtecke. Ein Fenster mit Rundbogen wird als Polygon mit 30+ Punkten erfasst, nicht als Rechteck das zu viel oder zu wenig Fläche einschließt.
Praxisbeispiel: Schaufensterfront mit 4 Fenstern und Tür
Du stehst vor einer Bäckerei. 4 Schaufenster, 1 Eingangstür mit Glaseinsatz. Klassiches Sichtschutz-Projekt.
Schritt 1: Foto machen. Normal mit dem Smartphone, möglichst frontal. Kein Stativ, kein Spezialgerät.
Schritt 2: In SignPilot öffnen. Auf ein Fenster tippen. Die KI erkennt sofort alle 4 Fenster und die Tür als separate Polygone. Dauer: 5-15 Sekunden je nach Serverauslastung.
Schritt 3: Referenzmaß setzen. Du klickst auf die Tür und gibst ein: Höhe 2,10m. Jetzt werden alle anderen Elemente automatisch berechnet.
Schritt 4: Sprach-Annotation. Du diktierst: "Fenster 1 bis 4: Milchglasfolie 3M Crystal. Tür: Öffnungszeiten Plotschrift weiß." Die KI ordnet die Materialien den Flächen zu.
Ergebnis: Eine SVG-Skizze mit allen Maßen, Flächenangaben und Material-Zuordnungen. Export als PDF. Dauer gesamt: unter 2 Minuten. Klassisch mit Zollstock und Zettel: 45 Minuten bis 1,5 Stunden.
Genauigkeit: ±5%
Die ehrliche Antwort: KI-Aufmaß ist nicht millimetergenau. Die Genauigkeit liegt bei ±5%, abhängig von der Perspektive des Fotos, der Bildqualität und der Entfernung. Ein Fenster das in Wirklichkeit 152cm breit ist, wird als 145-160cm erkannt.
Für Angebote ist das ausreichend. Du kalkulierst ohnehin mit Sicherheitszuschlag. Für die Produktion — wenn du die Folie zuschneidest — misst du vor Ort nochmal nach. Aber die Nachfahrt zum Nachmessen eines vergessenen Maßes fällt komplett weg, weil du alle Maße im System hast.
Perspektiv-Korrektur
Wenn du nicht exakt frontal fotografierst (und das tut niemand), entstehen perspektivische Verzerrungen. Elemente am Rand des Fotos erscheinen schmaler als in der Mitte. SignPilot korrigiert leichte Perspektivfehler automatisch. Bei starker Schrägansicht (mehr als 20°) empfehlen wir ein zweites Foto.
Was nicht funktioniert
Verdeckte Flächen: Wenn ein Baum vor dem Fenster steht, kann die KI das Fenster nicht erkennen. Nacht-Aufnahmen: Zu wenig Kontrast für zuverlässige Erkennung. Stark reflektierende Fassaden: Spiegelungen verwirren die Segmentierung. In diesen Fällen nutzt du die manuelle Draw-and-Snap-Funktion — du zeichnest die Polygone selbst auf dem Foto.
Fazit
KI-Aufmaß ersetzt nicht den Fachmann — es ersetzt den Zollstock beim Erstaufmaß. Die Zeitersparnis liegt bei 80-90% pro Fassade. Keine vergessenen Maße, keine unleserlichen Zettel, keine Nachfahrten. Und das Wichtigste: Der manuelle Fallback funktioniert immer. Produktdesign schlägt Modell-Hoffnung.