Werbetechniker arbeiten mit den Händen. Auf der Baustelle, auf der Leiter, am Auto, am Drucker. Tippen auf einem Smartphone ist in dieser Realität keine Option. Schmutzige Handschuhe, Werkzeug in der Hand, Regen, Kälte — das sind die Bedingungen unter denen Informationen erfasst werden müssen.

Trotzdem tippt die Branche. Oder schlimmer: schreibt auf Zettel. Der Audio-First-Workflow in SignPilot dreht das um. Du sprichst — die KI macht den Rest.

Das Zettel-Problem

Jeder Werbetechniker kennt das: Du stehst vor der Fassade, der Kunde erzählt was er will. Du schreibst auf einen Zettel. "3x Fenster MiGla, 1x Tür ÖZ weiß, Mo inkl." Zurück im Büro: Was bedeutet "MiGla"? Milchglasfolie oder Milchglas? War es 3M oder Oracal? Und ist das eine 3 oder eine 8?

Dazu kommen Fotos. 47 Fotos auf dem Smartphone, irgendwo zwischen dem Mittagessen-Foto und den Urlaubsbildern. Welches Foto gehört zu welchem Auftrag? Welches zeigt die linke Seite, welches die rechte?

So funktioniert Audio-First

Schritt 1: Memo erstellen

In SignPilot öffnest du ein neues Memo. Du siehst drei Optionen: Text, Audio, Foto. Du wählst Audio.

Schritt 2: Diktieren

Du drückst den Aufnahme-Button und sprichst. Frei, ohne Formular, ohne Struktur. "Bäckerei Müller, Hauptstraße 12, Saarbrücken. 4 Schaufenster, circa 150 mal 110. Milchglasfolie, der Kunde will 3M Crystal. Eingangstür soll Öffnungszeiten bekommen, weiße Plotschrift. Montage am Donnerstag, der Kunde hat morgens bis 11 zu, dann können wir rein. Ansprechpartner ist Herr Müller selbst, Handy steht im Kontakt."

Aufnahme stoppen. 30 Sekunden. Das war's.

Schritt 3: Fotos zuordnen

Du machst 3-4 Fotos: Gesamtansicht der Fassade, Detail der Fenster, die Eingangstür, eventuell ein Problem (Rollladen der im Weg ist). Jedes Foto wird als Snippet dem Memo zugeordnet — automatisch georeferenziert und mit Zeitstempel.

Schritt 4: KI transkribiert

Whisper (OpenAI) transkribiert die Aufnahme in Text. 95%+ Genauigkeit, selbst bei Hintergrundlärm. Die KI erkennt automatisch: Kundenname (Bäckerei Müller), Adresse (Hauptstraße 12, Saarbrücken), Materialien (Milchglasfolie, 3M Crystal, Plotschrift), Maße (150x110cm), und Termin-Infos (Donnerstag ab 11).

Das Memo wird strukturiert: Kontaktdaten, Positionen, Materialien, Termine. Aus dem Freitext-Diktat wird ein sauberes Auftrags-Dokument.

Schritt 5: Vom Memo zum Angebot

Ein Klick: "KI-Angebot generieren." Die KI nimmt die erkannten Positionen, kalkuliert mit Marktpreisen, generiert die Preisbegründung und erstellt ein PDF. Du prüfst, passt bei Bedarf an, und versendest.

Gesamtzeit vom Parkplatz vor der Bäckerei bis zum versendeten Angebot: unter 5 Minuten.

Fassaden-Sketch

Für komplexe Fassaden bietet SignPilot einen SVG-Sketch direkt im Memo. Du zeichnest eine vereinfachte Ansicht der Fassade — Rechtecke für Fenster, Linien für Fassadenkanten — und ordnest jedem Element das diktierte Material zu. Das ist kein CAD-Programm und soll es nicht sein. Es ist eine schnelle Skizze die dem Büro zeigt was gemeint ist.

Offline-Fähigkeit

Auf der Baustelle hast du nicht immer Empfang. Die Audio-Aufnahme und die Fotos werden lokal gespeichert und synchronisiert sobald wieder Netz da ist. Die KI-Transkription und Kalkulation passieren serverseitig — dafür brauchst du Netz. Aber die Erfassung funktioniert offline. Du verlierst keine Aufnahme weil du im Keller stehst.

Warum nicht einfach eine Notiz-App?

Könntest du auch die Sprachmemo-App deines iPhones nutzen? Ja. Aber dann hast du eine Audiodatei — keine strukturierten Daten. Du musst die Aufnahme nochmal anhören, die Infos abtippen, ein Angebot erstellen, Materialpreise nachschlagen. Das dauert genauso lang wie der Zettel.

Der Unterschied bei SignPilot: Die Transkription ist der erste Schritt einer automatisierten Pipeline. Sprache → Text → Positionen → Kalkulation → PDF → Versand. Jeder Schritt fließt in den nächsten. Das ist kein Voice-Memo — das ist ein Voice-to-Quote-Workflow.

Praxis-Tipps

Sprich Materialbezeichnungen aus: "3M Crystal Milchglasfolie" statt "MiGla". Die KI erkennt Markennamen besser als Abkürzungen.

Nenne Maße mit Einheit: "150 Zentimeter mal 110 Zentimeter" statt "eins-fünfzig mal eins-zehn". Zahlen mit Einheit werden zuverlässiger erkannt.

Ein Memo pro Auftrag: Nicht alles in ein Endlos-Memo diktieren. Ein Memo pro Baustelle hält die Zuordnung sauber.

Fotos zuerst: Mach die Fotos bevor du diktierst. Dann siehst du beim Diktieren die Fotos als Referenz.

Fazit

Der Audio-First-Workflow passt zur Realität. Hände beschäftigt, Schreibtisch weit weg, Zeit knapp. Statt abends im Büro Angebote zu tippen, diktierst du auf dem Parkplatz und das Angebot ist raus bevor du den Motor startest. Das ist keine Zukunftsmusik — das funktioniert heute, auf jedem Smartphone, ohne App-Download.