Bachelor-Demonstrator · THA

AI Voice-Agents.
Live im Browser.

Name: voiceagent
Author: Philipp Schmid

Drei Demos. Vier Connectoren. Echte Tool-Calls auf echte Daten.

Architektur ansehen

Voice-Agent · Live-DemoKlicke zum Sprechen

Klicke zum Sprechen

Erst Berechtigungen erteilen, dann sprechen.

Stack im Überblick

Was kann voiceagent?

Sechs Bausteine bilden den vollständigen Demonstrator — vom Audio-Capture bis zur Eval-CSV.

Voice-Pipeline

Whisper-STT, Claude Opus 4.7 als Reasoning-Layer, ElevenLabs Multilingual v2 für die Stimme. Sub-Sekunden-Round-Trip im Browser.

MCP-Connectoren

Mock-Shop, Demo-ERP, Calendar-Stub und produktives Gmail-OAuth. Alle Tools laufen über das Model-Context-Protocol.

Flow-Builder

Visueller Prozess-Graph mit Tool-Permissions je Knoten. Vorkonfigurierte Demo-Flows pro Branche.

Live-Activity-Feed

Jeder Tool-Call wird via SSE in Echtzeit gestreamt: Shop, ERP, Mailbox und Calendar sehen Agent-Aktionen sofort.

NPS + Latenz + WER

Eval-Modul mit Net-Promoter-Score, End-to-End-Latenz und Word-Error-Rate. CSV-Export für die BA-Auswertung.

Open-Source-Stack

Next.js 16, Prisma 7, Tailwind v4, shadcn/ui, Postgres. Quellcode offen — keine Black-Box-Abhängigkeit.

Drei Demo-Strecken

Drei Branchen, ein Stack

Jede Demo läuft in einem eigenen Backend-Mock — der Agent ruft echte Tool-Endpoints auf, die Daten persistieren in der Demo-DB.

#1042Schmid GmbHVersandt

#1041Mayer KGRetoure

#1039Bauer AGOffen

E-Commerce

Shop

Demoshop mit echten Bestellungen, Storefront-Admin und Voice-Agent.

Demo öffnen

Mi · 10:00BeratungFrei

Mi · 11:30Vor-OrtBelegt

Mi · 14:00CallFrei

Dienstleister

Kalender

Live-Terminbuchung mit Voice-Booking — der Agent schlägt Slots vor und bestätigt per Mail.

Demo öffnen

Reklamation #1041info@kunde.deNeu

Auftrag bestätigenralf@mayer.deAntwort

Rückfrage Lieferterminbuero@bauer.deOffen

B2B-Mittelstand

Mail / ERP

B2B-Service-Mailbox und Auftrags-ERP. Ticket-Anlage und Eskalation direkt aus dem Voice-Call.

Demo öffnen

Über voiceagent

Bachelor-Demonstrator zum praktischen Einsatz von AI-Voice-Agents im Mittelstand. Hosted auf Hetzner Cloud, entstanden im Rahmen einer Bachelorarbeit an der Technischen Hochschule Augsburg (THA).

Autor: Philipp Schmid · Mehr

Stack: Next.js 16, Tailwind v4, shadcn/ui, Lucide, React

LLM: Claude Opus 4.7 mit MCP-Tool-Calling

Sprache: ElevenLabs Conversational + OpenAI Whisper

Daten: PostgreSQL via Prisma 7

6MCP-Tools

30Test-Calls

<800 msZiel-Latenz

€40 / MonatHard-Cap

AI Voice-Agents.Live im Browser.

Was kann voiceagent?

Voice-Pipeline

MCP-Connectoren

Flow-Builder

Live-Activity-Feed

NPS + Latenz + WER

Open-Source-Stack

Drei Branchen, ein Stack

Shop

Kalender

Mail / ERP

Über voiceagent

AI Voice-Agents.Live im Browser.

Was kann voiceagent?

Voice-Pipeline

MCP-Connectoren

Flow-Builder

Live-Activity-Feed

NPS + Latenz + WER

Open-Source-Stack

Drei Branchen, ein Stack

Shop

Kalender

Mail / ERP

Über voiceagent

AI Voice-Agents.
Live im Browser.

AI Voice-Agents.
Live im Browser.