Zum Hauptinhalt springen

Voice System Übersicht

Das Voice System ist das Herzstück von JustCall. Es ermöglicht natürliche Telefonbestellungen durch KI.

Komponenten

Flow eines Anrufs

  1. Eingehender Anruf: Twilio empfängt Anruf und ruft twilio-incoming Edge Function
  2. Session erstellen: Edge Function erstellt call_session und gibt TwiML zurück
  3. Media Stream: Twilio verbindet WebSocket zum Voice Server
  4. OpenAI Verbindung: Voice Server verbindet zu OpenAI Realtime API
  5. Konversation: Audio wird bidirektional gestreamt
  6. Tool Calls: OpenAI ruft Tools auf (Menu, Delivery, Order)
  7. Bestellung speichern: Worker verarbeitet Order via Redis Queue
  8. Anruf beenden: Goodbye-Nachricht und Hangup

Wichtige Dateien

DateiBeschreibung
voice-server/src/index-unified.tsHauptserver
voice-server/src/openai-client.tsOpenAI Integration
voice-server/src/tool-client.tsTool Execution
voice-server/src/worker.tsBackground Worker
supabase/functions/twilio-incoming/TwiML Generator

Konfiguration pro Restaurant

Jedes Restaurant kann eigene Voice-Einstellungen haben:

SettingBeschreibungDefault
voiceOpenAI Stimme (alloy, echo, cedar, etc.)cedar
transcription_modelWhisper Modellwhisper-1
voice_modeopenai, hybrid, deepgramopenai
logging_levelnormal, debug, verbosenormal