CTO Matthias Gruber erklärt den Aufbau: "Zwar nutzen wir marktübliche LLMs als eine von vielen Komponenten, doch der eigentliche technologische Kern von fonio.ai liegt in der komplexen Infrastruktur und den speziell entwickelten Schnittstellen rundherum“. Anders als bei anderen Anwendungen, ist hier die Reaktionsgeschwindigkeit wichtig für die Akzeptanz bei den Nutzerinnen und Nutzern: „Für uns ist nicht die Größe des Sprachmodells entscheidend, sondern eine extrem niedrige Latenz, die wir laufend optimieren – denn Anrufende verzeihen keine Verzögerung." Mittlerweile dauert es nur 0,9 Sekunden, bis die KI auf einen gesprochenen Satz antwortet: „Das ist die geringste Latenz im gesamten DACH-Raum“.

Optimiert wird laufend, und Anfang April geht die zweite Produktgeneration an den Start: „Sie kann nun bis zu 15 Anrufe gleichzeitig entgegennehmen“, sagt Gruber. „Fallen im Gespräch bestimmte Schlüsselworte, werden die Anliegen automatisch an die richtigen Personen im Vertrieb oder Wartung per E-Mail weitergereicht, die dann in ruhigeren Momenten zurückrufen“, so Gruber. „Wir sind die erste Firma weltweit, deren KI am Telefon E-Mail-Adressen auf Deutsch verstehen kann – das ist unglaublich schwer“.