OpenAI lanserar nya röstmodeller: person använder röst-AI i en modern arbetsmiljö.

OpenAI lanserar nya röstmodeller som kan översätta och skriva av i realtid

OpenAI har presenterat tre nya röstmodeller i sitt API: en modell för samtal i realtid, en för liveöversättning och en för löpande tal-till-text. Tillsammans ska de göra det enklare att bygga tjänster som lyssnar, svarar och översätter medan en person pratar.

Vad betyder OpenAI lanserar nya röstmodeller?

Den största nyheten är GPT-Realtime-2, som enligt OpenAI kan hantera mer avancerade frågor och hålla igång ett samtal mer naturligt. Det betyder att AI-baserade röstdialoger kan bli mindre hackiga och bättre på att följa med när en användare ändrar ämne eller lägger till nya detaljer.

OpenAI har också släppt GPT-Realtime-Translate, som är byggd för att översätta tal direkt i samtal. Företaget säger att modellen klarar över 70 språk in och 13 språk ut. För användaren kan det i praktiken betyda smidigare kundtjänst, möten eller appar där människor som inte talar samma språk ändå kan förstå varandra i realtid.

Den tredje modellen, GPT-Realtime-Whisper, är en strömmande tal-till-text-modell. Den skriver ner det som sägs allt eftersom, i stället för att vänta tills någon har pratat klart. Det kan vara användbart i mötesverktyg, diktering och andra tjänster där snabb transkribering spelar roll.

För vanliga användare märks sådana här nyheter oftast indirekt, när utvecklare bygger in funktionen i appar och tjänster. Men riktningen är tydlig: röst-AI blir mer som ett löpande samtal och mindre som en knapp som väntar på färdiga kommandon.

Källor

Läs också

Ämnen i artikeln

AI-stödd text. Granskad, faktakontrollerad och redigerad av redaktionen.

Andra intressanta sidor att läsa

AI-Nyheter, Nyheter om AI | gptai.se
AI-nyheter
AI-nyheter: Håll dig uppdaterad i utvecklingen Världen av artificiell intelligens förändras snabbt!...
AI och etik
AI och etik – risker och möjligheter
AI och etik – risker och möjligheter Artificiell intelligens (AI) utvecklas snabbt och påverkar många...
Hur fungerar AI
Hur fungerar AI?
Hur fungerar AI? AI (artificiell intelligens) är som en smart assistent som kan förstå, analysera och...

Fler nyheter

OpenAI gör Codex mer användbart för fler än utvecklare: digital arbetsmiljö med AI-verktyg på flera skärmar.
OpenAI gör Codex mer användbart för fler än utvecklare
OpenAI har uppdaterat sitt verktyg Codex så att det inte bara riktar sig till programmerare. Nya funktioner...
Nvidia visar ny referensplattform för humanoida robotar: humanoid robot i forskningslaboratorium.
Nvidia visar ny referensplattform för humanoida robotar
Nvidia har presenterat en ny öppen referensdesign för humanoida robotar som ska göra det enklare för...
OpenAI vill få tydligare regler för avancerad AI i USA: dokument och digitala AI-symboler i en lagstiftningsmiljö.
OpenAI vill få tydligare regler för avancerad AI i USA
OpenAI har lagt fram ett förslag om hur USA kan bygga ett mer samlat system för att styra utvecklingen...
Google gör AI-läget i sök mer tillgängligt för fler: en mobil och skärm som illustrerar AI i sök.
Google gör AI-läget i sök mer tillgängligt för fler användare
Google fortsätter att bygga in AI djupare i sin sökfunktion. I en ny uppdatering berättar bolaget om...
Rulla till toppen