OpenAI lanserar nya röstmodeller: person använder röst-AI i en modern arbetsmiljö.

OpenAI lanserar nya röstmodeller som kan översätta och skriva av i realtid

OpenAI har presenterat tre nya röstmodeller i sitt API: en modell för samtal i realtid, en för liveöversättning och en för löpande tal-till-text. Tillsammans ska de göra det enklare att bygga tjänster som lyssnar, svarar och översätter medan en person pratar.

Vad betyder OpenAI lanserar nya röstmodeller?

Den största nyheten är GPT-Realtime-2, som enligt OpenAI kan hantera mer avancerade frågor och hålla igång ett samtal mer naturligt. Det betyder att AI-baserade röstdialoger kan bli mindre hackiga och bättre på att följa med när en användare ändrar ämne eller lägger till nya detaljer.

OpenAI har också släppt GPT-Realtime-Translate, som är byggd för att översätta tal direkt i samtal. Företaget säger att modellen klarar över 70 språk in och 13 språk ut. För användaren kan det i praktiken betyda smidigare kundtjänst, möten eller appar där människor som inte talar samma språk ändå kan förstå varandra i realtid.

Den tredje modellen, GPT-Realtime-Whisper, är en strömmande tal-till-text-modell. Den skriver ner det som sägs allt eftersom, i stället för att vänta tills någon har pratat klart. Det kan vara användbart i mötesverktyg, diktering och andra tjänster där snabb transkribering spelar roll.

För vanliga användare märks sådana här nyheter oftast indirekt, när utvecklare bygger in funktionen i appar och tjänster. Men riktningen är tydlig: röst-AI blir mer som ett löpande samtal och mindre som en knapp som väntar på färdiga kommandon.

Källor

Läs också

Ämnen i artikeln

AI-stödd text. Granskad, faktakontrollerad och redigerad av redaktionen.

Andra intressanta sidor att läsa

AI-Nyheter, Nyheter om AI | gptai.se
AI-nyheter
AI-nyheter: Håll dig uppdaterad i utvecklingen Världen av artificiell intelligens förändras snabbt!...
AI-hälsa
AI och hälsa
AI och hälsa: Så förändrar artificiell intelligens sjukvården Artificiell intelligens håller på att...
AI-ordlista | gptai.se
AI-ordlista
AI-ordlista – 40 viktiga begrepp för nybörjare Här är en enkel AI-ordlista med 40 viktiga begrepp som...

Fler nyheter

Google gör Gemini till mer än en chattbot: person använder AI-assistent på dator och mobil i en kontorsmiljö.
Google gör Gemini till mer än en chattbot
Google har presenterat flera nya Gemini-funktioner som gör assistenten mer praktisk i vardagen. Nyheterna...
Google gör Gemini mer hjälpsam i vardagen: person använder en AI-assistent i mobilen på morgonen.
Google gör Gemini mer hjälpsam i vardagen
Google uppdaterar sin Gemini-app med en ny snabböversikt, ett omarbetat gränssnitt och en ny videomodell....
Malta ger invånarna gratis ChatGPT Plus: person använder AI-verktyg i en vardaglig miljö på Malta
Malta ger invånarna gratis ChatGPT Plus efter AI-kurs
Malta blir första landet som kopplar gratis ChatGPT Plus till en utbildning i AI-kunskap. För att få...
EU:s AI-lag får nya vägledningar inför nästa steg: personer granskar AI-regler i ett kontorsrum.
EU:s AI-lag får nya vägledningar inför nästa steg
EU-kommissionen har publicerat nya frågor och svar om hur AI-lagen ska förstås i praktiken. Samtidigt...
Rulla till toppen
GPTAI - artificiell intelligens
Översikt

Denna webbplats använder cookies för att ge dig den bästa möjliga användarupplevelsen. Cookie-information lagras i din webbläsare och används för att känna igen dig när du återvänder till webbplatsen samt för att hjälpa vårt team att förstå vilka delar av webbplatsen du tycker är mest intressanta och användbara.