Noile modele de speech-to-text, „gpt-4o-transcribe” și „gpt-4o-mini-transcribe”, înlocuiesc modelul Whisper, care avea tendința de a inventa cuvinte și pasaje întregi, conform Techcrunch.
Harris de la OpenAI susține că aceste modele sunt „mult îmbunătățite” și nu mai halucinează atât de mult.
Totuși, dacă vorbiți în limbi precum Tamil sau Telugu, ghinion – modelul greșește aproximativ 3 din 10 cuvinte în aceste limbi.
Spre deosebire de Whisper, OpenAI nu planifică să facă noile modele disponibile în open source. Motivul invocat: sunt „prea mari” pentru a rula local.
Astfel, dezvoltatorii vor trebui să folosească exclusiv API-ul companiei pentru a accesa aceste tehnologii.
Articolul OpenAI lansează modele AI de transcriere și generare vocală mult mai bune apare prim...