AI zaczyna mówić jak człowiek. Google wprowadza syntezator mowy

Google zaprezentowało nowy model sztucznej inteligencji do generowania mowy – Gemini 3.1 Flash TTS. To kolejny krok w rozwoju technologii text-to-speech (TTS), który ma nie tylko poprawić jakość generowanego dźwięku, ale także zwiększyć kontrolę nad sposobem, w jaki AI "mówi".

Kinga Walczyk

06:35, 19.04.2026

AI zaczyna mówić jak człowiek. Google wprowadza syntezator mowy

fot. Arthur Osipyan; Unsplash

Kinga Walczyk

06:35, 19.04.2026

POLECAMY

Wydawcy

"Polska gurom". Pieniądze, wpływy i zasięgi. Kto dziś naprawdę robi to dobrze?

Tomasz Terlikowski: Mam parcie na szkło

Od 15 do ponad 100 zł za Netfliksa. Wielkie porównanie cen platform

Influencer Adam Mirek: Chwała rodzicom, którzy nie dają dzieciom telefonów

Jednym z głównych założeń Gemini 3.1 Flash TTS jest osiągnięcie maksymalnie naturalnego brzmienia. Według oficjalnych informacji Google, model generuje mowę bardziej realistyczną niż wcześniejsze rozwiązania, lepiej odwzorowując intonację, emocje i rytm ludzkiej wypowiedzi.

To oznacza, że generowane nagrania mogą być trudniejsze do odróżnienia od prawdziwego głosu, co ma znaczenie m.in. w produkcji audiobooków, podcastów czy systemach asystentów głosowych.

Precyzyjna kontrola nad głosem

Największą innowacją w Gemini 3.1 Flash TTS ma być możliwość bardzo szczegółowego sterowania sposobem mówienia. Użytkownicy mogą korzystać z tzw. audio tagów, które pozwalają określić emocje, tempo czy styl wypowiedzi bezpośrednio w tekście. Przykładowo, możliwe jest dodanie znaczników takich jak: szept, radość, złość, pauzy.

Model obsługuje ponad 200 takich tagów, co ma osiągać niespotykany dotąd poziom kontroli nad generowanym dźwiękiem.

Jak retail media podbijają reklamę [wywiad]

Wielojęzyczność i różnorodność głosów

Gemini 3.1 Flash TTS wspiera ponad 70 języków i wariantów regionalnych. Dodatkowo oferuje kilkadziesiąt predefiniowanych głosów, które można dopasować do konkretnego zastosowania.

Model potrafi również generować dialogi z udziałem wielu mówców.

Nowość od Google w ponad 200 krajach. Wyszukiwarka Live w trybie AI

Każde wygenerowane nagranie ma zawierać cyfrowy znak wodny SynthID, który ma umożliwiać identyfikację treści stworzonych przez AI.

Obecnie Gemini 3.1 Flash TTS jest dostępny w wersji testowej poprzez narzędzia takie jak Google AI Studio, Vertex AI oraz API Gemini.

AI zaczyna mówić jak człowiek. Google wprowadza syntezator mowy

Precyzyjna kontrola nad głosem

Jak retail media podbijają reklamę [wywiad]

Wielojęzyczność i różnorodność głosów

PRACA.WIRTUALNEMEDIA.PL

Ponad 2 miliony użytkowników miesięcznie

Redaktor_ka Serwisów Entertainment (Umowa na zastępstwo)

Programming Manager

Specjalista/Specjalistka ds. Analiz Rynku

Analityk ramówki telewizyjnej

Kierowniczka / Kierownik Produkcji Telewizyjnej

Dziennikarz/Dziennikarka serwisu „Zdrowie, Medycyna, Ochrona Zdrowia”

Dokumentalista-tka/Redaktor-ka

Wydawca / Wydawczyni

Dziennikarz informacyjny/ Dziennikarka informacyjna

NAJNOWSZE WIADOMOŚCI

Podatek cyfrowy coraz bliżej. "Nie dotyczy żadnego konkretnego państwa"

Wokalistka i dziennikarka radiowa kolejną uczestniczką "Tańca z gwiazdami"

Awaria Facebooka za nami. "Konto tymczasowo niedostępne"

Tego jeszcze nie było. Szykuje się najdłuższa przerwa w finale w historii. Wystąpią gwiazdy

TVP stawia na YouTube. Trafił tam "Teleexpress" TVP1

Dlaczego rynek SPF zmienia się szybciej niż rynek kremów przeciwzmarszczkowych?

Rolniczy król TikToka. Kołodziejczak prostymi środkami robi viral za viralem

AI zaczyna mówić jak człowiek. Google wprowadza syntezator mowy

Precyzyjna kontrola nad głosem

Jak retail media podbijają reklamę [wywiad]

Dołącz do newslettera Wirtualne Media!

Dziękujemy za zapisanie się do newslettera Wirtualne Media

Wielojęzyczność i różnorodność głosów

PRACA.WIRTUALNEMEDIA.PL

Ponad 2 miliony użytkowników miesięcznie

Redaktor_ka Serwisów Entertainment (Umowa na zastępstwo)

Programming Manager

Specjalista/Specjalistka ds. Analiz Rynku

Analityk ramówki telewizyjnej

Kierowniczka / Kierownik Produkcji Telewizyjnej

Dziennikarz/Dziennikarka serwisu „Zdrowie, Medycyna, Ochrona Zdrowia”

Dokumentalista-tka/Redaktor-ka

Wydawca / Wydawczyni

Dziennikarz informacyjny/ Dziennikarka informacyjna

NAJNOWSZE WIADOMOŚCI

Podatek cyfrowy coraz bliżej. "Nie dotyczy żadnego konkretnego państwa"

Wokalistka i dziennikarka radiowa kolejną uczestniczką "Tańca z gwiazdami"

Awaria Facebooka za nami. "Konto tymczasowo niedostępne"

Tego jeszcze nie było. Szykuje się najdłuższa przerwa w finale w historii. Wystąpią gwiazdy

TVP stawia na YouTube. Trafił tam "Teleexpress" TVP1

Dlaczego rynek SPF zmienia się szybciej niż rynek kremów przeciwzmarszczkowych?

Rolniczy król TikToka. Kołodziejczak prostymi środkami robi viral za viralem