Huis Ontwikkeling Wat is tekst naar spraak (tts)? - definitie van techopedia

Wat is tekst naar spraak (tts)? - definitie van techopedia

Inhoudsopgave:

Anonim

Definitie - Wat betekent Text to Speech (TTS)?

Tekst naar spraak (TTS) is een natuurlijk taalmodelleringsproces waarbij teksteenheden moeten worden veranderd in eenheden van spraak voor audiopresentatie. Dit is het tegenovergestelde van spraak naar tekst, waarbij een technologie gesproken woorden opneemt en deze nauwkeurig probeert op te nemen als tekst. Tekst naar spraak is nu gebruikelijk in technologieën die proberen audio-uitvoer van digitale tekst weer te geven om diegenen te helpen die niet kunnen lezen, of voor andere soorten gebruik.

Techopedia verklaart Text to Speech (TTS)

Het ontwikkelen van tekst-naar-spraakmogelijkheden omvat enkele unieke uitdagingen. Vooral in de Engelse taal, waar een groot aantal homoniemen verschillende uitspraken hebben, vertrouwen computerprogramma's op waarschijnlijkheidsmodellering om de gewenste uitspraak van een woord in digitale tekst te raden. Het programma moet ook teksteenheden omzetten in fonemen, de kleinste eenheden van spraakuitspraak. Het resultaat is dat veel tekst-naar-spraaktechnologieën minder dan onfeilbaar zijn, hoewel ontwikkelaars gedurende meerdere jaren enorme vooruitgang hebben geboekt op deze technologieën.


In de loop van de tijd hebben experts enkele best practices voor de ontwikkeling van TTS waargenomen. Deze omvatten foneembases en concatenatieve benaderingen met voorspellende analyses. De beste programma's kunnen ook werken met minimale geheugenvereisten en zijn eenvoudig in te stellen. Ontwikkelaars blijven werken aan TTS-bronnen voor elke taal, door de grote uitdagingen van dubbelzinnigheid en andere obstakels voor een nauwkeurigere weergave heen.

Wat is tekst naar spraak (tts)? - definitie van techopedia