Selle lehe abil saate lasta oma eestikeelset könet sisaldavaid helifaile automaatselt transkribeerida. Transkribeerimisel kasutatakse TTÜ Küberneetika Instituudi foneetika- ja kõnetehnoloogia laboris väljatöötatud tehnoloogiat ja mudeleid.

NB! Transkribeerimine on täisautomaatne: keegi neid salvestusi ei kuula ega transkriptsioone ei loe. Helifailide sisu võidakse aga siiski kasutada uurimisotstarbel, s.t. nende sisu võidakse pisteliselt kuulata, et analüüsida tuvastusvigade tekkimist.

Kuna automaatne transkribeerimine võtab kaua aega (natuke vähem kui helifaili kestus), siis ei saa me tuvastustulemust esitada kohe, vaid saadame selle e-mailile. Tuvastuse kestust võivad mõjutada ka muud tegurid, näiteks see, kui palju on tuvastamist ootavaid faile juba järjekorras.

Helifailis olev kõne peaks olema võimalikult hea kvaliteediga, s.t. lindistatud suu lähedal oleva mikrofoniga müravabas keskkonnas. Helifail peaks olema vähemalt 16-bit kodeeringus ja 16 KHz sagedusega, eelistatult WAV formaadis. Kuna maksimaalne üleslaetava faili suurus on 500 MB, siis võib pikemad WAV-failid kodeerida mp3 või ogg vormingusse, aga soovitav on siis kasutada vähemalt 128 kbit kodeeringut. Mahtu aitab kokku hoida ka stereovormingu muutmine monoks (tuvastuse käigus tehakse seda nagunii).

NB! Süsteem ei tööta hästi kahest tunnist pikemate helifailidega. Selliste failidega võib tuvastus ebaõnnetuda ja tuvastustulemust siis kasutajale ei saadata. Soovitame pikad failid eelnevalt tükeldada.

Lisatud 22.10.2018: Süsteem jookseb nüüd ETAISi poolt pakutavas serveris. Tuvastus peaks nüüd olema kiirem ja töökindlam.

Lisatud 27.06.2013: Kõnetuvastussüsteemi on lähtekood koos kõigi vajalike mudelitega on saadaval siin. See võimaldab installeerida pikkade kõnesalvestuste tuvastussüsteemi oma serverisse. Vajalik Linuxi tundmine.

Tähelepanu: kui kasutate seda süsteemi teadustööks, siis palun viidata oma publikatsioonides alltoodud artiklile (saadaval siin):

Alumäe, Tanel; Tilk, Ottokar; Asadullah. "Advanced Rich Transcription System for Estonian Speech" Baltic HLT 2018.