Ćwiczenie wymowy
Do niedawna ćwiczenie poprawnej wymowy języka obcego wymagało pomocy lektora. Chociaż jako wzór wymowy można było wykorzystać nagrania rodzimych użytkowników, samodzielne korzystanie z nagrań nie dawało możliwości oceny postępów. Dopiero technologia rozpoznawania mowy z graficzną reprezentacją dźwięku, która uwzględnia granice poszczególnych fonemów umożliwia samodzielną ocenę poprawności wymowy. Jako wzór służy nagranie rodzimego użytkownika, które jest nie tylko odtwarzane w formie audio, ale także przedstawiane graficznie w postaci grafu. Podobny graf jest generowany z wymowy studenta, dzięki czemu obie wymowy można porównać i znaleźć odstępstwa od poprawnej wymowy. Kolejne odtworzenie nagrania daje osobie uczącej się możliwość uświadomienia sobie różnicy między własną a poprawną wymową.
Część językowa
Podstawą działania tej technologii jest detektor mowy, który stara się interpretować rozpoznawany dźwięk zgodnie z podanym zapisem. Wyszukuje części, które są najbardziej podobne do fonemów znajdujących się w zapisie i oznacza ich granice.
Rozwiązanie softwarowe
Detektor jest najbardziej wymagającym elementem technologii, z reguły działa na dedykowanym serwerze. Aplikacja zawiera również prezentację grafu z zaznaczonymi granicami fonemu, animację odtwarzania oraz narzędzie do komunikacji z serwerem.
Dostępne funkcje
Serwer z detektorem
- na wejściu otrzymuje dźwięk oraz jego zapis, w zamian dostarcza lokalizację granic poszczególnych fonemów.
Aplikacja
- wysyła na serwer dźwięk oraz jego zapis,
- wyświetla graf przedstawiający wartości zarejestrowanego dźwięku wraz z wyznaczonymi czasowymi interwałami poszczególnych fonemów,
- animuje kursor grafu podczas odtwarzanie dźwięku.
Systemy operacyjne
Implementacja aplikacji jest możliwa na systemach Windows, Linux, iOS oraz Android, detektor jest dostępny na platformę Linux.