Jesteśmy online +48 784 515 798

Przeszukiwanie treści multimedialnych 

Przeszukiwanie treści multimedialnych należy do najbardziej efektywnych zastosowań rozpoznawania mowy. Dzięki automatycznemu rozpoznawaniu tekstu nagrań oraz ich indeksacji można uzyskać dostęp do informacji zawartych w nagraniu bez konieczności przesłuchania go. Możliwość ta jest szczególnie cenna w dzisiejszych czasach, kiedy informacji i nagrań bywa z reguły więcej niż czasu na ich przesłuchanie. Mając tak opracowane archiwum nagrań, nie trzeba przesłuchiwać całego materiału, nie trzeba również ograniczać wyszukiwania do skąpych informacji w postaci kluczowych słów.  

Część językowa

Technologia ta łączy w sobie rozpoznawanie mowy z wyszukiwaniem pełnotekstowym uzupełnionym o narzędzia językowe umożliwiające wyszukiwanie morfologiczne, a także słownik synonimów oraz tłumaczenie maszynowe. Do wyszukiwania treści można użyć głosu. 

Rozwiązanie softwarowe

W przypadku wszystkich efektywnie działających wyszukiwarek najpierw przebiega proces indeksacji, który umożliwia wyszukiwanie haseł z wykorzystaniem utworzonych indeksów. Kluczowym komponentem tej technologii jest detektor mowy, który przetwarza dźwięk na tekst (w przypadku niejednoznacznego wyniku rozpoznania również tekst może być niejednoznaczny). Następnie przebiega obróbka tekstu poprzedzająca proces indeksacji (wytworzenie indeksu), np. przetworzenie wyrazu do formy podstawowej lub języka, w którym będzie zestawiony indeks. Potem wyrazy są indeksowane, dzięki czemu treść może zostać wyszukana na podstawie zadanego pytania. 

Rozpoznawanie jest stosunkowo wymagające sprzętowo, dlatego osiągi obliczeniowe sprzętu muszą być ustawione tak, żeby umożliwiły dostatecznie szybkie przetwarzanie indeksów na tekst. Czas wymagany do opracowania zapisu jest ułamkiem czasu potrzebnym do jego odtworzenia w normalnej prędkości. Większa ilość jąder umożliwia paralelną obróbkę materiału. W przypadku większego obciążenia zaleca się umieścić detektory na dedykowanych serwerach o odpowiednich parametrach. Pozostałe procesy przebiegają zdecydowanie prędzej. W trakcie wyszukiwania przy dużym obciążeniu przeszkodą może być niska prędkość odczytu z dysku. Tego problemu można uniknąć korzystając z szybkich dysków, najlepiej SSD.