Jesteśmy online +48 784 515 798

Automatyczne dzielenie wyrazów

Najstarszy, najmniejszy, mimo to najbardziej efektywny. W ten sposób można w skórcie charakteryzować nasz moduł automatycznego dzielenia wyrazów na końcu wiersza. Niezbędny do pracy w systemach DTP w trakcie składania tekstu. Obecnie znajduje zastosowanie w bardziej zaawansowanych modelach e-booków.

Część językowa

Moduł dzielenia wyrazów nie korzysta z obszernego słownika, ale ze zbioru starannie wybranych wzorów, dzięki czemu nie obciąża pamięci urządzenia, i tak np. kompletny zbiór wzorów dzielenia polskich wyrazów zajmuje tylko 30 kB pamięci, jednocześnie osiągając skuteczność 99,92 %. Oprócz tradycyjnego zasobu słownictwa języka polskiego, moduł rozpoznaje wyrazy pochodzenia obcego (cy-to-pla-z-ma, spek-t-ro-skopsoft-ware, play-boy itd.) oraz niejednoznaczne polskie wyrazy (pod-ro-bić w znaczeniu sfałszować, ale po-dro-bić w znaczeniu pokruszyć). Uwzględnia takie zasady jak niedzielenie liter oznaczających jedną głoskę ( cie-szyć, a nie cies-zyć) czy granicę pomiędzy przedrostkiem (przed-nie-, roz-, …) a rdzeniem wyrazu (np. roz‑mowa, przed-kła-dać).

Rozwiązania softwarowe 

Program do dzielenia wyrazów jest zaprojektowany w ten sposób, aby rozpoznawał wszystkie możliwości dzielenia danego słowa. W odróżnieniu od prostych algorytmów dzielących nie ogranicza się wyłącznie do bezpiecznego określenia niektórych możliwości dzielenia. Częścią rozwiązania jest wyjątkowo efektywny algorytm wyszukujący wzory i informacje odnośnie dzielenia. Szybkość wyszukiwania wszystkich wzorów dla danego wyrazu zależy wyłącznie od jego długości, a nie od liczby możliwych wzorów. Zarazem dzięki zastosowanej strukturze słownika wzorów algorytm ten jest wyjątkowo prosty, a więc łatwy do zaaplikowania w jakimkolwiek produkcie.

Dostępne funkcje

Oferujemy moduł dzielenia wyrazów dla wielu światowych języków (zob. tabelka) oraz platform.

Referencje

Dzielenie wyrazów firmy Lingea jest stosowane w programie Adobe InDesign, czyli najpopularniejszym systemie składania książek i innych publikacji oraz we wszystkich programach Microsoft Office (Word, PowerPoint i inne). Jakość naszego algorytmu została doceniona również przez wydawców największych czeskich dzienników MF Dnes i Lidové noviny.