OCR Server

Kompleksowe serwerowe rozwiązanie OCR i konwersji PDF dla firm.

SILVERCODERS OCR Server jest potężnym i kompletnym serwerowym rozwiązaniem automatycznego rozpoznawania tekstu (OCR) i konwersji PDF dla firm. OCR Server umożliwia przeprowadzenie konwersji skanowanych dokumentów do edytowalnych i przeszukiwalnych formatów takich jak plik tekstowy, rtf, pdf, html, zapewniając wysoką jakość rozpoznawania w 189 językach. Dostępny jako aplikacja systemu Linux lub jako niezależna maszyna, z w pełni udokumentowanym API, bardzo dobrą wydajnością i elastycznymi zasadami licencjonowania serwer może stanowić pojedyncze, centralne rozwiązanie OCR dla Twojej firmy. OCR Server został zaprojektowany specjalnie w celu współpracy z systemami zarządzania dokumentami takimi jak SILVERCODERS DocStorage.

Optyczne Rozpoznawanie Znaków

Oprogramowanie, zawierające techniki (procesy), pozwalające zamienić dokument traktowany jako format graficzny (zdjęcie, skan) na plik w formie tekstowej z możliwością edycji.

Pierwsze urządzenie służące do rozpoznawania znaków tekstu powstało na przełomie lat dwudziestych i trzydziestych dwudziestego wieku i zostało opatentowane przez austriackiego naukowca, którego uważa się za jednego z pionierów współczesnych technologii - Gustava Tauscheka. Jego wynalazek wymagał jednak niezwykłej precyzji w zapisie znaków (delikatne odstępstwa od szablonów uniemożliwiały rozpoznanie tekstu). Dziś rozbudowane systemy OCR są znacznie bardziej wydajne i praktyczne: potrafią rozpoznawać układy tabel, znaki w różnych czcionkach, formatach, a nawet tekst pisany odręcznie.

Zasada działania

Dzięki szybkiemu rozwojowi sztucznej inteligencji, a ściślej ujmując dziedziny rozpoznawania wzorców, możliwa jest identyfikacja pisma i znaków na coraz wyższym jakościowo poziomie. Odpowiednio zaprogramowane sieci neuronowe dokonują podziału obrazu wykorzystując np. metody binaryzacji (progowania) w celu odczytania poszczególnych znaków z obrazu, oraz w kolejnym etapie odpowiedniego pogrupowania (np. na poszczególne litery, znaki interpunkcyjne itp.). Rozpoznane znaki zostają poskładane w tekst, który zazwyczaj (w celu wyeliminowania błędów) sprawdzany jest z językowymi bazami danych (słownikami).

Technologia OCR jest stale rozwijana pod kątem dokładności rozpoznawania, aby produkty OCR skierowane na bardziej złożone środowiska, jak np. zdjęcia z aparatów fotograficznych, spełniały swoje zadania (np. aby radziły sobie ze skomplikowanymi tłami, starymi obrazami, niewyraźnym tłem, zagięciami papieru, zniekształconymi obrazami, niską rozdzielczością, siatkami i liniami w tle, tekstem składającym się ze specjalnych czcionek, symboli, słów glosariuszy itp.)

W ostatnich latach, główni dostawcy technologii OCR zaczęli rozwijać dedykowane systemy OCR, każdy dla specjalnych typów obrazów. Łączą one w sobie różne metody optymalizacyjne związane ze specyfiką obrazu w celu poprawy dokładności rozpoznawania (czytanie znaków z kart kredytowych wymaga innych metod niż rozpoznawanie znaków ze słowników, kolorowych obrazów itd.).

Schematyczne (uproszczone) działanie systemów OCR

1. Plik graficzny trafia do programu.

2. Analiza układu (layout) - program wirtualnie dzieli stronę na wygodne do rozpoznawania elementy. Dzieli dostarczony plik graficzny na tekst i inne elementy grafiki, zdjęcia, tabelki itp. Wyodrębniony tekst dzielony jest w następującej kolejności: akapity, zdania, słowa, znaki. Na sam koniec analizy układu OCR zapamiętuje pojedyncze znaki, słowa, zdania, które będą uczestniczyły w późniejszym procesie rozpoznawania.

Proces rozpoznawania znaków - program za pomocą różnych metod identyfikuje znaki. Metody te można podzielić na dwie kategorie:

• rozpoznawanie wzorów (pattern matching) - program porównuje każdy ze znaków ze znakami, które zawiera biblioteka - baza danych z różnymi krojami pisma)

• rozpoznawanie cech (feature matching) - program rozpoznaje cechy znaków, które są niezależne od wielkości czcionki czy kursywy (np. litera Z to trzy linie, z czego dwie są równoległe do siebie, trzecia linia jest ukośna i łączy wierzchołki linii równoległych).

Przykładowe korzyści płynące z zastosowania systemu OCR w przedsiębiorstwie

1. Skomputeryzowanie firm i życia codziennego spowodowało zwiększenie zużycia papieru (zamiast zmniejszyć zużycie): faktury, faksy, oferty, umowy, instrukcje obsługi, materiały gwarancyjne, pisma, artykuły, reklamy - nieraz z ilością takiej dokumentacji papierowej nie może sobie poradzić przeciętne gospodarstwo domowe, a co dopiero firma. Ponadto niektóre dokumenty drukowane są nam potrzebne w wersji elektronicznej lub przynajmniej posiadanie takiej wersji znacznie ułatwiłoby procedury i skróciło czas oczekiwania na realizację jakiejś procedury. Wyliczono natomiast, że jedna osoba przepisująca 2 strony A4 dziennie, w ciągu roku na samym przepisywaniu spędza około 25 dni roboczych (5 tygodni pracy). Wyliczono natomiast, że średniej klasy skaner wraz z systemem OCR jest około 100 razy szybszy niż pisarz z wieloletnim doświadczeniem.

2. Elektroniczny obieg faktur, czy innych dokumentów jest niezwykle wygodnym i korzystnym rozwiązaniem dla firm. Zapobiega możliwości zagubienia dokumentu, długiego przetrzymywania go przez dział lub inną firmę, jego uszkodzenia czy zniszczenia. Wystarczy tylko posortowane dokumenty zeskanować i poddać obróbce przez system OCR.

Podsumowując zastosowanie systemów OCR pozwala zaoszczędzić firmie czas, pieniądze oraz zmniejszyć ryzyko popełnienia błędu (np. przy przepisywaniu dokumentów).

Back to Top