OCR Server

Optyczne Rozpoznawanie Znaków (OCR)

Optyczne Rozpoznawanie Znaków

Oprogramowanie, zawierające techniki (procesy), pozwalające zamienić dokument traktowany jako format graficzny (zdjęcie, skan) na plik w formie tekstowej z możliwością edycji.

Pierwsze urządzenie służące do rozpoznawania znaków tekstu powstało na przełomie lat dwudziestych i trzydziestych dwudziestego wieku i zostało opatentowane przez austriackiego naukowca, którego uważa się za jednego z pionierów współczesnych technologii - Gustava Tauscheka. Jego wynalazek wymagał jednak niezwykłej precyzji w zapisie znaków (delikatne odstępstwa od szablonów uniemożliwiały rozpoznanie tekstu). Dziś rozbudowane systemy OCR są znacznie bardziej wydajne i praktyczne: potrafią rozpoznawać układy tabel, znaki w różnych czcionkach, formatach, a nawet tekst pisany odręcznie.

Zasada działania

Dzięki szybkiemu rozwojowi sztucznej inteligencji, a ściślej ujmując dziedziny rozpoznawania wzorców, możliwa jest identyfikacja pisma i znaków na coraz wyższym jakościowo poziomie. Odpowiednio zaprogramowane sieci neuronowe dokonują podziału obrazu wykorzystując np. metody binaryzacji (progowania) w celu odczytania poszczególnych znaków z obrazu, oraz w kolejnym etapie odpowiedniego pogrupowania (np. na poszczególne litery, znaki interpunkcyjne itp.). Rozpoznane znaki zostają poskładane w tekst, który zazwyczaj (w celu wyeliminowania błędów) sprawdzany jest z językowymi bazami danych (słownikami).

Technologia OCR jest stale rozwijana pod kątem dokładności rozpoznawania, aby produkty OCR skierowane na bardziej złożone środowiska, jak np. zdjęcia z aparatów fotograficznych, spełniały swoje zadania (np. aby radziły sobie ze skomplikowanymi tłami, starymi obrazami, niewyraźnym tłem, zagięciami papieru, zniekształconymi obrazami, niską rozdzielczością, siatkami i liniami w tle, tekstem składającym się ze specjalnych czcionek, symboli, słów glosariuszy itp.)

W ostatnich latach, główni dostawcy technologii OCR zaczęli rozwijać dedykowane systemy OCR, każdy dla specjalnych typów obrazów. Łączą one w sobie różne metody optymalizacyjne związane ze specyfiką obrazu w celu poprawy dokładności rozpoznawania (czytanie znaków z kart kredytowych wymaga innych metod niż rozpoznawanie znaków ze słowników, kolorowych obrazów itd.).

System OCR

Schematyczne (uproszczone) działanie systemów OCR

1. Plik graficzny trafia do programu.

2. Analiza układu (layout) - program wirtualnie dzieli stronę na wygodne do rozpoznawania elementy. Dzieli dostarczony plik graficzny na tekst i inne elementy grafiki, zdjęcia, tabelki itp. Wyodrębniony tekst dzielony jest w następującej kolejności: akapity, zdania, słowa, znaki. Na sam koniec analizy układu OCR zapamiętuje pojedyncze znaki, słowa, zdania, które będą uczestniczyły w późniejszym procesie rozpoznawania.

Proces rozpoznawania znaków - program za pomocą różnych metod identyfikuje znaki. Metody te można podzielić na dwie kategorie:

• rozpoznawanie wzorów (pattern matching) - program porównuje każdy ze znaków ze znakami, które zawiera biblioteka - baza danych z różnymi krojami pisma)

• rozpoznawanie cech (feature matching) - program rozpoznaje cechy znaków, które są niezależne od wielkości czcionki czy kursywy (np. litera Z to trzy linie, z czego dwie są równoległe do siebie, trzecia linia jest ukośna i łączy wierzchołki linii równoległych).

OCR a firma

Przykładowe korzyści płynące z zastosowania systemu OCR w przedsiębiorstwie

1. Skomputeryzowanie firm i życia codziennego spowodowało zwiększenie zużycia papieru (zamiast zmniejszyć zużycie): faktury, faksy, oferty, umowy, instrukcje obsługi, materiały gwarancyjne, pisma, artykuły, reklamy - nieraz z ilością takiej dokumentacji papierowej nie może sobie poradzić przeciętne gospodarstwo domowe, a co dopiero firma. Ponadto niektóre dokumenty drukowane są nam potrzebne w wersji elektronicznej lub przynajmniej posiadanie takiej wersji znacznie ułatwiłoby procedury i skróciło czas oczekiwania na realizację jakiejś procedury. Wyliczono natomiast, że jedna osoba przepisująca 2 strony A4 dziennie, w ciągu roku na samym przepisywaniu spędza około 25 dni roboczych (5 tygodni pracy). Wyliczono natomiast, że średniej klasy skaner wraz z systemem OCR jest około 100 razy szybszy niż pisarz z wieloletnim doświadczeniem.

2. Elektroniczny obieg faktur, czy innych dokumentów jest niezwykle wygodnym i korzystnym rozwiązaniem dla firm. Zapobiega możliwości zagubienia dokumentu, długiego przetrzymywania go przez dział lub inną firmę, jego uszkodzenia czy zniszczenia. Wystarczy tylko posortowane dokumenty zeskanować i poddać obróbce przez system OCR.

Podsumowując zastosowanie systemów OCR pozwala zaoszczędzić firmie czas, pieniądze oraz zmniejszyć ryzyko popełnienia błędu (np. przy przepisywaniu dokumentów).

Pobierz program

OCR Server 1.0.4 (Linux)

OCR Server Client 1.0.1 (Linux)

Kompleksowe serwerowe rozwiązanie OCR i konwersji PDF dla firm.

O produkcie

Optyczne Rozpoznawanie Znaków (OCR)

Zasada działania

System OCR

OCR a firma

Pobierz program

Nasze Produkty

OCR Server

Kompleksowe serwerowe rozwiązanie OCR i konwersji PDF dla firm.

O produkcie

Optyczne Rozpoznawanie Znaków (OCR)

Zasada działania

System OCR

OCR a firma

Pobierz program