фото/ рисунок
текст
растровый рисунок
программа распознавания (Fine Reader)
двоичный текст
бумага или пленка
цифровая (двоичная) среда ПК
СКАНЕР
планшетный
Разрешение [dpi (dot per inch)] 300-1200
Формат A4, A3
HP, Mustek, Epson
Распознавание символов (сравнение с эталоном)
Д
А
Б
В
Г
Д
Е
Ё
Ж
З
…
A
B
C
D
E
F
J
H
I
…
a
b
c
d
e
f
j
h
i
…
а
б
в
г
д
е
ё
ж
з
…
A
Б
В
Г
Д
Е
Д – ошибка минимальная –>
код 196 (Win-1251) =&11000100
На основе общих признаков система выдвигает некоторое количество гипотез о том, что может быть на изображении. Например, если одна из гипотез предполагает, что данный символ - это буква «А», то этот символ проверяется на наличие признаков, присущих только букве «А». Если какой-то признак отсутствует, проверка этой гипотезы прекращается. - На основе общих признаков система выдвигает некоторое количество гипотез о том, что может быть на изображении. Например, если одна из гипотез предполагает, что данный символ - это буква «А», то этот символ проверяется на наличие признаков, присущих только букве «А». Если какой-то признак отсутствует, проверка этой гипотезы прекращается.
- Для проверки гипотез используются структурные эталоны четырех типов : отрезок, дуга, кольцо, точка.
Распознавание символов в системе FineReader
Распознавание символов в системе FineReader - Если в окончательный список попало более одной гипотезы, они попарно сравниваются.
- Окончательный результат распознавания осуществляется системой контекстной проверки. Даже если не все буквы в слове были распознаны, компьютер может "догадаться", что это за слово.
- После система пытается перераспознать неуверенно распознанные за первый проход символы и слова. К этому моменту адаптивный классификатор успевает обучиться на материале всей страницы целиком, поэтому при повторном распознавании может распознать то, что не далось ему вначале.
- Принципы Целостности, Целенаправленности и Адаптивности, положенные в основу данной системы позволяют машине приблизится к логике мышления, свойственной человеку.
Достарыңызбен бөлісу: |