Инструменты пользователя

Инструменты сайта


// Немного про распознавание текста (OCR) в Linux

Наверное самое слабое место для Linux систем. Хотя проектов достаточно много, например gocr, tesseract или ocrad, но многие из них до сих пор не вышли из зачаточного состояния, требуют для более-менее удовлетворительной работы длительное обучение, и даже после оного достаточно отвратительно распознают текст.

Небольшой перелом в положительном направлении стало открытие исходных кодов программы распознавания текстов cuneiform, но проект развивается достаточно медленно, и пока плохо распознает табличные тексты.

Но, несмотря на это, в настоящее время - это лучшая программа для распознавания под Linux.

На данный момент существует несколько способов её использования:

  1. из командной строки, доступна из коробки
  2. программа cuneiform-qt, довольно убога на данный момент
  3. программа yagf - достаточно удобна, хотя ещё и не достаточно функциональна, может работать сразу со сканером при помощи xsane
  4. веб интерфейс - CuneWebForm, ссылки тут:

Куниформ работает и потихоньку эту свою работу делает, надеюсь будет развитие.

Комментарии

Старые комментарии

Так вроде же cunewebform развивается силами того самого «сотрудников Вычислительного Центра НРТК».

1 | | 2009-12-03 16:24 | reply

ну да, а какая разница? BFS анестезиолог написал :-D главное ехать, а шашечки потом, тем паче в текущей ситуации

2 |
Alexander Drozdov
| 2009-12-03 23:22 | reply

Мне хватает http://www.finereaderonline.com/

3 | | 2009-12-03 23:32 | reply

Про проект слышал не раз. И действительно, лучшей «программной» альтернативы пока не существует. Благо моя работа не связана со скан-распознованием текста, поэтому этот вопрос для меня не актуален. зы: hatred, следи за предложениями, твое вот это «на данный момент» слишком часто используется. :)

4 | | 2009-12-04 09:11 | reply

Это хорошо, специально в обзор не включал, не всегда тырнет под рукой, у нас вот в школах до сих пор проблемы, а пост больше вопросами учителей навеян.

5 |
Alexander Drozdov
| 2009-12-04 09:40 | reply

Чукча писатель, чукча не читатель :-D сделаю вычитку ещё :)

6 |
Alexander Drozdov
| 2009-12-04 09:42 | reply

Ну давай. Будем наедятся на твою поправку. Ты же все таки теперь важная персона ;)

7 | | 2009-12-04 09:49 | reply