Компьютеры научились читать манускрипты
Исследователи из UAB Computer Vision Centre разработали новую систему автоматического распознавания рукописных текстов, которая на порядок эффективнее и надежнее существующих систем аналогичного назначения.
"Метод обработки размытых форм" предназначен для работы с древними, поврежденными или трудночитаемыми манускриптами, музыкальными партитурами, рукописями и архитектурными чертежами. В тоже время, метод позволяет взаимодействовать с человеком и распознавать документы прямо во время их написания или начертания.
Основа нового метода - база рукописных символов, созданная в результате анализа биологических процессов, протекающих в человеческом сознании во время распознавания различных типов изображений (узнавание форм, структуры, размеров и т.д.). Представленная компьютерная система отличается от похожих тем, что она может различать колебания и отклонения, упругие деформации и искажения, которые возникают во время ручного написания символов (цифр, букв, чертежей). Еще одним преимуществом данной системы является ее способность распознавать рукописный материал в режиме реального времени - буквально через пару секунд после того, как изображение попадает в компьютер.
Для того чтобы распознавать документы, система накладывает символы на координатную сетку и делит их на мелкие участки. Затем информация из каждого участка обрабатывается и сохраняется, причем регистрируются даже самые незначительные изменения в написании символа (например, ъ и ь). В зависимости от формы символа система предпринимает целый ряд действий для распознаваний символа, совершая все возможные преобразования и искажения его формы (например, длину хвостика у буквы р, ее наклон, закругленность и т.д.). После этого полученная информация автоматически обрабатывается и соответственно сортируется.
Чтобы проверить эффективность метода, исследователи создали базы данных музыкальных нот и архитектурных символов. База музыкальных нот создавалась на основе коллекции современных и древних музыкальных партитур (18 и 19 веков), взятых из архивов Семинарии Барселоны. Эта коллекция состояла из 2128 примеров трех типов музыкальных нот, написанных 24 различными людьми. Вторая база включала в себя 2762 примера ручного написания архитектурных символов, разбитых на 14 групп. Каждая группа состояла приблизительно из 200 видов символов, нарисованных 13 различными людьми.
Для того, чтобы сравнить результаты работы данного метода, такие же данные были обработаны на аналогичных компьютерных системах. Разработанная система смогла распознать музыкальных нот на 98% больше, а архитектурных символов удалось распознать на 90% больше. Только наши информеры новостей расскажут о самых свежих новостях.
Оригинал (на англ. языке): Sciencedaily.com
С этим материалом еще читают:
Тайвань занимается установкой подводной системы сейсмонаблюдения
Создана "невидимая" компьютерная мышка
Физики упростили метод производства графена
Еще из категории технологии:
- Новая трехмерная графеновая электроника
- Открыто еще одно необычное свойство графена
- Внутренний голос человека теперь можно подслушать
- Весит ли антиматерия больше материи?
- Впервые обнаружена квантовая вибрация в крупном объекте
- Создан микроволновый плащ – невидимка
- Химики создали оболочку для искусственной клетки
- Суперлинзы: на пороге создания почти совершенных линз
Последние комментарии
Читательский топ
- Последняя секретная дверь Великой Пирамиды будет открыта в 2012 году
- В России обнаружен квазикристалл внеземного происхождения
- Впервые получено прямое изображение диска черной дыры
- Феномен нейтрино разгадан благодаря специальной теории относительности
- Пять предсказаний о ближайшем будущем от IBM
- Чем особенна дата 11/11/11?
- В обновленной серии экспериментов нейтрино все также движется быстрей света





Комментариев нет. Будьте первым!