Компьютеры научились читать манускрипты

Исследователи из UAB Computer Vision Centre разработали новую систему автоматического распознавания рукописных текстов, которая на порядок эффективнее и надежнее существующих систем аналогичного назначения.
"Метод обработки размытых форм" предназначен для работы с древними, поврежденными или трудночитаемыми манускриптами, музыкальными партитурами, рукописями и архитектурными чертежами. В тоже время, метод позволяет взаимодействовать с человеком и распознавать документы прямо во время их написания или начертания.
Основа нового метода - база рукописных символов, созданная в результате анализа биологических процессов, протекающих в человеческом сознании во время распознавания различных типов изображений (узнавание форм, структуры, размеров и т.д.). Представленная компьютерная система отличается от похожих тем, что она может различать колебания и отклонения, упругие деформации и искажения, которые возникают во время ручного написания символов (цифр, букв, чертежей). Еще одним преимуществом данной системы является ее способность распознавать рукописный материал в режиме реального времени - буквально через пару секунд после того, как изображение попадает в компьютер.
Для того чтобы распознавать документы, система накладывает символы на координатную сетку и делит их на мелкие участки. Затем информация из каждого участка обрабатывается и сохраняется, причем регистрируются даже самые незначительные изменения в написании символа (например, ъ и ь). В зависимости от формы символа система предпринимает целый ряд действий для распознаваний символа, совершая все возможные преобразования и искажения его формы (например, длину хвостика у буквы р, ее наклон, закругленность и т.д.). После этого полученная информация автоматически обрабатывается и соответственно сортируется.
Чтобы проверить эффективность метода, исследователи создали базы данных музыкальных нот и архитектурных символов. База музыкальных нот создавалась на основе коллекции современных и древних музыкальных партитур (18 и 19 веков), взятых из архивов Семинарии Барселоны. Эта коллекция состояла из 2128 примеров трех типов музыкальных нот, написанных 24 различными людьми. Вторая база включала в себя 2762 примера ручного написания архитектурных символов, разбитых на 14 групп. Каждая группа состояла приблизительно из 200 видов символов, нарисованных 13 различными людьми.
Для того, чтобы сравнить результаты работы данного метода, такие же данные были обработаны на аналогичных компьютерных системах. Разработанная система смогла распознать музыкальных нот на 98% больше, а архитектурных символов удалось распознать на 90% больше. Только наши информеры новостей расскажут о самых свежих новостях.
Оригинал (на англ. языке): Sciencedaily.com
С этим материалом еще читают:
Специалисты полагают, что компьютеры за нами наблюдают

Ватикан и Оксфордский университет разместят в Интернете древние тексты

4-дюймовый iPhone 6c выйдет в середине 2016 года

Еще из категории технологии:
- Слышишь сигнал — но не видишь машину: скрытая проблема в безопасности электромобилей
- Новые наушники от Anker: шумоподавление, до месяца автономной работы и зарядка для смартфона
- Учёные «замораживают» квантовое движение с помощью лазерного трюка: открытие откроет путь к новым технологиям
- Новое антибактериальное покрытие на основе белка "прыгающих блох" блокирует 100% бактерий
- Технология под рукой: сенсорные экраны смартфонов помогут следить за уровнем гидратации организма
- Эпоха экзафлопсных суперкомпьютеров наступила — что это значит и на что они способны?
- Частое использование ChatGPT связано с одиночеством и эмоциональной зависимостью
- Стартап по натрий-железным батареям готов бросить вызов литий-ионным батареям для долгосрочного хранения энергии
Последние комментарии
Рассылка топовых новостей
Читательский топ
- Ваш мозг может содержать пластик
- Таинственная пирамида Амазонии: священная гора Эль Коно может скрывать древние тайны
- Холодные погружения запускают процесс очистки клеток и могут лечить старение и болезни
- Какие страны увидят солнечное затмение 29 марта — и где будет двойной рассвет
- Апноэ во сне связано с повышенным риском болезни Паркинсона
- Первичные препараты не действуют на 48% людей с депрессией
- Частое использование ChatGPT связано с одиночеством и эмоциональной зависимостью
Комментариев нет. Будьте первым!