Компьютеры научились читать манускрипты
Исследователи из UAB Computer Vision Centre разработали новую систему автоматического распознавания рукописных текстов, которая на порядок эффективнее и надежнее существующих систем аналогичного назначения.
"Метод обработки размытых форм" предназначен для работы с древними, поврежденными или трудночитаемыми манускриптами, музыкальными партитурами, рукописями и архитектурными чертежами. В тоже время, метод позволяет взаимодействовать с человеком и распознавать документы прямо во время их написания или начертания.
Основа нового метода - база рукописных символов, созданная в результате анализа биологических процессов, протекающих в человеческом сознании во время распознавания различных типов изображений (узнавание форм, структуры, размеров и т.д.). Представленная компьютерная система отличается от похожих тем, что она может различать колебания и отклонения, упругие деформации и искажения, которые возникают во время ручного написания символов (цифр, букв, чертежей). Еще одним преимуществом данной системы является ее способность распознавать рукописный материал в режиме реального времени - буквально через пару секунд после того, как изображение попадает в компьютер.
Для того чтобы распознавать документы, система накладывает символы на координатную сетку и делит их на мелкие участки. Затем информация из каждого участка обрабатывается и сохраняется, причем регистрируются даже самые незначительные изменения в написании символа (например, ъ и ь). В зависимости от формы символа система предпринимает целый ряд действий для распознаваний символа, совершая все возможные преобразования и искажения его формы (например, длину хвостика у буквы р, ее наклон, закругленность и т.д.). После этого полученная информация автоматически обрабатывается и соответственно сортируется.
Чтобы проверить эффективность метода, исследователи создали базы данных музыкальных нот и архитектурных символов. База музыкальных нот создавалась на основе коллекции современных и древних музыкальных партитур (18 и 19 веков), взятых из архивов Семинарии Барселоны. Эта коллекция состояла из 2128 примеров трех типов музыкальных нот, написанных 24 различными людьми. Вторая база включала в себя 2762 примера ручного написания архитектурных символов, разбитых на 14 групп. Каждая группа состояла приблизительно из 200 видов символов, нарисованных 13 различными людьми.
Для того, чтобы сравнить результаты работы данного метода, такие же данные были обработаны на аналогичных компьютерных системах. Разработанная система смогла распознать музыкальных нот на 98% больше, а архитектурных символов удалось распознать на 90% больше. Только наши информеры новостей расскажут о самых свежих новостях.
Оригинал (на англ. языке): Sciencedaily.com
С этим материалом еще читают:
Специалисты полагают, что компьютеры за нами наблюдают
Ватикан и Оксфордский университет разместят в Интернете древние тексты
4-дюймовый iPhone 6c выйдет в середине 2016 года
Еще из категории технологии:
- Новая работа создает дорожную карту для следующего поколения биоэлектронной медицины
- Средневековая нанотехнологичная кольчуга
- Исследование показывает, что телетерапия не улучшила доступ к психиатрической помощи
- Eni будет искать энергоресурсы с помощью суперкомпьютера нового поколения
- Искусственный интеллект: новая реальность трудового рынка
- 3D-печатная грибная топливная ячейка предлагает биоразлагаемое решение для получения энергии
- Колебания доменных стенок в 2D материалах раскрывают новый механизм сверхпроводимости
- IBM ускоряет обучение ИИ на скорости света при минимальном энергопотреблении
Последние комментарии
Рассылка топовых новостей
Читательский топ
- Западные пограничные течения и их влияние на климат
- Захороненные формы рельефа раскрывают древнее ледниковое прошлое Северного моря
- Эволюция контрацептивов: от древних методов до современных технологий
- Учёные объяснили рост тяжёлых инфекций, вызываемых Streptococcus
- Двухразовая инъекция снижает риск ВИЧ на 96%
- Жажда как индикатор обезвоживания: насколько она точна?
- Учёные готовятся к амбициозному исследованию тёмной материи и энергии
Комментариев нет. Будьте первым!