#НОРИЛЬСК. «Северный город» – Ученые Сибирского федерального университета разработали новую сверхточную нейросеть (CNN), способную распознавать изображения рукописных букв. Полученный алгоритм преобразует изображение и узнает букву, зашифрованную в нем. По словам ученых, точность классификации составляет 99 процентов. Об этом сообщается на официальном сайте вуза.
На сегодняшний день 2,4 процента населения в мире говорят по-русски. Сложность распознавания текста, написанного кириллицей от руки, достаточно велика – в особенности для людей, не знакомых с русским алфавитом. В интернете распространены сервисы, которые можно использовать для распознавания и преобразования текста любого типа – как цифрового, так и рукописного. Однако использование таких сервисов чревато утечками информации и ненадежно с точки зрения конфиденциальности и безопасности пользователя. Приложение, которое сможет легко и быстро распознать текст на кириллице, работающее на стороне клиента и не требующее подключения к интернету, может быть востребовано как у отдельных пользователей, так и у организаций, отмечают эксперты.
«Самой, пожалуй, интересной особенностью рукописного русского текста является индивидуальный стиль написания букв – то, что мы называем почерком. Стили написания имеют свойство меняться со временем, достаточно сравнить каллиграфические строчки в тетрадях-прописях поколения 70–80-х годов и то, как пишут современные школьники. Даже у одного человека почерк меняется в течение жизни. Целью нашего исследования было распознавание рукописного текста на русском языке нейросетью с использованием моделей глубокого обучения (DL). Насколько нам известно, это первая в мире работа такого рода», – отметил соавтор исследования, студент Института информационных и космических технологий СФУ Андрей Левков.
По словам ученых, созданная ими модель нейросети не является окончательной и может быть улучшена в будущем – вероятно, ее архитектура будет меняться, чтобы увеличить точность классификации. При этом на основании проделанной работы зарегистрирована уникальная программа ЭВМ, правообладателем которой выступил Сибирский федеральный университет.
Ранее «Северный город» рассказал о том, что за последний год интерес россиян к литературе, справочникам и словарям русского языка вырос на десять процентов. При этом несомненными лидерами этого тренда стали толковый словарь Дмитрия Ушакова и пособие по грамотной устной речи Татьяны Гартман. Более 10 тысяч лицензий на отечественное ПО предприниматели Красноярья приобрели за полцены. Кроме того, продолжается прием заявок от правообладателей программных продуктов отечественного производства.
Больше новостей читайте на совместном канале «Северного города» и «Таймырского телеграфа» в Telegram.