Новгородские ученые обучили ИИ читать и расшифровывать берестяные грамоты
Новая нейросеть может быстро загружать фото, распознавать буквы и экспортировать результаты
Современные нейросетки давно уже обучены распознавать тексты на разных языках, однако древнерусские символы имеют свою специфику.
На сегодня новгородские ученые располагают более 1200 берестяными грамотами, и количество этих артефактов продолжает увеличиваться с каждым годом.
Процесс расшифровки древних документов очень сложный и требует много времени, так как одни и те же символы могут иметь разные варианты прочтений. А разнообразие устаревших букв и наличие редких надстрочных, подстрочных и внутристрочных знаков делает ее крайне трудоемкой.
Ученый НовГу Иван Филиппов создал приложение, которое позволяет быстро и наглядно загружать любые изображения грамот, использовать функции зума и панорамы для точного выбора областей, автоматически или вручную выделять рамки вокруг букв, мгновенно редактировать, перемещать, удалять и отменять действия.
Для обучения нейросети использовали датасет из пяти «эталонных» грамот, на которых буквы были размечены вручную. При отборе грамот было важно, чтобы они были целыми, крупными по объёму и содержали наибольшее разнообразие разборчиво написанных букв.
Нейросетка способна самообучаться, и показала высокую производительность: полный прогон одного изображения занимает 1-2 секунды.
Точность распознавания высокая — после всех доработок и корректировок она составляет 98%.
Разработка Ивана Филиппова призвана стать быстрым инструментом для библиографиов, палеографов, архивистов.
Фото: НовГу
