Мировой прорыв в изучении древних рукописей совершили бурятские ученые. Им удалось оцифровать и расшифровать манускрипты с помощью искусственного интеллекта. Под умный сканер попали тибетские и старомонгольские книги разных жанров. Почему это так значимо для науки, разбиралась наша съемочная группа.
Эти древнейшие манускрипты чудом сохранились до наших дней. Бурятские ученые уберегли от антирелигиозной зачистки коллекцию тибетской и старомонгольской литературы. Её начали собирать около 100 лет назад. В хранилище - около 100 тысяч сказаний Будды. Каждое - объемом в 500 страниц. Искусственный интеллект поможет открыть все их тайны.
Олег Ринчинов, доктор исторических наук, руководитель центра восточных рукописей и ксилографов ИМБТ СО РАН: Наш новый проект нацелен на ввод в цифровой вид, в электронный вид огромного количества тибетских сочинений, которые хранятся в наших фондах. И для этого у нас с помощью методов искусственного интеллекта у нас создается цифровая технология, позволяющая из сканированных изображений получить машиночитаемый и человеком читаемый текст, который можно редактировать, который можно обрабатывать разными способами. В том числе и использовать его для машинного перевода.
Над проектом начали работать летом прошлого года. Результаты удалось получить спустя 3 месяца. Ученые института монголоведения, буддологии и тибетологии осваивали технологии совместно с Новосибирским университетом.
Олег Ринчинов, доктор исторических наук, руководитель центра восточных рукописей и ксилографов ИМБТ СО РАН: Мы их все хотим оцифровать. И получить цифровые корпуса, соответственно, и на тибетском, и на монгольском языке. Корпус - это основа для многих современных исследований гуманитарных. Это, во-первых, текстологические, источниковедческие исследования могут быть. Изыскания могут быть в области филологии тибетско-монгольской. В области истории, медицины.
Рукописная расшифровка применяется впервые только у нас. Ранее в восточных странах компьютеры обучили считывать печатную древнюю литературу. Новая технология пока распознает лишь 94% материала. В будущем распознавание планируется довести до 99%. Исследования всех областей древней литературы будут революционными как для России, так и для всего мира.
Полное или частичное копирование разрешено только с письменного согласия главного редактора Ариг Ус online