На филологическом факультете обсудили производство аудиокниг на языках малых народов России с использованием синтезаторов речи

26 января 2023 г. в Институте современных языков, межкультурной коммуникации и миграции РУДН прошел научно-образовательный семинар на тему «Синтезаторы речи в производстве аудиокниг на языках малых народов России».

Доклад представили коллеги из Национального исследовательского Томского государственного университета:
• Михаил Пожидаев – кандидат технических наук, доцент кафедры теоретических основ информатики Института прикладной математики и компьютерных наук.
• Елена Теплых – младший научный сотрудник лаборатории междисциплинарных исследований Научного управления.

На семинаре был представлен обзор различных аспектов производства аудиокниг на языках малых народов России с использованием синтезаторов речи. В частности, были рассмотрены следующие аспекты разработки аудиокниг:
• Чем модели создания и распространения синтезированных аудиокниг отличаются от моделей традиционных аудиокниг?
• Какие используются для этого технологии?
• Какие этапы подготовки должны пройти исходные материалы?
• Какие существуют правовые особенности подобной работы?
• Какие могут быть преимущества и недостатки?

Докладчики отметили, что часть результатов, полученных в настоящий момент для русского языка, может быть легко адаптирована для решения подобных задач для языков малых народов России. При этом существует ряд проблем, решение которых в немалой степени затруднено и требует проведения дополнительных филологических исследований.
Развитие этого направления подразумевает решение технических, академических и организационных задач. Это объясняется тем, что разработка подобных технологий требует глубокого вовлечения носителей языка и накопления филологических знаний, позволяющих выполнять лемматизацию слов, снятие омонимии и т. д.
Часть технических задач требует задействования машинного обучения и интеллектуальных алгоритмов. Несмотря на заметный скачок в развитии этой сферы, успех в немалой степени зависит от наличия достаточного количества обучающих данных. Их сбор и подготовка нередко требуют большой организационной работы с носителями того или иного языка.

На семинаре присутствовали представители внешних научно-образовательных организаций:
Агранат Татьяна Борисовна, доктор филологических наук, ведущий научный сотрудник, руководитель группы финно-угорских языков Института языкознания РАН.
Куцаева Марина Васильевна, кандидат филологических наук, научный сотрудник Группы финно-угорских языков Института языкознания РАН.
Безродная Елена Сергеевна, кандидат физико-математических наук, постдок Международной лаборатории алгебраической топологии и ее приложений Факультета компьютерных наук НИУ ВШЭ.

Новости: