Ученые ВШЭ примут участие в создании новой платформы Национального корпуса русского языка
В Минобрнауки России подведены итоги конкурса, победители которого получат гранты на реализацию крупных научных проектов. Среди победителей – заявка с участием ВШЭ, предусматривающая разработку компьютерно-лингвистической платформы нового поколения для цифровой документации русского языка.
На конкурс было подано 367 заявок, 41 из них стала победителями. Гранты предоставляются научным организациям и вузам для господдержки крупных научных или научно-технических проектов по приоритетным направлениям, определяемым президиумом РАН. Предельный размер гранта на финансовый год — 100 млн рублей. Продолжительность проектов — три года с возможным продлением на два года. Сведения о победителях конкурса и о размерах предоставляемых грантов размещены здесь.
В числе победителей конкурса – проект «Компьютерно-лингвистическая платформа нового поколения для цифровой документации русского языка: инфраструктура, ресурсы, научные исследования», представленный консорциумом вузов и научных организаций. Объем финансирования на три года составит 236 млн рублей. Основной исполнитель – Институт проблем передачи информации РАН, в состав консорциума вошли Институт русского языка им. В. В. Виноградова РАН, Институт лингвистических исследований РАН, Воронежский государственный университет и Высшая школа экономики, которую представляли ученые из Школы лингвистики.
Грант выделен на комплексную работу, связанную с обновлением платформы Национального корпуса русского языка - информационно-справочной системы, основанной на собрании русских текстов разных типов и жанров в электронной форме. Корпус предназначен, прежде всего, для обеспечения научных исследований лексики и грамматики языка и уникален тем, что содержит особую дополнительную информацию о свойствах этих текстов – так называемую разметку. В 2004 году, когда Национальный корпус создавался Институтом русского языка и компанией Яндекс, разметка была беспрецедентной даже по сравнению с зарубежными аналогами и с тех пор сохранила свою уникальность.
Более чем за 15 лет существования Национального корпуса его объем значительно вырос, появились новые подкорпусы, новые функции. Теперь для его дальнейшего развития и обеспечения эффективной работы необходимы новые технологические решения («Корпус 2.0»). Примечательно, что в разработке этих решений примут участие ученые из разных отраслей знания (компьютерные науки, лингвистика, филология, история и др.) и из разных регионов – Москвы, Воронежской области, Санкт-Петербурга. В северной столице расположен Институт лингвистических исследований РАН, к проекту также подключатся коллеги из питерского кампуса Вышки. Правильно выстроенная кооперация стала одним из факторов успеха на конкурсе.
Предполагается, что костяк коллектива, участвующего в работе по гранту от ВШЭ, составят профессора Екатерина Рахилина, Валентина Апресян, Ольга Ляшевская, Нина Добрушина, Наталия Слюсарь, Михаил Даниэль, доценты Анастасия Бонч-Осмоловская, Дмитрий Сичинава, Александр Летучий, старший преподаватель Мария Холодилова (Санкт-Петербург). Предстоит, в частности, подготовка статей для научных журналов и защита диссертаций по заявленной тематике.
Екатерина Рахилина, руководитель Школы лингвистики ВШЭ
Заявка на грант была подготовлена в рекордно короткие сроки, да еще в условиях самоизоляции. Для нас особенно важной была поддержка факультета гуманитарных наук: его руководство понимает специфику лингвистических исследований и создает все условия для их развития. Предстоящие работы по гранту мы воспринимаем как серию проектов. В них будут участвовать не только преподаватели и научные сотрудники, но и студенты, и аспиранты, не только лингвисты, но и филологи, историки, коллеги с факультета компьютерных наук и из Центра языка и мозга.
Бонч-Осмоловская Анастасия Александровна
Даниэль Михаил Александрович
Добрушина Нина Роландовна
Сичинава Дмитрий Владимирович