КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер проекта 16-18-02054
НазваниеИсследование русского языкового сознания на основе семантического, статистического и психолингвистического анализа лексической многозначности
Руководитель Апресян Валентина Юрьевна, Доктор филологических наук
Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Институт русского языка им. В. В. Виноградова Российской академии наук , г Москва
Конкурс №14 - Конкурс 2016 года на получение грантов по приоритетному направлению деятельности РНФ «Проведение фундаментальных научных исследований и поисковых научных исследований по поручениям (указаниям) Президента Российской Федерации»
Область знания, основной код классификатора 08 - Гуманитарные и социальные науки; 08-453 - Языкознание
Ключевые слова русское языковое сознание, ментальный лексикон, семантика, метафора, метонимия, лексикография, словари, неоднозначность, омонимия, многозначность, полисемия, частотность, корпус текстов, семантическая близость, семантические векторы, психолингвистика, анализ микродвижений глаз, вызванные потенциалы мозга
Код ГРНТИ16.21.51
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
Научная проблема, на решение которой направлен предлагаемый проект — изучение устройства русской лексической многозначности как одного из центральных компонентов русского языкового сознания в словаре, в узусе и в ментальном лексиконе. Проект направлен на разработку и применение комплексного мультидисциплинарного подхода к описанию явления лексической многозначности, сочетающего лексикографические, корпусно-статистические и психолингвистические методы.
Методология исследования опирается на
1) метод интегрального описания языка и системной лексикографии;
2) метод построения семантических векторов на основе анализа корпусных частот;
3) метод анализа микродвижений глаз;
4) метод анализа вызванных потенциалов мозга.
В ходе исследования планируется решить следующие задачи:
1) выработать лингвистические критерии выделения и упорядочивания значений для толкового словаря русского языка на основе анализа многозначных слов из разных частеречных и семантических классов;
2) провести психолингвистическую и корпусно-статистическую верификацию выделенных лексикографических критериев описания многозначности, в частности, определить
a. в какой степени эти структуры многозначности коррелируют с частотным распределением значений в современном русском языке;
b. в какой степени структуры многозначности, созданные на основе лексикографических критериев, коррелируют с реальным нейрокогнитивным восприятием семантической близости;
3) провести эксперименты по оценке удобства восприятия словарных статей многозначных слов, построенных по разным принципам:
a. в соответствии с лексикографическими принципами описания структуры и порядка значений;
b. в соответствии с корпусными данными о частотности разных значений;
c. в соответствии с психолингвистическими данными о семантической близости;
4) изучить динамику изменения значений (отмирание значений, появление новых значений, централизацию одних и маргинализацию других значений) как отражение взаимодействия языковых, социальных, культурных и исторических процессов в обществе.
В ходе выполнения проекта планируется получение следующих результатов:
1) лингвистически обоснованные критерии выделения и упорядочивания значений в словаре;
2) сведения о структурах и механизмах многозначности в разных частеречных и семантических группах русской лексики;
3) описание репрезентативных групп многозначных слов русского языка из частеречно и семантически различных групп лексики;
4) представление об отражении социальных, культурных и исторических процессов русского общества в системе многозначности русского языка;
5) описание структурного представления многозначных слов в ментальном лексиконе;
6) выявление динамики доступа к значениям многозначных слов в процессе понимания речи;
7) определение нейрональных коррелятов значений многозначных слов разного типа;
8) выявление возможностей компьютерно-лингвистических методов автоматического выделения значений в их применении к русскому языку и сравнение полученных наборов значений со значениями, выделяемыми в словаре на основе методов системной лексикографии;
9) сравнение устройства многозначности в русском языке в узусе (как степени частотной представленности разных значений в корпусе текстов), ментальном лексиконе и толковом словаре;
10) экспериментальная оценка usability (удобства использования) толковых словарей русского языка в сфере представления многозначности.
Результаты проекта могут иметь разнообразное применение, в частности:
1) лексикографические критерии представления многозначности могут быть использованы при составлении словарей русского языка;
2) лексикографические описания могут быть использованы для машинного обучения систем автоматической кластеризации значений типа AdaGram (Bartunov et al 2015);
3) словарные описания многозначных слов русского языка, включающие данные о сравнительной частотности их значений, могут быть использованы в создании лексических минимумов, разговорников, учебников и обучающих ресурсов;
4) списки многозначных слов, снабженные сведениями о частотности каждого значения, могут быть использованы в различных компьютерно-лингвистических приложениях например, для вероятностного разрешения многозначности в отсутствие контекста);
5) результаты психолингвистических экспериментов могут использоваться при составлении толковых, переводных, ассоциативных и других словарей и обучающих материалов, как отражающие ментальный лексикон.
ОТЧЁТНЫЕ МАТЕРИАЛЫ
Публикации
1. Апресян В.Ю. Information structure, syntax, pragmatics and other factors in resolving scope ambiguity Proceedings of the Workshop on Grammar and Lexicon: interactions and interfaces (GramLex, Coling'2016) (год публикации - 2016)
2. Левонтина И.Б. Lexicalized prosody and the polysemy of some discourse particles in ADR Proceedings of the XVII EURALEX International Congress: Lexicography and Linguistic Diversity, 17th edition, pp.789–798 (год публикации - 2016)
3. Апресян В.Ю. Глаголы "исчезнуть" и "пропасть": многозначность и семантическая мотивация Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2016”, Vol. 15 (22), pp. 16-27 (год публикации - 2016)
4. Иомдин Б.Л., Лопухин К.А., Лопухина А.А., Носырев Г.В. Word sense frequency of similar polysemous words in different languages Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2016”, Vol. 15 (22), pp.214–224 (год публикации - 2016)
5. Иомдин Б.Л., Лопухин К.А., Лопухина А.А., Носырев Г.В. Meaning structure of cognate words in English and Russian: comparing word sense frequency Journées internationales d'Analyse statistique des Données Textuelles. Nice, June 7-10, 2016, Vol.13 (год публикации - 2016)
6. Урысон Е.В. Изменение структуры полисемии и модальных рамок слова: наречие впору в XIX веке и теперь Русский язык в научном освещении, 2016, № 1 (31). С. 24-61. (год публикации - 2016)
7. Урысон Е.В. Видовые пары, семантическая теория и критерий Маслова Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2016”, Vol. 15 (22), pp.792–805 (год публикации - 2016)
8. Левонтина И.Б. Lexicalized prosody and the polysemy of discourse markers Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2016”, Vol. 15 (22), pp.369–381 (год публикации - 2016)
9. Лопухина А.А., Лопухин К.А. Regular polysemy: from sense vectors to sense patterns The 26th International Conference on Computational Linguistics (COLING 2016). Osaka, Japan, Proceedings of the 5th Workshop on Cognitive Aspects of the Lexicon (CogALex-V). P. 19-23 (год публикации - 2016)
10. Лопухина А.А., Лопухин К.А., Иомдин Б.Л., Носырев Г.В. The Taming of the Polysemy: Automated Word Sense Frequency Estimation for Lexicographic Purposes Proceedings of the XVII EURALEX International Congress: Lexicography and Linguistic Diversity, 17th edition, pp.251–258 (год публикации - 2016)
11. Апресян В.Ю. Двойные семантические роли в исходных и переносных значениях многозначных глаголов Вопросы языкознания (год публикации - 2017)
12. Лопухина А.А., Лопухин К.А. Word sense disambiguation for Russian verbs using semantic vectors and dictionary entries Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2016”, Vol. 15 (22), pp.393–404 (год публикации - 2016)
Публикации
1. Лопухина А.А., Лопухин К.А. Word Sense Frequency Estimation for Russian: Verbs, Adjectives and Different Dictionaries Electronic lexicography in the 21st century. Proceedings of eLex 2017 conference, Electronic lexicography in the 21st century. Proceedings of eLex 2017 conference. P.267-280 (год публикации - 2017)
2. Апресян В.Ю., Шмелев А.Д. «Ксенопоказатели» по данным параллельных корпусов и современных СМИ: русское ЯКОБЫ Компьютерная лингвистика и интеллектуальные технологии, Т. 2. С. 17-29. (год публикации - 2017)
3. Богуславская О. Ю., Иомдин Б. Л. Развитие полисемии у русских числительных и порядковых прилагательных Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Москва, 31 мая – 3 июня 2017 г.). Москва, Изд-во РГГУ, 2017., Вып. 16 (23): в 2 т. Т. 2. С. 96–105. (год публикации - 2017)
4. Урысон Е.В. Словарь vs. текст: актантная структура союза ХОТЯ Русский язык в научном освещении, №2 (34) (год публикации - 2017)
5. Урысон Е.В. Наречие СРАЗУ: семантика и грамматика Труды Института русского языка им. В.В. Виноградова РАН, 13 выпуск (год публикации - 2017)
6. Апресян В.Ю. Отрицательная и положительная поляризация: семантические источники Компьютерная лингвистика и интеллектуальные технологии, Т. 2. С. 2-16. (год публикации - 2017)
7. Лопухин К.А., Иомдин Б.Л., Лопухина А.А. Word Sense Induction for Russian: Deep Study and Comparison with Dictionaries Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2017”. Moscow, RGGU., Vol. 1. Pp. 121–134 (год публикации - 2017)
8. Апресян В.Ю. Двойные семантические роли в исходных и переносных значениях многозначных глаголов Вопросы языкознания, №2, 7-32 (год публикации - 2017)
9. Урысон Е.В. Предлог или наречие? Частеречный статус наречных предлогов Вопросы языкознания, №5, с.36-55 (год публикации - 2017)
Публикации
1. Левин И., Андриянец И., Иомдин Б., Амбарцумян А. Lexical Variation: Word Knowledge and Polysemy in Russian Everyday Life Lexicon Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2018”. Moscow, May 30 – June 2, 2018, Vol. 1. Pp. 410–419 (год публикации - 2018)
2. Левонтина И. Б. Об одном случае неканонического использования междометий (корпусное исследование) Компьютерная лингвистика и интеллектуальные технологии По материалам ежегодной международной конференции «Диалог» (2018) Выпуск 17, Выпуск 17. С. 424 -436 (год публикации - 2018)
3.
Лопухина А., Лопухин К., Носырев Г.
Automated Word Sense Frequency Estimation for Russian Nouns
Quantitative approaches to the Russian language / eds. M. Kopotev, O. Lyashevskaya, A. Mustajoki. Routledge, 2018, P. 79-94 (год публикации - 2018)
10.4324/9781315105048
4. Панченко А., Лопухина А., Усталов Д., Лопухин К., Арефьев Н., Леонтьев А., Лукашевич Н. RUSSE2018: a Shared Task on Word Sense Induction for the Russian Language Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2018”. Moscow, May 30 – June 2, 2018, Vol. 1. No. 17. P. 547-564 (год публикации - 2018)
5.
Лопухина А., Лауринавичюте А., Лопухин К., Драгой О.
The Mental Representation of Polysemy across Word Classes
Frontiers in Psychology, 2018. Vol. 9. P. 1-16 (год публикации - 2018)
10.3389/fpsyg.2018.00192
6. Лопухина А., Лауринавичюте А., Лопухин К., Драгой О. The representation of polysemous nouns, verbs, and adjectives in the mental lexicon Linguistic Evidence 2018 - Experimental data drives linguistic theory. Conference Booklet. Tübingen, 15th to 17th of February 2018, Pp. 105-107 (год публикации - 2018)
7. Лопухина А. А., Лауринавичюте А. К., Драгой О. В. Как в ментальном лексиконе хранятся многозначные слова разных частей речи? Восьмая международная конференция по когнитивной науке: Тезисы докладов. Светлогорск, 18–21 октября 2018 г., М. : Институт психологии РАН, 2018. С. 644 - 646 (год публикации - 2018)
8. Юрченко А., Лопухина А., Драгой О. Meaning relatedness in polysemous and homonymous words: an ERP study in Russian Working papers by the Basic Research Program. Series WP BRP 67/LNG/2018 "Linguistics / LNG". 2018. (Препринт НИУ ВШЭ) (год публикации - 2018)
9. Апресян В.Ю., Апресян Ю.Д., Драгой О.В., Иомдин Б.Л., Лауринавичюте А.К., Левонтина И.Б., Лопухин К.А., Лопухина А.А., Урысон Е.В. О методе комплексного семантического, статистического и психолингвистического анализа многозначности Русская речь (год публикации - 2019)
10. Е. В. Урысон Лексическое значение глагола в видовой паре: семантическая теория и критерий Маслова Вопросы языкознания (год публикации - 2019)