Головная страница ИПМ Библиотеки, издания  •  Поиск публикаций  English 
Публикация

Препринт ИПМ № 58, Москва, 2021 г.
Авторы: Клышинский Э.С., Бунтякова В.А., Карпик О.В.
Исследование грамматической неоднозначности наиболее частотных слов русского языка
Аннотация:
В своих предыдущих исследованиях мы обнаружили, что в европейских языках грамматическая неоднозначность наиболее частотных слов ведет себя несколько иначе, чем в более редких словах. В данном исследовании мы более подробно анализируем причины этого явления, уделяя особое внимание первой тысяче наиболее частотных токенов. Исследование современных систем снятия омонимии и синтаксического анализа показало, что всплеск разнообразия частей речи, который наблюдается в наиболее частотных слова, приводит к увеличению числа ошибок на выходе этих систем.
Ключевые слова:
грамматическая неоднозначность, квантитативный анализ, статистика распределения, русский язык
Язык публикации: русский,  страниц: 22
Направление исследований:
Математическое моделирование в актуальных проблемах науки и техники
Полный текст на русском языке:
Экспорт ссылки на публикацию в формате:   RIS    BibTeX
Статистика просмотров (обновляется раз в сутки):
за последние 30 дней — 18 (+12), всего с 19.08.2021 — 474
Сведения об авторах:
  • Клышинский Эдуард Станиславович,  orcid.org/0000-0002-4020-488XИПМ им. М.В. Келдыша РАН
  • Бунтякова Валерия Антоновна,  orcid.org/0000-0003-2409-2651,  Национальный исследовательский университет «Высшая школа экономики»
  • Карпик Олеся Владимировна,  orcid.org/0000-0002-0477-1502ИПМ им. М.В. Келдыша РАН