Головная страница ИПМ Библиотеки, издания  •  Поиск публикаций  English 
Публикация

Материал конференции: "Труды Международной конференции по компьютерной графике и зрению "Графикон" (19-21 сентября 2023 г., Москва)"
Авторы: Клышинский Э.С., Васильева В.В., Карпик О.В., Белобокова Ю.А.
О влиянии синтаксической структуры предложения на его векторизацию с использованием модели Bert
Аннотация:
Эксперименты показывают, что векторизация Bert отражает синтаксическую структуру предложения. В данной работы мы провели эксперименты по определению косинусной меры сходства между векторами Bert для слов, занимающих в предложении близкие позиции. Эксперименты показали, что векторизация Bert зависит от количества синтаксических составляющих, которые завершаются или начинаются между этими словами — с увеличением числа составляющих косинусное сходство падает. Более значительный эффект достигается для синтаксических составляющих, которые завершились между этими словами. При увеличении расстояния между словами до промежутка в три слова косинусное сходство также падает. Вообще, Bert присваивает словам в тексте близкие векторы, косинусное сходство которых выше 0,6. Для Word2Vec, которая формирует векторы без учета контекста, подобное поведение не характерно.
Ключевые слова:
Модель Bert, векторное представление слов, синтаксический анализ, составляющие
Язык публикации: русский,  страниц: 9 (с. 354-362)
Полный текст на русском языке:
Экспорт ссылки на публикацию в формате:   RIS    BibTeX
Сведения об авторах:
  • Клышинский Эдуард Станиславович,  orcid.org/0000-0002-4020-488XИПМ им. М.В. Келдыша РАН
  • Васильева В.В.,  orcid.org/0009-0007-0814-7874Национальный исследовательский университет «Высшая школа экономики»
  • Карпик Олеся Владимировна,  orcid.org/0000-0002-0477-1502ИПМ им. М.В. Келдыша РАН
  • Белобокова Ю.А.,  orcid.org/0009-0002-4169-7847,  МРСЭИ