Автоматическая генерация правил транскрипции и машинная транскрипция имен собственных с использованием конечного автомата
Аннотация:
В работе предлагается метод автоматической генерации правил транскрипции имен собственных на основе анализа обучающей выборки. Процесс генерации правил разбивается на два этапа: выделение простых (первичных) правил и генерация сложных правил. Для выделения первичных правил используется новая методика выравнивания. Для проведения транскрипции предлагается конвертировать правила в конечный автомат и проводить транскрипцию по нему.