Исследование методов построения моделей кодер-декодер для распознавания русской речи


Результаты экспериментов по автоматическому распознаванию слитной русской речи



бет13/23
Дата02.01.2022
өлшемі220.96 Kb.
#452242
түріИсследование
1   ...   9   10   11   12   13   14   15   16   ...   23
issledovanie-metodov-postroeniya-modeley-koder-dekoder-dlya-raspoznavaniya-russkoy-rechi

Результаты экспериментов по автоматическому распознаванию слитной русской речи

Для сравнения результатов получено несколько базовых моделей распознавания речи. Первым базовым решением являлась гибридная модель, объединяющая скрытые марковские модели и глубокие нейронные сети, которая была реализована с помощью инструментариев Kaldi [25] и CNTK [26] и описана в работе [27]. При декодировании использовалась двухграммная ЯМ со сглаживанием Кнесера — Нея [28]. Языковая модель была обучена на данных российских новостных сайтов. Обучающий корпус состоял из примерно 300 млн словоупотреблений. Словарь системы содержал более 150 000 словоформ русского языка. ЯМ применялись при построении базовых моделей. Наилучшие результаты получены в экспериментах с нейросетью топологии ResNet [27] и рекуррентной сверточной сети (RCNN) [29].

Вторым базовым решением являлись модель на основе механизма внимания и BLSTM, а также модель на основе Transformer-сети, реализованные с помощью библиотеки Tensor2Tensor [30]. Эта библиотека предоставляет общий подход к построению моделей для работы с последовательностями, и, в частности, для задачи по распознаванию речи. Результаты экспериментов по распознаванию речи с применением базовых моделей представлены в табл. 1.

1   ...   9   10   11   12   13   14   15   16   ...   23




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет