T-банк представил T-one: новую модель для распознавания речи на русском

Технологический отдел банка «Т-Банк» (бывший «Тинькофф Банк»), компания «Т-Технологии», сделала модель распознавания речи T-one общедоступной.

Разработчики заявили:

Эта потоковая модель ASR, имеющая сравнительно небольшой размер в 70 млн параметров, занимает лидирующие позиции среди других открытых моделей по качеству распознавания на русском языке на шумных и сжатых записях из колл-центров, где бизнес несет убытки из-за ошибок распознавания.

Модель создана для работы в режиме реального времени с аудиопотоком любой длины. Её применяют во внутренних продуктах «Т-Технологий», таких как служба поддержки «Т-Банка», мобильный секретарь в «Т-Мобайле» и средства защиты от спам-звонков.

В «Т-Технологиях» подчеркнули:

Отсутствуют общепринятые датасеты для проверки качества распознавания речи на русском языке в телефонии с надлежащей разметкой, однако по внутренним тестовым данным* по качеству распознавания на русском в телефонии T-one превосходит такие крупные открытые модели ASR как GigaAM v2 (242–243 млн параметров) и Whisper Large-v3 (1,5 млрд параметров).

Модель T-one небольшая, поэтому ее можно запустить без покупки дорогого оборудования. Программное обеспечение T-one распространяется по лицензии Apache 2.0, позволяющей свободно использовать и изменять его в коммерческих целях.

Не пропустите:  В Москве испытывают новый электробус малого класса.

Похожие статьи