«Яндекс Книги» представили виртуального рассказчика с «естественным» голосом для более чем 120 тысяч книг.

Яндекс представил обновление своего книжного сервиса. В «Яндекс Книгах» появилась новая версия виртуального рассказчика, использующего усовершенствованную нейросетевую модель для синтеза речи.

С помощью виртуального рассказчика можно прослушивать книги, для которых еще не созданы аудиоверсии. Предыдущая нейросетевая модель оперативно генерировала голос, однако звучание часто оказывалось монотонным. Новейшая технология позволяет решить эту проблему.

В Яндексе рассказали:

Обновленная технология позволила сделать интонации рассказчика более выразительными и реалистичными, а стиль чтения адаптируется к жанру произведения. Новая модель обеспечивает высокое качество синтеза речи на русском языке, превосходя аналогичные разработки ведущих мировых компаний, в частности, в 80% случаев она синтезирует голос лучше, чем ElevenLabs.

При обучении модели использовались записи речи, сделанные совместно с профессиональными дикторами. Дикторы читали тексты различных жанров, включая фантастику, детективы, романы и учебные пособия. Это позволило виртуальному рассказчику изменять интонацию в соответствии с жанром произведения. Модель также научилась распознавать начало диалога и выделять реплики героев с помощью интонации. Озвучка доступна для более чем 120 тысяч произведений. Функция реализована в веб-версии и мобильном приложении сервиса.

Яндекс Книги» (ранее «Букмейт») — это книжный сервис, входящий в экосистему Яндекса и работающий по подписке «Яндекс Плюс». Он предоставляет доступ к электронным и аудиокнигам, а также предлагает интерактивные возможности для чтения. В сентябре 2024 года сервис «Букмейт» был переименован в «Яндекс Книги». В июне 2024 года в сервис была добавлена функция виртуального рассказчика, созданного на основе искусственного интеллекта, который может озвучивать 13 тыс. книг в реальном времени.