Яндекс представил обновление своего книжного сервиса. В «Яндекс Книгах» появилась новая версия виртуального рассказчика, использующего усовершенствованную нейросетевую модель для синтеза речи.
С помощью виртуального рассказчика можно прослушивать книги, для которых еще не созданы аудиоверсии. Предыдущая нейросетевая модель оперативно генерировала голос, однако звучание часто оказывалось монотонным. Новейшая технология позволяет решить эту проблему.
В Яндексе рассказали:
Обновленная технология позволила сделать интонации рассказчика более выразительными и реалистичными, а стиль чтения адаптируется к жанру произведения. Новая модель обеспечивает высокое качество синтеза речи на русском языке, превосходя аналогичные разработки ведущих мировых компаний, в частности, в 80% случаев она синтезирует голос лучше, чем ElevenLabs.
При обучении модели использовались записи речи, сделанные совместно с профессиональными дикторами. Дикторы читали тексты различных жанров, включая фантастику, детективы, романы и учебные пособия. Это позволило виртуальному рассказчику изменять интонацию в соответствии с жанром произведения. Модель также научилась распознавать начало диалога и выделять реплики героев с помощью интонации. Озвучка доступна для более чем 120 тысяч произведений. Функция реализована в веб-версии и мобильном приложении сервиса.
Яндекс Книги» (ранее «Букмейт») — это книжный сервис, входящий в экосистему Яндекса и работающий по подписке «Яндекс Плюс». Он предоставляет доступ к электронным и аудиокнигам, а также предлагает интерактивные возможности для чтения. В сентябре 2024 года сервис «Букмейт» был переименован в «Яндекс Книги». В июне 2024 года в сервис была добавлена функция виртуального рассказчика, созданного на основе искусственного интеллекта, который может озвучивать 13 тыс. книг в реальном времени.
 
