Яндекс предоставил доступ к крупнейшему в мире набору данных для совершенствования рекомендательных систем.

В Яндексе опубликовали открытый набор данных Yambda (YAndex Music Billion-interactions DAtaset), один из крупнейших в мире для обучения систем рекомендаций. С его помощью учёные, исследователи и университеты смогут тестировать и совершенствовать алгоритмы предсказания предпочтений пользователей.

Сгенерировано нейросетью Dall-E

Датасет выпускается в трёх версиях: полная версия включает 5 миллиардов данных, уменьшенные версии — 500 миллионов и 50 миллионов. Разработчики и исследователи могут выбрать подходящий вариант в зависимости от задачи и имеющихся вычислительных ресурсов. Данные датасета и код для измерений доступны на… HuggingFace.

Yambda разработан с использованием обезличенных данных «Яндекс Музыки», самого крупного подписного музыкального сервиса в России. В Яндексе отметили, что его можно применять для оценки качества любых систем рекомендаций, так как основаны главные алгоритмы общего назначения.

Yambda использует агрегированные прослушивания, оценки «нравится» и «не нравится», а также некоторые характеристики музыкальных композиций. Все данные о пользователях и треках анонимизированы: набор данных содержит только числовые идентификаторы, что гарантирует конфиденциальность.

Техноблог

Яндекс предоставил доступ к крупнейшему в мире набору данных для совершенствования рекомендательных систем.

Китайская ракета-носитель нового поколения совершила успешный первый полет.

Испытание герметичности прогресса МС-31 прошло на Байконуре

Amazfit Bip 6: полный обзор

Анализ блендера Felfri FF-CB-13

Обзор материнской платы Asus TUF Gaming Z890-Pro WiFi с чипсетом Intel Z890

DeepSeek обогнал конкурентов: чат-бот совершенствован

Продажи «Москвича 8» перенесены на неопределенный срок.

Гарантия на автомобили Mercedes-Benz в России: два года или 100 тысяч километров.

MSI выпустила портативную игровую консоль Claw A8 на базе процессора AMD Ryzen Z2 Extreme

Китайский спутник Тианду-1 возглавил покорение резонансной орбиты Земля-Луна.