В Японии ржавеют два редких лимузина-внедорожника Chevrolet Suburban — их хотят продать

Яндекс откроет самый большой в мире набор данных, собранных беспилотниками: кому и для чего?

Новости

Александр Мирошкин

Комменты

Яндекс опубликовал самый большой в мире набор данных, собранных автономными автомобилями, которые используются для машинного обучения систем беспилотников. Это записи 1600 часов движения беспилотников Яндекса, которые ездили по России, Израилю и США.

Все эти данные разбиты на 600 000 фрагментов поездок беспилотников, а информация в них обезличена. То есть на выпущенных в открытый доступ роликах не видно регистраци­онных знаков других автомобилей или лиц пешеходов. При этом фрагменты содержат высокоточные карты маршрутов, треки остальных участников движения, их положение, скорость, ускорение и так далее.

Таким образом, в наборе опубликованных данных содержится всё необходимое для решения проблемы «сдвига данных» (distributional shift) в машинном обучении.

Что такое «сдвиг данных»?

Представьте себе элементарную ситуацию. Вы получили водительское удостоверение летом, неплохо научились ездить по сухому асфальту и чувствуете себя за рулём вполне уверенно. Но наступает зима: дороги становятся скользкими, разметку хуже видно под снегом, а водители других машин ведут себя совсем не так, как летом. И вам приходится адаптировать свои навыки под новые, более сложные условия.

Такие же задачи приходится решать беспилотным автомобилям, а справиться с ними помогает машинное обучение, которое на основе накопленных знаний прогнозирует ситуацию на дороге. 

Вот реальный и очень показательный пример. Один и тот же перекрёсток в Москве летом и зимой. Можно увидеть, что летом водители пересекают его быстрее и позволяют себе рискованные маневры. А зимой на снежной дороге они действуют более осторожно. Соответ­ственно, модель поведения, применимая летом, зимой будет работать хуже и её необходимо адаптировать.

Ещё один пример — езда в разных городах. Один из фрагментов записан в американском городе Энн-Арбор (штат Мичиган), а второй — в Москве. Налицо разница и в количестве машин на дороге, и в манере вождения. И в этой ситуации беспилотнику тоже надо уметь адаптиро­ваться с помощью машинного обучения.

Кому нужны эти данные и для чего?

Датасет опубликован для того, чтобы помочь разработчикам беспилотных систем в развитии систем машинного обучения. Одновременно запущен конкурс, который Яндекс проводит совместно с учёными из Оксфорда и Кембриджа. Заявив­шиеся разработчики должны буду использовать предо­ставленные данные для обучения собственных систем в части пред­сказания поведения других участников движения. Первый этап конкурса пройдёт с июля до начала октября.

На второй стадии (17–31 октября) командам предоставят новые данные. Часть их будет соответ­ствовать опубликованной ранее информации, а часть — новые примеры. За отведённый срок участникам нужно будет адаптировать свои наработки под новые условия. 31 октября жюри проверит системы на соответствие правилам конкурса с помощью третьего, закрытого набора данных. 

Победителя назовут 30 ноября. Главный приз — денежное вознаграждение.


Поддерживаете развитие технологий для беспилотных автомобилей?

Почитать ещё