Simon Kozlov:
Странные люди в Финляндии хотят делать unsupervised object segmentation для роботов - http://techcrunch.com/2015/10/02/do-androids-dream-of-curious/
Я так понимаю, хотят попытаться сделать reinforced learning для object segmentation,
т.е. чтобы робот перебирал треш и сортировал его, обучаясь в процессе.
Это близко к holy grail.
(segmentation - это задача определения какому объекту принадлежит каждый пиксель в изображении)
Simon Kozlov:
Здесь не совсем reinforced learning в классическом понимании, но в чем-то похоже.
Положим перед роботом кучу предметов, натравим CNN, который делает object segmentation, чтобы он различил эти объекты.
Потом попробуем "схватить" эти объекты манипулятором под всеми возможными углами и с разными сдвигами отностиельно центра.
Померяем датчиками, получилось ли поднять без того, чтобы они не упали.
И вот на этом натренируем пару новых уровней в нейросети, которая получает на вход изображение,
и таким образом будем предсказывать, получится таким образом объект схватить или нет.
Overall, of the 150 tries, Baxter grasps and raises novel objects to a height of 20 cm at a success rate of 66%. The grasping success rate for previously seen objects but in different conditions is 73%
Т.е. объекты, которые видел раньше - удачно поднимает в 73% случаев. А те, которые раньше не видел - в 66%
Очень клево это все.
Пишут, предсказание с помощью deep net значительно точнее простых эвристик типа "хватай по центру" итд,
но HoG features без deep learning кстати тоже нормально выступают.
Главное хоть на чем-то учиться.
https://www.youtube.com/watch?v=Mr7U9pQtwq8 - вот такой клевый робот.