Microsoft Research работает над визуальным распознаванием объектов Project Adam
На проходящей в эти дни в Вашингтоне Microsoft Research Faculty Summit Гарри Шэм (Harry Shum) представлил новый проект под название Project Adam, который тесно интегрирован с цифровым помощников Cortana и служит для визуального распознавания объектов.
Работает алгоритм с помощью нейронной сети в основу которой легли 14 миллионов изображений из сервиса Flickr и других популярных сайтов. Далее изображения были разделены на 22 000 категорий при помощи тегов изображений. Можно сказать, что Microsoft находится в числе первых, кто всерьез занимается визуальным распознаванием объектов.
На презентации новой технологии было продемонстрировано распознавание трех пород собак. Распознать Cortana смогла лишь первые две собаки, а вот с третьей возникла путаница, но тут скорее дело было в том, что существует очень много визуально схожих пород собак, которые способны различить лишь специалисты и хозяева. В целом тест прошел успешно и Cortana, надо сказать, не увидела в Гарри какую-либо породу собак.
Технология выглядит довольно полноценной и работоспособной. После просьбы помощника Cortana распознать визуально породу собаки, она просит сфотографировать объект, после чего в течение нескольких секунд уже готова выдать ответ.
По теме
- Microsoft запатентовала технологию воссоздания умерших людей в виде чат-ботов
- Microsoft представила свой сервис облачного гейминга Project xCloud
- Компания Microsoft погрузила на морское дно дата-центр
- Искусственный интеллект Microsoft обошел человека и конкурента от Alibaba в тесте на понимание полученной информации
- Microsoft патентует сканер отпечатков пальцев, встроенный в дисплей
- Microsoft представила платформу обучения ИИ Project Brainwave
- Microsoft достигла 5.1% ошибок в распознавании речи
- Бот Zo сказал, что Linux лучше Windows
- Чат бот Zo от Microsoft заговорил на запрещенные темы
- Microsoft Research создает гарнитуру дополненной реальности в виде обычных очков