Google відкрив доступ до своїх розробок в області комп'ютерного зору

Компанія Google випустила API сервісу комп'ютерного зору Cloud Vision. Використання API дозволить реалізувати розпізнавання різних об'єктів навіть у проекті з невеликими обчислювальними потужностями. Про це повідомляється в офіційному блозі хмарних сервісів Google.


За допомогою Cloud Vision API розробники можуть реалізувати у своїх проектах читання письмового тексту, розпізнавання предметів, логотипів, людських облич і визначних пам'яток. Крім того, хмарний сервіс допомагає розпізнати небезпечні зображення (аналог Google SafeSearch у пошуку зображень) і деякі базові емоції людини: злість, радість, подив.


Для демонстрації можливостей API представники компанії показали кілька прикладів на простому колісному роботі на базі Raspberry Pi. Зокрема, робот показав здатність розпізнавати різні об'єкти і називати їх вголос. Крім того, в опублікованому ролику робот під'їжджає ближче до людини, якщо бачить усміхнене обличчя.

Раніше, в листопаді 2015 року, доступ до свого сервісу розпізнавання емоцій відкрила Microsoft. Сервіс, розроблений в рамках Project Oxford, розподіляє умовні «бали» від одного до десяти між сумом, злістю, огидою, презирством, страхом, щастям, і подивом.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND