Автомобілі на вулицях передбачили політичні уподобання жителів району

Американські дослідники створили комп'ютерну модель, яка вміє передбачати політичні уподобання громадян щодо їхніх автомобілів. Для цього вони проаналізували 50 мільйонів зображень Google Street View, зроблених у 200 американських містах, а також дані про перепису населення. Про це повідомляється в статті, опублікованій в журналі.


Для збору демографічних даних (наприклад, під час перепису населення) зазвичай використовують численні паперові або електронні опитувальники, які заповнюють або самі жителі, або фахівці під час інтерв'ю. Такі дані необхідні для соціоекономічних дослідженнях, зосереджених на вивченні різних показників життя громадян - тим не менш, традиційні методи їх збору та аналізу неефективні в плані величезної кількості витрат (як часу, так і фінансів).


Сучасні технології, однак, дозволяють полегшити цей процес за допомогою автоматичної обробки загальнодоступної інформації: так, наприклад, за допомогою даних про користувачів Twitter можна вирахувати безробітних. У своїй новій роботі дослідники під керівництвом Лі Фей-Фей (Li Fei-Fei) зі Стенфордського університету використовували дані про автомобілі жителів США для передбачення демографічних показників в окрузі.

Проаналізувавши зображення місцевості, дослідники отримали окремі зображення 22 мільйонів автомобілів, що приблизно дорівнює 32 відсоткам усіх зареєстрованих транспортних засобів на території міст, що потрапили у вибірку. Це вдалося зробити завдяки алгоритму розпізнавання, який класифікує об'єкти на основі ознак, отриманих при аналізі об'єктів (у даному випадку - транспортних засобів) з навчальної вибірки.

Подальший аналіз зображень автомобілів був проведений за допомогою згорточних нейронних мереж - найефективнішого на сьогоднішній день алгоритму розпізнавання зображень. Цей алгоритм допоміг класифікувати транспорт за типом (наприклад, легковий автомобіль, вантажівка або мінівен), виробнику, моделі та року випуску. Вчені потім склали базу даних, що містить інформацію про розподіл автомобілів певного типу в 200 містах. Крім того, в базу даних була включена інформація про розподіл раси, рівня освіти та середнього річного доходу жителів.

База даних потім була розділена на дві вибірки: навчальну (35 міст) і тренувальну (165 міст). Дослідникам вдалося навчити просту лінійну модель за типами і моделями автомобілів у містах визначати демографічні показники їхніх жителів. Порівняння отриманих результатів з реальними даними вказало на валідність використовуваного методу: так, наприклад, річний дохід був правильно визначений з імовірністю 82 відсотки, а факт закінчення школи жителів - з імовірністю 65 відсотків.

Найцікавішим результатом є те, що дослідникам вдалося за типом і маркою автомобіля визначити політичні уподобання жителів. Для цього в навчальній вибірці вони використовували відсоток тих, хто проголосував за Барака Обаму, який представляв демократичну партію під час Президентських виборів 2008 року. Так, вчені з'ясували, що переважання пікапів над седанами в окрузі пов'язане з тим, що округ проголосує за республіканців з імовірністю 82 відсотки, тоді як зворотна ситуація (коли седанів у регіоні більше, ніж пікапів), призведе до того, що за демократів проголосують з імовірністю 88 відсотків. Запропонована модель, на думку авторів, може послужити ефективною заміною традиційним методам збору демографічних даних.

Минулого року вчені створили карту, на яку помістили дані про чисельність жителів великих міст, зібрані за останні 6000 років. Про це ви можете прочитати тут.


COM_SPPAGEBUILDER_NO_ITEMS_FOUND