17 марта 2016 20:05

Новый алгоритм распознает "пьяные" твиты

Ученые из Рочестерского университета в США разработали алгоритм, который способен распознавать записи, отправленные в Twitter в состоянии алкогольного опьянения. За основу исследователи взяли 11 тысяч твитов с привязкой к GPS-координатам, которые были опубликованы в Нью-Йорке и округе Монро за последний год, а затем отфильтровали их по наличию ключевых слов, связанных с выпивкой ("пьяный", "пиво", "вечеринка" и т.д.).

Затем команда, возглавляемая Набилом Хоссейном, обратилась за помощью к краудсорсингому сервису Amazon Mechanical Turk, участники которого позволили определить, действительно ли пользователи были пьяны, когда постили записи в Twitter, либо просто писали о выпивке.

Выработанная американскими учеными методика также позволила вычислить, кто распивал спиртные напитки у себя дома (на основе фраз "наконец-то дома!", "ванная", "диван" и др.), а кто — в других местах с точностью 80%. Например, как выяснилось в результате сопоставления твитов с точками продаж алкоголя, большая часть жителей Нью-Йорка пьянствует в 100 метрах от дома, а жители округа Монро — не менее чем в километре.

Ближайшая задача ученых — узнать, как привычка употребления спиртного меняется в зависимости от пола, возраста и этнической принадлежности. Вклад нового алгоритма в изучение влияния алкоголя на здоровье, возможно, поможет предотвратить инциденты и несчастные случаи, связанные с ведением нетрезвого образа жизни.

Источник: MIT Technology Review