Болезни можно прогнозировать по записям в микроблоге Команда исследователей из Рочестерского университета в США, руководителем которой стал Адам Садилек (Adam Sadilek), заявила об открытии нового алгоритма, который позволяет предсказать заболеваемость гриппом по записям пользователя в микроблоге. Авторы исследования утверждают, что могут определить повышенный риск простуды в следующие восемь дней. Хотя алгоритм предсказания выглядит почти как «гадание по Твиттеру», ученые провели эксперимент, который хорошо согласуется с теоретическими выводами. В частности, авторы провели поиск зависимости по записям жителей Нью-Йорка в микроблогах с учетом гео-тегов. Таким образом, удалось сопоставить время появления симптомов простуды и местоположение заболевших на карте. Применив модель распространения инфекционных заболеваний, авторы установили, что заболевание можно предсказать примерно за восемь дней. Фактически, новый алгоритм представляет собой комбинацию математического аппарата эпидемиологии и геоинформационой системы. Эпидемии и темы обсуждения в микроблогах имеют много общего. Новый алгоритм помогает отслеживать эпидемии простуды почти так же, как всплески внимания блоггеров к той или иной теме. Тем не менее, получаемые результаты содержат в себе нечто большее, чем просто констатация фактов. В частности, ученые проанализировали 4,4 млн. твитов с метками положения за один месяц. В результате получилась карта распространения гриппа или похожих на него простудных заболеваний по городу. Новый алгоритм анализа, в частности, учитывает разницу между субъективными описаниями заболеваний («ужасно болею, работать невозможно») и записями с явным выражением симптомов гриппа. Метки с указанием местоположения пользователя во время написания твита помогают узнать, где именно бывают люди, у которых проявляются симптомы, а также, бывают ли другие микроблоггеры в тех же местах города. Проведенный анализ показал, что прогнозировать заболевание можно с высокой степенью точности. С вероятностью 90% за 8 дней до первых проявлений можно предсказать, что здоровый сейчас автор заболеет. Не стоит, однако, придавать излишнее значение этим цифрам. Исследователи доказали, что их ретроспективный прогноз оказывается верным в 90% случаев, но в работе никак не учитываются заболевший люди, которые не зафиксировали этот факт в микроблогах и аналитических выкладках. Как бы то ни было, открытый алгоритм прогнозирования нельзя называть совершенным. Тем не менее, это явное указание на массу возможных статистических исследований в общественном здравоохранении. Например, если вы были в некоем месте, где в этот день зафиксирован всплеск сообщений о какой-то болезни, вы можете получить уведомление о высоком риске заболеть тем же недугом в течение следующей недели. Возможно, это поможет вам вовремя заняться профилактикой и защититься от очередной эпидемии. 31.07.2012 http://soft.mail.ru/pressrl_page.php?id=47645 http://www.popsci.com/science/article/2012-07/algorithm-scans-your-tweets-tell-you-if-youre-about-get-sick Видео можно посмотреть на http://www.newscientist.com/blogs/onepercent/2012/07/ai-predicts-when-youre-about-t.html?DCMP=OTC-rss&nsref=online-news