Цифровая эпидемиология

Революция средств коммуникации, начавшаяся в 90-тых годах, не только «подарила» каждому из нас мобильный телефон – она привела к возникновению новых способов общения людей и к переводу основных процессов этого общения в интернет. Такая «цифровизация» заставила измениться и учитывать новые реалии множество сфер нашей жизни – в первую очередь, науку, поскольку Интернет, исходно, разрабатывался для академических целей. Эпидемия COVID-19, продолжающаяся последних лет, еще более обострила вопрос, что делать с массой онлайн-информации, которая сопровождает каждое событие в наше время.

У медицины, кажется, есть ответ на этот вопрос. Он называется «цифровая эпидемиология».

 

Эпидемиология традиционная

Эпидемиология, в буквальном переводе с греческого – «наука о людях», изучает динамику здоровья и болезней в человеческой популяции. В настоящее время эпидемиология – это не некая медицинская отрасль, а, скорее, подотрасль дисциплины под общим названием «общественное здравоохранение» (public health).

Эпидемиологию часто связывают только с эпидемиями, но это неправильно. Проблема в том, что исторически основную проблему для здоровья населения составляли именно инфекционные заболевания, в связи с чем эпидемиология и занималась преимущественно эпидемическими процессами, но, начиная с середины XX века, основной проблемой здоровья населения стали заболевания не эпидемического характера. Эпидемиологические исследования стали применять при изучении любых болезней и состояний, носящих массовый характер, в том числе вызванных физическими и психическими, социальными и другими факторами1. Такие исследования направлены на выявление распространения, заболеваемости и этиологии наших заболеваний с целью улучшения понимания их причин и предотвращения их распространения.

Вплоть до последних лет эпидемиология основывалась на данных, собранных органами здравоохранения через медицинский персонал в медучреждениях и на местах (в полевых условиях).  Однако коммуникационная революция последних десятилетий привела к тому, что подавляющее большинство типов современной связи стало цифровым, а количество пользователей устройств, обеспечивающих подобную связь, во многих странах мира сравнялось с количеством лиц в популяции, способной ими пользоваться2. Как следствие, все большая часть того, что мы говорим и делаем, включая так называемое «эпидемиологически значимое поведение» – то есть записи о жалобах пациентов на какую-либо симптоматику (например, в карточке амбулаторного пациента или истории болезни), рекомендации врача по поводу профилактики (вакцинация) или лечения (рецепты и листы назначений) и тому подобное, – теперь хранится в электронном виде в форме, доступной анализу. Извлечение необходимой информации из этого потока данных довольно сложно, но вполне реально – и невероятно полезно для эпидемиологии3.

 

Коммуникационная революция

Коммуникационная революция – это термин, которым принято называть бурный рост использования мобильных телефонов и Интернета в последние несколько десятилетий. Как следствие этого процесса появились новые, цифровые источники данных (в первую очередь, чаты, социальные сети, блоги и тому подобное), где информацию можно было собирать уже непосредственно от отдельных людей с помощью оставляемых ими цифровых следов, пользуясь современной связью и современными электронными устройствами.

Так, например, именно социальные сети и обмен в них научной информацией заставили ученых разработать новые методы фиксации и оценки сетевого влияния научных публикаций и существенно повлияли на все понимание инфометрии  (науки о том, как генерируется, передается и обрабатывается информация) и взаимодействия между ее отраслями в частности. Это привело к возникновению альтметрик – нового инструмента, позволяющий обрабатывать и анализировать данные, поступающие из соцсетей и блогов – и такого нового раздела инфометрии, как вэбометрия, то есть отрасль, занимающаяся изучением «жизнедеятельности» информации уже конкретно в Интернете4.

 

Эпидемиология в цифре

Именно упомянутый выше инструментарий и был использован эпидемиологами для обработки эпидемиологически значимой информации, поступающей из Интернета5.

Эти цифровые источники, включая уже упомянутые выше чаты, социальные сети, блоги, а также онлайн-СМИ и даже кеш веб-поиска, имеют целый ряд преимуществ:

  • позволяют собирать информацию фактически в режиме реального времени,
  • облегчают получение зарубежных данных и тем дают возможность быстрого и более точного установления глобальной картины проблемы,
  • заполняют пробелы в инфраструктуре общественного здравоохранения,
  • дополняют существующие традиционные системы эпиднадзора.

Так, например, мы можем наблюдать парадоксальную картину: в развивающихся странах, где возможности лабораторного и клинического надзора не работают полноценно, развитие средств цифровой связи уже достаточно для того, чтобы получить необходимую информацию о заболевании6.

Цифровые источники данных  предоставляют локальную и своевременную информацию о вспышках заболеваний и связанных с ними событиях по всему миру. Они сокращают время между возникновением эпидемии и ее официальным признанием, что позволяет оперативно реагировать на угрозу. Обеспечивают раннее предупреждение о возникновении респираторных заболеваниях в местных сообществах и позволяют обнаружить факт отказа от вакцинации (или готовности к такому событию) и проследить его причины. Могут рассказать нам о новых тенденциях в эпидемиологически значимых моделях поведения, связанных со здоровьем, – например, о волне увлечения айкосами и отказе на этом фоне от курения традиционных сигарет – на местном и глобальном уровнях.

Последнее – немаловажная помощь эпидемиологам, ведь на здоровье популяции и возникновение и протекание хронических заболеваний типа депрессии, диабета II типа, сердечно-сосудистых и легочных заболеваний влияет масса разнообразных факторов риска (злоупотребление наркотиками, курение, неправильное питание, физическая активность и так далее), закономерности влияния которых найдены эмпирически и требуют дальнейшего изучения, которое тяжело организовать методами традиционной эпидемиологии. Информация же из Интернета более разнообразна, масштабна и своевременна, что облегчает изучение процессов, посредством которых возникает эта эмпирическая закономерность.

Немаловажна и возможность отслеживания индивидуального поведения, которое является одной из составляющих контроля распространения инфекционного заболевания на ранних этапах.

Так, например, при возникновении нового патогена (как это случилось с ковидом) главный фактор его опасности – быстрое распространение. Индивидуальное поведение в этом случае играет ключевую роль в усилиях по социальному дистанцированию как ранней реакции на вновь возникающее, быстро распространяющееся инфекционное заболевание. Усиливающаяся же глобализация нашего мира увеличивает значение этого фактора и в распространении уже имеющихся инфекций5.

Также в плане исследований инфекционных заболеваний цифровая эпидемиология имеет огромный потенциал как средство, позволяющее углубить понимание предполагаемых путей передачи, которые еще не установлены эмпирически. Например, нам все еще нужны данные, указывающие на относительную важность воздушно-капельной и контактной передачи гриппа и других распространенных респираторных инфекций в естественных условиях. До тех пор, пока ученые не узнают наверняка, какой именно фактор передачи из этих двух играет главную роль, и не проанализируют влияние всех факторов и путей передачи, рекомендации по предотвращению заболевания будут не способны полноценно защитить человека от респираторных вирусов.

При этом провести необходимые исследования довольно просто: можно, например, заставить членов небольшого коллектива (школа, завод) носить на себе цифровые устройства, которые определяют расстояние и положение людей относительно друг друга, а также записывают их перемещения в пространстве. Данные о близости и пространственной мобильности в сочетании с регулярным наблюдением за симптомами и случаями заражения, а также секвенированием вируса дадут возможность определить путь передачи инфекции, который привел к заражению каждого конкретного участника исследования. Если прямого контакта не было, а заражение произошло – то «виноват» не воздушно-капельный путь передачи.

Данные мобильного телефона в виде записей о звонках (содержащих информацию о местонахождении вышки мобильной связи, используемой во время звонка с мобильного телефона) предоставляют одну из самых интересных на сегодняшний день возможностей для изучения мобильности человека и ее влияния на динамику заболевания, что, в свою очередь, позволяет изучать географическое распространение и устойчивую передачу инфекционных заболеваний, в том числе – прогнозировать скорость распространения лекарственной устойчивости. Сбор и анализ информации из Интернета на данный момент позволяет наблюдать за пространственно-временными перемещениями миллионов людей во время вспышек заболеваний, обнаруживать новые и необычные заболевания в любом уголке земного шара, оценивать уровни активности гриппа в реальном времени.

 

Плохой хороший Google Flu Trends

Одной из попыток использования новых технологий в эпидемиологии стал проект под названием Google Flu Trends, который был запущен в 2008 году и официально закрыт в 2015 из-за недостаточной точности. Он опирался, главным образом, на методологию анализа больших данных и анализировал  поисковые запросы и уведомления в Интернете по соответствующим ключевым словам. Главной начальной целью Google Flu Trends было преодолеть 2-недельную задержку в отчетности о случаях гриппа и ОРЗ в официальной статистике эпиднадзора.

Методология начальной версии Google Flu Trends заключалась в том, чтобы найти совпадения среди 50 миллионов поисковых терминов, соответствующие 1152 точкам данных. Разработчиками были выделены 45 поисковых запросов, исторически связанные с гриппом и ОРЗ. Однако Google Flu Trends дал неправильные, как тогда показалось, оценки эпидемии 2009 года, и его принялись улучшать. Все это привело к тому, что в 2015 году проект окончательно закрыли.

Казалось бы, это свидетельствовало о крахе возможностей прогнозирования эпидемий по цифровым источникам данных.

Однако еще во время функционирования Google Flu Trends ряд ученых высказывал предположение, что потенциал службы недооценен. Так, уже в 2009 году вышла статья, анализировавшая прогностические возможности Google Flu Trends на материале новозеландской эпидемии гриппа H1N1, авторы которой продемонстрировали общее соответствие прогнозов Google Flu Trends прогнозам местной системы здравоохранения и пришли к выводу, что в целом Google Flu Trends предоставляет полезную бесплатную систему наблюдения, которую можно рассматривать как дополнительную к традиционным. А когда через 10 лет были проанализированы ошибки, допущенный службой при оценке эпидемиологической ситуации в течение 5 сезонов гриппа и ОРЗ, с последующим перерасчетом данных по новой методике, оказалось, что после перерасчета произошло общее снижение погрешности Google Flu Trends на 44% и на 80% – в течение 2012/13 годов, когда прогнозы системы разошлись с реальной эпидемиологической ситуацией максимально. К тому же погрешность результатов Google Flu Trends после внесения коррекции в расчеты оказалась меньше, чем у официальной системы мониторинга по ОРЗ ILINet, используемой Центрами по контролю и профилактике заболеваний (США)7.

Аналогично, нидерландское исследование 2020 года, использовавшее общую методику Google Flu Trends, но в модифицированном виде, продемонстрировало возможность точного прогнозирования заболеваемости гриппом и ОРЗ в режиме реального времени с помощью данных поисковых запросов Google.

На данный момент считается, что не в последнюю очередь на погрешность Google Flu Trends повлияла проблема так называемой «голубой» и «красной» ошибки – то есть манипулирования данными владельцами службы в коммерческих целях8. Подобная зависимость – одна из причин, по которой цифровые данные не так легко анализировать и собирать, как кажется. Также существует и проблема конфиденциальности, а также банальной лжи пользователей, по каким-то своим мотивом распространяющих недостоверную информацию.

И все же, несмотря на эти недостатки, цифровая эпидемиология была и продолжает оставаться совершенно необходимой для современной науки отраслью, чей потенциал еще будет раскрываться.

Примечания

Количество просмотров: 26.
Добавить комментарий