В 2025 году опубликовано исследование, в котором предложен метод построения графа побочных эффектов лекарств (knowledge graph, KG), использующий сочетание больших языковых моделей (LLMs) и краудсорсинга из социальных сетей. В качестве примера разработчики выбрали семаглутид — препарат, применяемый для снижения веса и лечения диабета.
Что сделано
-
Собраны сообщения пользователей о семаглутиде с платформы Reddit (в том числе бренды Ozempic, Wegovy и Rybelsus).
-
С помощью LLM (например, GPT-4 в подсборке) извлечены триплеты «лекарство — побочный эффект — атрибуты (тяжесть, продолжительность)».
-
Построен граф, где узлами являются препараты и реакции, а рёбра — связь между ними, с весами, отражающими частоту или силу связи.
-
Проведено сравнение с базой FAERS (FDA Adverse Event Reporting System) — многие выявленные сигналы совпали, но также обнаружены уникальные эффекты, не всегда отражённые в классических отчётах.
Почему это важно
-
Это показывает, как неструктурированные данные пользователей могут дополнять традиционные базы фармаконадзора.
-
Использование ИИ ускоряет анализ больших массивов текстов, выявляя слабозаметные закономерности.
-
Такой подход может помочь быстрее выделять потенциальные новые сигналы, особенно для препаратов, широко применяемых вне клинических условий.
-
Метод универсален и может быть адаптирован для других препаратов и терапевтических классов.
Исследование демонстрирует, как современные технологии — ИИ + краудсорсинг — могут увеличить эффективность фармаконадзора и дать более пациент-центричный взгляд на безопасность лекарств.