NLP,sentimental analysis：SNSではスタチンへの否定よりの投稿に偏っている

2023年5月6日 10:43

SNSのデータ解析を、AI技術、自然言語処理（NLP）、sentimental analysisを行ったところ

スタチンへの不安・不満は、副作用のプロファイル（例えば、筋痛、糖尿病のリスクの上昇、認知機能障害; グループ2）、LDL-C仮説への不信感、ライフスタイルの代替手段への嗜好（例えば、食事やサプリメントの変更; グループ1, 3, 6）、一般的な医療への不満（グループ5）、スタチンがCOVID-19の転帰を改善する役割、ケトジェンダイエットによるライフスタイルの改善と無症候性脂質異常症の発症の矛盾、冠動脈カルシウムスコアをスタチン開始の確信的なデータポイントとして使用すること、スタチンが胎児幹細胞で作られたという懸念からスタチンに対する懐疑心など多岐にわたっている

そして、ソーシャルメディアの投稿や議論の感情分析では中立から否定的な感情主体となっている。

Somani, Sulaiman, Marieke Meija Van Buchem, Ashish Sarraju, Tina Hernandez-Boussard, and Fatima Rodriguez. “Artificial Intelligence–Enabled Analysis of Statin-Related Topics and Sentiments on Social Media.” JAMA Network Open 6, no. 4 (April 24, 2023): e239747. https://doi.org/10.1001/jamanetworkopen.2023.9747.

キーポイント

【Question】広く利用されているソーシャルメディアプラットフォームで表現されるスタチンに対する一般市民の認識はどのようなものか？
【本研究では、スタチンに関する10】 233件のユニークな議論を対象に、人工知能（AI）パイプラインを開発し、これらの議論を分析した。これらの議論は、100のトピックと6つのテーマグループ（ケトジェニックダイエット、糖尿病、サプリメント、スタチン、スタチン副作用、スタチン躊躇、臨床試験評価、医薬品業界のバイアスとスタチン、紅イーストライスとスタチン）に自動分類された。これらのディスカッションのセンチメント分析では、そのほとんどが中立または否定的なセンチメントを持つことが示されました。
【意味】本研究で得られた知見は、現代の大規模なソーシャルメディアデータをAIで解析することで、一般市民の認識に関する洞察を生み出し、スタチン使用とアドヒアランスの障壁に対処するための戦略の指針になる可能性を示唆している。

要旨

【重要】スタチンは安全であり、一般的に忍容性が高く、心血管イベントを減少させるという説得力のある証拠にもかかわらず、最もリスクの高い患者においてさえスタチンは十分に使用されていない。ソーシャルメディアは、スタチンに関する一般市民の認識について現代的な洞察を提供する可能性がある。
【目的】広く利用されているソーシャルメディアであるRedditにおける10年以上にわたるスタチン関連の議論から得られた、スタチンに関する一般市民の認識を特徴づけ、分類すること。
【デザイン、設定、参加者】本質的研究では、2009年1月1日から2022年7月12日までの日付のソーシャルメディアプラットフォーム上のすべてのスタチン関連ディスカッションを分析した。スタチンおよびコレステロールに焦点を当てたコミュニティを特定し、スタチン関連のディスカッションのリストを作成した。人工知能（AI）パイプラインは、これらのディスカッションを特定のトピックと包括的なテーマグループに分類するために開発されました。パイプラインは、半教師付き自然言語処理モデル（BERT [Bidirectional Encoder Representations from Transformers]）、次元削減技術、およびクラスタリングアルゴリズムで構成されている。各議論の感情は、事前学習されたBERTモデルを使用して、肯定、中立、または否定としてラベル付けされた。
【エクスポージャー】スタチンやコレステロールという用語を含むスタチン関連の投稿やコメント。
【主な成果および測定法】スタチン関連のトピックおよびテーマグループ。
【結果】 5188人のユニークな著者による合計10 233のユニークなスタチン関連の議論（961の投稿と9272のコメント）が同定された。スタチン関連のディスカッションの数は、1年あたり平均32.9％（41.1％）の割合で増加した。合計100のディスカッショントピックが特定され、6つの包括的なテーマグループに分類された：（1）ケトジェニックダイエット、糖尿病、サプリメント、スタチン、（2）スタチン副作用、（3）スタチン躊躇、（4）臨床試験評価、（5）製薬業界の偏見とスタチン、（6）レッドイーストライスとスタチン。センチメント分析の結果、ほとんどの議論が中立（66.6％）または否定的（30.8％）のセンチメントであったことがわかった。
【結論と関連性】本研究の結果は、大規模かつ現代の一般公開されたソーシャルメディアデータを分析し、スタチンに関する一般市民の認識に関する洞察を生み出すAIアプローチの可能性を示しました。この情報は、スタチン使用とアドヒアランスの障害に対処するための戦略を導くのに役立つと考えられる。
【www.DeepL.com/Translator（無料版）で翻訳しました。】

序文 written with ChatGPT4

スタチンは、世界で最も死亡原因となる動脈硬化性心血管疾患（ASCVD）の罹患率と死亡率を確実に減らします。そのため、スタチンはASCVDの治療と予防において現代の臨床実践ガイドラインで重要な役割を果たしています。スタチンは、米国で最も一般的に処方される薬の一つで、過去10年間のすべての約17%を占めています。これは、広範囲に利用可能であること、低コストであること、高い効果があること、および多くの臨床的適応があることが理由です。しかし、スタチンの利点と安全性が確立されているにもかかわらず、ガイドラインが推奨する高リスクな個人でのスタチン使用が十分でないことがあります。
スタチンの不十分な使用の理由を理解することは、ASCVDの予防と治療に向けた公衆衛生および実施努力を促すために重要です。ソーシャルメディアプラットフォームは、医療現場外での健康に関する意見を理解するための有望な手段となっています。これらのプラットフォームは、個人の話や意見交換、さまざまな話題についての議論を行うために使用されます。これらのプラットフォームは、編集されていない透明なピアディスカッションを通じて情報や誤情報を迅速に広めます。
過去数年で健康関連の目的で人気を集めているソーシャルメディアプラットフォームの一つがRedditで、スタチンを含む多様な分野の質問、コメント、トピックが投稿できるディスカッション型のプラットフォームです。Redditは無料であり、5200万人の毎日のアクティブユーザー、およそ4億3000万人の月間ユーザーがおり、毎月300億回以上の閲覧があります。このプラットフォームの広範な利用により、スタチンに関する患者の意見や誤情報が大規模に収集され、分析される可能性があります。本研究の目的は、Redditでの10年以上にわたるスタチン関連の議論から得られた一般の認識を分析し、分類することです。
スタチンの使用に関する患者の視点を理解することは、ASCVDの予防と治療に向けて公衆衛生や実施努力を促す上で重要です。ターゲット化されたアンケートやフォーカスグループを使用してスタチン使用の障壁を調査する方法があるものの、これらは広く一般化できない場合があります。7-9
Redditなどのソーシャルメディアプラットフォームは、健康に関する情報や意見を収集するための有望な方法です。Redditは、広範な患者視点のデータを提供することができ、スタチンに対する誤情報が影響を与える可能性があります。15

手動でのソーシャルメディアデータ分析は限定的であり、AI技術を活用することで、患者生成データの分析や解釈が容易になります。NLPは、大量のテキストデータから洞察を得ることができるAI技術で、Redditでのスタチン関連の議論から一般の認識を分析し、分類することを目的としています。

discussion written wit ChatGPT4

この質的研究では、ソーシャルメディアプラットフォームから10年以上にわたる患者生成データを利用し、スタチンに対する一般の信念と認識を明らかにしました。AI技術を用いて、5188人の著者から10,233件のユニークな議論を分析しました。このアプローチでは、6つのテーマグループに分類される100のトピックが識別されました：(1) ケトジェンダイエット、糖尿病、サプリメント、スタチン；(2) スタチンの副作用；(3) スタチンへの懐疑心；(4) 臨床試験の評価；(5) 製薬業界のバイアスとスタチン；(6) 赤麹米とスタチン。感情分析では、これらの議論は中立から否定的な感情が主であることが示されました。これらの結果は、スタチン使用に対するコミュニティの認識や変更可能な障壁を浮かび上がらせました。
本研究では、AIがスタチンに対する一般の認識を理解するためにソーシャルメディアデータの抽出と分析を自動化する可能性を示しました。これは、Twitter投稿の手動での質的分析を用いてスタチンの態度と信念を評価した過去の研究を補完し、拡張しています。13 トピックの事前指定は、予期しない新たなアイデアを見逃す可能性があるため、研究のAI対応アルゴリズムは、議論をトピックやより広いグループに半自動的に組織化し、これらの議論に対する感情をカテゴリ分けしました。大量の貴重なソーシャルメディアデータを効率的に抽出し、解釈することで、AIは大規模で公衆の感情を継続的に監視する展望を提供します。
本研究の主要な議論グループは、スタチンに関する患者の信念を評価した先行研究の結果と一致しています。例えば、USAGE（Understanding Statin Use in America and Gaps in Patient Education）研究およびPALM（Patient（Provider Assessment of Lipid Management）レジストリは、患者の認識とスタチン服用への障壁を特定しています。 本研究は、これらの先行研究の一部の結果を裏付け、スタチンへの懐疑心に関連する類似の理由を明らかにしました。これには、副作用のプロファイル（例えば、筋痛、糖尿病のリスクの上昇、認知機能障害; グループ2）、LDL-C仮説への不信感、ライフスタイルの代替手段への嗜好（例えば、食事やサプリメントの変更; グループ1, 3, 6）、一般的な医療への不満（グループ5）が含まれます。さらに、スタチンがCOVID-19の転帰を改善する役割、ケトジェンダイエットによるライフスタイルの改善と無症候性脂質異常症の発症の矛盾、冠動脈カルシウムスコアをスタチン開始の確信的なデータポイントとして使用すること、スタチンが胎児幹細胞で作られたという懸念からスタチンに対する懐疑心が新たに明らかになりました。Redditのような公開されているソーシャルメディアプラットフォームから匿名で非キュレーションされたインフォーマルなピアツーピアの議論を活用することで、フォーカスグループや臨床試験の設定で特定されないかもしれないトピックや感情が明らかになる可能性があります。
スタチンに関するソーシャルメディアの投稿や議論の感情分析では、主に中立から否定的な感情が示されました。先行研究では、スタチンに関する悪い評判が患者の服薬遵守に影響を与えることが示されています。例えば、デンマークの研究では、スタチンに関する不利なメディア報道が、新規スタチン使用者の減少および報道から1年以内の現行スタチン使用者のスタチン中止の増加と関連していることがわたことが示されています。35 より積極的な公衆衛生の取り組みが、容易にアクセスできるソーシャルメディアプラットフォーム上の健康関連の誤情報を監視するために必要です。
スタチン関連の誤情報のいくつかの例が特定されました。これには、LDL-Cが心臓病と因果関係があるという仮説に対する不信感（例えば、「私はLDLはほとんど関係ないと思います。HDLとトリグリセリドがはるかに重要です」[r/keto, topic 7]）や、COVID-19とスタチンとの関連についての不信感（例えば、「結果は、COVID-19で入院した患者においてスタチン療法の潜在的な利点を示唆しています」[r/COVID19, topic 78]）が含まれます。自然なサプリメントの代替品への支持（例えば、「赤麹米は基本的にスタチンです」[r/Cholesterol, topic 69]；「スタチンは基本的に菌毒素であり、CoQ10、ビタミンD、K、A、Eなどの脂溶性栄養素を枯渇させ、おそらくこれらの枯渇を通じて心血管の健康を悪化させる」[r/Supplements, topic 90]）は、この研究で複数のテーマグループ（1, 2, 4）で強力でしたが、最近のSPORT（Supplements, Placebo, or Rosuvastatin）試験では、低用量のロスバスタチンでは一般的なサプリメントと比較してプラセボと比較してLDL-Cが大幅に減少しました。36 このような誤解は、ソーシャルメディアプラットフォームに投稿されると、誤情報の拡散の種となることがあります。例えば、本研究で使用されたソーシャルメディアプラットフォーム上の議論は、プラットフォームがアカウントを持つ必要がないため、容易にアクセスでき、検索エンジンで高く表示されます。また、一部の人々は、このプラットフォームをデフォルトの検索エンジンとして使用しています。37 これらの要因は、COVID-19パンデミック中の誤情報の拡散が報告されたように、影響を受けやすい層に誤情報が広まる可能性があります。38 事実上のデマを理解し、解決策を設計することを最優先事項として、アメリカの外科医総監事務所が最近インフォデミック（情報過多）時代の健康デマに関する大きな優先事項として強調しており、39 本研究の重要性を示しています。
本研究では、AIを用いてソーシャルメディアデータから一般のスタチンに対する認識を把握することの可能性が示されました。これは、Twitter投稿の手動での質的分析を用いてスタチンに対する態度や信念を評価した先行研究を補完し、拡張しています。13 トピックの事前指定では、予期しない新たなアイデアを見逃すことがあるため、本研究ではAIを用いたアルゴリズムが、議論をトピックやより広いグループに半自動的に分類しながら、これらの議論に対する感情をカテゴリ分けしました。AIは、大量の貴重なソーシャルメディアデータを効率的に抽出し、解釈することで、大規模に一般の感情を継続的に監視する見通しを提供します。

これらの調査結果は、スタチン利用に関する地域社会の認識や変更可能な障壁を浮き彫りにし、スタチンに関する誤情報を広める可能性のある投稿や議論を特定することで、公衆衛生の専門家がアクセスできる情報源を提供しています。将来的には、このような情報を活用して、一般市民や患者に対する正確で信頼性の高い情報提供を強化し、スタチンに対する誤解や懸念を解消することが期待されます。

bingに"sentimental analysis"聞いたらWikipeidiaへ繋がれた

それで、同じく、written ChatGPT-4

感情分析（Sentiment analysis）とは、テキストデータ（例：ソーシャルメディア投稿、商品レビュー、意見など）から、著者の感情、意見、態度を把握し、評価する自然言語処理（NLP）の技術です。感情分析の主な目的は、ポジティブ、ネガティブ、ニュートラルなどの感情のカテゴリを特定し、これらの感情がデータ内でどのように分布しているかを分析することです。

感情分析は、以下のような手法で行われます。

辞書ベースのアプローチ：事前に定義された単語やフレーズのリスト（辞書）を使用し、それらがポジティブかネガティブかを判断します。テキスト内の単語が辞書と一致する場合、その感情スコアがテキスト全体の感情スコアに影響を与えます。
機械学習ベースのアプローチ：大量のラベル付きデータ（感情が既に分類されたテキスト）を使用して、機械学習アルゴリズムを訓練します。訓練されたモデルは、新しいテキストデータの感情を分類するために使用されます。
深層学習ベースのアプローチ：ニューラルネットワーク（例：リカレントニューラルネットワーク（RNN）やトランスフォーマー）を使用して、テキストの感情分析タスクを行います。これらの手法は、文脈や言語のニュアンスをより正確に捉えることができます。

感情分析は、企業が顧客の意見や反応を理解し、マーケティング戦略や製品開発を改善するために利用されます。また、公衆衛生や政策立案においても、市民の意見や懸念を把握するために役立ちます。

この記事が気に入ったらサポートをしてみませんか？