HIV感染者の集中治療ユニットへの入院のリスクを予測するための機械学習アルゴリズム:単一中心の研究| Virology Journal

HIV感染者の集中治療ユニットへの入院のリスクを予測するための機械学習アルゴリズム:単一中心の研究| Virology Journal

1754407359 2025-08-05 15:03:00 中国では、抗レトロウイルス療法がPLWHSに利用可能ですが、日和見感染症とHIV関連の併存疾患は依然としてICUへの入院の主な理由であり、社会経済的負担を増加させ、ICUの受け入れのリスクを減らすための深刻な併存疾患の発生のタイムリーな予測を思い出させます。特定の危険因子を予測するためのMLモデルに基づくインテリジェントなヘルスケアシステムは、臨床研究に潜在的な価値を持っています [11,12,13]、ICU入場を含む。 ML-Modelベースのインテリジェントヘルスケアシステムは、医師がICU入院のリスクをタイムリーに特定し、深刻な病気を発症する可能性を減らし、患者の苦痛を緩和し、医療費を削減する予防戦略を開発するのに役立ちます。 [34]。 この研究では、固定時間ウィンドウアプローチを使用して、HIV患者のICU入院のリスクを分析しました。固定観測ウィンドウは、比較的安定した代表的な観測間隔を提供します。たとえば、2009年1月から2020年12月までのデータを観察ウィンドウとして選択し、その間、選択基準を満たしているすべてのHIV患者の臨床データと回帰情報を体系的に収集しました。この固定された観察期間により、このグループのICU入場の傾向は、長期間にわたって、それらに関連するさまざまなリスク要因の関連性を明確に観察することができました。いくつかの研究では、固定された観察ウィンドウが疾患の発達の段階をキャプチャし、予測モデルの構築に信頼できるデータベースを提供することを示しており、予測の精度を改善するリスク要因に基づいてアルゴリズムを最適化できるようになりました。 鎖では、複雑なデータセットを扱う際のマウスアルゴリズムの重要な利点のために、単純な平均代入などの方法よりも、チェーン式(マウス)アルゴリズムによる複数の究極の帰属が選択されました。 [35, 36]。マウスは、データ内の他の変数に条件付けられた欠損値を持つ各変数の予測モデルに繰り返し適合します。これは、変数間の相関関係を考慮し、よりリアルにデータ分布と基礎となる関係を反映しています [37]。単純な平均代入では、変数の分布が変化し、偏った予測モデルが生じる可能性があります。臨床研究から、欠損データはしばしば完全にランダムではなく、疾患の重症度などのさまざまな臨床要因の影響を受けます。マウスアルゴリズムは、実際のデータ状況をより正確にシミュレートし、臨床変数間の本質的な関係を保持し、その後の機械学習モデルの精度と堅牢性を高めるためのより信頼性の高いデータベースを提供します。 医学における機械学習アプリケーションは、さまざまな疾患の診断、治療、予後に潜在的な価値を持っています。人工ニューラルネットワーク(ANN) [38] 脳内のニューロンの構造と挙動に基づいた機械学習アルゴリズムであり、慢性疾患の進行と治療効果の予測に大きな影響を与えます [39,40,41]。と一致しています Pienaar et al。小児集中治療室における死亡率予測に関する研究の研究 [42]、1,530人のエイズ患者(7:3のトレーニング対テスト比)の研究により、最高のパフォーマンスメトリック(最低ブライアスコア、最高のAUROC/AUPRC)を使用して、log/rf/nn/svm/xgbモデルよりもANNの優位性が確認されました。 モーガン等。 [43] サンプルサイズが増加すると、機械学習モデルは、より正確さと安定性が高まり、近似が少なく、内部検証との一貫性が示されたことが示されました。サンプルサイズが増加すると、機械学習アルゴリズムのメトリックは、Brierスコア、AUROC、AUPRCなどのモデルの安定性と一般化可能性を高めました。 ブライアースコア [27] 予測された確率と観察された結果の間の平均二乗偏差を指し、0〜1の範囲の値を持っています。低いブライアスコアは、モデルのパフォーマンスが向上したことを示しています。受信者動作特性曲線(ROC)および精密回復曲線(PRC)分析[[28、29、30]は、疾患の診断精度と予測精度を評価するためのより適切で好ましい技術であり、値は0から1の範囲で、曲線の下のより大きな領域がより良いパフォーマンスを示しています。この研究では、5つの機械学習モデル、log、RF、KNN、SVM、およびXGBは、ANNモデルと比較して、より高いブライアスコアとより小さなROC-AUCおよびPR-AUCのために最適ではありませんでした(Brierスコア= 0.034、ROC-AUC = 0.961、PR-AUC = 0.895)。 従来のAIモデル、特に深いニューラルネットワークは、しばしば正確な予測を行う「ブラックボックス」と見なされます。ただし、これらの結果をどのように取得するかを理解することは困難です。説明可能な人工知能(xai) [52,53,54,55] ブラックボックスの内部の仕組みを感じることを目的としたAIモデルの意思決定プロセスを人間に理解しやすくするように設計されたさまざまな方法と技術を指し、システムの結果または出力にどの入力機能が最も大きな影響を与えるかを決定し、最終的にシステムを解釈可能かつ解読可能にします。ローカル解釈可能なモデルに依存しない説明(LIME)など、さまざまな確立されたXaiメソッドと技術 [56]、グラデーションクラスのアクティベーションマッピング(Grad-Cam) [57]、Shapley Additive説明(shap) [31, 32]、および深い学習重要な機能(Deeplift) [58] さまざまなドメインの予測タスクに採用されています。 機械学習モデルの精度は高いです。ただし、それらの固有の予測プロセスは表示されず、ブラックボックスモデルです。モデルの説明可能性を高めるために、この研究では、機能の重要性分析のためにShapley(SHAP)値を導入しました。 Shapleyの値は、参加者のすべての可能な順列を考慮して、結果に対する各参加者の限界的な貢献に基づいて計算されました。ただし、Shapleyの値には、大量の計算などの制限もあります [59]。図4は、機能のSHAP値の要約プロットを示しており、各機能のSHAP値は、その正または負の寄与に従ってプロットされています。 X軸の正と負の値は、それぞれターゲット変数にプラスまたはマイナスの影響を示します。 Thus, the main reasons for the increased risk of ICU […]