新しい研究により身体活動の追跡が強化されました

雑誌に掲載された最近の研究では NPJデジタルメディシン研究者らは、英国バイオバンクの 700,000 人日分のラベルなしデータからなる大規模な加速度計データセットを使用して、より正確で一般化可能な身体活動レベルを監視するモデルを構築しました。

勉強: 70万人日のウェアラブルデータを用いた人間の活動認識のための自己教師あり学習。 画像クレジット: sutadimages / Shutterstock

背景

ヘルスケアの分野では、健康とフィットネスの追跡、患者の遠隔監視、リアルタイムデータを必要とする臨床試験、病気の早期発見、個別化医療に使用できるセンサーを備えたウェアラブルデバイスの開発と使用が急速に増加しています。 、大規模な健康調査を実施しています。 これらのデバイスは、動き、睡眠の質、歩数、ペース、座りっぱなしの時間に関する概要指標を提供します。 ただし、センサーによって収集されたデータから人間の活動に関する情報を取得するには、信頼できるアルゴリズムが必要です。

自然言語処理やコンピューター ビジョンなどの分野は、これらの学習モデルをトレーニングするための余剰データが利用可能になったことで大幅に進歩しましたが、アルゴリズムのトレーニングに使用できる大規模なデータセットが不足しているため、信頼性が高く、信頼性の高いモデルの開発の進歩が制約されています。人間の活動を正確に認識します。 これらのモデルをトレーニングするのに十分なデータが不足していることも、深層学習モデルに関する調査結果を混乱させており、深層学習モデルが単純な統計などの従来の方法よりもパフォーマンスが良くないことを示唆しています。

研究について

本研究では、研究者らは英国バイオバンクの加速度計データセットを使用して、身体活動を正確に認識するための深層学習モデルをトレーニングしました。 英国バイオバンクは、50 万人近くの参加者を集めた大規模な加速度計研究を実施しました。 これらの参加者のうち10万人以上が、研究室ベースの環境ではなく、自然環境で1週間手首に加速度計を装着しました。 これにより、約 700,00 人日の自由生活の人間の動作データが得られました。

提案された自己教師あり学習パイプラインの概要。 ステップ 1 には、英国バイオバンクからの 700,000 人日のデータを使用したマルチタスクの自己教師あり学習が含まれます。 ステップ 2 では、転移学習を介して 8 つのベンチマーク人間活動認識ベースラインにおける事前トレーニング済みネットワークの有用性を評価します。

研究者らは、自己教師あり学習アプローチを使用しました。これは、生成事前トレーニング変換器や GPT などの例に使用されて成功しています。 最近の研究では、マスク再構成、マルチタスク自己監視、ブートストラップ、対照学習などの多数の自己教師あり学習アプローチを使用して、ウェアラブル センサーからのデータの分析を調べています。 本研究では、マルチタスク自己監視手法を英国の大規模なバイオバンク データセットに適用し、事前トレーニング済みモデルを健康および臨床的に重要な活動ベースの広範なデータセットにどのように一般化できるかを示しました。

マルチタスク自己監視学習手法は、ディープ畳み込みニューラル ネットワークをトレーニングするために、英国バイオバンクの大規模加速度計データセットに初めて適用されました。 その後、8 つのベンチマーク データセットを使用して、事前トレーニングされたニューラル ネットワークのパフォーマンスを評価し、さまざまな集団やアクティビティ タイプの表現の品質を評価しました。

ラベル付きデータセットは、転移学習におけるモデルの成功を評価するために使用されました。 さらに、この研究では、情報が少ない動きが少ない期間の問題を回避するために、加重サンプリング手法も使用されました。 モーション センサーから収集された現実世界のデータには非アクティブな期間があり、そのような静的信号は変換中に変化しないため、自己教師あり学習タスクには問題が生じます。 したがって、トレーニング プロセスの収束と安定性を向上させるために、研究者らはデータ ウィンドウを比例してサンプリングし、それらのサンプルの標準偏差を分析に使用する加重サンプリング アプローチを適用しました。

結果

その結果、この研究でトレーニングされたモデルを 8 つのベンチマーク データセットでテストしたところ、中央値の相対改善率 24.4% でベースラインを上回ったことがわかりました。 さらに、このモデルは、幅広いモーション センサー デバイス、生活環境、コホート、外部データセットにわたって一般化できます。

マルチタスク自己監視の事前トレーニング方法は、ラベルのない小さなデータセットであっても、人間の活動の下流の認識を向上させるのに効果的であることもわかりました。 自己教師ありの事前トレーニングは、教師ありの方法よりも優れたパフォーマンスを発揮する可能性もあります。

研究者らは、この研究により、マルチタスク自己監視学習法がウェアラブルセンサーからのデータセットに適用でき、深層学習アルゴリズムを使用して正確で一般化可能なアクティビティ認識モデルを構築できることが実証されたと述べた。

研究者チームはまた、事前トレーニングされたモデルをデジタルヘルス分野の研究コミュニティにリリースし、限られたラベル付きデータを含む他のさまざまな領域で使用するために、それらに基づいて高性能のモデルを構築できるようにしました。

結論

要約すると、この研究では、加速度計データで構成される英国バイオバンクのラベルなしの大規模データセットを使用して、自己教師ありアプローチを通じて深層学習モデルを事前トレーニングしました。 これらの事前トレーニング済みモデルは、コホート、センサー デバイス、生活環境が異なるデータセットにわたるモーション センサー データを正確に分析する際に、ベースライン レベルを超えてパフォーマンスを発揮しました。 研究者らは、これらのモデルを構築して、限られた量のラベル付きデータを含むさまざまなシナリオに使用できると考えています。

参考雑誌:

  • Yuan, H.、Chan, S.、Creagh, AP、Tong, C.、Acquah, A.、Clifton, DA、および Doherty, A. (2024)。 700,000 人日のウェアラブル データを使用した人間の活動認識のための自己教師あり学習。 Npjデジタルメディシン7(1)、91。DOI: 10.1038/s41746024010623、 https://www.nature.com/articles/s41746-024-01062-3

1713753303
#新しい研究により身体活動の追跡が強化されました
2024-04-22 02:09:00

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick