ブレークスルーAIは、視覚障害のある人々が世界をどのように経験するかを変え、彼らにこれまでにないような馴染みのない場所の美しさを発見、理解し、体験するためのツールを提供します。
勉強: AIシステムは、なじみのない環境を解釈して体験する際に、失明と低視力を持つ人々を促進します。画像クレジット:Angel Santana Garcia/Shutterstock.com
中国の研究者チームは、視覚障害のある個人が周囲の馴染みのない環境を探求、理解し、味わうのに役立つ可能性のある人工知能(AI)駆動型システムを開発しました。この研究は、に掲載されています Nature Portfolio Journal人工知能。
背景
公園などの自然環境を探ることは、身体的および精神的健康に大きなプラスの影響を与えます。ただし、視力が低い人や失明を持つ人々は、これらの利点から除外されることがよくあります。
視覚障害のある個人を導くために開発された既存の支援ソリューションは、主にナビゲーションや障害物回避などの機能的支援の提供に焦点を当て、自然と受動的に関与できるようにします。
視覚障害のある個人は、なじみのない環境を探索しながら、しばしば無力感を感じます。これは通常、彼らが家族、友人、またはボランティアに頼って支援を求めていることを意味します。これは、馴染みのない環境を積極的に探求し、理解する能力を損ない、他の視覚障害のある個人と彼らの旅について覚えてコミュニケーションをとることを意味します。
中国に拠点を置く研究者のチームは、Viptourという名前のAI駆動型システムを開発し、視覚障害のある個人に、なじみのない環境で独立感を提供しました。
Viptourはどのように機能しますか?
Viptourは、軽量でポータブル、消費者グレードのデバイス(カメラとスマートフォン)のセットと、FocusFormerと呼ばれる新しい深部学習アルゴリズムネットワークを含むAI駆動型システムです。オーディオや階層触覚相互作用などの効率的な多感覚相互作用技術は、視覚障害のあるユーザーとViptourシステム間の相互作用を促進します。
Focusformerは、美学、新鮮さ(新規性)、および基本的なニーズ(ナビゲーションと安全を含む)を、複雑でなじみのない環境から意味のある情報を抽出し、冗長な視覚的詳細を除外する主な要因と見なします。これにより、視覚障害のあるユーザーの認知負荷が削減されます。
Focusformerは、膨大な量の情報を構造化された、まばらで、階層的なパーソナライズされたグラフに変換します。このよく構成されたグラフに基づいて、FocusFormerはスマートフォンアプリケーションを介して視覚障害のあるユーザーと対話し、好みを理解し、アダプターを介してパーソナライズされた支援を提供します。
それは、審美的なバイアスを効果的に減らすのに有益な自己監視方法で、目撃された観光客からの何千もの公開観光ビデオで訓練されています。
Viptourシステムには、経験を記録、保存、共有するオプションもあり、視覚障害のある個人間の感情的なコミュニケーションを促進し、ソーシャルネットワーク内での知識と経験の交換を促進するオプションもあります。
Viptourのコア技術革新は、マルチアテンションFocusforferネットワークにあります。このアプローチでは、背景サブネットワークを利用して、一般的に見られるオブジェクト、アトラクションサブネットワークを除外してハイライトを識別し、斬新な機能を発見するための新鮮さのサブネットワーク、視覚障害のある参加者で実施された調査でトレーニングされたサブネットワークを除外します。これらのサブネットワークは、各ユーザーに最も関連性の高い情報を選択、ランク付け、および提示するために組み合わせています。
Viptourシステムは、BLV-in-the-Loopアダプターも利用しており、「いいね」や「嫌い」などの個々のユーザーフィードバックに基づいてリアルタイムで推奨事項を更新し、パーソナライズを可能にします。
Viptourについてのユーザーの意見
Viptourシステムは、失明または低視力の33人でテストされ、分析のために自己報告された感情的経験が収集されました。
支援パフォーマンスに関して、この研究は、Viptourシステムが視覚障害のある個人が積極的に馴染みのない環境を積極的に探求し、完全に理解し、正確で長続きする回想を強化し、仲間とのコミュニケーションを可能にすることを効果的に支援することを発見しました。
自己報告された経験を広く分析することにより、この研究では、Viptourを使用している参加者は、陽性の感情反応の67.9%の増加、覚醒の94.7%の増加、認知マッピング精度の772.73%の増加、および長期記憶精度の200%の増加を成功裏に達成したことがわかりました。
ユーザー評価では、Viptour Systemのユーザビリティスコアは、視覚障害のある個人向けの他の支援ツールと同等またはそれ以上の100のうち80を超える100のうち80を超えていました。
電極活動や心拍数の変動を含む生理学的測定は、Viptourの使用により大幅な改善を示し、感情的な関与の強化を示しています。
研究の重要性
この研究では、AI駆動型のViptourシステムの潜在的な用途が、視覚障害のある個人に楽しく記憶に残る体験を提供しながら、なじみのない環境を積極的に探索することを強調しています。これらの経験は、感情的な状態を大幅に高め、全体的な生活の質を向上させることができます。
既存の証拠は、組織化された魅力的な情報を提示することで、人の喜びのレベルを高め、より深い記憶保持を促進することを示唆しています。人間は、十分に構造化された意味のある情報を処理する自然な傾向があり、それが彼らの経験をより楽しく思い出深いものにします。
この人間の傾向は、認知の流encyさの概念によって説明される可能性があります。これは、明確で組織化された情報提示により、個人の認知負荷が減少することを示しています。その後、これにより、メンタルリソースをコンテンツの理解と統合に向けて導くのに役立ちます。この改善された加工流encyさは、個人が情報をより快適に知覚するため、肯定的な反応を引き起こします。
さらに、斬新な情報と馴染みのある情報の間の相互作用は、記憶に関する組織化された興味深い情報の効果に影響します。新しい情報は好奇心を刺激し、注意を高め、馴染みのある情報は認知的な快適さと一貫性を提供します。
情報を構造化された魅力的な方法で提示することは、斬新さと親しみやすさのバランスをとることができ、個人の関心と関与を維持するのに役立ちます。
何千もの非標識公開観光ビデオを備えたフォーカスフォーカーの自己監視されたトレーニングは、認知の流encyさを効果的に捉えており、観光シーンの異なる概念間の統計的関係を明らかにしています。このアプローチは、ツアー優先ラベリングの潜在的なバイアスを排除し、モデルをトレーニングして、関連するコンテキスト情報のみを抽出します。
Focusformerのこれらのパーソナライズされた設計上の考慮事項により、Viptour Systemは望ましい認知流encyさをうまくモデル化することができ、視覚障害者の観光体験が改善されました。
Viptourの影響は、オブジェクト検出やセマンティックグラフ生成など、基礎となるAI技術の品質に依存することに注意する価値があります。これらの方法の将来の改善により、システムのパフォーマンスがさらに向上する可能性があります。
ジャーナルリファレンス:
- Lin H.2025。AIシステムは、なじみのない環境を解釈して経験する際に、失明と低視力を持つ人々を促進します。 NPJ人工知能。 https://doi.org/10.1038/S44387-025-00006-W https://www.nature.com/articles/S44387-025-00006-W
1749428688
#AIは視覚障害のあるユーザーの観光を変革します
2025-06-09 00:05:00
