1767290971
2025-12-30 16:45:00
VEHME の概要を説明する模式図。クレジット: arXiv (2025年)。 DOI: 10.48550/arxiv.2510.22798
UNIST と提携した研究チームは、人間の講師と同じように、最も乱雑な手書きの数学の解答でも採点し、詳細なフィードバックを提供できる新しい AI システムを発表しました。
UNIST人工知能大学院のTaehwan Kim教授とPOSTECHのSungahn Ko教授が率いるチームは、複雑な手書きの数学式を評価するために特別に設計されたAIモデルであるVEHME (Vision-Language Model for Evaluating Handwriting Mathematics Expressions)の開発を発表した。
研究というのは、 出版された で arXiv プレプリントサーバー。
自由形式の数学問題の自動採点は、これまで教室で多大な労力と時間のかかるプロセスでした。この問題は、方程式、グラフ、図などの解答形式が多種多様であることに加え、手書きのスタイルや生徒の解答の組み立て方の違いからも生じます。このような非構造化された多様なコンテンツを正確に理解して評価できる AI の開発は、依然として大きな障害となっています。
VEHME は、人間の採点者の作業方法を模倣することでこの問題に取り組み、問題と解決策内の各要素の位置と意味を注意深く分析して間違いを特定します。
VEHME は、微積分から初等算術までの幅広い範囲をカバーするテストで、より軽量で効率的なモデルであるにもかかわらず、GPT-4o や Gemini 2.0 Flash などの大規模な独自モデルに匹敵する精度レベルを達成しました。注目すべきことに、VEHME は、回答が頻繁に回転したり不適切に書かれたりする困難なケースにおいても商用モデルを上回り、より信頼性の高いエラー検出を実証しました。
GPT-4 や Gemini などのモデルには数千億のパラメーターが含まれていますが、VEHME はわずか 70 億で動作し、膨大な計算リソースがなくても高いパフォーマンスが達成できることを示しています。
この進歩は、Expression-aware Visual Prompting Module (EVPM) と呼ばれる特殊なビジュアル プロンプト テクノロジーと 2 段階のトレーニング プロセスを組み合わせることによって可能になりました。 EVPM を使用すると、VEHME は複雑な複数行の式を仮想的に「ボックス化」することで理解できるようになり、モデルが問題のレイアウトを確実に認識できるようになります。 2 番目のトレーニング ステージは、VEHME が正解を認識するのに役立つだけでなく、問題解決中にエラーが発生する場所と理由を説明できるようにします。
詳細なエラー注釈を備えた高品質の手書きデータセットが不足していることを考慮して、チームは大規模言語モデル (QwQ-32B) を使用して合成トレーニング データを生成し、VEHME の学習および評価機能を大幅に向上させました。
最も重要なことは、VEHME はオープンソースであり、自由にアクセスできるため、システムの導入または強化に関心のある学校や研究者にとって実用的なツールとなっています。
Kim 教授は、「手書きの数学解答の採点は、教育 AI において最も困難なタスクの 1 つであり、画像と言語の両方の微妙な理解を必要とします。複雑な解決手順に従い、間違いを正確に特定する VEHME の能力は、実際の教室での応用に向けた重要な一歩となります。」と述べました。
「当社の EVPM テクノロジーは、複雑な視覚情報を自動的に解釈できます。これは、文書処理、技術図面分析、手書き記録のデジタル アーカイブなど、教育を超えた潜在的な用途を持っています。」
詳細情報:
Thu Phuong Nguyen 他、VEHME: 手書きの数学式を評価するためのビジョン言語モデル、 arXiv (2025年)。 DOI: 10.48550/arxiv.2510.22798
提供元
蔚山科学技術院
引用: 新しい AI モデルは、乱雑な手書きの数学の解答を正確に採点し、生徒の間違いを説明します (2025 年 12 月 30 日) (2026 年 1 月 1 日 https://techxplore.com/news/2025-12-ai-accurately-grades-messy-handwriting.html より取得)
この文書は著作権の対象です。個人的な研究や研究を目的とした公正な取引を除き、書面による許可なしにいかなる部分も複製することはできません。コンテンツは情報提供のみを目的として提供されています。
#新しい #モデルは乱雑な手書きの数学の解答を正確に評価し生徒の間違いを説明します