ChatGPTが成績ではなく生徒の作文を静かに変革する方法

約5,000人の学生のレポートを対象とした新たな調査によると、ChatGPT導入以降、成績は変わらないものの、文章表現はより洗練され、形式的になり、明るくなっていることが示されています。この調査結果は、発言、批判的思考、そしてAIが豊富な世界において大学が文章をどのように教えるべきかといった新たな疑問を提起しています。

ウォーリック大学が主導した新たな調査によると、ChatGPTの導入以来、学生の作文はより洗練され、形式的かつ明るいものになったが、成績はほとんど変わっていないという。

研究者たちは、10年間にわたって学生が作成した約5,000件のレポートを分析し、ChatGPTなどの生成型人工知能ツールが広く利用可能になった2022年後半以降、学生が使用する言語が著しく変化していることを発見した。 公表 学術誌「コンピュータと教育:人工知能」に掲載された論文によると、AI は生徒の議論や説明の仕方にはまだ変化はなかったとしても、生徒の文章作成方法を微妙に変えつつあるという。

研究チームは、10年間にわたり学部生から提出された約17万語に及ぶ4,820件の実証レポートを調査した。AIを使っている個々の学生を特定するのではなく、ChatGPT導入前後における、文体、語調、語彙に関する幅広いコホートレベルのパターンを研究した。

調査の結果、2022年以降、生徒の作文は感情がより肯定的になり、口調がよりフォーマルになり、語彙がより多様化していることが分かりました。これらの変化は、トピックを問わず、あらゆる報告書に見られ、生徒が文章に言葉を書く方法が全体的に変化していることを示唆しています。

論文の筆頭著者でウォーリック大学の心理学助教授であるマシュー・マック氏は、学生の作品の調子が現在、人気のAIツールのデフォルトのスタイルに非常に似ていると述べた。

「学生の文章のトーンは、ChatGPTの成果と一致して、より肯定的であるように見えます。これは本質的に良いことでも悪いことでもありませんが、AIツールが学生の声を均一化してしまう可能性について懸念を引き起こします」とマック氏はニュースリリースで述べた。

多くの生成AIシステムは、不快感や有害性のあるコンテンツを避けるため、丁寧で​​建設的、そして明るい印象を与えるように設計されています。こうしたポジティブな雰囲気が、ブレインストーミングや言い換え、課題のブラッシュアップにこれらのツールを使う学生たちにも影響を与えているのかもしれません。

マック氏とその同僚は、心理学的研究において、ポジティブな気分と批判的な精査の低さとの間に関連性が見られると指摘している。学生がAIによって生成された、容赦なく楽観的なトーンの文章に常にさらされている場合、大学はそれが学生の長期的な批判的思考力と学問的発言力にどのような影響を与えるかを理解する必要があると研究者らは主張している。

この研究では、ChatGPT導入後、文章のフォーマル度と語彙の幅が急激に向上したことも確認されました。こうした文体の改善は、通常、長年のライティング練習を経て初めて現れるものであり、生徒の基礎スキルの急激な向上を反映しているとは考えにくいでしょう。

言い換えれば、エッセイは表面上はより洗練されているように見えるかもしれませんが、それは必ずしも、議論を構築したり、証拠を検討したり、データを解釈したりするというより深い意味で、学生がより優れたライターになったことを意味するわけではありません。

AIの影響をより直接的に調査するため、研究者たちは2022年以前に作成されたレポートをChatGPTに書き直してもらいました。AIによって生成された書き直しには、ChatGPTの導入後に提出された実際の生徒のレポートに見られたのと同様のトーンとスタイルの変化が見られました。この類似点は、生成AIが研究チームが観察した変化の重要な要因であるという主張を裏付けています。

研究者たちは、AI生成の文章でよく使われる単語の使用状況も追跡しました。これらの用語の中には、2024年にかけて人気が急上昇し、その後2025年に急激に減少したものもあります。この傾向は、AI検出ツールへの意識の高まりや大学の方針の変化を受けて、学生がチャットボットのような話し方をすることに慎重になっている可能性を示唆しています。

こうしたスタイルの変化にもかかわらず、変わらなかったものが 1 つあります。それは成績です。

10年間のデータ全体を通して、生徒の推論力や分析力の質の大幅な向上を示唆するような、成績や試験官からのフィードバックの急上昇は見られなかった。著者らは、この安定性は、中核的な学力こそが依然として最も重要であることを示していると主張している。

研究チームは結果の詳細な要約の中で、「文体の変化にもかかわらず、学生が受け取った成績とフィードバックは比較的安定していた。これは、文体の変化が必ずしも高得点につながるわけではなく、採点者は表面的な言語表現よりも分析の深さやデータの解釈といった要素を優先する可能性があることを示唆している」と述べている。

この発見は、AIが評価を一瞬にして覆してしまうのではないかと懸念していた教育者にとって、安堵をもたらすかもしれない。同時​​に、生徒の提出物がいかに洗練されているかということと、それが実際に学習について示していることとの間に、ますます大きな乖離が生じていることを浮き彫りにしている。

この調査は、大学における生成型AIの利用が急増している中で発表されました。ウォーリック大学のチームが引用した最近の業界全体を対象とした調査では、学生の最大88%が評価にChatGPTを使用していると回答しています。その用途は、アイデア創出やアウトライン作成から、草稿作成や編集まで多岐にわたります。

ウォーリック大学の研究者らは、大学にとってこの新たなデータは警告であると同時にチャンスでもあると述べている。

彼らの分析は、AIが成績に劇的な変化をもたらさなくても、生徒の作文の質を既に変えていることを浮き彫りにしている。彼らは、この現実を踏まえ、教育機関は課題の作成方法、作文指導、そして責任あるAI利用について生徒と話し合う方法を再考すべきだと主張している。

著者らは、その影響に関する議論の中で、「批判的思考力、解釈力、議論力といった中核的な学力は依然として評価の中心であり」、かつ「少なくとも、文体の変化によって影を潜めていない」ことを強調した。これは、教育者がこれらのより深いスキルの指導に注力すると同時に、AIが豊富な環境において生徒が真の発言力を育むのを支援する余地を残している。

調査結果はまた、特定のバズワードや一様に明るいトーンといった表面的なチェックだけでは、学生がAIを実際に活用しているかどうか、またどのように活用しているかを理解するのに十分ではないことを示唆しています。教員はむしろ、学生がどのように計画を立て、草稿を書き、修正し、そしてどのように自分の考えを明確に表現できるかといったプロセスにもっと焦点を当てる必要があるかもしれません。

著者らは、教育機関は今こそ、新しいツールに逐一対応するのではなく、このようなエビデンスを政策の指針として活用し、時代を先取りするチャンスがあると主張している。これは、AIが許容される状況に関するより明確なガイダンス、学術的誠実性に関するより透明性の高い議論、そして口頭試問、授業中のライティング、あるいは反復的なフィードバックを重視した新しい評価方法の導入を意味する可能性がある。

生成型AIが多くの分野で知識労働の日常的な一部となるにつれ、高等教育における課題はもはや学生がこれらのツールを使うかどうかではなく、どのように使うかです。ウォーリック大学の研究は、これまでのところAIは学生の文章の内容よりも、見た目や雰囲気を変えていることを示唆しています。そして、大学が今後どのような取り組みをするかが、これらの変化が最終的に学生の思考力とコミュニケーション能力を強化するのか、それとも弱めるのかを決定づける鍵となるでしょう。

出典: ウォリック大学