AI モデルが Zoom 通話の楽しさとスムーズさを予測

NYU の科学者による新しい研究では、会話の順番や表情の動きを分析することで、ビデオ会議のスムーズさと楽しさを予測できる AI モデルが明らかになりました。この画期的な進歩により、仮想会議が劇的に改善され、より効率的で楽しいものになる可能性があります。

COVID-19パンデミックが始まって以来、ZoomやMS Teamsなどのビデオ会議プラットフォームは、私たちの仕事や社会生活に欠かせないものとなっています。これらのプラットフォームには利点があるにもかかわらず、ぎこちなく感じたり非生産的だと感じたりする瞬間がしばしばあります。現在、ニューヨーク大学の科学者チームが、仮想会議をより楽しく効率的にするためのハイテクソリューションを提供しています。

研究者らは、ビデオ会議中の人間の行動を評価できる人工知能モデルを開発した。これには、会話の順番や表情を監視して、これらのやり取りがスムーズで楽しいかどうかを予測することが含まれる。

「私たちの機械学習モデルは、ビデオ会議の基本的な音声とビデオ信号内の微妙なパターンを解読することで、高度な社会的相互作用の複雑なダイナミクスを明らかにします」と、ニューヨーク大学心理学部の博士研究員で主執筆者のアンドリュー・チャン氏は新しいリリースで述べています。「この画期的な進歩は、会話の脱線が起こる前にそれを回避する方法を示すことで、ビデオ会議の体験を動的に強化するための重要な一歩を表しています。」

この機械学習の驚異を生み出すために、100時間を超えるZoomの録画が分析されました。モデルは声、表情、体の動きに注目し、会話をスムーズにしなかったり楽しくなかったりする妨害要素を特定しました。

興味深いことに、このモデルは「気まずい沈黙」が会話の重複よりも会議の質に悪影響を及ぼすことを発見し、活発な議論が沈黙の時間よりも好ましいことを示唆している。

このモデルを検証するため、300人以上の審査員が同じビデオ会議の映像を審査し、やり取りがどれだけスムーズで楽しかったかを評価した。審査員の評価はAIの予測とほぼ一致し、モデルの信頼性が確認された。

「ビデオ会議は今や私たちの生活の重要な機能となっているため、そのネガティブな瞬間を理解して対処することは、対人コミュニケーションとつながりを良くするだけでなく、会議の効率と従業員の仕事の満足度を向上させるためにも不可欠です」と、ニューヨーク大学心理学部の客員研究員で論文の主任著者であるダスティン・フリーマン氏は付け加えた。「会話が途切れる瞬間を予測することで、この研究は、暗黙的に信号遅延を操作するか、ユーザーに明示的にヒントを与えるかのいずれかによって、ビデオ会議システムが会話の途切れを軽減し、会話の流れをスムーズにするための道を開くことができます。現在、私たちはこれを実験中です。」

チームの研究は、 公表 IEEE 国際音響・音声・信号処理会議 (ICASSP) の議事録で発表されたこの研究は、仮想通信分野における大きな進歩を示すもので、ビデオ会議を超えてさまざまな形態のリモート通信にまで応用できる可能性があります。

この論文は、当時ニューヨーク大学タンドン工学部の大学院生だったヴィスワドルス・アッカラジュ氏とレイ・マクファデン・コリアーノ氏、そしてニューヨーク大学とドイツのミュンヘンにあるマックス・プランク協会の心理学教授であるデイビッド・ポッペル氏の共著者である。

出典: ニューヨーク大学