皆さん、「テキストマイニング」という言葉はご存知でしょうか。
実は、これは、世の中のトレンド傾向が予測でき、マーケティング戦略など多岐にわたって分析において優秀な側面があります。
今回は、このテキストマイングを「教育」に流用する記事になります!
例えば、生徒が授業の感想を記入するために、アンケートに回答する機会があったとしましょう。
そこにテキストマイニングを活用することで、授業を通して、どのように生徒が感じることが多かったかなどの定性的な部分を分析できます!
つまり、こうした"生徒の言葉"を分析することで、授業の改善や授業教材の一つとして使用できるなどの利点があります。
そして、それを実現するためのものはたった2つです!
今回の記事では、以下の内容をご紹介します。
- 教育に流用することのメリット
- テキスト分析の準備・活用方法(簡単)
- 分析のやり方を比較!
塾講師6年目 / 2023年度 第1志望校合格率 "71.4%"達成!(難関校合格あり)
高校数学・情報の教員免許取得!(元 科目等履修生[2年間])
文系で大学の情報学部に入学 / ITパスポート・基本技術者試験に合格!
- テキストマイニングとは
- 生徒の言葉をAI分析!その真相とは
- 生徒の言葉を分析してみよう
- 文章続きにしたらどうなるのか【補足】
- 結果
- 最後に
テキストマイニングとは
テキストマイニングとは
テキストマイニングは、大量の文章データから有益な情報を抽出する分析手法です。
顧客のニーズや動向を知るための手段であるというのが現状です。
一方で、膨大な文章データがないと、そもそもテキストマイニングの能力が発揮できないので、膨大な文章データを確保する必要はあります。
テキストマイニングの仕組み
仕組みは意外とシンプル!
自然言語処理(ChatGPTや検索エンジンがこの領域)を用いて、文章を単語に分割し、単語の出現頻度などを分析しています。
テキストマイニングのメリット
テキストマイニングは、次のメリットがあります。
- 高い頻度で出現する単語を分析することで、世の中のトレンド傾向が予測できる
- AIエンジンを使って、さらに精巧な分析が可能になる
- 市場や消費者のニーズをくみ取りやすくなる など
以上の利点を教育に流用することで、教員・生徒が新たな発見ができる可能性を秘めているのです。
生徒の言葉をAI分析!その真相とは
昨今、教育のICT化が進み、授業内容やその他の教育現場において、より一層工夫が求められています。
そうした中で、1つの工夫の仕方をご紹介します。それは、アンケート結果です!
アンケート結果の見方は"数値"だけじゃない!
こんなアンケートが一般的だと思います。
「満足している」を5、「満足していない」を1として答えなさい。
こうした方法をとる理由は、アンケート作成者が集計の際に、数値だと回答の分析がしやすいというメリットがあるからです。
ですが、それは定量的な結果を見ているに過ぎません。
一方で、理由の記述などの「文章での回答」に関しても分析は欠かせません。
つまり、定性的な分析です。
定性的は「物事の様子や変化などを、数字では表せない『性質』の部分」です。
そこで、定性的な部分を分析するのに有用な「テキストマイニング」という方法をご紹介します!
「教育」×「テキストマイニング」でできること
先ほどからテキストマイニングを教育に流用しようと伝えております。
どんなことができるのかを改めて、ご紹介します。
1. 学習管理システム(LMS)の分析
教育機関が使用するLMSのディスカッションフォーラムや提出されたテキストデータを分析することで、学生の理解度、関心のあるトピック、苦手な分野などを把握できます。
これにより、教員は授業の内容をより効果的に調整することができます。
2. 論文やエッセイの自動評価
テキストマイニングを使用して、学生の論文やエッセイを自動的に評価するシステムが開発されています。
これらのシステムは、文法、スペル、内容の一貫性、主張の妥当性などを評価することができます。
3. 教育資料の分析
教科書や学術論文のコンテンツを分析して、特定のトピックに関連するキーワードや概念を抽出し、教育カリキュラムの開発や更新に役立てることができます。
4. トレンド分析
テキストマイニングを用いて教育に関するソーシャルメディアの投稿、ニュース記事、研究報告などを分析し、教育分野のトレンドや政策の動向、新たな教育技術の出現などを把握することが可能です。
5. 感情分析
学生や教員のフィードバック、評価コメントなどから感情を分析し、教育プログラムやコースの質を評価したり、学生の満足度や不満点を理解することができます。
今回はこちらの内容について深掘りしていきます!
6. 自動要約
大量のテキスト情報を処理して要約を生成することで、学生や研究者が文献レビューや研究資料の読解にかかる時間を節約できます。
7. 誤解の診断
テキストマイニングを利用して、学生が提出した答案や課題の中に見られる誤解を特定し、個別のフィードバックや追加指導の提供に役立てることができます。
8. 質問応答システム
教育用FAQやヘルプデスクのデータを分析して、学生がよく持つ疑問や問題に対する回答を自動生成するシステムを構築することができます。
9. プラジャリズム(剽窃)チェック
学生の提出物に対してテキストマイニングを使用して、インターネット上のコンテンツや以前の提出物との類似性をチェックし、剽窃を検出します。
生徒の言葉を分析してみよう
それでは、テキストマイニングでアンケート結果を分析してみます。
実践
テキストマイニングの準備
使用するのは、ユーザーローカル(企業)の「AIテキストマイニング」です。
- 無料で使用できる(2023年11月4日時点)
- アカウント登録なしで使用できる
今回紹介するテキスト分析では、アカウント登録なしで使用できます。ただし、項目によっては登録しなければいけないものもあります。
以下の記事をクリックすると今回使用するテキストマイニングが開けます。
この画面になったらOK
アンケートを準備しよう
テキスト分析なので、文章であればなんでもOKです。
今回の記事では、Googleフォームを使用したアンケート結果をもとに分析してみます。
Googleフォームでアンケートを作成する方法は、下の記事で紹介しています。
今回は、Googleフォームで回答した結果を全体的に分析します。
なので、よりデータを詳細にみる必要があります。それが下の「Googleフォームで回答したものを確認する方法」です。
Googleフォームで回答したものを確認する方法
フォームの編集側の画面に移動してください。回答内容の確認は、以下の方法です。
「回答」をクリック
「スプレッドシートにリンク」をクリック
「新しいスプレッドシートを作成」を選択し、「作成」ボタン
この画面になったらOK
今回の記事では、僕が以前、ロボコンのイベントを実施した際に、生徒にアンケートをとった結果(今回は「感想」という項目を使用)をもとに分析します。
今回テキスト分析に使用するもの↓
テキストマイニングで「テキスト分析」をする
先ほどのWebサイトに移動する
回答結果のテキスト類をコピー&貼り付け
回答結果の「感想」などのテキスト項目をコピーし、「フォーム入力」のところに貼り付けましょう。
「ワードクラウド作成」のボタンをクリック
結果
この画面になったらOK
ワーククラウド作成をクリックすると最初は、右上にある「スコア順」が表示されます。
-
スコア順:重要度を加味した値が「スコア」。スコアが高い単語は、そのテキストを特徴づける単語である。
-
出現頻度順:単語の出現率を加味した値が「出現頻度順」。
-
字の大きさが違う:大きいほど「関連性が高い」や「出現率が高い」。
-
色が違う:品詞を区別(例:緑が形容詞、青が名詞、赤が動詞)。
スコア順の結果
この結果から、今回のロボコンでは、かんがえるなどの言葉があるので「プログラミング要素(論理的思考力)」が強く、また競り合うという言葉があるように「競争するゲーム性」が強い。
一方で、壊れるという言葉から次回から運営者側が作品の点検などの最終調整をする必要性があるかも。
こんな感じに分析できます。
出現頻度順の結果
この結果から、今回のロボコンは、楽しいという言葉が大きくなっていることから、生徒にとって、ポジティブな気持ちになったことが言える。
つまり、今回のロボコンは成功と言える。
こんな感じに分析できます。
文章続きにしたらどうなるのか【補足】
先ほどの分析は生徒一人一人の感想を抽出したかたちになるので、上のような文章の入れ方をしました。
一方で、下の画像のように文章に区切れがなく分析したらどのようになるのか検証したと思います。
結果
スコア順の結果
pythonnasiという単語が爆誕しました。
今回のロボコンについて、プログラミング言語は使っていません。
スコア順の結果は、文章の区切りがないと結果の正確性が左右されやすいかもですね。
出現頻度順の結果
先ほどの結果と比較すると、そこまで大差はないですね。
ここでもpythonnasiという単語がありました。本当になんなんでしょう。
最後に
いかがでしょうか。
本来、テキストマイニングはマーケティング分野などのビジネス面で使用される場合が多いですが、教育に流用するだけで、分析者側からの発見にもなります。
また、この結果を生徒に見せることで、授業資料の一つになりえます。
使うことで観察力や推測力など分析に欠かせないスキルを育成することにもつながります。