評価の基本と実施上の留意点

評価は教師の仕事の中で大きなものの1つです。昔は5~1の数字を評定として付ければそれで済みましたが、今ではそうはいきません。そこで、ここでは評価に関する理論的なことと実際の評価活動で留意すべき点について述べたいと思います。

 

1. 評価とは?

一口に評価と言ってもさまざまなことを考慮して作業にあたる必要があります。そこで、まずは評価の理論的な側面を確認しておきましょう。

 

(1) 「評価」の意味

実は私たちが単に「評価」と言っていることばには2つの意味があります。英語ではそれを分けて表記していますので、それを確認してみましょう。

 

① evaluation

→測定した後に結果に対する判断を加えたもの

 

➁ assessment

→判断を下すために測定した情報を提供すること

 

私たち教員が「評価」と言うときは、多くの場合で①のことを指しています。ただし、実力テストの結果などを論じる場合は➁を指すこともあります。

 

(2) 評価の種類

評価はその分類の仕方によってに様々なものがあります。

 

① 評価の"機能"による分類

ア)診断的評価[diagnostic evaluation]

→学習に先立って生徒の学力の状態を把握する

(例)クラス分け用のテスト

イ)形成的評価[formative evaluation]

→学習の途中で生徒の学力の伸長の状況を把握する

(例)「よくできました」などと褒めて学習意欲を喚起する

ウ)総括的評価[summative evaluation]

→学習の最後に生徒の学力の達成度を把握する

(例)小テスト、定期テスト、実力テスト

※「達成度評価」「到達度評価」と呼ばれることもある

 

➁ 評価の"尺度"による分類

ア)相対評価[relative evaluation]

→集団内の他との比較により教育目標の達成度を評価する

(例)偏差値、30年以上前の評定

イ)絶対評価[absolute evaluation/scale]

→教育目標に対する個人の達成度を評価する

(例)観点別評価、現行の評定

ウ)個人内評価[evaluation in the individuals]

→教育目標の達成度ではなく個人の進歩を評価する

(例)ポートフォリオ(方法の1つ)による評価

 

③ 評価の付け方による分類

ア)総合的評価[integrated evaluation]

→教育目標に対する達成度をまとめて評価する

(例)教科の評定

イ)観点別評価[criterion referenced evaluation]

→教育目標をいくつかの項目に分けて項目ごとに評価する

(例)教科の観点別評価

 

2. 評価実施上の留意点

ここでは評価を実施する上で留意すべき点を理論的な側面から説明し、実際の評価活動で起こっている問題点について取り上げます。

 

(1) 理論的なこと

評価について論じるとき、理論的には次の3点を十分に満たしたものでないと適切な評価を行ったことにはならないと言われています。

 

① 妥当性[validity]

評価における「妥当性」とは、「本当にその評価を行う意味(価値)はあるのか?」ということをさしています。自分が行おうとしている評価は本当に正しいものなのかということを常にチェックする必要があります。

 

➁ 信頼性[reliability]

評価における「信頼性」とは、「得られたデータは一貫性のある信頼できるものなのか?」ということをさしています。特に40人という生徒を評価する場合に得られたデータはその集団内や他のクラスのものと比べて一貫したものであるかを確認しないと、最終的に付けた評価は信頼できないものになります。

 

③ 実行性[feasability]/実際性[practicality]

評価における「実行性/実際性」とは、「その評価活動を実際に行えるのかどうか」ということをさしています。せっかく評価計画を立てたのに、その多くを実施できないのであれば計画を立てた意味がありません。教師個人だけでなく、校内英語科教師全員でコンセンサスを得られる評価計画を立てることが重要です。

 

(2) 学校現場での問題点

(1)で評価に関する理論的な側面を押さえた上で、①~③に関して学校現場で起こっている/過去に起こったことがある問題点についてお話しします。もし現在もそのようなことがあれば、早急に改善されることを望みます。

 

① 妥当性に関して

今でこそ観点別評価は一般的になって教師の間でもごく普通に行われるようになっていますが、これが初めて導入された際は現場が大変混乱しました。それは誰も何をどのように評価したらいいかわからなかったからです。そこで、国・都道府県・市町村などが研究委嘱校を指定し、その学校の実践例をみんなで見合って研究するという会が全国で開かれました。そのときに少なからぬ学校の実践に対して大きな問題点が指摘されました。

 

例えば、「コミュニケーションへの関心・意欲・態度」を付けるための材料として、授業中に何回手を上げたかを「補助簿」につけて合計するという手法が紹介されたのです。当然、「手を上げることと関心・意欲・態度はどう関係するのか?」という疑問が呈されました。また、教師が授業中に補助簿にチェック(記録)することばかりやっていて指導がおろそかになっているという点も指摘されました。「チェックマンになっている」という批判が噴き出したのです。

 

それらの批判もあって現在はほとんどこの話を聞かなくなりましたが、実際にはどうでしょうか。筆者の元勤務校ではこのようなことがないように、例えばパフォーマンス・テストではある授業時間を1時間使って全員を評価し、その時間は評価活動のみを行うようにしています。

 

➁ 信頼性に関して

これも観点別評価の導入時に起こったことです。授業中にチェックばかりしていて指導ができていないという批判に対して、評価をする時間を分散して指導時間を確保するという実践が紹介されました。例えば、今日はこの列、明日は次の列、明後日はその次の列の生徒を評価するというやり方です。

 

表面的には上手な実践方法に見えたこのやり方には評価の理論から大きくはずれる点がありました。それは今日、明日、明後日では授業の内容も生徒の状態も異なるので、得られるデータには一貫性(信頼性)がないという点です。

 

これを解決するには、やはり評価活動を同一時間内で全生徒に対して行う必要があります。先述のとおり筆者の学校では25年以上前からそのような評価活動を行っています。筆者はこれを「評価専用場面」と呼んでいます。

 

③ 実行性/実際性に関して

これは残念ながら現在も多くの(ほとんどの?)学校で起こっていることです。もちろん筆者の個人的な感想で言っているわけではありません。筆者はこれまでに何度か評価に関する研修会の講師を務めたことがありますが、その際に「自分が立てた評価計画どおりに評価を行っていますか?」という質問をよくしました。これまでに数百人の先生方に尋ねていますが、「はい」と答えた先生は一人もいません。

 

その最大の元凶は管理職や教育委員会から要請されて提出する「評価計画」です。大変面倒な事務作業でもあるので、多くの先生が教科書会社が出している評価計画をそのまま、あるいは改編して自分の評価計画を作っているという実態があります。ところが、この教科書会社が作っている評価計画は「仮にこの場面で評価を行うとしたらこういうことが考えられる」というものをすべて網羅したものであるということを理解せずにそのまま使っている教師が多いようです。

 

これでは実行性/実際性のある評価計画及び評価活動などは到底できません。必要最低限の評価計画にとどめるべきなのです。これは管理職や教育委員会にも責任があります。そのような形を整えたものを出せばいいという姿勢を変えないかぎり、現場はいつになっても実行性/実際性のある評価計画を作ることができるようになりません。

 

(3) より妥当性・信頼性・実行性のある評価計画

ここでは筆者の前任校の実践を元により妥当性・信頼性・実行性のある評価計画を作成するためのポイントをお話しします。

 

① 教科書の内容にそった評価計画からの脱却

おそらく多くの先生が教科書を1年間でどのようにこなすかということを軸にした評価計画を作成していると思います。各レッスンをいつまでに行うかということを時間軸に当てはめていくやり方です。しかし、これではあまりにも機械的で教師の主体性が無さすぎますし、教科書が替わるごとに新しく作り直さなければならないので大変です。

 

そこで、教科書の内容をこと細かに割り振る評価計画をやめ、測定したい生徒の力にしぼった評価活動だけを記すものにすることを提案します。このような評価計画を作成すれば、実際に行うことができる評価活動の割合が高くなります。また、教科書が替わる度にすべてを書き直す必要がなくなります。

 

➁ 前任校の評価計画

筆者の前任校である筑波大学附属中学校では、上記のような考えに則って必要最低限の評価活動を考え、それを全教員でできるだけ実施しようというコンセンサスを得て評価計画を作成するということを20年以上前から行ってきました。それが以下のものです。

これをご覧になると、「えっ?たったこれだけなの?」と思われるかもしれません。しかし、これまで何度もお話ししたように、ここに書いてあることは英語科全員でコンセンサスを得て全員が実施しているものであると言えば納得していただけるでしょう。

 

この中で注目していただきたい点は、各期の一番下の「表現の能力」の「話すこと」の実技テスト(パフォーマンス・テスト)の内容です。年間にこれだけの実技テストを行っているわけですが、計画どおりに実施したもの(◎印)、計画にはなかったことを実施したもの(〇印)、計画したがてきなかったもの(×印)をきちんと記録として残してあります。これは平成18(2006)年度のものですが、このようなものを毎年積み上げていくと段々と真に実行可能な評価計画ができるようになります。

 

なお、現行の学習指導要領下における評価計画は後輩たちが作成しているはずです。

 

3. パフォーマンス・テストにおける評価について

現行の学習指導要領では、生徒の「主体的・対話的で深い学び」を実現したり「思考力・判断力・表現力等」を育成したりするためにパフォーマンス・テストが欠かせないということを謳っています。そこで、パフォーマンス・テストを行う際の留意点についてまとめておきたいと思います。

 

(1) 評価の際に注意すること

パフォーマンス・テストの評価はいわゆる「観察法」によって行われるのが一般的です。つまり、生徒の活動内容や活動の様子などを教師が主観的に評価するわけです。この際に問題になるのは、評価する教師によって評価に大きなちがいが出ないことです。しかし、実際にはそういうことが起こることが過去に筆者が講師を務めた評価の研修会での結果からわかっています。

 

実は、それを明確にするために、参加者に評価をしてもらう際に「これから男女2人の生徒が教科書の音読をする映像を見てもらいます。それを1~5点で採点してください」という指示だけしか与えませんでした。すると次のような評価の開きがたいていありました。

 

・男子…4~2点

・女子…5~3点

 

これだけ評価者によって評価点にちがいが出ると、評価の妥当性と信頼性が揺らいでしまいます。もちろん、その最大の原因は筆者の指示によるものです。あまりにもおおざっぱな指示で評価をしてもらったので、これほど大きな差が出てしまったのです。参加者の先生もその点に気づいていて不満な表情が見て取れます。それを利用して観察法による評価を行う際に注意すべき3点を示しています。

 

①「観点」を示す

生徒の発表のどのような点を見てもらいたいかということ(観点)がわからなければ評価のしようがありません。ちなみに、附属中学校では音読テストを行う際に次の3点を教師も生徒(事前に伝えてあります)も評価の観点としています。

ア)態度…Read and Look up で話しかけるように読んでいるか

イ)英語…英語らしい発音、リズム、イントネーションで読んでいるか

ウ)演出…登場人物の気持ちや説明文で伝えたい内容を表すように読んでいるか

 

➁ 2つの「きじゅん」(規準と基準)を示す

「規準」(のりじゅん)とは達成目標のことです。どこまでやれば最高点がとれるのかという目標を示します。「基準」(もとじゅん)とは評価のカッティング・ポイントのことです。評価点の分かれ目をはっきりさせます。達成目標はなかなか口では説明しきれないので、附属中ではたいてい上級生の発表ビデオ(生徒互選で選ばれたベスト版)を見せるようにしています。そうすると生徒は一発で規準と基準を理解します。

 

③ 評価者間の調整作業を行う

特に同学年を複数の教員でクラスを分けて担当する場合に重要です。「A先生は厳しく、B先生は甘い」ということになると、評価の信頼性が疑われます。これを解決するには事前にいくつかの過去の発表を一緒に見て、それぞれが何点を付けるかということを話し合う場面を設ける必要があります。

 

(2) 指導と評価の一体化の視点から

ここまで評価を行う際の留意点を理論的な側面や実際の評価活動で起こりうる問題点から論じてきました。最後にそれを「指導と評価の一体化」という視点からお話ししたいと思います。なお、すでにそのことに関して雑誌『指導と評価』の編集後記に書いたことがあるので、それを転記することで要点を説明したいと思います。

 

評価は妥当性、信頼性、実際性(実行性)の3つの要素を十分に考慮して行われるべきであると言われる。しかし、学校現場の実際の評価場面、特にパフォーマンス評価を行う場面ではもう1つ重要なことがある。それは、その評価を行うに足る指導が事前に行われていたかということである。

 

今から約20年前、元勤務校で現在も恒例となっている「リーディング・ショー」という音読テストを中3の英語の授業で行ったときのことである。すでに6回それを経験していたことによるマンネリ感もあってか、生徒たちはこちらが期待するようなパフォーマンスを見せなかった。その状況を何とかしたいと考え、一学年上の生徒の発表をビデオで見せてみた。すると、「もう一度やらせてください!」という声が生徒たちからあがった。そこで、しばらくしてからもう一度同じ活動をさせてみたところ、生徒たちは前回とは見違えるような素晴らしい発表を行った。

 

この時、もしこの評価を1回目の発表で行っていたら、先述した三要素がそろっていたとしても、正しい評価ができたとは言えないことを学んだ。以来、正しい評価を行うには、それ以前に生徒の力を100%引き出せる指導を行わなければならないと考えて指導にあたっている。(肥沼)(『指導と評価』2022年7月号「編集後記」)