漫才コンテスト「M-1グランプリ」が今年も開催された。例年ほぼリアルタイムでみるが、今年はオンタイムでは完全に見逃した。
こんなときM-1ファンとして心配なのは、自分が見る前に、結果を先に知ってしまうことだ。番組の臨場感を味わいたい。私はスマホをなるべく見ず、間違っても「M-1」と検索したりしないよう、そして日本のニュースを見ないようにした。そうした「護身」のかいあって、結果を事前に知らないまま、最初から最後まで通しで見ることが出来た。
例年、ノートで勝手に採点しながらみる。今年も審査結果と合わない自己評価となった。この勝手な自己採点と講評をフェイスブックで投稿するのも恒例だ。今年はそれを書きながら、ちょっとムズムズした。「MBAで習った定量分析を使って、定性で書いていることに、もっと説得力を持たせられないか」。かつてない不思議な衝動だ。
定量分析=Quantitative analysisという言葉。MBA界隈をうろうろし始めるまでは知らなかった。
マイナビから引用する。
定量とは「数字」で表せる要素のことで、売上額や顧客数、価格、変化率などがあてはまる。数字という客観的事実を通して表された定量データを活用すれば、すべての受け手が共通の認識を得ることができる。
定性とは「数字」で表すことのできない要素のこと。物事を定性的に表すことで、その意味や因果関係などを明確にしやすくなる。
理系は定量分析が、文系は定性分析が得意で、逆の関係は不得意だと言われがちだ。
文系の私がM-1を定性だけでなく、定量で分析するとは、どういう意味か。
自分が論理的だと信ずる主張を、データで裏付けて示すということだ。
例えば、
上沼恵美子さんの採点は自分とあっておらず、点数の落差が激しい! 好き嫌いで採点しているじゃないか。
こう思ったとしよう。こうした発言はSNSでもよく見かける。ここで感情まかせではなく、数字やデータを使って冷静に説得力を持たせるのが定量分析である。
MITのMBA入学前には数学のeラーニングを受けねばらならなかった。入学後も、Data, Model and Decision(DMD)やOperationの必修科目で統計を学ぶ必要があった。ビジネスのマネジメントというと「現場100回」「習うより慣れろ」の経験や勘、センスが大事そうだ。ただ実際は数字がかなり重視されており、理系大の一角にあるMITスローンマネジメントスクールは、データで裏付けされた決定をより重視している。かくして文系の私も、統計をはじめとする定量分析を勉強することになった。
せっかく習っても使わなかったら意味がない。ちょうど冬休みで、学びを振り返りたい。ただ、真面目なテーマだとやる気が起きない。たまたま転がり込んできた教材がM-1の審査点数だった。分析したらどうなるか。そう思ってエクセルに向かった。
ただ、私1人ではすぐ行き詰まった。同級生のSさんの協力を得てデータ分析中だ。
最初に出したのが、基礎中の基礎である平均と分散だ。
平均はいいとして、分散とは何か。1年前なら耳にしただけで頭が硬直して、「よくわからない」と逃げてしまいそうだった。いまは数字を読み取ってみよう、という気力がわいているだけで大いなる前進といいたい。
分散を求めるまではすぐ出来た。正確にいうと計算は自分でする必要はなく、エクセルで分散の英語名(variance)を表す「=VAR」と入れて、範囲を選択すれば一発で出てくる。
1年前に無知だった私に語りかけるように、自分の復習を兼ねて書き進める。
分散は、平均を中心としてデータがどれくらいバラついているかを見る指標。
芸人別で、評価が割れたか割れてないか(バラついたか、バラついていないか)をみるために、K列を縦に見ていく。
もっとも分散の値が小さい(バラツキが少ない)のは?
K7にある「1.33」のオズワルドである。平均95.0と高得点に対して、分散が小さいので、「審査員の皆がかなり面白いと感じた」ということが定量的にも説明できる。
逆に評価が大きく割れた芸人コンビは? 分散値が大きいところを探す。
K5にある「11.48」のハライチである。
実際に、各審査員の点数をみてみると、オール巨人が88点と辛くつけている一方で、上沼恵美子が98点と高評価して、バラついている。
「そんなことは、審査員の点数が出ている時点で、パッと見で分かるじゃないか」と思うかもしれない。それはその通りだ。ただ、審査員が100人、1000人、1万人といた場合ならどうだろう?
もはやバラツキを測るには、目視では不可能である。「分散」の出番である。
統計は、データが多ければ多いほど、正確にもなるし、人間の限界を助けてくれる。
ほかにも、分散のK列を通しで比較してみることができる。
分析とは比較すること
と習ってきたが、例えば分散の比較から、平均点が高い低いを別として、審査員で評価が割れた芸人コンビは、ハライチ(11.48)、ランジャタイ(9.9)、ロングコートダディ(7.57)の順だということがわかる。
テレビをみながら審査員の数字をみて感じた「印象」とも近い。なんとなくバラついたな、という印象。これを数字一つで表して、かつ全10組のなかでの位置づけ、比較を一発でこなすのが、統計の分散だ。
評価が割れた芸人比較で、「平均点が高い低いは別として」と前提を置いていたが、平均点とセットでみると、より立体的にみえる。
繰り返しだが、さっきのオズワルドがまさにそうである。平均95.0と高得点だったなか、分散が1.33と小さいので、「審査員の皆がかなり面白いと感じた」。
ここまでみると、じゃあ平均点が低くて、分散が小さいコンビをみると、「みんなが一応に、それほど面白くないと評価した」ことが数字でも言える。
平均と分散の縦軸を2列にらめっこしながら探すと、モグライダーの平均91.0と分散3.0があてはまる。
ただ、91点はそこまで悪くない数字だ。定性で表現するとすれば、「審査員が一応に、まぁまぁ面白いと評価した」と結論づけられる。これも体感と一緒だろう。
一方、平均点が89.7と最も低く、総合点628点で最下位だったのは、ランジャタイだ。最終結果の順位表をみて、私がランジャタイなら、ひどく落ち込んでいるかもしれない。ただ、ここで改めて分散に注目したい。
ランジャタイは、分散ではハライチに次いでバラつきが大きい9.9だった。
平均点の低さとかけ合わせて比較すると、「総じて低い評価だったが、高く評価した審査員がいる」と推察できる。志らくが96点をつけて「0点か100点の芸」とコメントしたことと一致する。
ランジャタイは落ち込む必要はない。モグライダーは平均点が低めで分散が小さく、「まんべんなくややウケした」のと比較すれば、ランジャタイは「刺さる人には刺さった」芸人である。お笑いライブで熱狂的なファンは、ランジャタイのほうが付きやすいかもしれない、と定性的に評価できる。
こうして定量と定性を組み合わせて考えていく楽しさを少しずつ覚えている。
◇
分散の結果をSさんに示すと、「分散もいいですけど、標準偏差を出されたほうが、使い勝手がいいですよ」と助言が入った。
どういうことか?
同じバラツキを表す統計として、分散のほかに標準偏差がある。
どちらも平均値(縦のK軸でいえば、芸人コンビに対して審査員7人がつけた点数の平均)に対して、どれぐらいのバラツキがあるかを一つの数字で表す。
少しややこしく感じるが、分散を出すために実は、数式上で「2乗」している。これはいわば、バラツキの分かりやすさを出すために、体重を極端に増やして測定したイメージだ。相撲に例えるなら、白いまわしをつけた体重検査であって、化粧まわしをつけた本場所ではない。
本場所の土俵では松本人志や上沼恵美子が横綱審議会のように点数をつけているのだが、分散は土俵にそのまま出せる身体(数字)ではない。
そこで、標準偏差の出番である。
2乗した値である分散を√(ルート、平方根)で戻したのが標準偏差だ。逆に標準偏差を2乗すると、当たり前だが分散になる。
分散を√=標準偏差
標準偏差を2乗=分散
分散も標準偏差も、どちらも「平均値に対してのバラつき」をみるための数値であり、バラつきを見る目的だけなら、計算が簡単な「分散で十分」である。
ただ、繰り返しだが、分散は2乗しているため、その数字を土俵に上げて他の審査員がつけた元の点数や平均値、総合点などと比較することはできない。その目的ならば、2乗した分散を平方根(ルート)を使って、本場所の土俵上でも比較可能な数字に戻さねばならない。それが標準偏差である。
ここで標準偏差について、教科書的な説明を転載する。
データのバラツキを示すものとして、平均値との差(偏差)の2乗を平均した値(分散)の平方根である標準偏差がよく用いられている。 標準偏差は通常σ(シグマ)で表示される。
今度は黄色で色づけしたL列の「標準偏差」に注目してみる。
錦鯉の標準偏差σ=1.99を一例にとる。分散との関係を念のため復習すると、標準偏差σを2乗すると、1.99×1.99=3.95(分散)だ。逆に分散3.95を√で戻すと、標準偏差1.99ということである。
ここでは、分散と標準偏差が同じく「バラツキ」を表す仲間であることと、分散では他の実数と比較できないこと、標準偏差は比較可能である数値であることを理解してほしい。
錦鯉の標準偏差σ1.99をおよそσ=2とする。これは比較可能な数字なので、例えばオール巨人が錦鯉につけたB9の92点と、平均からのバラツキを示すL9の標準偏差のσ2点は、同じ土俵にあがっているとイメージしてほしい。
書いている初学者の私も頭が混乱しそうになるので、順を追って丁寧にみていく。
バラツキをみるために、同じ土俵にあがった標準偏差σをプラスとマイナスの幅で、以下のように2倍までみてみる。
1σ(イチ・シグマ)=2点
-1σ(マイナス・イチ・シグマ)=-2点。
2σ(ニ・シグマ)=2×2=4点
-2σ(マイナス・ニ・シグマ)=-2×2=-4点
錦鯉の平均点93.6点を山の頂上にして、錦鯉の点数は下の図のように収まる。
これは、錦鯉の点数が平均93.6点を山の頂上に、-2σ(-4点)と+2σ(+4点)の幅に、95%の確率で収まる、ということを示している。
計算すると、平均点93.6-4=89.6点、平均93.6点+4点=97.6点。
つまり錦鯉の点数は、89.6点~97.6点の幅に収まる確率が約95%ということだ。
サンプルがとても少ないが、実際の審査員の点数でみても、最低点が志らくの90点~最高点が礼二96点で、標準偏差から導いた89.6点~97.6点の範囲内に収まっている。
今回は、M-1グランプリ2021年大会で錦鯉の取った点数7サンプルから導いている。仮に錦鯉が10年連続で決勝に出て、点数のデータがもっと多くたまっていたと仮定しよう。
10年分データから、仮に2σが同じく89.6点~97.6点なら、錦鯉は95%の確率で、出来が悪くても89.6点、めちゃくちゃ出来が良くても97.6点の範囲内で笑いを取る、ということが統計上いえる。つまり、100点を目指しても難しく、逆に80点のような低すぎる点を取ることもほぼ無い、ということだ。
標準偏差は、こうした計算や予測をするときに便利な数字に整えられているので「使い勝手が良い」ということだ。
◇
ここまで一覧表を縦軸にみて、お笑いコンビへの評価を軸に「おもしろさ」を競った採点結果のバラツキをみた。
今度は審査員を軸に横に並べて、各審査員の採点の付け方のバラツキをみたい。
14列の標準偏差に注目すると、標準偏差(σ)が小さい=採点にバラツキが少ないのは、サンド富澤(1.96)、ナイツ塙(1.83)あたりだ。
標準偏差は平均と比較しながら見ると、より立体的になる。
ナイツ塙は平均点が92点と高くて、バラツキが1.83と小さい(レンジが狭い)ので、「甘口な審査員」と統計的に言える。
逆にバラツキが小さくても、平均点が低いケースを探してみよう。
オール巨人は平均点が90.3点と低いなか、バラツキが2.11と低いため、辛口審査員。
M1ファンとして、さらに定性と定量を交えて分析すると、
1人だけ落語家で採点やコメントが目立ちがちな「志らく」(σ=2.81)の陰で、中川家・礼二(σ=2.77)と松本人志(σ=2.78)も、実は同じようなレベルで採点のバラツキがある。
志らくと礼二は、評価するコンビこそ違うものの、平均値93.1と同数で、標準偏差も近いので、実は似たような評価軸のレンジをもって審査している。
テレビをながめているだけではわからない、マニアックな分析が可能になった。
審査員の標準偏差を比較すると、ネット界隈で話題の上沼恵美子さんは7人のなかでは、σ3.53と群を抜いて採点がバラついている。標準偏差は、私たちの体感にとても近い。
今回の定量分析でいえば、標準偏差σが大きい審査員は、好き嫌いがハッキリしている。好きなコンビは褒めちぎって、逆はまったく評価しない、ということだ。まさに上沼さんのM-1審査員像と重なる。
私は実は、上沼さんの今回の採点結果が自分の好みと合わなかった。
一方で、統計上で自分の自己採点についても統計分析してみた。
平均90.6点に対して、標準偏差σ=3.03だった。統計データでは、私も好みがハッキリしているタイプだといえる。
定量分析や数字は、物事を冷静に判断するために大事なツールだとMBAでは習う。アクセルで突っ走る意思決定に、数字は時にアクセルをさらに押し、時にはハンドルを軌道修正し、また場合によってはブレーキをかけるような役割だ。
M-1審査員の上沼さんと自分は、面白いと評価したコンビは違えど、同じような好き嫌いのバラツキがある。そう冷静に考えれば、「上沼さんの採点基準はおかしい」とは、私は決して言えない。
お疲れ様です。
σ÷平均にて率でみてみるのも面白いですよ。
お疲れ様です。
面白い!!!!!!ともにビジネスアナリティクスで苦しんだ者として、最初は「うっ」ときましたが、読み進めるうちにだんだん引き込まれました。定量ってもしかして楽しい?とちょっと思ってしまう自分が、定性代表としてはちょっと恥ずかしいくらいです。
>自分が論理的だと信ずる主張を、データで裏付けて示す
これは、自分の主張になかなか自信が持てないものとしては、やはり身に着けるべき手段だと痛感しています。そして、のがさんご自身の特性までも裏付けらえたことは、とても興味深いです。続きが楽しみです!!