ビジネス統計スペシャリスト対策！スプレッドシートでＦ検定を求める操作方法

2021年12月3日

この記事で分かること

●スプレッドシートでＦ検定を行う方法
●データの読み取り方

Contents

1. はじめに
2. 操作方法
3. データから分かること
4. まとめ

はじめに

ご訪問ありがとうございます！まちゅけんです

ヨメちゃんです

今回はビジネス統計スペシャリストにも役立つ、スプレッドシートでＦ検定を行うための操作方法とデータの見方について解説します。

Ｆ検定を一言でいうと、「ＡチームとＢチーム、各チーム内の数値のバラつきは、ＡチームとＢチームで同じか？」ということを調べる行為です。

統計学の用語を使って言い換えると、「２つのデータ群の分散は等しいか・そうではないか」とも説明できます。分散分析とか言ったりします。

実はこのＦ検定ですが、単独で使うことはテストでもない限りはあまり機会がありません。多くの場合、ｔ検定という別の分析とセットで使用します。

ｔ検定に関する説明はまた別の機会にお話をさせていただくとし・・・

早速、Ｆ検定の操作方法について解説をします。

「ビジネス統計スペシャリストってなに？」という方は下記の記事を参考にして下さい。

【ビジネス統計スペシャリストに合格】統計検定との違い、難易度、メリット　解説しま

こんなひとに読んでほしい統計検定との違いを知りたいひとビジネス統計スペシャリストのメリットを知 ...

https://machuken.com/post-497/

操作方法

Ｆ検定を行うにあたり、下記の例題を使用します。

例題

あなたは食品メーカーの商品開発担当です。この度、あなたが担当するうどん部門で新商品を開発することになりました。開発部長からは、地域の特性にあった商品を提案してほしいと依頼されています。まずは参考として既存商品の人気調査から始めました。既存の商品は一つのうどんでもさっぱり味・こってり味で２種類の商品を北海道と九州で展開しています。

部長「今回は北海道と九州で、同じ商品だけど味付けが違うものを限定で展開したいと思うんだ。既存商品を参考に、人気の味付けで評判の良い方をそれぞれの地域に展開したいと思うんだけどどうかな？」
あなた「データさえあれば可能ですね」
部長「ということであれば、既存商品の味付け別に北海道・九州それぞれ10人にアンケートを取ったデータがあるよ。評価は1～5点。使えそうかな？」
あなた「任せて下さい！これがあれば北海道・九州にそれぞれに最適な商品が分かるかもしれません」

地域ごとの商品評価

	さっぱり	こってり
北海道	5	4
北海道	5	5
北海道	4	1
北海道	5	4
北海道	4	5
北海道	5	1
北海道	4	5
北海道	5	1
北海道	3	4
北海道	5	5
九州	4	5
九州	5	4
九州	5	4
九州	4	5
九州	5	4
九州	4	4
九州	5	5
九州	4	5
九州	5	5
九州	5	4

北海道・九州の各10人にさっぱり味・こってり味を5点満点で評価してもらったアンケート

スプレッドシートでＦ検定を行うにはデータ分析ツールを使うのですが、初期設定のままでは使用することができません。簡単な操作で機能解放できますので、まだの方は参考にして下さい。

【ビジネス統計スペシャリストに合格】スプレッドシートを活用しよう！

はじめにこの記事では下記の２点が分かります。この記事で分かること１：スプレッドシートでXLMiner ...

https://machuken.com/post-735/

F-Test Two-Sample for Variances を選択

スプレッドシートの分析ツールを開き、「F-Test Two-Sample for Variance」を選択します。日本語では「Ｆ検定：２標本を使った分散の検定」と言います。

範囲指定をする

今回の検定では２通りの検定を行います。

１回目の検定では・・・
変数１の入力範囲にさっぱり味×東京10名
変数２の入力範囲にさっぱり味×大阪10名
※薄味に対する東京・大阪の評価のバラつきを比較

２回目の検定では・・・
変数１の入力範囲にこってり味×東京10名
変数２の入力範囲にこってり味×大阪10名
※濃い味に対する東京・大阪の評価のバラつきを比較

をそれぞれ調べます。

結果が出ました！

おめでとうございます！結果がでました！

これだけ見てもよくわからないな

見るところは限られているから大丈夫だよ

データから分かること

今回の結果で見るべき箇所はたったの一つ

P(F<=f)one-tailだけです。

この値をＰ値といいますが、Ｐ値はパーセンテージに置き換えることができます。

Ｐ値を２倍にして0.05(５％)よりも大きけれ変数１と変数２のバラつきに違いはあったとしても「誤差程度」ですし、逆に小さければ変数１と変数２のバラつきは「明確に異なる」と判別をします。
ちなみに「５％」という数字がどこから出てきたのかというと、統計学ではこの値を有意水準といいます。有意水準は自由に設定することができますが概ね５％で設定をします。「検定結果が５％を切ったら、北海道と九州の評価のバラつきに違いがあるのは有意（意味が有ること）にしよう。それ以上の数字が出たら偶然として処理しよう」と考えます。

P(F<=f)one-tailを２倍する

「なぜ２倍？」

と思ったかもしれません。こちらの説明をするには帰無仮説・対立仮説・片側検定・両側検定の概念を説明する必要があります。

しかしビジネス統計スペシャリストではそこまで深く突っ込んだ部分は問われないことを考えるとこちらでの説明は省略します。

統計検定２級の受験者向けに「簡単な片側検定と両側検定の見分け方」について解説した記事があるので気になる方はご参考程度にお読みください。

帰無仮説が「２つのデータ群の分散に違いはない」、対立仮説が「２つのデータ群の分散に違いがある」と思いながら読むとお分かりいただけるかもしれません。

片側検定と両側検定　超簡単な見分け方を統計検定２級の合格者が解説します

この記事で分かること ●片側・両側検定の見分け方ご訪問ありがとうございます！今回は統計検定２級の ...

https://machuken.com/post-959/

先ほどからパーセンテージと言っていますが、これが一体なんの確率かわかりませんよね。

１つめの検定を例にあげていえば

「さっぱり味に対する北海道と九州の評価のバラつきに違いがあるのは0.36(0.18の２倍)の確率でたまたま」

ということができます。

なので２つ目の結果からは、

さっぱり味に対する北海道と九州の評価のバラつきには違いがあるので、「北海道と九州のどちらかではこってり味は賛否両論なんだろうな」みたいなことが分かったりします。

たしかによくデータを見ると、さっぱり味は北海道・九州ともに評価が高い一方で、こってり味は北海道で賛否が分かれています。

なので「よし北海道では思い切ってさっぱり味だけ、九州ではこってり味だけ売ろう」といった判断の材料にすることができます。

注意点

スプレッドシートの分析ツールでＦ検定をする際の注意点です。黄色く塗った分散という箇所をご覧ください。分析をする際は分散の値が、変数１＞変数２となるように計算をして下さい。上記画像のように逆転させるだけでＦ境界値が全く関係のない数字になりますのでご注意下さい。

まとめ

今回はビジネス統計スペシャリストでも活用できる、スプレッドシートを使ったＦ検定の操作方法について解説をしました。実際の問題ではこのあとにｔ検定をして結果を求めさせるようなコンビネーション問題が出ることがほとんどだと思います。ｔ検定については次回以降の記事で解説しますのでお待ちいただければと思います。

F 検定を解説するには統計学の用語や概念をかなりふんだんに盛り込む必要があるので、もしかしたら少しわかりづらい点があったかもしれません。

「座学でガッツリやりたい！」

と思った方は統計検定の受験をオススメします。なぜオススメするのかについては下記の記事でたっぷりと解説していますのでお読み下さい。