【統計】Pythonでポアソン分布を用いた検定をやってみる

今回はポアソン分布を用いた検定をやってみます。ポアソン分布については以下をご覧ください。

ポアソン分布を用いた検定

お題

1日に平均15人来店する中華料理屋があります。来客数を増やしたい店主は、オリジナルのメニューを考案しSNSで宣伝活動をしました。その結果、1か月で1日平均25人まで来客数が増えました。

このとき、オリジナルメニューのSNS宣伝活動によって来客数が増加したと言えるでしょうか。

1日で15人しか来客がないということで、来客は稀な事象ともいえます。故に1日平均λ人訪れる中華料理屋にx人訪れる確率f(x)はポアソン分布に従います。

仮説

お題から仮説を立てます。帰無仮説H0と対立仮説H1は次のようになります。

  • H0:1日で中華料理屋に来店する人数は15人である
  • H1:1日で中華料理屋に来店する人数は15人であるとは言えない。

検定統計量

検定にそのままの数字を使うことはできないので、検定統計量を算出します。確率変数xがポアソン分布Po(λ)に従うとき、期待値E(x)=分散V(x)=λが成り立ちます。

今回Xは1か月間の来客数で、25×30=750になります。サンプルサイズnは1か月の日数で30日です。

中心極限定理によりnが十分大きいときに独立した確率変数の和は正規分布に収束します。よってXは正規分布N(nλ,nλ)に従うと考えられます。そして次の式は標準正規分布N(0,1)に従います。

サンプルサイズが十分大きい場合、X/nは正規分布N(λ, λ/n)に従うと考えられます。よって次式の値も標準正規分布N(0,1)に従います。X/nとは今回の場合1カ月の来客数を日数で割った値(1日あたりの来客数)です。

棄却域の設定

この検定では標準正規分布を使用します。また来客数が増えたかを知りたいので、片側検定を採用します。有意水準はα=0.05としてとして進めていくことにします。Z0.05を読むと、1.64が判定の基準となります。

検定統計量の算出と検定結果

これまでの情報をもとに検定統計量zを算出してみます。

検定統計量z

標準正規分布を図にしたとき、検定統計量z=4は、次の位置になります。

検定統計量zの位置

この図から、検定統計量zは棄却域に入っていることがわかります。したがって、「有意水準5%において帰無仮説を棄却し、対立仮説を採択する」という結論に至ります。

つまり、店主の努力で来客数は増えたということが言えそうです。

まとめ

ポアソン分布を用いた検定をやってみました。今回の例は明らかに増加していそうな感じでしたが、増加や減少が微妙なときに検定をすることで客観的な結論を下してくれます。

効果を検証する際は、数学的なエビデンスとして検定をご利用ください。

ではでは👋