2020ー2021年のツアースタッツから稼げる選手を分析
1年目の春期前半に履修した授業は、視覚障害学特論・健康障害学特論・運動障害学特論、そして、統計学である。履修科目のシラバスを見たときから、統計学の文字が嫌な感じで迫っていた。
実は私、大学受験時まで「確率・統計」を勉強していた。当時行きたかった大学の2次試験に必要だったからだ(結局、国語、英語、小論文しか必要のない大学に進学したのだけれど)。
しかし、苦手だった。理解してもいなかったと思う。そこに数学的思考の真髄があるような気もしていた。
「統計」は、研究テーマによっては必須である。量的研究でデータ分析を行う際にはなくてはならないもの。特に医療、教育などの分野では必要不可欠。
徐々に学ぶなかで「身近な数字やデータを使って」と言われたレポートは、結局全部ゴルフにつなげた。ゴルフって数字を使うスポーツなんだと改めて思った。たとえば、初ラウンドのスコア(従属変数)は、レッスン回数(独立変数)が多いほど良くなる、という仮説を立てたり……。
そして、最終的にグループワーク&発表が行われることとなる。チームでテーマを決めデータを探し仮説を立て分析するのだ。ここでチームの皆さんのご協力を得て、「ゴルフ」をテーマにした研究にしてもらった。同級生に少しでもゴルフを知ってもらえるチャンスだとも思った。
データセットは、2020-2021年のJGTOとJLPGAのスタッツデータから。男女とも賞金シード獲得者、男子65名、女子50名のデータ。出身都道府県・年齢・出身校・賞金ランク・賞金額・飛距離&ランク・パーオン率&ランク・平均パット数(パーオンホール)&ランク・血液型・身長・体重・ゴルフ歴、そして、せっかち度のデータ。「せっかち度」のみ、ゴルフ記者としての私の独断と偏見で5段階評定とさせていただいた。
飛ばせる選手は稼げるのか? という仮説
目的は、ゴルフ界の「定説」を検証するという形にした。私が感じることをいくつか出して面白そうなものを仮説としてピックアップした。
仮説1・飛ばせる選手は強い。
仮説2・パット イズ マネー(勝利にはパットが重要)
仮説3・血液型がB型・AB型の選手は強い。
また、説明がわかりやすくなるように、研究の背景としてゴルフをしない人も知っている石川遼プロを使わせていただいた。(遼プロ、スターの宿命と思ってお許しください)
「最近、思うような調子が出ないようにみえる石川遼プロ。賞金王になった2009年よりも、飛距離は10ヤードもアップ。しかし平均パット数のランクは1位から43位に下がっている。また、遼プロの血液型はO型……ゴルフ界の『定説』に何か関係が? データを分析し、明らかにする」
まずは様々な統計分析を行う。相関分析・分散分析・一元配置分散分析・重回帰分析など。分析方法には、個性が出るため、面白く勉強になる。それらを持ち寄り、最終的な発表資料を作成した。
現在の統計分析は、ソフトを使って効率的に行うことができる。我々は「SPSS」という解析ソフトを使用。昔はすべて手計算で行っていたというから、時代は進化するものだ。
さらに、現在のPGAツアーで出しているSG(ストロークゲインド)といった詳細データは、こういうことから来ているのだなあとしみじみ。
量的な研究デザインを考えるとき、「測りたいものは何か」「それはきちんと測れるか」「ものさしはイメージできているか」「誤差なく測れるか」を常に自問自答する必要がある。
仮説を立て、正規性の検討をし、従属変数と独立変数を決め、その尺度から対応できる分析法を選択、信頼性と妥当性(体重を体重計で測れているかの「妥当性」と目盛りは狂っていないかの「信頼性」)の検討や交絡要因の測定なども。
結局は、自分が「やりたいこと」「見たいもの」を考え、「それは何のためなのか」をしっかり決め、ブラさず、プロセスを大切にして進めていかねばならない。常に調べ、先生方はもちろん、仲間に相談しながら。研究は孤独な作業ではない。
さて、統計学2班の5人の分析とまとめは以下のとおり。
仮説1&2・平均飛距離が長いプロ、パット数が少ないプロは、獲得賞金が多い ← 賞金額を従属変数とする重回帰分析。
仮説3・血液型がB型とAB型のプロは、獲得賞金が多い ← 血液型による一元配置分散分析。
(飛距離のデータは、男女別にShapiro-wilkの正規性検定を行った。優位確率は男子0.414、女子0.215でともに正規分布に従った。賞金額のデータは、優位確率が男女とも<0.01で正規分布に従わなかった)
結果。男子の有意要因、①パーオン率が高い ②平均パット数が少ない ③せっかち度が少ない。女子の有意要因、①パーオン率が高い ②平均パット数が少ない ③身長が低い、となった。
飛距離は有意な独立変数に選ばれなかった。
また、血液型は賞金額と関係あるのかを分散分析した(等分散性の検定で優位確率がp=0.05以上であったため、等分散している)。結果は、有意確率がp=0.05以上であったため有意差はなかった。
よって、仮説1は×、仮説2は◯。「パット イズ マネー、ショット イズ マネー」の結果に。血液型の仮説3は×だった。
最近の女子プロ界は身長が低いほうが強い傾向
付け加えるならば、男子プロは「せっかちではないほうが稼げる」、女子プロは「大きくなくても諦めないで!」ということも証明された。
ゴルファーの皆さんなら納得できる結果ではないか。また、最近の若手女子プロは、身長は低い選手が強い傾向にあることも現れている。
ゴルフもよくご存知の先生からの「アプローチなどの要素が途中抜けては判断するのに不十分なのでは?」という鋭い指摘もあったが、今回はそれなりに面白い分析ができたと思う。
客観的かつ主観的に。分析の仕方はもっとある。見えないものを見える化し、有意義な情報を得るために……。
私は現在、自分の研究のアンケート作業中だが、これを集計・分析する際に、当然統計学を使用しなけらればならない……もう一度勉強し、先生や仲間に相談しながら、頑張っていきたい。
グループの皆さん、本当にありがとうございました。石川遼プロ、題材に使わせていただいて、ありがとうございました。