いわしはだいだい昼寝をしている

まとまりもとりとめもない脳内爆発日記

やっぱりデータは大事だね,という話

データデータ言われすぎて耳が痛い世の中です.

が,しかし自分たちでデータをしっかり調べる癖をつけていた方がいいと最近実感しています.

一億総ジャーナリストと言われる時代なので 結構身勝手にツイッターなどで意見を発信していたりする.まーこのブログもそうなんですけど.

そんな中で,根拠がないのに他人を罵ったり,間違っている,と一刀両断している人は結構多い.例えばプロ野球なんかは Twitter のおかげでファンとファンの交流が増えて,監督の采配やチームの運営などをしょっちゅう議論している.一ファンとしては嬉しい限りだ.一方で,結構おおざっぱな議論や精査されてない意見などが散見されていて,議論に加わらないで,見ている方としては複雑な気分になる.一方的な印象である選手を散々バカにしたかと思えば,一点,自分の好きな選手を手放しに褒めたりする.

皆さんもご存知の通り僕はベイスターズファンである.やっぱりベイスターズファンの中でも,今シーズン活躍しなかった選手を大した根拠もなしにディスったりトレードしようとか言ってる人が結構いる.

野球界の流れとしてデータを活用しようというものがあるプロ野球選手のほとんどの試合に関する行動はデータ化され多くのファンやもちろん球団そして一般企業によって,分析の対象となっている.例えば War という指標がある.これは選手の総合的な能力の指標だ.この指標を使えば,ある選手がどのくらいの能力を持っているかなどを簡単に理解できる.つまりちょっとの手間を惜しまなければ,データを調べることによって自分が思っていること(例えば選手批評)と現実の一面(データ)が乖離しているか,それともデータが自説を支持するものなのか,は簡単にチェックできるのだ

WAR (野球) - Wikipedia

自説への根拠のない自信

f:id:iwashi8washi:20181022105347j:plain

 

例えばこういう考えがあったとしよう.それは認めるべきことだ.そして,まず僕らがやるべきことは,批判することでも信じ込むことでもない.データをチェックするべきだ.

baseballdata.jp

 

このサイトをもとに,2018年シーズンの選手の価値を計算して見た.

すると,

横浜の野手のXRWIN: 0.08
横浜の投手のRSAA: -6.19

檻の野手のXRWIN: -2.01
檻の投手のRSAA: -5.02

と,なり両者ともかなり微妙な感じになる強いていうのであれば横浜が損をすることになる.選手の能力は毎年変化するので,次年度の話を前年度のデータで議論するのはいささか大雑把であるが,何も見ないで直感のみで議論をするよりはマシであろう.

この話は何も野球に関することだけに通じているわけではなく,色々な主張(テレビや新聞などのメディア)をただただ同意したり毛嫌いするのではなく,自分でしっかり根拠を調べてみよう,という話である.意外と根拠がないものが多かったりする