December 21, 2011

11月に書いた記事で、ビル・ジェームステオ・エプスタイン過大評価ぶり、そして現状の単純すぎるパークファクターの数値としてのいい加減さと、その使われ方のデタラメさについて書いた。

こんどはホームランをもてはやすのによく使われる指標、OPSの「デタラメさ」について、ちょっと書いてみる。

ダメ捕手、城島健司。The Johjima Problem.:2011年11月8日、ボストンの2004年ワールドシリーズ制覇におけるダン・デュケットの業績を振り返りつつ、テオ・エプスタイン、ビル・ジェームス、マネーボールの「過大評価」を下方修正する。

ダメ捕手、城島健司。The Johjima Problem.:2011年11月10日、「パークファクター」という数字の、ある種の「デタラメさ」。


ブログ主は、ホームラン20本程度の打者のうち、低打率で、ただただバットを振り回したがるだけの低脳スラッガーが非常に嫌いだ。
この手のハンパ打者を甘やかすモノの見方をしたがるタイプのハンパな野球ファンは、日本でもアメリカでも、またファンであれメディアの記者であれ、実に多い。彼らは、たとえ打率が2割ちょっとか、2割半ばくらいしかなく、週に1本打つか打たないかのホームラン数でも、なにかシーズン中ずっと活躍していたかのように言いたがる。実にアホらしい。

こういう「デキそこないの子供に大金を与えて甘やかす、デキそこないの、ダメ親」みたいな現象が起きる原因は、たとえばOPSのような、「出来た当初こそ、画期的な部分があると思われたが、時間がたってから見てみると、作った人間の好みの野球の反映にすぎないシロモノであることがバレバレの、まるで都会に戻ったら相手がいかに不細工だったかがわかるリゾラバみたいなギミック(笑)」が、ああいう輩に意味不明の自信をつけさせ増長させた点も見逃せない。
あたかも「現実を数多くプロファイリングし、その積み重ねから野球という現実全体に通用する有用な法則を作りあげた」ように見せかけていたわけだが、実際にやっていることといえば、「単に長打を礼賛したいだけ」のために、「現実は最初から無視して、最初から長打を礼賛したい自分の好みに都合のいいレトリックを作っただけ」だったりするのは、本当に困りものである。



例えばOPSに関する日本のWikiに、次のような記述がある。
「例えば出塁率.400、長打率.400の打者でも、出塁率.300、長打率.500の打者でも、同じ.800という数値が出る。」


もっともらしく書いてある(失笑) 多少野球の数字をかじった人は、「その記述どおりでしょ。何か問題でも?」とか思って読むに違いない(笑)いやー、笑える(笑)馬鹿か、と言いたい。

この記述、実は現実の野球にあてはめると、非常に馬鹿馬鹿しいのである。特に「出塁率.400、長打率.400の打者」なんていう記述の馬鹿馬鹿しさ、数字のまやかしに、これまで誰も気づかなかった。
ちょっと、いつぞや書いた「iPodの原型は、ウォークマンである」というロジックの単純さに似てなくもない。(この「ウォークマンとiPodの件」についても、そのうち続編を書く)
ダメ捕手、城島健司。The Johjima Problem.:2011年10月9日、「iPodの原型は『パソコン』であって、ウォークマンではない」ことが瞬時にわかるのが、「パソコン以降の文化的視点」。


この手の「現実離れした、粗末なヘリクツ」が、日本でもアメリカでも、大手を振ってまかり通ってきた原因は、Wikiを書いた人間のロジックがあまりにも巧妙だから、言っていることの「矛盾」や「あまりにも辻褄が合わない部分」に気づかないのではなくて、むしろ、こういう風に、「数字の側から、野球という現実を見て判断することは、常に正しい」と自分勝手に思いこんでいる馬鹿があまりにも多くなりすぎた、という点にある。
表向きでは「野球という現実を、データとして数多く統計的に蓄積、プロファイルして、その結果の精密な分析からみえてきた法則性を、指標という形式にとりまとめた」ように見せかけているが、その実、実際の算出手法と、その根底にある思考回路は、まるっきり逆だ。
この『数字』にあてはまる『現実』は、野球というスポーツのほんの一部でしかない」のである。


例えば「出塁率.300、長打率.500」という部分だが、それに近いタイプの打者を、この2シーズンのア・リーグの打者から探してみると、2011年でいうと、この設定にかなり近いバッターは、ネルソン・クルーズ(出塁率.312/OPS.509)を筆頭に、J.J.ハーディー(.310/.491)、マーク・レイノルズ(.323/.483)、マーク・トランボ(.291/.477)と、まぁ、けしてサンプル数が無限にあるとまでは言えないにしても、「探せば、有力プレーヤーに何人かサンプルを見つけられる」レベルにはある。また2010年ア・リーグの例では、多少「出塁率.300、長打率.500」という設定からは遠ざかるが、カーティス・グランダーソン(.324/.468)、マイク・ナポリ(.316/.468)と、なんとか数字的に近い打者を見つけることができる。(しかも近年のペナントの行方を左右した選手の名前も多い)

つまり、言いたいのは、「出塁率.300、長打率.500の打者」というレンジ設定は、「野球という現実を、多少なりとも反映している」ということだ。


これに対して、「出塁率.400、長打率.400の打者」という部分については、OPSは同じ.800でも、話はまったく異なる。なぜなら、出塁率.400、長打率.400という設定にあてはまる打者を、ほとんど見つけることができないからだ。
理由はハッキリしている。
出塁率.400、長打率.400なんていう打撃スタッツの打者は、現実の野球には、ほとんどありえない
からだ。出塁率.400、長打率.400などというレンジ設定自体が現実離れしているのである。
(たとえば「出塁率.400、長打率.400の打者」といえるのは、2010年のオークランドの一塁手ダリック・バートンだが、OBP.393、SLG.405 四球110と、あまりにも奇妙な打撃スタッツだ。たぶんこの「ダリック・バートン」なんて名前、おそらく日本のMLBファンの大半が記憶に無く、またこの選手がOPS.800を記録したからといって、ほぼ同じOPSのネルソン・クルーズに匹敵する打者だとは、誰も思わない。さらにダメなのは、バートンが2010年以降も似たような打撃スタッツを続けられるわけがないことだ。つまりバートンの成績には「再現性」が全く無いのである。「再現性」がない現象は、単なる偶然か、ドーピングによる作為でしかなく、それを「法則の一部」とみなことなどできるわけがない。)


どうしてまた、こういう奇妙なことが起きるのか。


これを検討するためには、以下のような諸点などを十分に検討して話を進めていかなければならないので非常にめんどくさい。(だからすべての議論を一度にひとつの記事に詰め込むことは、すぐにはできない)

1)「長打率(Slugging Percentage)」とか「自称」している数字は、そもそも「打数あたりの塁打期待値」である。
長打「率」なんて完全に間違ったネーミングのせいで誤解されているだけで、長打率は「長打だけに関する打率」でもなんでもないのだ。
だいたい、そもそも長打率は「率」ですらない。「期待値」は「率」ではないのだ。また、「長打のみについて抜き出して算出された数字」ですらない。

1の余談)ちょっと細かい話になるが、「シングルヒットでも長打率が上がるから、OPSには欠陥がある」だのなんだのいう「OPS批判にみせかけたシングルヒット批判」は、長打率が本当は塁打期待値で、得点期待値ではないことの意味をちょっと考えれば、それがある種の大ウソに過ぎないことは、すぐにバレる。
塁打数を計算する数値である長打率は、当然ながら「どの種類のヒットを打つか」によって、数値の変化度合は違うわけだが、仔細に見てみると、長打率の仕組みそのものが、主にホームランだけが数値を押し上げる要素になるように「仕組まれた数値」でもある。例えばある打者がある試合で4打数1安打でシングルヒット1本だとして、たとえそのシングルが試合を決める2点タイムリーだったとしても、その日の塁打期待値そのものはたった.250に過ぎない。シングルヒットは長打率を押し下げる要素としてしか計算されないし、また、シングルヒットは塁打計算においては得点期待計算より半分の評価しか与えられない。
そのため、打者の長打率によっては「シングルヒット、場合によっては二塁打を打ってさえも、長打率は下がりさえする」のである。だから、ヒットを打てば打つほどOPSも大きく上昇する、とは限らない。
原因は簡単だ。塁打数としてだけの意味では、ホームランの「4」に対し、シングルヒットは「1」、二塁打は「2」としか評価されず、その一方でそれぞれのイベント発生頻度、つまり、シングルヒットや二塁打の発生度数の多さはまったく考慮されない。だから「シングルヒットが塁打期待値を押し下げる方向にだけしか働かないように設計された数値」においては、「シングルヒットを打てば打つほど、数値が下降」していく珍現象が起こる。逆に「ホームランは、発生頻度が非常に低いのに、数値が大きく上昇する」。そういう風に設計されている塁打期待値を、発明者は恣意的に『長打率』と呼びならわし、しかもあたかも得点期待値でもあるかのような印象づけを試みた、のである。
現実の野球では、シングルヒットに意味がないなどということは有り得ないことなど、あえて言うまでもない。シチュエーションと打者によっては、ホームランより出現頻度の高いヒットのほうが得点期待値が高いことすらある。(例えば第2回WBC決勝)
得点期待値の算出においては、ホームランとシングルヒットの比重が現実の野球に近くなるように考慮されているため、長打率のようなこうしたデタラメは起こらない。

2)長打率の算出根拠は、「塁打数」であるために、近年の打撃スタッツの得点貢献度の算出における計算手法より、ずっとホームランを過大に計算している
そのため、あたかも「長打率 イコール 得点期待値」と他人に思いこませたいだけの悪質なスラッガー好き人間と、ホームランを礼賛したいだけの無能ライターの格好のエサになって、根本的に間違えた議論の格好の材料になっている。
例えばOPSの基礎になる長打率では、ホームランを4、二塁打を2、ヒットを1などとして、打数あたりの「塁打数」を計算するわけだが、こうした「塁打数」は「得点期待値」とイコールではない。例えば「シングルヒットで2点入る」こともあれば、「ホームランで1点しか入らない」こともあるように、「塁打数は、得点期待値には、直結しない」。
例えば近年WARのような指標の計算も盛んだが、ここでも0.72BB+0.75HBP+0.90単打+0.92エラー出塁+1.24ニ塁打+1.56三塁打+1.95HRなどという計算式(これはwOBAの計算方式だが、この加重の方法を絶対的なものと考える必要はまったくない。あくまで例に過ぎない)があるように、得点貢献度の計算においては、ホームランとシングルヒットの得点貢献度の比率は、およそ「2対1」であり、長打率のように、ホームランを「4」、シングルヒットを「1」などと、ホームランとシングルヒットの比率を「4対1」とか、ホームランについて過大な計算をしてはいない。

3)OPSは、2種類の性質も母数も違う数字同士を、単純に足し算しているが、その「違う種類の数字を、足しても問題ない、足しても意味が成り立つ、という根拠」が、まるで明確でない。2種類の性質の異なる数字を、「補正も何もせずに、ただ単純に足し算する行為の正当性がほとんど不明であること」は、数値として「デタラメをやっている」としか言えない。
「出塁率」は「率」であり、「長打率」はグロスの「期待値」である。だから、それぞれの数値の性格がまったく違う。また、この2つの数値は、数値算出のための母数が異なる。また数値がカバーしている現実の野球のレンジも異なる。

4)OPSは、母数が違う数字同士を単純に足し算している。
出塁率の計算における母数は「打数+四球+死球+犠飛」などと、ほぼ「打席数」に近いものだが、長打率の計算の母数は「打数」であり、打席数ではない。

5)OPSは、相互に相関のある数字同士を足し算している。ちょっと考えれば誰でもわかることだが、相互に独立しておらず、相関の存在する2種類の数値同士を、単純に足し算する行為は、数値の算出の元になる素材の「ダブり」を生む
たとえ話として、企業会計にたとえるなら、「打撃能力による収益を、特定部分だけ、重複して計上する」行為だ。当然のことながら、「重複して計上された素材(=例えばホームラン)については、明らかに帳簿上の収支が高く見せかけられている」ことになる。
これは、明らかに「出塁率と長打率の間に隠れて存在する計算素材のダブりを利用したデタラメな手品」である。

また、四球数の増加によって、当然、打数は減少するが、そうなれば当然、「打数を母数に計算される塁打期待値」である「長打率」はモロに影響を受け、増大する。つまり、「たとえ長打数に変化がなくても、四球を増やすことで打数を減らすことによっても、みせかけの長打率を上昇させることができる」し、OBPよりも数値上昇が大きく表現されやすいSLGが上昇すれば「OPSを増加させたようにみせかけることができる」のである。(それはチーム戦略として、勝つためにプレー内容の質と量を向上させる戦略的行為では、まったくなく、単に見栄えのいい数字を得るために数字そのものをいじるだけの「帳簿上の見かけの操作」に過ぎない)

6)OPSは打率を欠陥指標として「打率」を排除したとよく言われる。だが、OPSの計算式の内部では、排除どころか、むしろ打率に依存した一面も持ちあわせている。
例えば、出塁率についてだが、一度このブログで書いたように、「現実の野球におけるチーム出塁率は、実はチームの四球数にほとんど無関係で、大半はチーム打率に依存している」。つまり、「出塁率を左右するのは、結局は打率」なのである。また現実の野球において長打率の意味するところは、実際には打席あたりの出塁可能性でもあることを考えると、現実の野球においては、長打率が打率とまったく無関係と考えるのは馬鹿げている。
つまり、OPSは、タテマエとして打率を欠陥指標として排除したように見せかけているが、裏ではこっそり依存している部分が多々ある
ダメ捕手、城島健司。The Johjima Problem.:2011年9月3日、チームというマクロ的視点から見たとき、「出塁率」を決定している唯一のファクターは「打率」であり、四球率は無関係、という仮説。

7)「出塁率.400で、長打率.400」というバッターがほとんど実在していないことからわかるように、OPSという数字の仕組みで、現実の野球全体が説明できるわけではない。むしろそれどころか、OPSで非常にうまく説明される打者は、実は、非常に限られている。
あたかもOPSが現実の野球のすべてを説明するかのように思われがちだが、実際には逆であり、おそらくOPSの作者は自分好みのリーグのトップクラスのバッターだけしか着目せず、彼らの優秀さを礼賛するのに都合のいい数値を作ってみただけのことであると推定される。

8)細かいことを言えば、現実の野球においては塁打数の計算においてすら、打率が大きく関係してくる。打席ごとに長打を打てるかどうかは、毎打席ごとの確率の問題であり、打率が無関係になることなど、ありえない。
例えば、「600打数の打者が、20本程度のホームランを含め、ヒットを180本打つ」、という行為は、「あらかじめ1から4の数字が書かれた当たりくじ180個を含む600個のくじを入れた箱に、手を突っ込んで、1個だけを取り出し、そのくじを元に戻さないで、順に全てのくじを引いていく」という意味のわからない予定調和ではない。
現実の野球はむしろ、「まず、600個のうち180個の当たりの入った箱に手を突っ込んで、幸運にも当たりを引くことができたら(=ヒットを打てたら)、その『一度目のくじ』を元に戻して、こんどは、1から4、4つの数字の入った箱に手を突っ込んで、数字を決めるための『二度目のくじ』を引き、獲得できた数字(=塁打数)を確定する」という感覚のほうが近い。この2つの行為の差が、OPSにはまったく反映されていない。


OPSのWikiでの記述の話に戻る。

そもそも「出塁率.400前後の打者」といえば、近代野球の場合、各リーグにほんの数人しか出現しない素晴らしい出塁率である。そして、その素晴らしい数字だからこそ、むしろ問題になる。
というのは、「出塁率.400前後の、出塁率がリーグで5本指に入るようなトップクラスのバッター」というのは、ほぼ例外なく「それなりの数のホームランや二塁打を打ち、それなりの数の四球も選ぶのが、むしろ当たり前」だからだ。
つまり、OPSの言う「出塁率.400、長打率.400の打者」というのは、「野球という現実」を、まるで反映してない
現実の野球」に実在するのは、現実にはありえない空想といっていい「出塁率.400、長打率.400のバッター」ではなく、「出塁率.400、長打率.500前後のバッター」なのだ。

さらに、それだけではない。
ここまで書いてきた「出塁率と長打率の両方に隠れて存在する計算素材のダブりをこっそり利用したデタラメな手品」によって、大半の打者の打撃スタッツにおいて、「出塁率よりも、長打率のほうが大きい」という状態が成立する
これは、現実の打者がそうなることが経験上多いというリアルな意味ではない。計算上のみせかけのレトリックによってそうなる、のである。
数字の成り立ちからして、出塁率と長打率との間には相関関係が存在していて、2つの数字は相互に独立していない。上でも書いたことだが、相互に独立していない数値同士を足し算すれば、「多数の四球が長打率を押し上げてしまうという例」があるように、出塁率と長打率に内在する相関関係が原因で、「みせかけだけのOPS上昇」が発生し、「出塁率をやや上回る長打率が、自動的にはじき出されて」きてしまう。
常に「出塁率よりも、長打率のほうが大きい」という状態が成立するのは、単なる「計算上のまやかし」に過ぎない。

そりゃそうだろう。
率より塁打期待値のほうが、普通、数値としてデカいに決まっている。

OPSが「デタラメ」になっている主な原因は、「ホームランについて過大な評価が与えられていて、実は「率」ですらない長打率を、なんの補正せず、そのまま計算に採用し、「率」である出塁率と故意に、なんの理由もなく混ぜ合わせる「まやかしの手品」によって、あたかもホームランだけが得点を大量生産できる有効かつ最良の手段ででもあるかのように、「数字的にみせかけていること」にある。
だからこそ、「出塁率と長打率の数値がほぼ同じ、なんて打者は、ほぼ出現しない」ように、「OPSは、最初からできている」のである。この「巧妙なまやかし」が理解できないかぎり、この「OPSのデタラメさ」を理解できないだろう。


言い変えると、OPSという指標は、ある日突然「得点相関の高いと思われた2つの数字、出塁率と長打率(=実際には打数あたりの塁打期待値)を足し算してみることを、突然思いついたオッサン」が、「野球という非常に幅の広い現実のうち、自分好みの特定部分(たぶんそれはトップクラスのホームランバッター数名)を故意にクローズアップし、大好きな彼らのバッティングを褒めちぎるのに最も都合のいい恣意的な数値を作り上げた」ということでもある。

Copyright © damejima. All Rights Reserved.


(続く)

ハワイ移民150周年
No Ichiro, No watch.

Play Clean
日付表記はすべて
アメリカ現地時間です




Twitterボタン

アドレス短縮 http://bit.ly/
2020TOKYO
think different
 
  • 2014年10月31日、PARADE !
  • 2013年11月28日、『父親とベースボール』 (9)1920年代における古参の白人移民と新参の白人移民との間の軋轢 ヘンリー・フォード所有のThe Dearborn Independent紙によるレッドソックスオーナーHarry Frazeeへの攻撃の新解釈
  • 2013年11月8日、『父親とベースボール』 (8)20世紀初頭にアメリカ社会とMLBが経験した「最初の大衆化」を主導した「外野席の白人移民」の影響力 (付録:ユダヤ系移民史)
  • 2013年11月8日、『父親とベースボール』 (8)20世紀初頭にアメリカ社会とMLBが経験した「最初の大衆化」を主導した「外野席の白人移民」の影響力 (付録:ユダヤ系移民史)
  • 2013年11月8日、『父親とベースボール』 (8)20世紀初頭にアメリカ社会とMLBが経験した「最初の大衆化」を主導した「外野席の白人移民」の影響力 (付録:ユダヤ系移民史)
  • 2013年6月1日、あまりにも不活性で地味な旧ヤンキースタジアム跡地利用。「スタジアム周辺の駐車場の採算悪化」は、駐車場の供給過剰と料金の高さの問題であり、観客動員の問題ではない。
  • 2012年7月3日、『父親とベースボール』 (2)南北戦争100年後のアフリカ系アメリカ人の「南部回帰」と「父親不在」、そしてベースボールとの距離感。
  • 2012年7月3日、『父親とベースボール』 (2)南北戦争100年後のアフリカ系アメリカ人の「南部回帰」と「父親不在」、そしてベースボールとの距離感。
  • 2012年6月29日、『父親とベースボール』 (1)星一徹とケン・バーンズに学ぶ 『ベースボールにおける父親の重み』。
Categories
ブログ内検索 by Google
Google

livedoorブログ内検索
Thank you for visiting
  • 今日:
  • 昨日:
  • 累計:

free counters

by Month