指標のデタラメさ(OPS、SLG、パークファクターなど)

2017年2月1日、41本ホームラン打ったクリス・カーターに再契約オファーがなかったことからわかる、「ホームランバッターは三振が多くて当たり前」という話の真っ赤な嘘。
2016年8月10日、一塁手・DHの存在価値を見失いつつあるMLB。
2015年1月22日、「MLBの得点力低下をもたらした四球・長打の過大評価」原論に向けて (2)原論の骨子と目標、打者の「均質化」、ビヘイビアの変化
2014年12月21日、「MLBの得点力低下をもたらした四球・長打の過大評価」原論に向けて (1)MLB25年史からわかる「2000年代以降、特に2010年代のホームランの得点効率の質的劣化」
2014年10月20日、やがて悲しきアダム・ダン。ポスト・ステロイド時代のホームランバッター評価の鍵は、やはり「打率」。
2014年10月14日、「パスカルの賭け」の欠陥の発見と、「ホームランという神」の出現。期待値において出現確率を考慮しない発想の源について考える。
2014年10月13日、「ホームラン20本の低打率打者A」と「高打率の打者B」をwOBAでイコールにしようとすると、「打者Aのホームラン以外のヒットは、全て二塁打でなければならなくなる」という計算結果。
2014年1月28日、相関がほとんどないのが明らかな2つの事象の関係をベースにモノを言う愚かな行為の例 〜 投手のZone%とBABIP
2013年5月24日、「ボールを振らず、かつ、ストライクだけ振れるチーム」など、どこにも「存在しない」。ボールを振るチームはストライクも振り、ボールを振らないチームは、ストライクも振らない。ただそれだけの話。
2012年11月17日、ア・リーグMVP論争から垣間見えてきたセイバーメトリクスの「未完成なままの老化」。
2012年4月8日、チームの「総得点」と「総四球数」の相関係数を調べた程度で、「四球は得点との相関が強い」とか断言する馬鹿げた笑い話。
2012年1月3日、率と期待値を足し算している「OPSのデタラメさ」 (4)実例にみる「四球数の、長打力イメージへのすりかえ」。数字に甘やかされたハンパなスラッガーたちのOPSの本当の中身。
2011年12月22日、率と期待値を足し算している「OPSのデタラメさ」 (3)OPSにおける四球の「二重加算」と「ホームランバッター優遇 水増し加算」のカラクリ
2011年12月21日、率と期待値を足し算している「OPSのデタラメさ」 (2)小学生レベルの算数で証明する「OPS信仰のデタラメさ」
2011年12月20日、率と期待値を足し算している「OPSのデタラメさ」 (1)「OPSのデタラメさ」の基本を理解する
2011年11月10日、「パークファクター」という数字の、ある種の「デタラメさ」。
2011年9月3日、チームというマクロ的視点から見たとき、「出塁率」を決定している唯一のファクターは「打率」であり、四球率は無関係、という仮説。
2010年9月3日、8月3勝、負けなしのブランドン・モローがヤンキース戦先発。「投手の能力にフタをして、ホームランや四球を増やすキャッチャー、城島問題」のようなケースを計測できないFIP。

February 02, 2017

このブログではOPSという指標がデタラメであることを繰り返し指摘してきた。期待値と率を合算する無意味な計算方法といい、四球と長打を過大評価する計算結果といい、こんなデタラメな数字でスポーツを語っていた人間は、救いようのない馬鹿である。
また、こういうデタラメな計算方式の指標の恩恵を最も受けてきたのが、アダム・ダンマーク・レイノルズのような「低打率のホームランバッター」であるという指摘もずっと続けてきた。
カテゴリー:指標のデタラメさ(OPS、SLG、パークファクターなど) 1/17ページ目 │ Damejima's HARDBALL

さらには、「四球や長打の過大評価」が、かえって近年のMLBの得点力低下をもたらしたことについても指摘してきた。
1990年代中期以降ずっと続いてきた「ホームラン偏重によって得点を得るという手法」が衰退しはじめていることの意味や、得点とホームランの相関関係における最大の問題が「ホームランの量的減少」ではなく「ホームランの著しい質的低下」であることを、人は忘れすぎている。(中略)

「ホームランバッターに高いカネさえ払っておけば、多くの得点が得られることが約束された時代」は、10数年前に終わっているわけだが、どういうわけか知らないが、「量的にも質的にも価値が低下している長打能力を過大評価し、それに高いカネを払う、わけのわからない時代」は、今なお続いている。
出典:2014年12月21日、「MLBの得点力低下をもたらした四球・長打の過大評価」原論に向けて (1)MLB25年史からわかる「2000年代以降、特に2010年代のホームランの得点効率の質的劣化」 | Damejima's HARDBALL


こうしたブログ主の立場からすれば、去年41本打ったクリス・カーターが所属球団から再契約のオファーがなかったことなど、別に不思議でもなんでもないが、こんな簡単なことすら理解できない(理解したがらない)人も、きっといまだにいるに違いない(笑)

そういう頑固で時代遅れな人のために、
ちょっとだけ資料を作っておく(笑)


クリス・カーターの2016年の成績は、160試合に出場(うち1塁手として155試合)、ホームラン41本94打点。長期休養もないし、数字だけ見るとあたかも堂々たるスラッガーのようにみえる。

ところが、だ。

クリス・カーターは他の数字が実に酷い。原因は、三振数206とか、打率.222といった、基本的な打席パフォーマンス全体の「質の悪さ」だ。そのためFangraphではwOBA.346、WAR0.9、しかなく、Baseball ReferenceでもWAR0.9しかない。
Chris Carter » Statistics » Batting | FanGraphs Baseball
Chris Carter Stats | Baseball-Reference.com


とはいえ、WAR0.9とか数字だけいわれても実感がわかない人もいるだろう。もっと具体的で、わかりやすい話をしてみる。

例えばBaseball Referenceで、ホームラン40本、OPS.850以下という検索条件で調べてみると、以下の「13人の選手」が出てくる。
(この「13人」に近年の選手がやたらと多いことを覚えておいてもらいたい。また、あえてここで「OPSというデタラメ指標」を検索条件として使用したのは、「四球と長打を過大評価するデタラメ指標で測定してさえも、救いようがないほど低い評価数値しか出ない」のが「低打率のホームランバッター」だという「事実」を理解してもらうためだ)

マーク・トランボ2016年 47本 .850 SS)
ホセ・カンセコ(1998年 46本 .836 SS)
トニー・アーマス・シニア(1984年 43本 .831 SS)
フアン・ゴンザレス(1992年 43本 .833 SS)
カーティス・グランダーソン(2012年 43本 .811)
ロッキー・コラビート(1959年 42本 .849)
ディック・スチュアート(1963年 42本 .833)
クリス・デイビス2016年 42本 .831)
アダム・ダン(2012年 41本 .800)
トニー・バティスタ(2000年 41本 .827)
クリス・カーター2016年 41本 .821)
アルバート・プーホールズ(2015年 40本 .787)
トッド・フレイザー2016年 40本 .767)
(注:SS=シルバースラッガー賞)


この「MLBはじまって以来の中身のないシーズンを記録したことのあるホームランバッター13人」に、さらに「打率.250以下」というフィルターをかけてみる。すると、以下の近年の選手ばかり、7人に絞られる。

ホセ・カンセコ(1998年 打率.237)
カーティス・グランダーソン(2012年 打率.232)
クリス・デイビス2016年 打率.247)
アダム・ダン(2012年 打率.204)
クリス・カーター2016年 打率.222)
アルバート・プーホールズ(2015年 .244)
トッド・フレイザー2016年 .225)

2016年の選手が3人もいる。どう表現すると、この「2016年のホームランバッターたちの酷さ」が表現できるだろう。

100年をこえるMLB史で、「シーズン40本以上のホームランを打ったバッター」なんてものは、「のべ300人」ほどしかいない。
その、100年間に出現した「たった300人」のうちの、「ワースト10」のほとんど全員(もちろんマーク・トランボも例外ではない)が、「2012年以降の数シーズン」、「特に2016年に集中」して出現しているわけである。
2016年に40本以上打ったバッターで、「中身がともなったスラッガー」なんてものは、守備もうまく、ルーキー三塁手としてゴールドグラブを受賞し、今年はフィールディング・バイブルまで受賞したコロラドのノーラン・アレナドしかいないのである。これは、いったいどうしたことか。

そもそも「ホームラン40本以上、シーズン200三振」なんておかしな記録は、100年以上のMLB史において、クリス・カーター以外に、クリス・デービス、マーク・レイノルズ、アダム・ダンと、「たったの4人」しかやっていない。どいつもこいつも近年の選手ばかりだ。
例えば、馬鹿ばかりがマネージメントしていた2000年代後期のシアトル・マリナーズが4番をまかせた、あの三振王リッチー・セクソン、毎日毎日三振ばかりしてファンを激怒させ続けた、あの「リッチー・セクソン」ですら、シーズン最多三振は「167」なのだ。
クリス・カーターの200を越える三振数が、いかに天井を突き抜けた数字か、わかりそうなものだ。

いわば2016年クリス・カーターは、「MLB史に残るほど酷い内容のホームランバッター」だったのであって、こんなのに再契約の高額オファーを出す球団があるとしたら、出すほうがどうかしてる。


ちなみに、こういう話をすると必ず「ホームランをたくさん打つバッターは三振が多いのなんて当たり前だ」などと、知ったかぶりにお説教したがるアホな年寄りが出現するものだ。
昔の野球マンガか、スポーツ新聞の記事か、どこでそういう間違った思い込みを吹き込まれるのか知らないが、それはハッキリいって、他人に野球についてしゃべるのを止めたほうがいいレベルの「低俗で子供じみた間違い」だ。

いい機会だから、きちんと認識をあらためたらどうか。
「ホームランバッターがやたらと三振ばかりする」のは、
昔からあったことではない。
むしろ、「つい最近に限った傾向」だ。


例えば、「シーズン200三振」という恥ずべきシーズン記録だが、過去に記録したのは、わずか「延べ9人」で、2000年代のマーク・レイノルズの2回を除き、200三振のすべては「2010年以降」に記録されているのである。(以下、「9例」とは「延べ9人」を意味する)

これを「シーズン180三振以上」とすると、どうか。過去51例が記録されているが、「2000年代以前の100年間」には、わずか6例しか記録がない一方で、残り45例すべてが「2000年代以降」であり、ことに「2010年代」が29例(約56.9%)と、半数以上が2010年代の記録で占められている。
シーズン160三振以上」と範囲を広げても事態はさほど変わらない。過去157例のうち、「2000年代以前の100年間」はわずか35例にとどまる一方、「2000年代以降」が48例、「2010年代」にいたっては74例(約47.1%)と、またもや2010年代が約半数を占めるのである。

さらに捜索の範囲を広げ、「ホームラン数30本以上で、三振180以上」としてみると、100年以上のMLB史で該当記録はたった「33例」しかいない。
そして、その「ホームラン数30本以上で、三振180以上を喫した33例」は、そのほとんどが「2000年代以降の選手」によるものだ。ジム・トーミ、ライアン・ハワード、ジャック・カスト、マーク・レイノルズ、アダム・ダン、ペドロ・アルバレス、マーク・トランボ、マイク・ナポリ、マイク・トラウト、クリス・カーター、クリス・デービス。これは、どうかしてる。

逆に、「ホームランを30本以上うちながら、三振数を150以下に抑えた」という記録は、過去に「300例」ほどある。これは、たった30例ほどしかない「30本、180三振以上」の約10倍にあたる。「ホームランバッターが三振ばかりすることが、けして当たり前だったわけではないこと」は、ほぼ動かしようのない事実だ。


最後にしつこく、もう一度まとめる

「ホームランバッターが三振が多いのは当たり前」というのは、真っ赤な嘘である。

●MLBで「三振ばかりするホームランバッター」が大量生産されだしたのは、「2000年代以降」のことであって、とりわけ「2010年代」に大量に生産されだした。彼らは、本物のスラッガーではなく、いわゆる「大型扇風機」にすぎない。


ちなみに大型扇風機が三振しやすい理由は、とっくの昔に書いた。
かつてカーティス・グランダーソンはヤンキース所属時代の終盤に「インコースのストレートを強振してホームランを打つこと」ばかり狙って打席に入っていた。
そんな「ホームランだけを狙って、特定のコースだけ、特定の球種だけを狙う、単調なバッティング」なんてものが、このスカウティング全盛の時代、長く通用するわけはない。
2012年11月2日、2012オクトーバー・ブック 「スカウティング格差」が決め手だった2012ポストシーズン。グランダーソンをホームランバッターに押し上げた「極端なストレート狙い」が通用しなくなった理由。 | Damejima's HARDBALL

damejima at 09:11

August 11, 2016

マーク・テシェイラプリンス・フィルダーという2人の一塁手が引退することになった。彼らが「高額サラリーの不良債権一塁手」であることは偶然ではない

(実は、この記事、2016年6月に書き始めていたものだ。だから、この2人の引退を前提に書いたわけではない。なんとも象徴的な8月だ。
また最初にことわっておきたいが、以下の文章は「マーク・テシェイラが一塁手として二流の役立たずだった」と言っているのでは、まったくない。むしろ彼は、怪我に悩まされなければ、2000年代以降で最も優秀な一塁手だったと思うし、ブログ主は今でも彼のファンだ)

一塁手とかDHに得点力を依存する時代は終わっていることに気づきもせず、常識にとらわれたままチーム編成をしているような馬鹿なチームは終わっていくのだ。

2016ナ・リーグのポジション別WAA
2016ナ・リーグ ポジション別WAA
2016 National League Season Summary | Baseball-Reference.com

2016ア・リーグのポジション別WAA
2016ア・リーグ ポジション別WAA
2016 American League Season Summary | Baseball-Reference.com

2つのグラフは2016年6月時点でのポジション別WAA(=勝利貢献度を表わすWARの算出のための数値)を表している。データが少し古いのはとりもなおさずこの記事を2016年6月に書き始めたなによりの証拠だ(笑)

青色の円は「プラス」赤色の円は「マイナス」を示し、また、円の「大きさ」が平均をどれだけ上回っているかという値を示している。
注:評価は打撃だけでなく「守備」も含めたものになっている。だから、例えばDH制のないナ・リーグでは投手の評価に「打撃を含む」し、一方、DH制のア・リーグでのDHの評価は「打撃のみ」で決まってくる。


見た目から、まず以下のようなことがわかる。

●両リーグ共通の「貢献度の高いポジション」は
 先発ピッチャーセンターサードセカンドなど

●逆に、両リーグ共通の「貢献度の低いポジション」は
 キャッチャーファーストレフト

●ナ・リーグのゲームはほとんどが先発投手の出来に左右される

「頼れるDH」なんてものはいまや、ほんのわずかしかいない

一塁手は、もはや「スラッガーの定番ポジション」とはいえない


項目の中で、ブログ主が最も印象深いと思うのが
一塁手とDHの「地位の低下」だ。


今のMLBは、センター中心に外野手の活躍が目立つ。

ブライス・ハーパーマイク・トラウトジャンカルロ・スタントンだけでなく、売り出し中のデクスター・ファウラージョージ・スプリンガーマーセル・オズーナムーキー・ベッツジェイソン・ヘイワードも外野手だし、既存のヴェテランにも、ホセ・バティースタアダム・ジョーンズユニエス・セスペデスアンドリュー・マッカチェン、そしてもちろんいうまでもない天才イチローと、沢山の人材がいる。


他方、ファースト、サードなど、「従来スラッガーの定番と考えられてきたポジション」の選手層はもはやペラペラに薄くなっている

例えば一塁手だが、ポール・ゴールドシュミットジョーイ・ヴォットーとか、中身の濃いスターが全くいないわけではないにしても、外野手と比べると層の薄さは歴然としている。(サードが本職と思われがちなミゲル・カブレラはメジャーデビューは外野手で、もともとショート出身。サードやファーストが本職ではない)
今の時代の一塁手は、例えば打線の強力なトロントでは1軍半クラスのハンパ選手でしかないジャスティン・スモークがファーストを守らせてもらえるように、「他に与えるポジションがないからファースト」とか、「多少打てるが、守備が下手だから、しょうがなく一塁手」とかいう「とりあえず一塁手」が増えている。

三塁手の選手層にしても、エイドリアン・ベルトレ、ジョシュ・ドナルドソン、マニー・マチャド、カイル・シーガーなどがいるとはいえ、選手層はもはやイメージほど厚くはない。(そういえば、引退するアレックス・ロドリゲスなんていう名前のクズ野郎もサードだった)


では、もともと守備意識の強いポジションである「セカンド、ショート、キャッチャー」はどうだろう。「攻守に秀でた選手」はどのくらいいるか。

セカンド、というと、ロビンソン・カノーやベン・ゾブリスト、チェイス・アトリーなどが思い浮かぶ人がいまだに多いわけだが、いまの時代のMLBで「二塁手のWAA」を引き上げているのは、ジェイソン・キップニスディー・ゴードンホセ・アルトゥーベなど、20代の若手二塁手であって、けしてロビンソン・カノーが彼の巨額サラリーに見合った貢献をしているわけではない。

ショートにしても、デレク・ジーターが引退し、トロイ・トゥロウィツキーなどにも精彩がなくなったことで、打てるのはクロフォードとかボガーツくらいだし、「攻守に秀でたショート」なんてものをだんだんみかけなくなってきた。

キャッチャーにしても、ジョニー・ベンチマイク・ピアッツァイヴァン・ロドリゲスジョー・マウアーとか、「打撃にも守備にも秀でた名キャッチャー時代」がかつては存在した。
だが今となっては、マウアーの後継者ともいうべき存在だったバスター・ポージーが一塁手に転向してしまって、すっかりキャッチャーは「守備専用ポジション」として定着してしまった感のほうが強い。
今キャッチャーはどこのチームでも「別に打てなくていいから、とりあえず球をしっかり受けといてくれ」という「とりあえずキャッチャー」が当たり前になった感じがある。


こうして眺めてみると、ブライアン・マッキャンとかマーク・テシェイラ、アレックス・ロドリゲスなど「中古のヴェテラン」に大金を注ぎ込んでチーム編成をしてきたヤンキースの選手編成コンセプトが、どれだけ「時代遅れで、馬鹿げたものか」が、よくわかる。
たとえで言うなら、「本人は最先端ファッションを大金出して買い集めたつもり」だが、実際にやっていることといえば、「他人が着たおしてヨレヨレになった古着を買い集めて、おまけに、それを滅茶苦茶なコーディネートで着てみせて、毎日街を鼻高々に歩きまわっている、壊滅的に時代感覚が衰えた、センス皆無な老人」そのものだ。ダサいこと、このうえない(笑)

ヤンキースにおけるマーク・テシェイラの劣化は何年も前からわかっていたことだが、プリンス・フィルダーにしても、今のテキサスにフィルダーとチュ・シンスとハミルトンがいなければもっと早く首位奪還できていたはずであって、ノーラン・ライアンなきあとのジョン・ダニエルズの大型補強はことごとく失敗だ。


「成長の止まった分野」に資源を集中していたら、企業は消滅してしまう。当たり前の話だ。
投資の最適化のルールというものは、「限りある投資を、事業を構成する分野それぞれにおいて見込まれる収益やサービスに見合った割合において実行すること」だ。もちろん、将来の収益確保のために、まだ利益を生み出してはいない新分野に投資することがあるにしても、それは先行投資という意味なだけであり、長期的な収支は「最適化ルール」から外れない。
例えばIT企業が、卓球台を購入したり、オフィスでペットを飼ったりすることにしても、それが許されているのは「社員のリフレッシュのアイデアとして一定の意味はあるから」であり、なにも2017年シーズンにアレックス・ロドリゲスが野球をまるでやらなくても20Mもらえるのと同じように、「毎日卓球だけやって帰宅するアホ社員でも、高額なサラリーがもらえる」という意味ではない。
同じように、新聞のような印刷メディアを買わなくなってきた、そんな時代に、新聞広告に大量の広告費を投資するようなことをしても、なんの意味もない。人の目に触れない広告にカネを払う価値など無いからだ。

こんなこと子供でもわかる。わかるはずだが、そういうことをいまだにやっているマネジメントは確実存在する。
野球という「世界で最も巨大かつ数値化によるデータ管理が進みつつあるスポーツビジネス」においても、あいかわらず「ミスとしかいいようがない投資」「凡庸なマネジメントによるミス」が横行している。


確かに、プレーひとつひとつの「価値」が数値化・可視化され、細かく評価されだしている、それは事実だ。
だが、OPSのようなデタラメな指標、パークファクター、守備補正の根本にある「いい加減さ」でもわかるように、その「価値判断をする人間の判断力そのもの」は実はいまだに正確になど、なっていない。


ブログ主はむしろ「野球におけるスポーツ数値化の流れは、いまや停滞し、それどころか頭打ちになっている」と考える。

プレーを数字で分析する行為が流行したせいで、今の野球ではあらゆる点がきちんと合理的に価値判断されている、などと思っている人がいるかもしれないが、ブログ主に言わせれば、そんなものは「真っ赤な嘘」だ。
実際にやっていることといえば、「ニセモノで、出来損ないの数字」を使い、ひとつひとつのプレーに「間違った価値判断」を下し、ビリー・ビーンがそうであるように「プレーヤーの評価を大きく間違え」、ジョシュ・ハミルトンやプリンス・フィルダーのような「ウィークポイントがすでに全球団に知れ渡っている有名選手」に大金を投資するようなミスを犯して、チームを弱体化するような間違った行為が日常的に行われている。


他方、これは困ったことなのだが、「商品の質と価格が必ずしも比例せず、質の悪いものの価格がむしろ高騰する」というような事態は、たしかにある。

例えばだが、アイク・デービスがそうであるように、「ロクな一塁手がいなくなってきたことによって、かえって、平凡な一塁手にすら希少価値が出てきてしまい、二流のプレーしかできない平凡な一塁手やDHの価格までもが高騰する」というような悪例が少なからず見受けられるのだ。
MLBのようなスポーツマーケットでは「限られた人材を多数のチームが取り合う売り手市場」なので、質がまるで見合わないのに、希少価値のみが理由で質の悪い選手の価格が高騰する例は少なくない。


だが例えば、突然の地震でびっくりした人がミネラルウォーターやガソリンを買い占めることで一時的にそれらの小売価格が暴騰したとしても、やがて事態が落ち着けば、高値で買い占めた人間は損をこうむることになる。
つまり、希少価値のせいで二流の一塁手が大金を稼ぐなんて事態は、長続きしない、ということだ。


それでも、近い将来ヤンキースはどこかの一塁手とか三塁手に大金を払うことだろう(笑)そうなったとき、彼らにはどこかのブログ主が冷笑しながら眺めていることを必ず思い出してもらいたいものだ(笑)

damejima at 12:43

January 23, 2015

この記事グループ、「MLBの得点力低下をもたらした四球・長打の過大評価」原論の今後のターゲットは、「MLB全体での四球・長打の過大評価や、出塁率の過大評価による打者の過度の拘束が、かえってMLB全体での継続的な得点生産力低下をまねいた」ことを、データであれ、例証であれ、法則性であれ、なんらかの形で把握することにある。
それが、けして簡単な作業でなく、また、立証に至るかどうかもわからない作業であることは、百も承知だ。


まず考えてみたいのは、もし例えばOPS(OPSを改造したバリエーションを含む)のような「打者のバッティング評価の基準」が、かつて、ずっといわれていたように「得点に最も直結する」というのが本当ならば、「OPSで高く評価されるタイプのバッター」が増えれば増えるほど、そして、「OPSを獲得する選手の評価基準にして編成したチーム」や、「OPSを重視したゲーム戦術を採用するチーム」が増えれば増えるほど、「MLB全体の得点力は上昇を続けきていなければおかしい」だろう、ということだ。

実際、そうなったか。
事実は、まったく逆だ。

前記事でも掲出した以下のグラフでもわかるように、2000年代以降(特に2010年代)MLBの得点生産性は減退を続けてきている。
「得点との直結」をやたらと主張したがるデータ分析手法が導入され、普及したからといって、そのことによってMLBの得点生産能力が飛躍的に増進したという事実は、どこにもない
のである。

この25年間のホームラン数と得点総数の関係(1990-2014)


したがってブログ主が近年の「得点力デフレ」を説明していくための「出発点」は、まったく逆の立場からのものだ。
1)制度上の変更による得点力減退
MLB全体における「得点生産能力の低下」は、たくさんの要因からなる非常に複雑な現象なのは間違いなく、たったひとつの要因だけをとりだして、それを単独の原因として指摘することはできないし、明らかに間違ってもいる。
今のところある程度わかっている得点力低下の要因の多くは「MLBの制度上の変更」によるものだ。
ステロイド規制強化による長打の減少、ストライクゾーンの拡大、アンパイアの判定精度の急速な向上やアンパイアの世代交代、守備シフト、インスタントリプレイ導入など、さまざまな立場の人によって、さまざまな指摘が行われつつある。
参考記事:
2014年10月31日、「MLBアンパイアの若返り傾向」と、「得点減少傾向」の関係をさぐる。 | Damejima's HARDBALL

2014年11月28日、「低めのゾーン拡張」を明確に示すHardball Timesのデータによって、より補強された「ルールブックどおりのストライクゾーン化、アンパイアの判定精度向上」説。 | Damejima's HARDBALL

2)しかし、「MLB全体の得点能力の低下」の要因には、上記以外に、まだ指摘されていないものがあるだろう、とブログ主は考える。

3)打撃分析手法の誤りと束縛
近年、OPSとそのバリエーションに代表される打者のデータ的な評価手法や、出塁率重視のチーム戦略の普及など、新しい選手評価手法が普及したが、これらの普及が進んだ理由のひとつは「チームの得点力向上に直結する」と、「思われた」からだ。
もちろんデータ分析そのものの有効性は疑いのないところだが、しかしながら、OPSという指標が「算出手法自体に長打や四球の価値を過大に評価する根本的欠陥を持っている」という事実からもわかるように、データ分析による選手評価手法には今も「一定の構造的な誤り」が含まれており、その「誤り」はいまだ十分修正されていない。
関連記事:2014年10月14日、「パスカルの賭け」の欠陥の発見と、「ホームランという神」の出現。期待値において出現確率を考慮しない発想の源について考える。 | Damejima's HARDBALL
関連記事:2014年10月13日、「ホームラン20本の低打率打者A」と「高打率の打者B」をwOBAでイコールにしようとすると、「打者Aのホームラン以外のヒットは、全て二塁打でなければならなくなる」という計算結果。 | Damejima's HARDBALL
だが、こうした「誤り」は実際のチーム編成や実際のゲーム運営に「誤ったまま」適用されており、長打や四球、あるいは出塁率を過度に重視して選手をリクルートし、チームを構成する事例は増加し続けている。選手側でも、そうした「チーム側の好み」に合わせて自分のバッティングスタイルを作り上げる傾向にあり、メディアもそうした選手をほめちぎる。
だが、こうした傾向のもとにあるMLB全体で実際に起きている「事実」は、といえば、「得点力の向上」ではなく、まったく逆の「得点力の減退」でしかない。


たしかに、この「原論」の根拠を固めていく作業自体が、どこをどう調べるべきかもまだハッキリしないし、気長にやっていくしかない作業なのだが、今は例として「均質化」という現象を取り上げ、その説明を通して目指す場所をもう少し明らかにしておきたい。


打者の均質化


「得点に直結する」と強弁し続けてきたOPSなどの指標群にみられるように、MLBに浸透した「数字とデータに基づく野球」は、打者の「バッティングにおける行動パターン」を「著しい均質化」に向かわせてきた可能性があると、ゲームを見ながらいつも思ってきた。

いい例が、ビリー・ビーンのチームのバッターたちだ。彼らは「気味が悪いほど、相互にあまりにも似すぎている」
彼らが「お互いにソックリ」なのは、ひとつには、ビリー・ビーンが「似たタイプのバッター」ばかり獲得したがることに原因があるが、もうひとつ、「ビリー・ビーンが、どのバッターにも「同じ目的」しか与えないこと」にも原因がある。(そして、その目的は「その打者の能力をフルに発揮させることをあえて求めない目的」でもある)
関連記事:2014年12月4日、オークランドGMビリー・ビーンが重視する「野手の打撃能力の具体的な種類とレンジ」。打撃能力と「プラトーンシステム」との深い因果関係。 | Damejima's HARDBALL

簡単にいえば、
同じ目的をもたされた人間は、
「似たような行動をとりがち」になる。
ということだ。

人間という生き物は「個ではなく『群れ』として行動すべし、という原則」が本能というOS(=Operating System)に書き込まれたまま進化してきたために、本人の意思とは無関係に、とかく「群れが向かう方向にならって、群れと同じ行動をとりたがる」ようにできてしまっている。
なんとも哀しい生き物である。

こうした「バッティングにおける行動パターンの均質化」が過度に進めば、MLBにおける打者の質的低下を招くだけでなく、「他チームに簡単に分析されるバッターの急激な増加」をもたらす、と、ブログ主は考える。

何度か記事に書いたようにヤンキース時代のカーティス・グランダーソンや、テキサス時代のジョシュ・ハミルトンがインコースだけしか狙ってないことくらい、すぐに他チームにスカウティングされたように、投手側からみれば、「やることなすこと、すべてが大雑把なバッター」や「狙いがあまりにわかりやすいバッター」が、「対処しやすく、うちとりやすいバッター」なのは当然だ。
そうしたバッターが増えすぎたことは、リーグ全体の「投高打低」を助長し、「MLB全体のホームラン数の減少や、得点減少に導いた」のではないのか。

つまり、「四球による出塁と長打の組み合わせばかりを重視する傾向」が強くなりすぎることによって、「四球か、長打か、三振か」というような「ワンパターンなバッティング」ばかりするアダム・ダン的なバッターが増えすぎたことで、むしろ「MLB全体が得点デフレとでもいうような、長期的な得点減少傾向に陥って、抜け出せなっていった」のではないかと思うのである。
関連記事:
2014年10月20日、やがて悲しきアダム・ダン。ポスト・ステロイド時代のホームランバッター評価の鍵は、やはり「打率」。 | Damejima's HARDBALL


「原論」のターゲットのうち、「OPSとそのバリエーションの指標群のデタラメさ」については、それらが「得点に直結する数字で野球を分析すると称しながら、その実、四球や長打を過大に評価する構造的誤りをもつデータ分析手法」であり、野球というスポーツの選手評価において大量の「判断ミス」が生産され続ける原因にもなっていることは、これまで何度となく記事にしてきた。

こうした誤った評価手法は、例えば二流・三流のホームランバッターのサラリー高騰、GM・監督などのチーム運営責任者とマスメディアがそういうバッターを過大評価する傾向の拡大、打者自身がそういうバッターを目指したがる安易な傾向、プチ・ステロイド時代ともいえる「ステロイド回帰」、ホームランや出塁率に過度に依存する非効率的な得点戦術への傾倒、そして失敗、失敗を犯し続けるGMや監督の責任追及の甘さなど、数え切れないほど多くの悪弊を生んでいる。
得点力不足に悩み、得点が欲しくてたまらないチームに限って、間違ったゲーム戦術や間違った人材の起用等によって、かえって、さらなる得点力不足に悩むようになるのは、近年のシアトルやヤンキースを見ていれば(笑)誰でもわかることだ。


以上が「原論」のだいたいの見取り図で、あとは蛇足である(笑)「原論」としたことでおわかりのように、この論はまだまだ模索の域を出ない。これからも地味に資料収集して、少しずつ固めていくしかない。ただ、今までこのブログに書いてきた記事の中に、既に数多くの証拠やデータ、論理を提出してきたことも確かだ。


資料収集はまだどこで何を探したものかもわからないが、必要な情報は、例えば四球重視という風潮に打者がやたら束縛される時代になったことで、「打者の行動パターン」になにか変化があったのか、なかったのか、というようなことだ。
例えばだが、これまで「打者有利」とか「投手有利」とかいわれてきたカウントの「意味」は、15年前のホームラン狂騒時代と今とで、変化した可能性が、あるのか、ないのか。同じことを投手側からみれば、投手と打者の「かけひきのパターン」はこの15年で変化したのか、しないのか。(例えば、あるチームの投手陣は近年「打者と高めで勝負する」という戦術をとっている。これはもちろんローボールヒッター対策だ)


例:
以下の図は「カウント別ホームラン発生率」を、ステロイド・ホームラン時代の1999年と、そこからホームランが1400本も減った投高打低の2014年とを比べてみたグラフだ。
大きく変化しているものと期待して調べてはみたが、実際には、思ったほどは変化していなかった(笑)
ホームランが多く発生するカウント」は、今も昔も「17%前後を占める初球」が代表的であり、次に11%前後の「2球目」、そして「平行カウント」、あと、あえて付け加えれば「フルカウント」だ。

カウント別のホームラン% 1999年vs2014年

1999年のデータの出典:Major League 1999 Batting Splits | Baseball-Reference.com

2014年のデータの出典:Major League 2014 Batting Splits | Baseball-Reference.com


ただ、まぁ、細かい違いならある。

打者不利(投手有利)と思われがちな「ストライク先行カウント」、特に「2ストライクカウント」でのホームラン発生率が、むしろ上昇している。

その一方で、打者有利(投手不利)と思われがちな「ボール先行カウント」でのホームラン発生率は減少している

こうした変化が統計的にどのくらい有意なのかは調べてないが、たしかに細かい(笑)おまけに、なぜこうした現象が起きたのかは、まだ想像もつかない。

投手側の立場からすると、「2ストライクをとった後で、ホームランを打たれやすくなる」ということは、「追い込んだ打者をうちとるためのストライクを投げて、かえって長打を浴びた」とでもいうような意味になるかもしれない。
一方、「バッターが、ボール先行カウントなのに強振してこない率」は、どうやら15年前よりほんの少し高くなっているように見える。


ならば、とりあえずこういう仮説を立ててみる。

<打者のビヘイビア(behavior=行動パターン)の変化仮説>

ボール先行カウントでは
近年の打者は、無理なフルスイングを避け、四球を選んで出塁する方向への行動選択をしたがる。これは「フルカウント」においても、同じことがいえる。
つまり「ボール先行カウント」は今の打者にとって「かつてほど強振するカウントではない」傾向にある。

ストライク先行カウントでは
近年の打者は、投手が打者をうちとるために投げてくる「ストライク」をむしろ待ち受けて、長打狙いで強振してくる、ともいえる。
つまり「ストライク先行カウント」は、「投手が確実にストライクゾーンに投げこんで、打者を打ち取りにくるカウント」であるという意味において、近年では「打者にとっての重要なバッティングカウント」になりつつある。


こうした「ごくわずかな変化」を例として挙げたのは、数字そのものに大きな意味があると強弁したいからではなく、こういう地道な作業の積み重ねからそのうち意味が出てくるから待っててくれ、という意味だ(笑)ほんと、気長にやっていくしかない。
ただ少なくとも、景気刺激策のつもりでやった財政政策や金融政策がかえって景気後退を招いたり、家庭菜園をやっている人が作物のためと称して化学肥料をやりすぎて、かえって作物を枯らせてしまうことが多いように、「施策が、意図とは真逆の結果を生む」ことがけして少なくないのが、人間という生き物の困った点であることは、よく知っている(笑)それなりの結果につなげていく自信はある。

damejima at 12:01

December 20, 2014

「かつてはホームランを10本打てば、得点が15点くらい入った気がするのに、今では11点か12点くらいしか入らない感じ」
「ほんのたまにホームランを打つくらいで、あとは守備能力も走塁もできない、DHタイプの野手が増えた」
「ホームランは申し訳程度に出るが、タイムリーはほとんどない」
「残塁がやたら多い」
「どこのチームの野手も、似た感じしかしない」
「先発投手が打てないから、ゲームはいつも終盤にひっくりかえる」
「ホームランにゲーム決定力がない」
「ソロホームランが多い」
「延長戦がやたら増えた」
「試合結果に関係ないホームランばかり打っている選手がいる」
「防御率のいい投手が増えている割に、良い投手が増えたという実感がない」
「打者のほとんどが、三振か四球かホームランのタイプ」
「クリンアップに不動のホームランバッターがいる打線よりも、シーズンに15本程度のホームランを打つ中途半端なバッターが打順のすべてに点在しているオークランド・アスレチックス的チームが多くなった」
「四球がやたらと増えたが、得点にはつながってない」
「特定の打者さえ敬遠しておけば、投手は失点を簡単に回避できる」
「ソロホームランは打たれても、ゲーム結果には、ほとんど関係ない」
「特定のひとりだけはいつもヒットを打つが、チームはいつも負ける」
などなど。

以上の項目の半分程度に「そういえば最近、そういうゲームが増えたな・・・」という「感想」があるなら、以下の記事を読んでみたほうがいい。


これは、1990年から2014年までの四半世紀の「MLB総ホームラン数(X軸)と総得点数(Y軸)の関係」をグラフ化したものだ(グラフ1)。この25年でMLBの野球スタイルがどう変わったか、非常によくわかる。

グラフ1
この25年間のホームラン数と得点総数の関係(1990-2014)
赤い線は線形近似であり、相関係数は0.9097となっている。
何度も書いてきたことなので、あらためて書くのもアホらしいが、2つの事象の間の相関係数を計算した程度のことで、「Aという事象(この場合は野球の得点)は、ほぼ事象B(ホームラン)だけを要因にして決定される」などと考える単細胞な人間は、例外なく、間違いなく、「馬鹿」だ。
もし2014年の19761点の総得点の90パーセントを 「たった4186本のホームランだけ」で稼ぎ出そうとすると、たとえ「2014年のホームラン全てが満塁ホームラン」であったとしても、まるで足りない。例えば「打点」にしても、得点と打点の相関はホームランよりはるかに100に近いのだが、その「打点」ですら「打点が野球の全て」などとはいえないというのに、馬鹿なことを言うなといいたい。また線形近似だけが近似を示す方法論ではないのに、線形近似だけを用いて何かを断定する論拠にして、論理的に正しいと言い張る合理性はどこにもみあたらない。

そもそも、野球において「得点との間に高い相関係数を有するプレー」というのは、ホームラン以外にも「複数」ある。
と、いうことは、「野球における『得点』という現象は、常に、相互に独立でない複数プレーの『集合体』として存在している」という意味だ。
そういう、「相互に独立でない事象どうしが、相互に複雑にからみあった結果、成り立っている事象」を説明する場合、たとえ、その発生事由のひとつ(ホームラン)と解明しようとする事象(得点)との相関係数がいくつだろうが、そんな数字の断片で語れる可能性など、無い。ゼロだ。
「相関係数を調べたくらいで、なんでも語れると勘違いしてきた根本的な馬鹿」のためにもっと詳しい説明をするのもアホらしい。さらに詳しい話は自分の頭を使って考えてもらいたい。


さて、グラフ1を観察すると、以下のことがすぐにわかる。
近い年度のデータ群が、いくつかのグループに分かれて、特定の場所に「固まって」点在している。

特定年度ごとに固まっている」という、このシンプルな事実は、野球のスタイルの変化というものについて重要な示唆を与える。

つまり、こういうことだ。
「シーズンごとのホームラン総数」は、MLBの得点方法のスタイルに影響を与える大きな要因のひとつだが、その「増減」という「変化のトレンド」は、「連続的に、なだらかに、変化する」のでは、まったくない。

むしろ、予期せず起きた巨大地震で陸の地形が一気に変化するように、「ホームラン総数の変化というトレンド」は、「特定の年」に、しかも「突発的かつ不連続」に起きる。そして、この「不連続な変化」は、「発生後、次の不連続な変化が起こるまで、何年でも維持される」のである。

さらにいえば、次のようなことも言える。
おそらく「ホームラン総数の突発的で不連続な変化」は
偶然起きるのではなく、何か原因がある可能性が高い

原因を特定できるかどうかは別にして、「ホームラン数の突発的で不連続な変化」は、例えば、「ストライクゾーンの突然の拡張や縮小」、「アナボリック・ステロイドの大流行」、「ボールの反発係数の突然の変更」など、必ず何らかの「突発的で不連続な原因」があってはじめて発生すると考えられる。


グラフ2
ホームラン数と得点総数の関係 4グループ推移(1990-2014)


グラフ2は、MLBのホームラン数と総得点数の関係を「4つのグループ」に分けたものだ。(注:グループBとCの「境界」は「別の位置での線引き」もありえるのだが、もし境界線の位置を変更したとしても以下の論旨に影響はないので、このままにしておく)
A:1990-1993年
B:1990年代中期と、2010-2014年
C:1998年までの1990年代末期と、2000年代
D:1999年、2000年の2シーズン

これを年代順に記述してみると、こうなる。
A→B→D→C→B

A(1990年代初期)→上昇→B(1990年代中期)→上昇→D(1999年、2000年のピーク)→下降→C(2000年代)→下降→B(2010年代)


よく見ると、1990年代の「上昇」(グループA→B→D)と、2000年代以降の「下降」(グループD→C→B)では、以下にまとめたように、「変化の軌跡」がかなり違う。
1900年代のドット(点)は、MLBストライキがあった1994年などの例外を除き、ほぼ全体が常に「近似曲線の上側」にある。

それに対して、2000年代以降は、データのかなりの部分が「近似曲線の近辺か、下側」にある。

このことは、MLB総得点においてホームランという現象がもっている「質的な重さ」、つまり「比重」が、1990年代と2000年代とでは非常に大きく異なっている可能性が高いことを意味している。


グラフ3
ホームラン数と得点総数の関係 3グループ比較(1990-2014)


総得点に占めるホームランの「比重」は、常に「一定」ではない。そのことを「過去25年のMLBの歴史の中で、ホームランの得点効率が異常に悪いシーズンだった2012年、2013年」を例に、3つ目のグラフで説明する。

総ホームラン数と総得点数
X:2012年 4934本 21017点
Y:1993年 4030本 20864点
Z:2007年 4957本 23322点

2012年を中心に3つのシーズンを相互比較してみると、以下のような
2010年代のMLBのホームランによる得点効率の悪さ」がわかってくる。

グラフ3における
X(2012年)とY(1993年)の比較

1993年は、2012年よりホームラン数が「約900本」も少ない。にもかかわらず、1993年の得点総数は、2012年とほぼ「同程度」だ。
「MLB全体でホームラン数900本の差」というのは、MLBのチーム数は30だから、「1チームあたりホームラン30本の差があった」ことを意味する。たとえでいうと「2012年は1993年にくらべると、計算上、全チームでクリーンアップのホームランバッターがひとりずついなくなっていた勘定」になる。

X(2012年)とZ(2007年)の比較
2007年は、2012年とホームラン数がほぼ「同程度」だ。にもかかわらず、2007年の得点総数は、2012年より「2305点」も多い。
「1シーズンで、約2300点の得点差」というと、MLBの1シーズンの試合数は4860試合だから、「2012年は2007年に比べて、1試合1チームあたり約0.47点も、得点が低かった」ことになる。


2012年と2013年のホームランの得点に対する貢献度が著しく低い可能性があることがわかった。そこで、以下のようなことがいえる可能性が浮上してくる。

ホームラン数から、その年のMLB総得点数はある程度の誤差で概算できるわけだが、「2010年代のMLB」は、「ホームランによる得点効率」という面で過去25年間で最低レベルにある


年代順にもう一度まとめ直してみよう。

MLBの野球は、「1990年代初期」には今よりはるかに「ホームランだけに依存しないプレースタイル」だった。
それは例えば、「1試合あたりのホームラン数(HR/G)と盗塁数(SB/G)」が1990年代初期まではほぼ同等の数値だったことからも明らかだ。1970年代後期から1990年代初期までのMLBでは、野球のあらゆるプレーを利用して得点チャンスをつくるダイナミックな野球が行われていた。
資料:2010年9月9日、盗塁とホームランの「相反する歴史」。そしてイチローのメジャーデビューの歴史的意義。 | Damejima's HARDBALL

だが1990年代中期になると、MLBのオフェンスは「ステロイドへの階段」をまっしぐらに駆け上がりはじめ、1999年と2000年に「ステロイド・ホームラン時代のピーク」を迎えることになる。1999年にマーク・マグワイアが65本のホームランを打ち、2000年にバリー・ボンズが73本のホームランを打ったことが、2つのシーズンの「意味」を象徴している。
「1試合あたりのホームラン数、盗塁数」からみても、HR/GとSB/Gの数値は1990年代中期以降大きく乖離しはじめており、「MLBでのホームラン偏重が始まったのが1990年代中期であること」は明らかだ。

だが、イチローがMLB入りした2001年に時代は一変する。ステロイダー追放の機運が急速に上昇するとともに、得点総数とホームラン数は年を追うごとに減少していく。
2000年代のホームランによる得点効率はまだそれほど低下してはいないが、「2010年代」に入ると、ホームラン生産数減少だけでは済まなくなり、クルマに乗っていてギアを落としたら同時にトルクもなくなったかのように、「2010年代のホームランと得点との関連性は急速に薄れて」いき、2010年代のMLBのホームランによる得点効率はこの25年間での最低水準になった。ホームランが大量生産されたステロイド・ホームラン時代ですら、ホームランと得点との関係は今よりはるかに良好なものだった。

1999MLB 総ホームラン数 5528本
2014MLB 総ホームラン数 4186本(▲1342本 24.3%減)

2014年のMLB総ホームラン数は、いまや「ピーク時の約4分の3」にまで減少している。
だが、グラフ1で2014年のデータが「近似曲線の真上」にあることから、実は2014年の「ホームラン数と得点総数の関係」そのものはあくまで「例年どおりの水準」だ。ここ数年の「ストライクゾーン拡張」や「アンパイアの判定精度の向上」、「ステロイド規制の強化」など、ホームラン発生を阻害する要因が増え続けていることを考慮すると、2014年の「量的な減少」という結果そのものは、実は「想定内の変化量」であり、それほどたいした問題ではない。

むしろ2010年代の大きな問題は、ホームランと得点との関係が、MLBストライキのあった1990年代中期に肩を並べるほど「質的に悪化している」ことのほうだ。


だから今のような時代に、「ホームランバッターに多額の投資を行うこと」の意味は、昔とは大きく違っている。

「ホームラン総数が激減している」ということは、ホームランバッターの希少価値が高まっているという意味でもあるから、たった40本(しかもステロイドで)ホームランを打つだけでホームラン王になれるこのおかしな時代には、ホームランバッターの「価格」、つまり「サラリー」がむやみと高くなるのは当然だと、誰しも思ってしまいがちだ。

だが、
1990年代中期以降ずっと続いてきた「ホームラン偏重によって得点を得るという手法」が衰退しはじめていることの意味や、得点とホームランの相関関係における最大の問題が「ホームランの量的減少」ではなく「ホームランの著しい質的低下」であることを、人は忘れすぎている

たとえでいうと、ウナギの減少という自然現象により、うな重の「価格」が異常に高騰しただけではなく、「ウナギの味覚そのものが、劇的にマズくなっている」としたら、どうだろう。しかも、OPSのようなデタラメな数字で評価するデタラメな評価基準の蔓延によって、マズい料理の価値を過大評価する舌の麻痺した無能な料理評論家たちが、マズい料理でも「うまい」と逆評価するような詐欺的な行為すら行われだした、としたら。


ホームランバッターに高いカネさえ払っておけば、多くの得点が得られることが約束された時代」は、10数年前に終わっているわけだが、どういうわけか知らないが、「量的にも質的にも価値が低下している長打能力を過大評価し、それに高いカネを払う、わけのわからない時代」は、今なお続いている。

例えばホームランの価値だが、発生数激減による希少性の高まりも事実としてある一方で、「質的な暴落」が同時に発生している可能性は高い。
にもかかわらず、MLBでは、「ホームランに過度に依存しない、もっと効率的な得点方法への戦術的シフト」が十分試されてはいない。(ちなみに、現実の野球ではいくつかの「ホームランに過度に依存しないチーム」が勝ったのが、2014年だ。2014年のMLBで最もホームラン数の少ないチームは、2014年ワールドシリーズを戦ったロイヤルズであり、その次に少なかったのが、NLCSでジャイアンツに敗れたカージナルスだ)
むしろ、「価値がスカスカになって比重が低下しつつあるホームランを、さらに過大評価までして、高いギャランティーを払って三顧の礼で迎え入れる」という意味のわからない行為は、いまだに蔓延している。

もちろんこうした「取引」は、どんな経済原則にも、のっとっていない。
価値が低下する一方で価格が上がる、すなわち価値と価格が乖離するわけだから、当然ストーブリーグでは、選手のサラリーの「インフレ」が起きる。つまり、「たいして能力がないのがわかりきっている選手」に「ありえないような高い給料が約束されるケース」が蔓延しはじめるわけである。当然、シーズンに入れば、給料の高い打者をいくら並べても、得点力がむしろ「低下」するような事態が、頻繁に、どこのチームでも起こりうるようになる。


こうした「ホームランの価値低下と価格上昇とが同時に起こるという矛盾したトレンド」は、元をただせばどんな原因から起きるのか。
「1999年と2000年のピーク(グラフ2のDグループ)」を、「2000年代のトレンド(グラフ2のCグループ)」に減速させ、それをさらに「2010年代のトレンド(グラフ2のBグループ)」にまで減速させた「原因」とは、いったい何だろう、というのが、次のテーマになる。

damejima at 15:18

October 21, 2014

以下の図は、90年代以降、各シーズンごとのホームラン数ランキング上位5人を図示したものだが、今シーズン限りで引退するらしいアダム・ダンが2000年代後半以降打ってきたホームラン数が「けして少なくない数だった」ことがわかる。

にもかかわらず、アダム・ダンの「評価」は低い。
理由を以下に示してみる。

90年代以降のホームランランキングとアダム・ダン

●(赤い丸印)
で示したのは「ステロイダーのランキング位置」だ。
マーク・マグワイア、サミー・ソーサ、バリー・ボンズ、アレックス・ロドリゲス。近年ではライアン・ブラウン、ネルソン・クルーズ、クリス・デービス。こうした「ステロイダー」のランキングの高さ、数の多さをみれば、「1990年代後半から、2000年代前半にかけてのMLB」が「どれほど酷いステロイド・ホームラン時代」だったか、一目瞭然にわかる。

他方、「2000年代後半以降、ランキング上位者のホームラン数そのものが右下がりに減少し続けていること」もわかる。ポスト・ステロイド時代にホームランを量産するのは、もはや簡単なことではないのだ。


ステロイダーは絶滅していないとはいえ、今のMLBがステロイド時代からポスト・ステロイド時代への変化の中にあることを考慮するなら、アダム・ダンが2000年代後半以降に残したホームラン数は、けして少なくない。
だが、それでも彼の評価はけして高くない。それはなぜか。


以下に近年の「アダム・ダン率」ランキングを上位7人分だけ挙げてみた。
「アダム・ダン率」というのは某巨大掲示板で語られている「ネタ」のことで、指標ではない(笑)「かの三振王アダム・ダンのごとく、ホームラン、三振、四球の占める割合が異常に高いホームランバッター」を意味する。(計算は簡単で、3つの数字を足して打席数で割るだけ)
近年の「アダム・ダン率」ランキング

「アダム・ダン率」のネタとしての面白さ自体は正直認めざるをえないが(笑)、ツッコミを入れさせてもらうと、これら「アダム・ダン率の高い打者」たち同士の間には、「ある歴然とした差」が存在する。
それはホームラン数と四球数の多さでは判定できない「差」であり、「その打者が、スラッガーとみなされるか、それとも、昔シアトルにいたリッチー・セクソンのようなフリースインガーのひとりという評価で終わるかの、分かれ目」でもある。(ちなみにマグワイアはただのステロイダーであって、マトモなスラッガーではないので評価など必要ない)

そこで、アダム・ダン率ランキング上位選手たち同士の比較のためのデータとして、wOBAWARをつけておいた。(参考までにあのお笑いデタラメ指標OPSも添付した)
たとえどんな視点から眺めようと、2010年マーク・レイノルズと2012年アダム・ダンの打撃は、彼らがどれほど多くのホームランや四球を生産したにしても、そのクオリティはあまりにも低いものだったことがハッキリわかる。


アダム・ダンの「超絶的なほどのアダム・ダンらしさ」の本当の原因は、彼の「打率の低さ」にあるのである。7人を打率順に並べかえた以下のグラフを見てもらいたい。

打率によって決定される
「アダム・ダン率上位者の打撃クオリティ」
「アダム・ダン率」と、打率、wOBA


アダム・ダン的な「低打率のホームランバッター」のバッティング・クオリティは、打ったホームラン数、選んだ四球数、三振数にほとんど関係なく、『打率の低さ』によって決まる。(こうしたバッターの場合、wOBAの高低も打率のみに比例して決まる)
マーク・レイノルズ、アダム・ダンの2人が、「アダム・ダン率チャンピオン」であるはずのジャック・カストより、はるかに『アダム・ダンらしく』見える本当の原因」は、2人のホームランの多さでも、四球や三振の多さでもない。


アダム・ダンの評価が、彼のホームラン数ほど高くはないのは当然だ。
彼は、全盛期のアルバート・プーホールズや、近年のミゲル・カブレラのような、パワーもクオリティも兼ね備えた超越的ホームランバッターではない。

2014年10月13日の記事で書いたことでもあるが、「低打率のホームランバッターの評価が低い」のは当然なのだ。
単にホームランを人より多く量産しただけの「低打率、低クオリティ打者」を過大評価しなければならない理由など、もはやどこにもない。それが「ポスト・ステロイド時代に求められるクールな評価基準」というものだ。
2014年10月14日の記事で書いたように、「パスカルの賭け」に毛が生えた程度の欠陥ロジックでホームランという神を捏造する時代は、とっくに終わっている。

そもそも彼のような「アダム・ダン的 低打率のホームランバッター」が生産されはじめた原因は、ステロイド規制の強化と、データ重視野球のまだ未成熟でデタラメな部分を理解しないで思いつきに導入しだした軽薄な流行にあるだろう
MLBのいくつかのチーム、多くの指導者、多くのマスメディアは、本格的にデータ野球を理解して運用しているわけではなくて、単に近年の流行にのっかっただけだ。たとえとして言うなら、「OPSのデタラメさすら理解せずに、OPSで打者を評価したりするような馬鹿なマネをしてきた」、ただそれだけだろう。
ときどき思い出したようにホームランを打って、あとは四球を待つだけのワンパターンなパワーヒッターであっても、デタラメ指標のOPS(と、そのバリエーション)でなら「そこそこ素晴らしいバッター」と評価されたのである。

関連記事:
2014年10月13日、「ホームラン20本の低打率打者A」と「高打率の打者B」をwOBAでイコールにしようとすると、「打者Aのホームラン以外のヒットは、全て二塁打でなければならなくなる」という計算結果。 | Damejima's HARDBALL

2014年10月14日、「パスカルの賭け」の欠陥の発見と、「ホームランという神」の出現。期待値において出現確率を考慮しない発想の源について考える。 | Damejima's HARDBALL


ただ、だからといって、アダム・ダンが、このホームラン量産がますます難しくなりつつあるポスト・ステロイド時代に多くのホームランを打ってくれた素晴らしいバッターだったことに変わりはない。
ミゲル・カブレラほどの才能に恵まれなかった彼は、「打率をとるか、ホームランをとるか」という選択において、いさぎよく打率を捨て、ホームランをとった、それだけのことだろう。彼の三振の多さは、彼ならではの「正直さ」の表われだ。
アダム・ダンがステロイダーではなかった場合、という条件つきではあるが、彼の引退に心からの拍手を送りたい。

Note:
近年の「四球」についての過剰な評価が嘘八百であることの考察は、「チーム視点からみたとき、『チーム四球数』と『チーム総得点』との間には、ほとんど何の関係もないこと」を明確化した2012年4月記事も参照のこと。
Damejima's HARDBALL:2012年4月8日、チームの「総得点」と「総四球数」の相関係数を調べた程度で、「四球は得点との相関が強い」とか断言する馬鹿げた笑い話。

2011ア・リーグ 打率と出塁率の比例関係(ホーム)
2011ア・リーグ 打率と出塁率の比例関係(ビジター)

2011ア・リーグ 打率と出塁率の比例関係(ビジター)
2011ア・リーグ 打率と出塁率の比例関係(ホーム)

これらのデータが意味するところは、こうだ。
そのチームが稼ぎ出す「総四球数」というものは、それが
得点の多い強豪チームであれ、得点の少ない貧打のチームであれ、ほとんど変わらない。

このことから、チームデータを観るかぎりにおいて、
次の事実が確定する。

チームという視点で見るとき、「四球数」は、チームの総得点数にまったく影響しない


damejima at 12:02

October 15, 2014

パスカルの賭けPascal's Wager)という話をご存じだろうか。

計算1 パスカルによる「神から受ける恩恵の期待値」計算

神が実在する場合の恩恵期待値
=(神が実在する確率)×(神から受ける恩恵=無限大)
=無限大(少なくともゼロよりは大きい)

神が実在しない場合の恩恵期待値
=(神が実在しない確率)×(実在しない神から受ける恩恵=ゼロ)
=ゼロ

有名な17世紀の哲学者Blaise Pascal(ブレーズ・パスカル)は神の実在について、こんな意味のことを考えたらしい。
「何も得られないゼロより、プラスのほうがいい。計算上、神の実在を信じないより信じたほうが恩恵がある。だから、神を信じたほうがいい」

この記事の目的は「期待値」というものについて考えてみることだ。神の実在を論じることでも、パスカルの賭けへの反論でもない。だからパスカルの賭け、それ自体を深く論じることはしない。
(勘違いしてほしくないのは、たとえ「パスカルの賭け」というロジックの貧弱さがわかったとしても、だからといって超自然的な存在が実在しない証明にはならないことだ。いつの世も、破綻するのは常に人間の浅知恵のほうであって、大自然の摂理ではない)


さて、ここに「ギャンブルにおける期待値(トラップ満載版)」を用意してみた(笑)
これはロジック内部にいくつもの「論理的なトラップ」を故意に用意して、読んだ人をあざむくために作ったロジックだ。ゆめゆめ脳内が汚染されないよう、気をつけて読んでもらいたい(笑)

計算2 ギャンブルにおける期待値計算(トラップ満載版)

ギャンブルすることの期待値
=(賭けに当たる確率)×(賭けに勝つことの利益=プラス)
=少なくともゼロよりは大きい

ギャンブルしないことの期待値
=(賭けに当たらない確率)×(利益=ゼロ)
=永遠にゼロのまま

結論:「ギャンブルすることの期待値」は常にプラスであり、いつまでたってもゼロのままである「ギャンブルしないことの期待値」より、常に大きい。だから結論として言えるのは、「ギャンブルは、やらないよりも、やったほうが、間違いなく儲かる」ということだ。


さてどうだろう。
この「ギャンブルにおける期待値計算(トラップ満載版)」のどこに、どういう形の「ロジックの罠」があるか、わかっただろうか。


少し種明かしをしてみよう。
計算3 ギャンブルにおける期待値計算(修正版)

ギャンブルして、賭けに当たる期待値
=(賭けに当たる確率)×(賭けに勝つことの利益=有限のプラス)
=少なくともゼロよりは大きいが有限であることが多い

ギャンブルして、賭けに当たらない期待値
=(賭けに当たらない確率)×(賭けに負ける損失=無限のマイナス)
=理論的にいえば「限度なしのマイナス」

ギャンブルしないことの期待値
=(賭けに当たらない確率)×(賭けの利益=ゼロ)
=永遠にゼロのまま

結論:「ギャンブルをやる」ことは「必ず儲かる」ことを意味しない。また「ギャンブルをやったほうが、やらないよりは儲かる」とはいえず、そうした断定に根拠はない。

ここまで書くと、「なぜギャンブルというものが、ちょこちょこ勝って、大きく負けることが多いのか」が、多少理解できると思う。


計算2「ギャンブルにおける「期待値計算」(トラップ満載版)」には、ざっと挙げただけでも、下記のような「トラップ」、論理的な落とし穴がある。

計算2に内在している「トラップ」

・ギャンブルにおける行為選択には少なくとも、第1に「参加する、しない」、第2に「勝つ、勝たない」という、「2段階のステップ」があり、「それぞれ別の確率の発生場面」が存在するが、計算2は「2段階の行為選択」をまったく区別せず、混同して語っている。

・第1段階の行為選択における「ギャンブルに参加しない」というチョイスは、第2段階における「賭けに勝つ、勝たない」という行為とその確率とまったく無関係の事象であり、拘束されない。にもかかわらず、計算2は、関連のないもの同士を無理に関連づけて計算している。

・ギャンブルの結果には、「勝つ」以外に、「勝たない(負ける)」という選択肢がある。だが計算2は「負ける」という結果とその確率を視野から消去している。

・ギャンブルの利益は、たとえ「勝つ」場合でも、たいていの場合「有限」なものだが、「負ける」場合のマイナスの利益=損失は、理論的には「無限」である。そのため「負ける」という結果や確率を視野から消去した話においては、ギャンブルのプラスの利益ばかりが過大に評価され、イメージに焼き付きやすい。

・ギャンブルに投資できる「原資」は、例外なく「有限」であり、賭けにおける当たりに遭遇するまで「無限に投資し続けること」は不可能。しかし、計算2ではそれが想定されていない。現実には「勝つ確率が非常に低いギャンブル」の場合、大多数の人は負けのみを経験し、負債の山とともにギャンブルの場面から退場することになる。


「パスカルの賭け」というロジックに多くの誤謬、論理矛盾、トラップがあることは、ここまでの説明(というか証明)でわかると思う。
それでも、計算2のようなトラップ満載のロジックは、現代社会のありとあらゆる場面で、毎日のように実際に使われ、数多くの人がその「落とし穴」に毎日落ちてもいる。また、「パスカルの賭け」に存在する、誤謬、論理矛盾、トラップは、この有名なロジックについて書かれてきた多くの書籍やブログできちんととらえられてさえこなかった。困ったものだ。
記事例:確率1

ただ、パスカルの生きた17世紀にはまだ「確率論の土台」というものがなかったことを思えば、彼のロジックの甘さやズルさをいまさら問いただすより、むしろ、彼が後世の確率論そのものの開祖のひとりであることのほうを忘れてはいけないのだろうとは思う。
彼がやったような、「論理を、まるで建築物の構造部分でも組み上げるかのように組み立てていき、その『建築されたロジック』というメスで、あらゆる対象を例外なく解剖できる、と信じる」という、その「度外れた論理オタクぶり」(笑)が、中世を近代に引き寄せた彼の業績そのものなのだ。(もちろん現代でそれをやっても意味などない。中世にやったから意味があっただけで、現代からみたパスカルの「論理の建築」はミスだらけの「あばら家」だ)
「神」のような超自然的なものですら、「計算で発見できる」と考えた論理思考の鬼、それがパスカルなのだ。


さて、さらに話を
低打率のホームランバッター」に振ってみる。


wOBAでは「ホームランは、シングルヒットの約2倍程度の得点貢献度がある」という発想をするわけだが、これを「文字として」読んだ人は、脳内で「ホームランバッターは、すべての打席において平均的な打者の2倍の得点をたたき出す能力を持っている」だのなんだのと、勝手に脳内変換しやすい(笑) ほんと、つくづく人間の脳の仕組みって出来損ないだなと、いつも思う。

もちろん、そんなことはありえない。
「パスカルの賭け」がもっている論理矛盾をえぐりだしたことで理解できると思うが、ホームランという現象には、「打席に入る」、「ホームランを打つ」という「2つの段階」がある。このことは常に見過ごされ、忘れられやすい、ただそれだけの話だ。

わかりにくいと思うので、もう少し具体的に書いてみる。

ホームランを打つという行為は、「打席に入る」、「ホームランを打つ」という「2段階の行為」なのだ。だから「ホームラン1本あたりの得点期待値」と、「ホームランバッターの、1打席あたりの、ホームランによる得点期待値」とは、イコールではない。
もし「ホームランバッターの、1打席あたりの、ホームランによる得点期待値」を計算したければ、必ずホームランの「出現確率」を想定に入れておかなくてはならない。また、計算3でわかるように、大多数の打席が実は失敗に終わること(=たとえば三振など、打席がなんらかの意味の「凡退」に終わること)の「損失の大きさ」も、損益計算に入れておくべきだ。

だが、上に挙げた「パスカルの賭け」や、「ギャンブルの期待値計算2」からわかるように、人は「当たりの出現確率の低さ」というやつを意識したがらないし、失敗が起きる頻度の高さを想定したがらない。また、「ホームランバッターが、いとも簡単に三振するバッターでもある」ということを、最初からまるで想定しないとか、または「無様な失敗場面を全部なかったことにして話す」ことも、非常によくある。

こうした無頓着な17世紀的ギャンブル感覚(笑)が、結果的に「ホームランの出現を信じる人のほうが、信じない人より恩恵がある」などという飛躍した論理、つまり、「ホームランという神」を生み出す原因になる。

計算4 「パスカルの賭け」を無批判に鵜呑みにした
トラップと論理矛盾まみれの「ホームランの恩恵の期待値」の計算例

ホームランが実現した場合の恩恵期待値
=(実現する確率)×(恩恵=はかりしれないほど大きい)
=少なくともゼロよりは大きいプラス

ホームランが実現しない場合の恩恵期待値
=(実現しない確率)×(恩恵=ゼロ)
=ゼロ

「パスカルの賭け」的ホームラン主義の結論:何も得られないゼロよりは、プラスのほうがいい。たとえ「低打率のホームランバッター」であっても、計算上、ホームランを打たないより打ったほうが恩恵がはるかに高いのだから、ホームランを期待して打席に送りだすべきだ。

計算4の論理の、どこがどう間違っているかは、もう説明するまでもない(笑) だがこの21世紀になっても、いまだに17世紀の「パスカルの賭け」の論理を使ってモノを考えたがる人の、多いこと、多いこと(笑)

では最後に、前記事にちなんで、ちょっとした計算をしておこう。
前記事:2014年10月13日、「ホームラン20本の低打率打者A」と「高打率の打者B」をwOBAでイコールにしようとすると、「打者Aのホームラン以外のヒットは、全て二塁打でなければならなくなる」という計算結果。 | Damejima's HARDBALL

打席数600、打率.220で、ホームラン20本を打つ打者A
打席数600、打率.330で、シングルヒット198本を打つ打者B

打者Aのホームラン1本、1打席あたりの得点期待値
2×(20÷600)≒0.06666666…
打者Bのシングルヒット1本、1打席あたりの得点期待値
0.9×(198÷600)≒0.297


「0.067の神の出現」だけを延々と待ち続ける野球をするのは、その人の自由だから、勝手にすればいいが、ステロイドで「0.067でしかないものを、0.1くらいに無理矢理に引き上げる不正行為」はまったくもって感心しない。ステロイドで捏造した神はニセモノであり、野球の冒涜だ。

たしかに0.297をうまく積み重ねることだけが野球の方法論ではない。また、期待値に縛られるのがスポーツの醍醐味ではないことも間違いない。だが、「マイナス面を直視しないパスカル的ギャンブル」は、もはや過去の遺物である。
現実というものを見て実利的で効果的な打線構造を決め、その上でギャンブルすべきタイミングを見定めていくのが、「ノン・ステロイド時代の打線」というものだ。

damejima at 12:26

October 14, 2014

打者の攻撃力を測る指標のひとつに、wOBA(Weighted On-Base Average) がある。
「ホームランの価値はシングルヒットの4倍」などと(笑)、あらゆる面でデタラメな計算ばかりしているドアホなOPSと違って、例えば「得点生産力でみると、ホームランは、シングルヒットのだいたい2倍程度」という具合に、リーズナブルな比重計算をもとに「その打者の打撃面の得点貢献度の総計」を計算する。
wOBAは、シーズンごとに変わる微小な差異や、計算者ごとのポリシーの違いに基づく計算手法の違いがあるものの、いずれにせよ現在ではさまざまな指標の根幹データのひとつとして活用されている。
関連記事:Damejima's HARDBALL │ カテゴリー:指標のデタラメさ(OPS、SLG、パークファクターなど)

あるシーズンのwOBAの計算例=
0.72四球+0.75死球+0.90シングルヒット+0.92エラー出塁+1.24ニ塁打+1.56三塁打+1.95ホームラン

別の計算方式:wOBA(Speed)=
{0.7×(四死球−敬遠)+0.9×(シングルヒット+エラー出塁)+1.25二塁打+1.6三塁打+2.0本塁打+0.25盗塁−0.5盗塁死}÷(打席数−敬遠−犠打)

それにしても、指標の計算において、なぜまた「パークファクター」なんていう自軍のホームランと対戦相手のホームランの区別もつけられないような「根拠のあいまいな不完全な数値」で補正するのだろうと、いつも思っている。
例えば、あの四球とホームラン偏重のデタラメな計算で成り立っているデタラメ数字のOPSですら、パークファクターで補正すると「OPS+」になって多少マシなものになる、と、思い込んでいる人がたくさんいる。
つまり、多くの人が「パークファクターで補正した数値なら、元がどんなデタラメなものであれ、より正しいものになっているはず」と思い込んでいるわけだ。困ったものだ。根拠が曖昧な数値で補正して、何がどう「より正しくなる」というのか。さっぱりわからない(笑)


話を元に戻そう。
この記事の目的は「低打率のホームランバッターの意外なほどの価値の低さ、そして、そういう選手に大金を注ぎ込むことの無駄さ」を「数字で明示してあげる遊び」にwOBAを使ってみることだ(笑)

ここでの計算のとりあえずの目的は、
以下に仮定する「低打率のホームランバッターAが、高打率のアベレージヒッターBとwOBAで同等になるためには、『打者Aはいったいどれだけの二塁打を打たなければならないか』を、数字の上で計算してみる」ことだ。(計算式は上記の2つのうち、上の例を採用)

打者A 「ホームラン20本だが、低打率.220」
打者B 「高打率.330だが、ホームランはゼロ」

計算結果の意味を理解しやすくするため、A・B両者とも、四死球、敬遠、エラー出塁、犠打はまったく無く、打席数600とする。打者Aの三塁打はほんのわずかな数だろうから、打者Aの「ホームラン以外の長打」はすべて二塁打と仮定し、コントラストをつけるために打者Bのヒットは全て「シングルヒット」と仮定する。

打者A
600打数 20ホームラン 打率.220
ヒット総数=132本
ホームラン以外のヒット総数=132−20=112本
ホームランのみの得点貢献=20×1.95=39

打者B
600打数 ホームランなし 打率.330
ヒット数=198本(全てがシングルヒット)
得点貢献合計=198×0.90=178.2


「打者BのwOBA合計=178.2」から「打者AのホームランのみのwOBA=39」を引くと、wOBAにおいて「打者Aが打者Bと同等」となるために必要な、「打者Aのホームラン以外のヒットにおいて必要な得点貢献度」がわかる。
178.2−39=139.2

「打者Aの、ホームラン以外のヒットにおいて必要な得点貢献度の合計」が、139.2であることがわかった。

この139.2を、「打者Aのホームラン以外のヒット数」で割ってみる。すると「打者Aのホームラン以外のヒット1本あたりに必要な得点貢献度」がわかる。
139.2÷112≒1.243


wOBA計算式における「二塁打の比重」がちょうど「1.24」だ。
したがって、次のような話になる。
wOBAにおいて、打者A=打者Bとなるためには、打者Aのホームラン以外のヒット112本すべて『二塁打』でなければならない。

どうだろう(笑)

いかに野球ファンというものが、「ホームラン20本というのは、なかなか凄い数字だ」という「印象操作」、「マインドコントロール」にとらわれているか、ご理解いただけるだろう。
まぁ、こういう風に数字で明示してあげても、たぶん、誰もマインドコントロールから抜け出せないのだろうとは思う(笑)、だが現実に「ホームランを20本打つ低打率のバッター」なんてものは、明らかに『ただの見掛け倒し』にすぎないのだ。


ア・リーグのシングルシーズンの二塁打数は、トップクラスの選手でもシーズン40本くらいだから、「シーズン112本の二塁打」なんてことは絶対に達成不可能だ。だから「結論」はこうなる。
結論:「20本のホームランを打つ程度の低打率バッター」と「打率.330のバッター」と比べると、実は、前者は後者よりも得点貢献度ははるかに低く、まったく比較にならないほどだ。



おいおい。「ここまでの計算には四球とか敬遠が含まれていないじゃないか」。などと、思った人がいるとは思う(笑)
だが、記事が長くなりすぎるので細かい計算は省かせてもらうが、たとえ四球を含めて計算しなおしても、結論はまったく変わらない。(ちなみに「敬遠」はwOBAの算定からは普通除外される。それを知らないホームランマニアも多いはず)

いったい打者Aが何個くらい四球を選ぶと、「打者Aの打つべき二塁打」が現実の野球で多少は可能性のある数字レンジにおさまるか、計算してみるといい(笑)
ちなみにブログ主の計算では、「打者Bは、まったく四球を選ばない」という仮定のもとでなら、「打者Aが60個くらいの四球を選ぶと、wOBAにおいて打者A=打者B」という計算になる感じだ。

ところが、だ。
この「打者Aが四球60個を選ぶと、打者A=打者Bになる」という計算は、「打者Bのヒットが全部が全部シングルヒットで、ホームランも四球もまったくなし」という、「現実の野球ではありえない前提」での計算なのだ。だが現実には、打率.330の優秀な打者Bは、四球を選ぶし、長打も、ホームランも打つ。うっかりすると敬遠もされる。

実際ざっくり計算してみると、だいたい打者Aは、「打者Bの長打数+ホームラン数+四死球数」くらいの数の二塁打を打たなければ、wOBAにおいて打者A=打者Bにはならない。
だから「打者Aに必要な二塁打の数」なんてものは、絶対に「ゼロ」にはならないどころか、現実の野球でありえる上限の「二塁打40本」をはるかに越えていってしまう
さらにいえば、打者Bの盗塁守備貢献をプレーの貢献度として計算にいれてくる指標では、両者の「価値」はもっと違ってくる。



どこをどう仮定しなおそうと、打者Aに求められるホームラン以外の長打数(=現実には二塁打の数)は膨大な数になるのである。だから「wOBAの計算上、打者Aが打者Bと同等になることはありえない」という結論に、変化など起こらないのである。
「20本のホームランを打つだけの、低打率のバッター」が、いかにたいしたことのない存在か、そして、そうした打者をズラリと並べただけのチームが、やたらと金がかかるクセになぜ弱いのか、わかっていただければ幸いだ。
(さらに言えば「20本のホームランを打つだけの、低打率のバッター」はたいていの場合、守備もできなければ、足も遅い。ならば、打者Aは想像よりはるかに使い道の狭いプレーヤーだ、ということにほかならない)

こういうことの意味をチームとしてもっと重くとらえるべき時代が「ノン・ステロイド時代の野球」なのだが、その話は次の記事以降で書く。

damejima at 05:16

January 29, 2014

Baseball Analyticsが1月22日付の記事で、ヤンキース黒田について記事を書いている。
記事の要旨は要するに、「2013シーズン、黒田は、4月から7月まではストライクゾーンで勝負できていたが、8月以降にゾーンで勝負する率が劇的に下がってしまい、その結果、投手としての成績がガタガタになった」と言いたいらしい。
Hiroki Kuroda and Throwing in the Strike Zone - Baseball Analytics Blog - MLB Baseball Analytics

いつものように結論からいわせてもらえば、少なくとも、こんな出来そこないの無根拠な話から 「黒田という高給取りのピッチャーのピッチングの質が悪い理由」 がみえてきたりはしない


たいていの場合、こういう「ごたいそうなグラフ」を見せられると、「ほほぉ・・・・。そうなんだ」と思って信じてしまう人が大勢いる。困ったものだ。
相関係数なんていう取扱いに独特のクセのあるものを安易に野球にあてはめて、鼻高々に野球というゲームのファクターを説明したつもりになっている馬鹿がひとりでも減るように、簡単に説明しておくことにする。
(なお以下のグラフは、オリジナルをより見やすいように改造している。オリジナルはY軸の位置が上下で揃っていないのと、軸の太さが細すぎるため、非常にわかりづらい)

2013MLB BABIPとゾーン率の相関マップ


図中に、やや右下がりの赤い直線がある。
これはおそらく「近似直線」だろう。

近似直線や近似曲線は、グラフ上にマッピングされたデータの細部を思い切って捨象することで、「事象Aと事象Bの相関関係の様相や濃さ」などを可視化して見えやすくするために用いられる表現手法だ。(グラフに近似直線を書き加える機能は、例えばパソコンソフトのエクセルなどにも備わっているので、誰でも取り扱うことができる)

例えば野球ブログで、「得点とOPSの相関関係」や「得点と四球の相関関係」のような「2つの事象の相関」を取り扱う場合、使われてきた手法は、そのほぼ全てが「直線という表現を使う『線形近似』」であり、ブログ側の人間はその程度の曖昧な数字を根拠に鼻高々に語ってきた(笑)

だが、「近似の程度」を示す表現手法には、多項式近似によって「曲線」として表現するなど、さまざまなパターンがあるのであって、相関関係を「直線」として表現する方法なんてものは、たくさんある近似の表現のひとつに過ぎない。


さて、上の図の場合でいうと、X軸の事象であるZone%と、Y軸の事象BABIPとの相関関係は、やや右下がりの、平坦な直線として表現されている。
これは、どういう意味になるかというと、Zone%とBABIPという2つの事象の間に、「Zone%が上昇すると、BABIPが低下するという関係が、ほんのわずかならありうること」を示している。
もっと平たく言うと、「投手がストライクゾーンにより多く投げれば投げるほど、バッターに打たれないですむ傾向」が、「ほんのわずかならありうること」を意味している。


いま、「ほんのわずかなら」と書いたことには、もちろん重要な意味がある。

というのは、上の図の上にマッピングされた個別データの分布には、「個別データが、グラフ全体に、しかも、まんべんなく広がっている」というハッキリした特徴があるからだ。


こうした「法則性がほとんどみられないデータ分布」が意味するのは、「なにもわざわざ線形近似などみなくても、X軸とY軸で示された2つの事象の間に明瞭な相関が存在しないのは、明らかだ」ということだ。
つまり、「Zone%とBABIPとの間に、強い相関関係などそもそも存在していない」という意味であり、もっと具体的にいえば、「MLBの投手において、ストライクゾーンに投げれば投げるほど、それがそのまま、より多くの打者を凡退させられるという好結果につながる、という関係が成立する可能性は、非常に低い」という意味だ。

もしZone%とBABIPの間に強い相関関係があるなら、データの分布は、例えば「データが、右下がりに45度傾いた直線に沿って、右下がりにきれいに並ぶ」というように、ハッキリした「傾向」を示す。
だが実際には、こういうふうにデータがグラフ全体にまんべんなく広がって分布している。明確な相関関係が存在するわけがない。
上の図はそもそも、「世の中にはいろんなタイプのピッチャーがいる」という、ごく当たり前のことを言っているにすぎず、Zone%とBABIPの相関関係の強さを保障したりするどころか、まったく何も証明できていないまま、勝手に結論を導きだしているのである。


だから、この「Zone%とBABIPの関係を示したグラフ」とかいう「いい加減な基準」を使って、「2013黒田の成績がシーズン後半に大きく崩れたのは、彼がストライクゾーンに投げなくなったからだ」だのなんだのと、ごたいそうに結論づけるのは、いい加減なものさしを使って、長さを測定し、結論を導いていることにしかならない。
このロジックは「ものさし」そのものがいい加減なのだ。だから、そこから引き出された結論など、信じるわけにはいかない。当然のことだ。


このブログでは、2013シーズンの黒田のピッチングの「質の悪さ」については2013年9月にとっくに書いている。
Damejima's HARDBALL:2013年9月13日、黒田という投手を評価しない理由。そして、なぜジラルディは満塁ホームランを打たれるような場面を自ら演出してしまうのか、について。

このブログの記事では「黒田が先取点を安易に取られ過ぎるピッチャーだ」という論点から書いたわけだが、月別にみると、「黒田が先取点を取られる傾向」は、Baseball Analyticsが黒田のZone%が良かったとする「4月から7月」にも存在するし、また、Zone%が悪化したとする「8月以降」にしても、同じようにみられる。
だから、「4月から7月までの黒田と、8月以降の黒田は、まったく別人のような投球をしていた」というBaseball Analyticsの主張には、なんの説得力も感じない。単に7月だけが異常に良かっただけの話だ。
(以下の自作グラフでみてもらうとよりわかりやすいが、青色のセル部分は、4月から6月にも大量にあるし、また8月以降にもある。黒田が給料にみあう仕事をしていたのは、7月のみに過ぎない)

資料:2013黒田 全登板 ©damejima

図で、青色のセルで示したのは、「黒田が先取点をとられたゲーム」。(4月8日クリーブランド戦含む。この試合では、1回表ヤンキースが3点先制したが、1回裏に3失点している) また赤色のセルは、「ヤンキースが先制しながら、黒田が打たれて逆転負けした試合」を意味している。
黒田登板ゲームの詳細data generated by Hiroki Kuroda 2013 Pitching Gamelogs - Baseball-Reference.com


何度も書いてきたことをまた書くのは本当にうんざりだが、MLBのピッチャーにはたしかに「ものすごくストライクばかり投げて、なおかつ打たれないピッチャー」や、「ものすごくボールを投げて、それでも失点しないピッチャー」がいる。前者の代表はクリフ・リーであり、後者の代表は引退したマリアーノ・リベラだ。
Damejima's HARDBALL:2013年7月8日、グラフひとつでわかる「ボール球を振らせる投球哲学」と、「ストライクにこだわりぬく投球哲学」 常識に縛られることなく投球術の両極を目指すマリアーノ・リベラと、クリフ・リー。


だが、何度も書いてきたことだが、ストライクの鬼神クリフ・リーのような「非常に特別な投手」は、野球世界の頂点であるMLBにさえ、ほんのわずかしか存在していない。
他の投手たちの「投球術」というものは、どれも似たり寄ったりで、たいして違わない。たとえ好投手といえど、十分すぎるくらい「平凡」なのが普通なのだ。

昔の記事に次のような記述をしておいた。気になる人はあらためて読み返してもらいたい。
2013ア・リーグで「ボール球を振らせる率の高い投手ベスト20」のほとんど全員は、「非常に狭いエリア」に固まって存在している。そして、その大半は「ア・リーグ奪三振ランキングベスト20」とダブっている。

一部例外を除き、大半の投手の数値は似たり寄ったりであり、全投球に占めるストライクは42〜46%、「32〜35%前後のボール球」をバッターに振らせている。
つまり「ボール球を振らせることのできる率の高い優秀な投手」のほとんどは、「奪三振数の多い投手」でもあり、しかも彼らの投げるストライクとボールの比率はかなり共通した数値になる。
彼らのような奪三振系ピッチャーの投球術には、実は思ったほど相互に差異はなく、似たり寄ったりである

O-Swing%とZone%

X軸:O-Swing%(ボール球を振らせる率)
Y軸:Zone%(ストライクゾーンに投げる率)
青い点:O-Swing率の高いア・リーグ先発投手ベスト20
ソース:Fangraph(データ採集日:2013年7月5日)


投手にとって大事なことは、Baseball Analyticsのおざなりな記事がいうような「ストライクゾーンにどれだけ投げられるか」などという、低次元な話ではない。
ほんと、よくそんな素人分析で野球を解析できると思い込めるものだ。そんな低レベルの話でいいなら、誰も苦労なんてしない。

とりあえず、MLBでいい投手になるための出発点は、
ゾーンに投げても痛打されない、質のいいストライク
思わず打者が手を出したくなる、質のいいボール球
この「2つ」を持った投手になることだ。

もちろん、この「2つ」をモノにできたからといって、そのピッチャーがなれるのは、ごく普通の「三振がとれるピッチャー」に過ぎない。その程度の、どんな時代にも3人や5人はいるピッチャーに、みんながみんな殿堂入りされたんじゃ、たまったもんじゃない。

平凡な先発ピッチャーが、配球の天才ロイ・ハラデイやストライクの鬼クリフ・リーのような、個性ある名投手になろうと思えば、まったく別次元の高さのハードルが待っている。ちょっとくらい三振が人より多くとれた程度のことで、その投手が天才や名投手になれるわけじゃない
それは、Baseball Analyticsがいうような「ストライクゾーンに投げれば投げるほど、打者を打ち取れる」などという、子供じみた、嘘くさい分析で理解できるレベルの話ではない。

damejima at 01:36

May 25, 2013

まずはア・リーグ各チームの2013年5月の「ボールを振る率とスイング率との比例関係」を示すグラフを見てもらおう。

ボールを振る率とスイング率の関係

ア・リーグの各チームについて、横軸に「ゾーン外をスイングする率」(O-Swing%)、縦軸に「スイングする率」(Swing%)をとってある。
右下にも、左上にも、該当チームがない。このことは、チームの 「スイング率」 と 「ボールを振る率」、2つの事象の間の比例関係に、ほとんど「例外」がないことを意味している。線形近似の決定指数でみても、0.8681と、そこそこ高い。
(ただ、そのうち書くつもりだが、この0.8681程度の数字では、けして「両者の相関が完璧」なんて意味にはならない。完璧とまで言えるのは0.95くらいの高い数値にならないと無理)

こうしたことから、チーム単位でみると、「スイング率」 は 「ボール球を振る率」にほぼほぼ比例していることがわかる。
(ちなみに、チームごとのスイング率の差なんてものは、ほんのわずかな数字に過ぎないのは確かだ。だが、野球というのは「ほんのわずかな初期値の差が、結果の非常に大きな差になって表れるカオス的スポーツ」である。チーム間のほんのわずかな差を「有意」ととらえるかどうかは、人による)
参考記事:Damejima's HARDBALL:2012年11月9日、2012オクトーバー・ブック WS Game 4でフィル・コークが打たれた決勝タイムリーを準備した、イチローの『球速測定後ホームラン』 による『バルベルデ潰し』。


と、こんな話を聞かされると、
俗説を信じたまま野球を見ている大半の人は、
すぐこんなことを考えてしまう。

ボール球を振らないチームほど、スイング率が低いんだな。
じゃあ、無駄にボール球に手を出さないチームはやっぱり、ストライクをしっかりスイングしてるってわけだな


まったく笑える(笑)
頭は生きているうちに使え。

得点とOPSの相関数値を調べた程度のくせして、「OPSで得点の大半を説明できる」だのなんだの、腹を抱えて笑える俗説を打ちたてて自信満々になっていたくせに、OPSのデタラメさが明らかになっても自説を曲げる気配のない、どうしようもないOPS馬鹿とソックリな俗説が、ここにもある。

「ボール球を振らないチームは、選球眼がいいから、必然的にストライクを振る。だから打撃成績もいいはず」という俗説を信じてやまない人たちの考え方を、もうちょっとリクツっぽい話に直すと、たぶんこんなところだろう。

野球の投球は、「ボール」と「ストライク」、2つの相互に排他的な(あるいは独立した)ファクターから成り立っている。
だから、もし「ボール球をスイングする率」が、他チームより低い「ボールを振らないチーム」では、自動的に「ストライクを振る率」が高くなって、打撃成績も向上しているはずだ。


スジが通っている?
とんでもない(笑)

最初に挙げたグラフは、『チームにおけるスイング率』という事象が、『ボール球をスイングする』という事象との間に、そこそこの相関関係がある、という意味だ。

では、
その相関関係は、『ストライクをスイングするという事象』に影響して、その確率を押し上げるか?
いいかえると、「他チームよりボールをスイングしないチームは、他のチームよりストライクを多くスイングする」という仮説は妥当か?

結論など言うまでもない。
もちろん、正解は "No" だ。
理屈で説明するより、グラフで見たほうが説明が早い。

ア・リーグ2013年5月の「ボールを振る率とスイング率の比例関係」
ストライクを振る率とスイング率との関係


2つのグラフを見比べるといい。

ひとつの例外もなく、
上の「スイング率とボールを振る率の関係図」で、「左下」にあるチームは、下の「スイング率とストライクを振る率の関係を表わす図」においても、「左下」にある。

同じように、上の図で「真ん中」あたりにあるチーム、「右上」にあるチームは、下の図でも同じように「真ん中」「右上」にある。


つまり、こういうことだ。

結論

2つのグラフにおいて、あらゆるチームの位置は同じような位置にある。

このことから、チームごとのスイング率、つまり、それぞれのチームの「スイングしたがる度合い」というものは、実は、「ボール球を振る率」で決まるわけではない。「スイング率」と「ボール球をスイングする率」の相関係数がどれだけ高かろうと、なんだろうと、関係ない。

平たく言い直せば、
スイングしたがるチームは、
ボールも、ストライクも、両方振る。
スイングを抑制しているチームは、
ボールも、ストライクも、両方振らない。

ただ、それだけの話。


「OPS」と「得点」、たった2つの事柄の間の相関数字を調べただけで、野球すべてを説明できたようなつもりになっていたOPS馬鹿たちがやってきた間違いと同じ単細胞なミスが、ここにもある。
OPS馬鹿は、得点とOPSの単純な関係を調べただけで、指標として意味があると勝手に思い込んでいるわけだが、この場合、たとえ「ボール球をスイングする率」と「スイング率」との間に、ある程度高い相関関係がみられたからといっても、そのたったひとつの断片的な判定だけで、「スイング率を決定しているのは、ボールをスイングする率である」と断言できたりはしないのである。

ちなみに、野球の投球はたしかに「ストライク」と「ボール」の2つに分類される。だが、細かく言えば、この2つの現象が、相互に排他的な事象(Mutually exclusive events)であるか、あるいは独立な事象(Independent events)であると断定して扱っていいかかどうかを、単純に断言することなど、できない。
というのは、例えば「打者有利なカウントにあるバッターにとって、ボールの投球が、ストライク以上に『次の球をスイングする誘因』になっていること」は誰が考えても明らか、だからだ。
例えば、カウント2-0になったら、バッターは次の球を非常にスイングしたがる。だから、わざとボールを2球投げてカウント2-0にしておいて、次の球を「ほんの少し動くストレート系」を投げて、打者をゴロアウトにする配球術も、現実にMLBには存在する。
この「カウント2-0」の例にみられるように、「ボールとストライクとは、相互に排他的な存在とみなしてもいい」と単純に考えるのは、あまりにも野球知らずというものだ。

野球のボールとストライクは、コインの裏と表とは性質が全く違う。

野球というスポーツは、『カウント』や『配球』によってシチュエーションがめまぐるしく変化するところに面白みがある。
だから、現実の野球に存在するさまざまなケースで考慮すれば、ボールとストライクとは無関係どころか、むしろ「あまりにも密接な関連さえ、ありうる」と考えないかぎり、現実の野球にまったく近づけないとさえ、言える。そうでなければ、配球なんてものを考える意味がない。


ちょっと話が横道にそれた。
たとえ野球の投球が「ボール」(事象A)と「ストライク」(事象B)の2つだけで出来ていて、「スイング」という行為と「ボールを振る」行為との間にそこそこ強い相関関係がみられたからといって、「ボールを振らなければ、そのチームのストライクを振る率は上昇する」とか、「ボールを振らないチームは、他のどんなチームよりストライクを振っているから強い」などと断言できる根拠など、実はどこにもないのである。
チームとして、「『スイング率』と『ボールを振る率』との相関関係が高いこと」は、けして「その相関関係が、『スイング率』と『ストライクを振る率』を左右する」ということを意味しない。


こうした俗説はどんな思考プロセスから生まれてくるのか。
-------------------------------------------------
野球ファンは、日頃から『ボール』と『ストライク』という2つの事象を、ついつい、相互に排他的な事象(あるいは独立した事象)と考えるクセが身についてしまっている。
-------------------------------------------------
そこに、「ボールを振る打者は、選球眼が悪い」という、野球ファン特有の古い道徳が加わると、いつのまにか、「ボールを振ることと、ストライクを振ること、これら2つの現象の間には、どちらかが上がれば、どちらかが下がるというようなパレート最適的関係がある」という思い込みが生まれる。
-------------------------------------------------
さらにそこに「ボールを振る率と、全体のスイング率とは、相関関係にある」なんてデータを提示されると、どうなるか。
自分の脳内で、「ボールを振らないと、スイングが減る。だから、ストライクを振る率は上がるから、打てるようになるに決まっている」と無意識に思い込んでしまう。


「ボールを振らないで我慢していれば、カウントは、より打者有利になる。だからボールを振らなければ必然的に、よりストライクだけを振れるから、いい打撃成績になる」と、常識的な視点から反論したがる人が出現するかもしれないので、あらかじめ言っておくが(笑)、そんなのはただの俗説だ。

例えば、ア・リーグで最もスイングしないチームであると同時に、ア・リーグで最も打てないチームでもあるシアトル・マリナーズのスイングデータを見ればわかる。
シアトルマリナーズという打撃不振のチームは、他のスイングしない系のチームに比べ、よりボール球をスイングし、よりストライクを振らない。
つまり、このチームの打者は、「ただただ打席で縮みあがって、萎縮していて、バットが振れないだけ」だ(笑)スイングを抑制することは、選球眼の向上を意味しないし、チームの打撃成績の向上も意味しない。


ストライクをフルスイングすることだけがヒットを打つ道であり、ボールを振らないことが四球を選ぶことであり正義だ、などという、何の根拠のない思い込みだけで勝手に作り上げた野球道徳をたよりにモノを言いたがるアホウな人間は実に多い。
だが、才能と、体格と、給料と、素晴らしい施設とスタッフに恵まれたメジャーリーガーでさえ実現できないことを、誰かれ問わず押し付けたがる人間が振り回す、その無根拠な断定的ロジックの土台は、実は、こんなにもいい加減な俗説でできているのである。


ア・リーグの「2つのスイング傾向」でわかる
「MLBの2種類の野球」の存在
2つのスイングスタイル

ちなみに、このグラフで赤い楕円で示したように、ア・リーグの野球には大まかに分けて2種類の野球がある。

スイングしたがるチーム
LAA、KC、CHW、HOS、DET、NYY、BAL
スイングを抑制したがるチーム
TOR、MIN、BOS、TEX、SEA、CLE、TB、OAK

この2つのグルーピング結果がかなり面白いのは、ゲーム結果がある程度予測できることだ。
例えば、アナハイムとカンザスシティの対戦があるとすれば、どちらもア・リーグ屈指の「スイングしたがりチーム」なわけだから、必然的に打ち合いの空中戦になる、と予測が立つわけだ。

また、今年ア・リーグ中地区でクリーブランドが強いわけだが、今年のCLEはかつてのような大味な野球ではなくて、細かい野球をやり出していることが、このグラフでハッキリした。
同じ中地区のデトロイトは、ア・リーグ屈指の「ボールを振らず、ストライクを振ってくるチーム」だが、けしてスイング抑制系のチームカラーではない。
シアトル、クリーブランド、タンパベイ、オークランドの4チームのスイング率は似たようなものだ。だから、「チームカラーが似ているはず」と思うかもしれないが、ストライクをスイングする率はオークランドが飛びぬけている。ずっと貧打と言われ続けてきたオークランドだが、このデータから今年のオークランドが「いやに打てている」という直観が、単なる偶然ではないことが、よくわかる。
ア・リーグ西地区は、スイングしたがるアナハイム、ヒューストンと、スイングを控えるオークランド、テキサス、シアトルの構成だが、明らかにオークランドとテキサスが頭2つくらい抜けていることは、このグラフだけでわかるというスグレモノだ。

ちなみにヤンキースだが、あらゆる意味で「中庸」といえる位置にある。めちゃくちゃにスイングするわけでもなく、かといって、ボールを見逃して出塁することに命をかけているわけでもない。
だからこそ、今のヤンキースは攻守のバランスで首位を保っているチームなのであって、このチームを「スラッガーの集まった打撃型のチームとみなして語る」ことになど、何の意味もない。あるわけがない。


こんな、たったこれだけのわずかな差が、チームカラーと、チームの打撃効率、ひいてはチームの予算効率を左右するのが、野球というスポーツの繊細さだ。

damejima at 10:31

November 18, 2012

11月はMLB各賞の発表シーズンなわけだが、どういうものか、今年のア・リーグMVPを巡っては、「受賞すべきなのは、三冠王ミゲル・カブレラではなく、マイク・トラウト」と、執拗に主張したがる人たちがいて、細々と論争が行われた。(結果は、いうまでもなくカブレラが受賞)

ブログ主に言わせれば、こんな論争に意味などない。今年のア・リーグMVPは他の誰でもなく「ミゲル・カブレラ」で決まりであり、議論の余地など最初からなかったからだ。
2012年のヤンキースは、もしシーズン終盤のイチローラウル・イバニェスの貢献がなかったら地区優勝すら無かったわけだが、もしデトロイトにカブレラがいなかったら、たとえバーランダーがいても、地区優勝もワールドシリーズ進出も無かった。
こうした「印象度の強さ」に加えて、カブレラの打撃の穴の無さは、「主観を数字に置き換えただけの指標ごっこ」よりもずっと雄弁に、カブレラの仕事のスケールの大きさを物語ってくれた。

フィルダーとカブレラを比べるだけも、わかりそうなものだ。『オクトーバー・ブック』というブログ記事で書いたように、カブレラが今シーズン果たした仕事の大きさは、打撃の欠点が露呈したフィルダーとは比べものにならない。
もし仮に、守備負担の少ない一塁手であるフィルダーがカブレラを上回るホームラン数を残して、カブレラが三冠王達成を逃していたと仮定しても、ブログ主は、トラウトではなく、カブレラがMVPに選ばれるべきだと思う。


トラウトがア・リーグMVPを受賞すべきだという主張を頑として曲げたがらない人々が本当に主張したがっていたことは、実は「ア・リーグMVPを誰が受賞すべきか」という話ではなくて、しかも非常に手のこんだロジックが使われている。
彼らが主張したかったことは、本当は「トラウトがMVPを獲得すべきだ」という単純なことではなくて、「『WARの数値が最も高いトラウト』にMVPを受賞させるべきだ」ということであり、これはつまるところ「自分の信じている『WAR』という指標の価値を、もっと高く評価せよ」という意味になる。
つまり彼らは「指標で野球を語っている自分の『正当性』を、他人に押し付けようとしている」わけで、これではまるで宗教の押し売りのようなものだ。


最初にハッキリ言っておくと、「WARというシステムが、現状であまりにも不完全すぎるのが原因で、今シーズンのミゲル・カブレラの活躍度を正確に測定できない」としても、それを理由にカブレラのMVP受賞を執拗に批判するのは、完全に筋違いである。
カブレラの受賞はなにも、セイバー系でない野球記者の野球についての思考方法があまりに古いためではない(そういう印象を植え付けようとするネット上の言動も感心しない)。また、セイバーメトリクス関係者だけが数字の本質をわきまえていて、野球という謎の解読に有史以来はじめて初めて成功したわけでもない。


いつのまに、「数字を知っていることが、最も偉いことだ」などという勝手な思い込みがひとり歩きするようになったのか。

言わせてもらえば、今のWARの完成度の低さなら、その測定精度は、セイバーメトリクス派ライターたちが主張したがる「WARの正当性」より、ずっと、はるかに、低い。そしてWARには出来損ないの部分がいまだに多い。
なのに、どうしてまた「この完成度の低い指標を使う人間だけが、野球を正しく語っていることになる」と思いこめるのか、そこが理解しかねる。


数字になっていさえすれば、それがイコール客観的という意味になる、わけではないのである。
たとえ「ある事象を数字に還元して表現できた」としても、もしそれが未熟な測定システムなら、それは単に「『個人の主観』を『数字』に置き換えて、客観的にみせかけているだけの未完成品」に過ぎない。
「数字」が発達している(と思われがちな)MLBですら、実はこうした「主観を数字におきかえただけ」という指標が、いまだに掃いて捨てるほどある。それらの「未完成な数字」は、いつのまにか自分勝手に権威をふりかざすようになってきているわけだ。

つまりはこれ、「老化」が始まっているということなのだ。



WARという指標が、チーム貢献度をあますところなく数字におきかえて表現できている、とは、まったく思わない。(以下にいくつか理由を書く)

WARは、レギュラーシーズン中の活躍をシチュエーションを捨象して走攻守にわたってとらえ、量的に示そうとする数値なわけだが、ことMVPという賞に関しては、シチュエーション、つまり「その選手の活躍がどのくらい重要な場面で行われたか」という観点や、「その選手の活躍時期がどのくらい重要な時期にあたっていたか」という観点は重要だ。

いいかえると、「WARキング=シーズンMVP」とする観点には、もともと無理がある。というのも、WARはプレーそれぞれの重要度抜きに数値が決定されているからであり、そのWARをもとに決めるMVPこそが「本当の客観的なMVPだ」なんて、わけのわからないことを言われても、「まったくそうは思わない。アホか」としか言いようがない。
「WARキング=MVP」だと、どうしてもいいたい人は、自分で勝手に「WARキング」という賞でも作っておけば済む。ただそれだけの話だ。

そもそも、例えば併殺打をいくつか打つと、それで決勝タイムリーの数値すら消されてマイナスになるようなわけのわからない指標は、そもそもMVP選考に使うのには明らかに向いてない。

もし将来、WARがもっと発達して「レギュラーシーズンを通じた、走攻守のチーム貢献度を100パーセント示せる指標」なんてものが完成したとしても、だからといって、「数字を元に選ぶのが客観性というものであり、客観性に基づくのが本当のMVPというものだ」なんていう歪んだ発想を、全員が共有しなくてはならないなどとは、まったく思わない。

いや、むしろそういう「硬直しきった発想」に断固反対していきたい。
野球とは、必然と偶然のゲーム、カオス的な事象を含むゲームだ。ならば、野球のすべてがリニアかつ量的に表現される時代など、来るわけがない。



例えば、セイバーメトリクス系ライターのひとり、Joe Poznanskyは、このところこんな主旨の記事を書いている。
American League MVP vote was going to be close between Triple Crown winner Miguel Cabrera and WAR winner Mike Trout.
Joe Blogs: MVP (The Aftermath) 太字はブログ側で添付


Joe Poznanskyは好きなライターのひとりで、クレバーな人だと思っているが、こと「マイク・トラウトこそ、ア・リーグMVPにふさわしい」という執拗な主張の中身には、ちょっとこじつけが多すぎる。

たとえばPoznanskyはテッド・ウィリアムズの例を挙げて、こんなことを言っている。
1942年にボストンのテッド・ウィリアムズは三冠王になった。だが、この年のア・リーグMVPを獲得したのは、ヤンキースのジョー・ゴードンだった。MVPはテッド・ウィリアムズが受賞すべきだったし、もっと言わせてもらえば、1941年と1947年のMVPも彼が獲得するべきだった。
What's known about measuring value -- and what isn't. | SportsonEarth.com : Joe Posnanski Article
もうちょっと詳しく書くと、Poznanskyは、ボストンの打撃専門外野手で守備の上手くないテッド・ウィリアムズを、「三冠王を獲得したのにリーグMVPを受賞できなかったサンプル」として挙げておいて、さらに「テッド・ウィリアムズは三冠王達成シーズンの1942年にMVPを獲れなかったが、1942年のMVPは彼が獲るべきだったし、他の年度でも彼がMVPであるべきだったシーズンがある」と主張している。

ならば、Poznanskyは三冠王ミゲル・カブレラについても、「三冠王を獲ったカブレラは、テッド・ウィリアムズのケースと同じように、彼こそがリーグMVPにふさわしい」とでも主張するのか、と思えばそうではないのだから、困ったものだ。
Poznanskyが主張しているのは、こうだ。
2012年カブレラは、1942年三冠王のテッド・ウィリアムズとは違う。なぜならカブレラのWARはリーグ最高ではないからだ。1942年のテッド・ウィリアムズはMVP受賞にふさわしいが、2012年のカブレラはふさわしくない」という、ややこしい話になる。

Poznanskyがこのロジックにおいていかに巧妙に「WAR最高!」と主張しているか、理解できただろうか。非常に『ズルさ』を感じさせるやり方を彼はしている(以下に書く)。



WARは本来、走攻守を総合評価できる評価手法だったはずだが、そもそもたかが「フェンウェイのレフト」に過ぎなかった平凡な外野手テッド・ウィリアムズが、WARの数値が本当に高かった選手、つまり「走攻守揃った選手」だとは、とても思えない
「1942年のテッド・ウィリアムズのWARが高すぎる原因」はたぶん、WAR算出において、テッド・ウィリアムズの守備面のマイナス評価をあまりにも低く抑制し過ぎている、つまりテッド・ウィリアムズの守備が過大評価されていることにあるだろう。

要するにPoznanskyは、2002年以降にUZRがWAR算出に使われだす何十年も前の「算出手法が怪し過ぎるテッド・ウィリアムズの過大評価のWAR」を引き合いにして、ちゃっかり、カブレラのMVP受賞に反対し、裏ではWARの正当性を補強する材料として利用しているのだ。こういうのを「マッチポンプ」という。


かなり手のこんだギミックだが、まったく感心しない。
論理として、都合が良すぎる。



たしかに、1942年のテッド・ウィリアムズは三冠王であると同時に、WAR数値も高い。
Fangraph版では、テッド・ウィリアムズ12.1に対し、ジョー・ゴードン9.3。Baseball Reference版では、テッド・ウィリアムズ10.2で、ジョー・ゴードン7.8。
つまり、三冠王テッド・ウィリアムズは、打撃スタッツだけでなく、WARでもゴードンを上回っていた。だからこそ、Poznanskyはこの何十年も前の古いサンプルを持ち出してきて、「テッド・ウィリアムズはオッケーだが、ミゲル・カブレラはダメだ」と言っているのだ。


だが、三冠王テッド・ウィリアムズが1942年のリーグMVPを受賞できなかったのには、ジョー・ゴードンこそリーグMVPにふさわしく、テッド・ウィリアムズはふさわしくない、と多くの野球人が考えるに至る理由が、「数字以外にも存在した」からであり、それは打撃タイトルの数や、WARの数値とは関係ない。
ちなみに、テッド・ウィリアムズが高い打撃スタッツを残しながらもリーグMVPを受賞できなかった1940年代の数シーズンの原因は、打撃成績ではなく、野球記者との不仲が原因だったといわれている。他にも、もちろん、1942年にゴードンのヤンキースがボストンに9ゲームもの大差をつけてリーグ優勝したことや、ゴードンの守備ポジションが、「フェンウェイのレフト」程度の「楽なポジション」ではなく、苦労の多いセカンドであったことなども関係しているだろう。
いくら同じ「フェンウェイのレフト」だったカール・ヤストレムスキーが7回もゴールドグラブを受賞しているとはいえ(ヤストレムスキーの7回のゴールドグラブにしたって、補正を厳密に適用して測定しなおせば、必ずしもゴールドグラブに値する守備だったと言えるかどうかわからない)、大飛球を必死に追いかけてキャッチする必要もなく、外野手が試合を左右するミスを犯す可能性も非常に低い「フェンウェイの安易なレフト」で、それも平凡以下レベルの外野手といわれたテッド・ウィリアムズの「フェンウェイのレフト守備」を高く評価する人間などいない。


問題を絞ってみよう。
テッド・ウィリアムズとカブレラの違いがWARにあるとPoznanskyは暗に示唆しているわけだが、WARは本当にテッド・ウィリアムズの走攻守を正確に測定できているだろうか。
そして彼のWARは本当に高かったのか?



そもそも、WAR算出に使われる守備指標のひとつUZRは、レンジ・ファクターを改良する意味で2001年に提唱されたわけだから、それ以前の時代にはない。
例えば、FangraphのWARでは、2002年より前のWAR算出についてはUZRを適用していない。だから厳密にいうなら、UZRから算出することのできる近年のWARと、古い時代のプレーヤーについて計算したWARに、「完全なデータ連続性」が保証されているわけはないのだ。
Baseball Referenceにも、第二次大戦前のプレーヤーについてWARを掲載しているわけだが、テッド・ウィリアムズの1942年当時の守備データのかなりの部分は「空欄」になっている。つまり、この当時のWARは「詳細なデータが欠落しているのを承知したまま、仮のものとして算出している」のである。

ブログ主は、この10年間にUZRから算出されたWARでさえ、それが確かなものだとは思わないし、まして、1942年のWARが今のWARと同じ精度をもつ、なんて思わない。
それはそうだろう。昔のMLBプレーヤーの守備データなんてものについて、詳細かつ正確なデータが存在するわけはないのだ。当然のことだ。
言わせてもらえば、「1942年のテッド・ウィリアムズのWAR」なんてものが正確に計算できたわけがない。古い時代の選手のWARなんてものは、「後世の人間が、仮に計算した参考数値の域を出ない」のである。
にもかかわらず、WARを産出するにあたっては、正確な守備指標も必要なはずだが、各データサイトは、守備数値が必ずしも明確に算出できそうにない時代のプレーヤーについてもWARというやつを計算しているわけだ。
大昔のプレーヤーのWARとかいう「アテにならない数値」をもとに、テッド・ウィリアムズとミゲル・カブレラを比べてアレコレ言ってみても、何もはじまらない。


むしろ、UZRができて以降の例でいうなら、なぜPoznanskyはテッド・ウィリアムズなどではなく、イチローを挙げないのか、と思う。

イチローがシーズン最多安打記録を更新した2004年のWARは、Fangraph版で7.1だが、この年ア・リーグMVPになったウラジミール・ゲレーロのWARは、6.3しかない。「イチロー以下」だ。
もしPoznanskyのような人たちが「WARはリーグMVPを数字的に説明できる唯一の根拠だ」としつこく主張したいのなら、ステロイダーのミゲル・テハダはそもそも論外だという意味で2002年のミゲル・テハダ、WARが低い2004年のウラジミル・ゲレーロ、同じくWARが低い2006年ジャスティン・モーノーは「リーグMVPにふさわしくない」こと、そしてイチローはこれまで、まだUZRがWARの算出に適用されてなかった2001年のア・リーグMVPだけでなく、2002年、2004年、2006年と、合計で4回リーグMVPに選ばれていてもおかしくなかった、とでも、強く主張してもらわなければ困る。
Fangraph版 WAR
年度 イチロー リーグMVP受賞者
2001  6.1  6.1(イチロー 同じ年のAロッドは7.8)
2002  4.5  4.7(テハダ)
2003  5.6  9.3(Aロッド)
2004  7.1  6.3(ゲレーロ)
2005  3.4  9.1(Aロッド)
2006  5.4  4.0(モーノー)
2007  6.0  9.7(Aロッド)
2008  4.6  6.7(ペドロイア)
2009  5.4  7.9(マウアー)
2010  4.7  8.4(ハミルトン)
Ichiro Suzuki » Statistics » Batting | FanGraphs Baseball


この際だからハッキリしておきたいが、
そもそもWARという「未完成な指標」の算出方式には不備が多すぎる。

例えば、「ポジション補正」。

WARの算出においては、その選手の守備ポジションによって、数値をプラスしたりマイナスしたり、「補正」を行うわけだが、この「補正」は基本的に、どんな形状のボールパークであっても「同じ数値を補正する」のがスタートラインになっている。センターが「プラス2.5」、レフトとライトは「マイナス7.5」だ。

この補正手法にブログ主は納得してない。あらゆる外野手について同じ補正をして計算を開始する行為は、今となっては「あまりにも時代遅れ」だ。
あらゆる地域に、どれもこれも似たような形のボールパークが次々と建設されていった1970年代頃の「クッキーカッタースタジアム時代」ならいざ知らず、新古典主義以降のボールパークは、球場ごとに、「形状」も「広さ」も異なる
とりわけ、外野手に関して言えば、ボールパークの形状によって、守備の難易度は大きく変わる。ボールパークごとに、「守りの難易度」はまるで違ってくるのである。
レフトが広くて守りにくい球場もあれば、逆にライトが広大な球場もある。フェンスが固い電光掲示板になっていて非常に危険な球場もあれば、フェンス形状が複雑な球場、いろいろある。

にもかかわらず、WARは、算出のスタートラインとして、センター「プラス2.5」、レフトとライトは「マイナス7.5」と、一律に同じ補正数値を適用して算出を開始するのだが、これでは出発的からして、そもそもおかしい。いかにも野球をやったことがない人が考えそうなことだ。
補正設定が大きく間違っていれば、補正をさらに補正しても、修正しきれないケースが当然出てくる


実際、この「ポジション補正の基本的欠陥」を、どう後処理しているかというと、ポジション補正を、さらにシーズンごとに手を加えて再補正している。つまり「補正の補正」を加えている。
例えば外野手テッド・ウィリアムズの1942年の「ポジション補正」は、基本は「マイナス7.5」だが、「補正の補正」後は「マイナス6.5」になっている。つまり「補正の補正」で、プラス1ポイントを「こっそり加算」しているわけだ。

同じく、二塁手ジョー・ゴードンは、基本が「プラス2.5」で、「補正の補正」をプラス3.9ポイント受けて、「プラス6.4」になっている。いかにゴードンの守備が上手かったかが、わかる。
ゴードンの「補正の補正」の数値の大きさから、「ただ打てるだけの打撃専門レフト、テッド・ウィリアムズ」と違って、ゴードンが「打てて、守備もいいバランスのとれた選手だった」ことがわかるわけだ。


もしWARが走攻守を正確に判定できるのなら、本来はジョー・ゴードンのWARはもっと高いはずで、テッド・ウィリアムズより高くても妥当だと思う人がいても、まったく不思議ではない。
もし、仮にだが、詳細な守備データの存在しない古い時代のWARを算出した人間が、テッド・ウィリアムズの1942年の守備について「もっと大きなマイナス評価」を下していれば、「1942年のテッド・ウィリアムズとジョー・ゴードンのWARの差」なんてものは、やすやすと逆転するのである。
ここらへんがWARの「主観的な」ところだ。この程度のものを絶対視だなんて、とんでもない。


イチローに関しても、「あれだけ広大に広いセーフコでプレーし、しかも神業的守備を披露し続けてきたのだから、さぞかし守備の補正が効いてプラス補正されているだろう」と思うかもしれない。
だが、そんなことはない。Fangraph版WARをみればわかる。
WAR算出において、イチローの大半のシーズンの守備評価は、あれだけ守備で貢献したというのに、ライトの基本数値である「マイナス7.5」からほとんど「補正の補正」によるプラスはされていないのだから、腹が立つ。
2007年の補正値がプラス1.6になっているのは、このシーズンはセンターを守っていたからで(1339.1イニング)、センターの基本数値は「プラス2.5」なわけだから、2007年のイチローの守備補正値「プラス1.6」は、なんと基本数値「プラス2.5」から、0.9もの「マイナス評価」を受けていることになるのだ。(センターとライトを半々くらい守った2008年に関しても似たようなものだ)
ライトを守ったシーズンでも、イチローの守備に関する最終評価値は、ライトの基本数値「マイナス7.5」からほとんどプラス補正されていない。2004年、2005年などにいたっては、「マイナス7.5」と「マイナス7.6」であり、ライトの基本数値である「マイナス7.5」から、まったくプラス補正されていないのである。
これは数値上、名手イチローのこれまでの守備が、たかが「フェンウェイのレフト」でしかないテッド・ウィリアムズ以下だった、という評価になっているのだから、WARの守備評価なんてものがいかに馬鹿馬鹿しいかがわかる。まったくもって腹立たしいかぎりだ。

上のほうで、もし「WARでMVPを決めるべき」だというのなら、そもそも2002年、2004年、2006年にMVPを獲るべきだったのはイチローだ、という話をしたが、WARという指標がプレーヤーの「守備」について、いかにきちんと評価していないか、いかに誤った主観的な補正が行われているか、イチローの例でわかろうというものだ
たとえで言えば、イチローの強肩を頭にいれた対戦チームのランナーがホーム突入を最初からあきらめた(いわゆる「抑止力」というやつ)などという事象を、WARなんて曖昧で主観的なものが、きちんと算入できている、わけがない。

WARは、走攻守を総合的に評価している「フリをしている指標」だが、むしろ、WARで「走塁」や「守備」についての基本評価、あるいは「走塁」や「守備」の補正値があからさまに低く抑えこまれているのなら、WARという指標はかえって「単に打てるだけの選手」を高く評価する指標にしかならない。これでは、まったく意味がない。

そのくらいのこと、気づかいないで、どうする。

Fangraph版 WARにおける
イチローのポジション補正値

年度 イチロー
2001 -7.2
2002 -7.0 (WAR イチロー4.5 MVPテハダ4.7)
2003 -7.0
2004 -7.6 (WAR イチロー7.1 MVPゲレーロ6.3)
2005 -7.5
2006 -5.1 (WAR イチロー5.4 MVPモーノー4.0)
2007 1.6
2008 -3.2
2009 -6.7
2010 -7.5



さらに「パークファクター」という補正手法について書く。
「パークファクター」は非常にフェアな補正手段であり、指標算出には不可欠な存在、と思いこんでいる人が多いかもしれない。
だが、以前に書いたように、「パークファクター」というもの自体がいまだに対戦チームの影響なのか自軍の影響なのかが区別がつかないあやふやなものなのだから、これさえ補正に使っておけば、あらゆる数値がフェアにできる、などと言えるわけではない。そこを多くの指標が忘れている。
Damejima's HARDBALL:2011年11月10日、「パークファクター」という数字の、ある種の「デタラメさ」。


テッド・ウィリアムズの例、イチローの例からわかるのは、むしろ、「しょせん今の時点のWARの完成度は相当に低い」ということだ。


数値の構造全体にしても、WARが「走攻守をトータルに評価する」と標榜していながら、実際のところは、打撃に置かれている重心はいまだに重いものがあって、守備は補正が大きすぎて軽視されがちだ。

「補正」すること自体はいいとしても、バランスを大きく欠いた大きな数値を適用している「ポジション補正」の例からわかるように、数値レンジの大きすぎる補正行為は、WARの算出結果そのものを大きく左右する。

たとえば、WARの最大数値は大きくプラスに振れるMVPクラスの選手でも、「プラス10」程度くらいにしかならないが、その一方で「ポジション補正」は「プラス12.5」から「マイナス17.5」まで、「プラスマイナス30もの広い数値レンジ」を持っている。
本数値と補正値をくらべると、補正値のほうが振幅がずっと大きいわけだから、これは「選手の活躍そのものよりも、指標の補正行為のほうが、WARに対する影響が大きい」ということを意味しかねない。
これでは「いくら選手が1年間必死に活躍しても、その活躍の評価は、WARの構造そのものにある歪みと、補正計算にひそんでいる主観性によって、簡単に消されてきたのではないか?」ということになる。

長々と書いたが、いいたいことをまとめよう。
ミゲル・カブレラのMVPにグダグダ文句つける前に、
まず自分たちがWARの欠陥を直せ。

考える、という行為には、かなりのエネルギーを要する。
今セイバー・オヤジたちのやっていることは、まがりなりにエスタブリッシュに成功したが、いまだに指標は未完成なままなのに老化が始まってしまったという、奇妙な「未完成な子供の老化現象」だ。世間はいまだにOPSだのWARだのパークファクターだの言っているわけだが、数字で語りたいならグダグダ言ってないで、アタマ使って、もっとマトモなものを持って来い、と、言いたい。

damejima at 04:29

April 09, 2012

たまにウェブを検索していると、特にセイバー系とか自称する、数字で野球を語るウェブサイトやブログで、次のような「相関係数を使ったと自称する笑い話」に出くわす。こういう「鼻高々に間違えたことを発言しているサイト」は案外多い(笑)

チームの四球数と得点数の相関係数を調べると
両者にはかなり強い相関関係がある。四球は重要。

四球とシングルヒットとで、得点との相関係数を調べると、四球の相関係数のほうがよりが大きい。だから、四球のほうが、より得点力への関連が強い。


(このネタ、さまざまなバリエーションがある。比較対象をシングルヒットではなく「打率」にするパターンもあれば、総得点を使う人、平均得点を使う人もあるようだ。まぁ、話のくだらなさに差はない。だいいち、彼らの主張する「得点と四球の相関」の相関係数は0.7以下程度しかないのだから、決定係数は0.5以下しかない。つまり事象の半分以下しか説明できないわけで、こんな低い相関関係の、どこをどう間違うと、「四球は野球の戦略上、重要」だの言い切れるのか、気がしれない)

得点総数と四球総数を照らし合わせた程度のくだらない作業、それも低い数値の相関から、何か真実が見えてくる、わけがない。


例えばこんな計算をしてみる。

チーム総得点と総RBIの相関(2011ア・リーグ)

これ、何かというと、
2011年ア・リーグ全チームの、総得点数と、総RBI(打点)数を、グラフ化したものだ。

相関係数(r)=0.996851
決定係数(r2 つまり相関係数の2乗)=0.9937


相関係数と決定係数が、ほぼ「」である。
これが何を意味するか。わかる人には、わかるだろう。
チームの得点数とRBIは、
 ほぼ完全な相関関係にある
ということだ。得点とRBIの相関関係が決定的なのがわかれば、当然のことながら、次の結論は間違いなく正しい。
チームの得点力というものは、RBI、
 つまり打点にほぼ完全に依存して決まる


相関係数で得点相関をうんぬんしたいなら、
打点こそ王道であり、打点こそ正義である。


と、まぁ、とりあえず書いてみる(笑)
すると、どうなるか。
もちろん興味の無いほとんどの人はこんな計算など無視する。それはいいとして、中には、相関係数とかいう手法の「ものものしさ」に負け、よく考えてみもせずに鵜呑みにしてしまう気弱な人もいれば、逆に、自分の先入観にまみれたまま、何も考えもせず反対してくるアタマの悪い人もいる。


「得点とRBIのほぼ完全な相関関係に、どういう意味があるか」という議論それ自体は、実は無意味ではない。それどころか、かなり面白い議論ではあるのだが、それはそれとして、上のグラフの目的は、そこではない。
単に「相関係数を使って、どれだけ、あたかも自分の出す結論が正しいように見せかけることができるか」を、「やってみせている」だけの話。まぁ、一種の「手品の種明かし」みたいなものだ。


例えば、いくら得点とRBIの相関係数が、たとえ「完全な相関」を意味する「1」に近いとしても、「野球というスポーツにおいては、RBIだけが重要」なんて子供じみた単純な結論にはならないのが、野球という現象の複雑さであり、統計とかいうやつ本来のややこしさだ。
AとB、2つの事象の相関係数が十二分に高かったからといっても、AとBの相関関係がすぐに判明するわけではない。相関係数の判定の難しさについては、Wikiにも書いてある。

AとB、2つの事象の相関関係には、少なくとも以下の3パターンある。
「A が B を発生させる」
「B が A を発生させる」
「第3の変数C が A と B を発生させる」


たとえ「得点と打点の相関係数」が「カンペキな相関関係」を意味する数値を叩きだしたとしても、例えばだが、「得点でもない、打点でもない、『第3の要素』が、得点と打点を同時に変化させている可能性」についても、きちんと検証を終えることができないかぎり、得点と打点の相関関係をパーフェクトだと言い切るわけにはいかない、のである。

まして、決定係数0.5以下という、全体の半分の事象すら説明できないような数値に無理矢理ヘリクツをつけて、得点と四球の相関が野球というスポーツの法則ででもあるかのようなことを語っているようでは、まるでお話にならない。冷笑にも値しない。


別の例をみてみる。
ここに1シーズンで、同じ四球数、同じ得点数を稼いだ2つの野球チーム、AとB、があるとする。
Aでは、四球の20%が得点にからんだ。
Bでは、四球の80%が得点にからんだ。

こういうことは、十分ありえる。
たとえ見た目の総得点数と四球数が同じでも、四球数のどの程度の割合が得点にからむか、なんてことは、そのチームの攻撃スタイルや、打線の構成によって左右される。
(もちろん、日本野球における四球に対する感覚が、そのままMLBで通用するはずもない。四球のランナーを送りバントで得点につなげようとする日本と、MLBとの間にある根本的な野球文化の違いも、大いに考慮してモノを言うべきだ)

まとめれば、得点にからむ四球もあれば、全く無関係な四球もある。そのパーセンテージは、相関係数からは、まったくわからない、ということだ。 当然の話だ。

以下に挙げる例も含めていうと、
総得点が多い(あるいは少ない)こと、
総四球数が多い(あるいは少ない)こと、
この2つの数値の数学的関係を、相関係数を使って語る(もしくは騙る)行為そのものに、実は、意味が無い
のである。

(よく考えればわかることだが、「数値と数値の間に一定の相関係数を見出す」ために必要な「2つの数値」というのは、実は全く無関係な数値同士でも全くかまわない。例えば右肩上がりの2つの数値、例えば「マグロの消費量と、リンゴの価格」をもってくれば、両者の時系列変化が右肩上がりで似ているという、たったそれだけの理由から、両者に一定の相関係数がはじき出せてしまう可能性があり、その結果、「マグロの消費にはリンゴの価格が大いに関係している」と結論づけることくらい、まったく難しくない。
言い換えると、「相関係数」は、2つの数値系列の配列パターンが相互にどれだけ「似ているか」をパーセンテージとして示しているだけで、実は「結論の正しさをまったく保証などしていない」ということだ)

また、こういうこともありえる。
1シーズンに500個の四球を挙げた2つのチーム、AとBがあるとする。
Aの総得点が500点
Bの総得点は700点

1シーズンに850得点を挙げた2つのチーム、AとBがあるとする。
Aの四球数が600個
Bの四球数は450個


実際、2011年のア・リーグにおいて、こういう対照的な2チームが存在した。
ヤンキース 867得点 627四球(リーグ1位)
テキサス  855得点 475四球(平均以下)


こういう実例を示しても、「それはヤンキースとテキサスのようなコンテンダーが、統計上の例外にあたるだけで、得点と四球の強い相関関係に『例外』は寄与しないのだから、特殊な2チームの成績など、検討する価値はない」とか、なんとか、わけのわからない反論をしてくる根っからの数字馬鹿が必ず現れるだろう(笑)
いや。ぜひ現れて、積極的に笑いモノになってもらいたい(笑)

そういう、数字だけで野球を語れると勘違いする発想こそ、スポーツを体感したことのない、ホンモノの「数字馬鹿」だ。



実際の野球の最前線は、0.5以下の弱い決定係数が想定する偏差の範囲、数値レンジなど越えた領域に、本来の価値がある。相関係数など飛び越えられるチームでなければ、優勝などできないのである。

リーグ優勝であれ、ホームラン王や首位打者などのタイトルであれ、「飛びぬけた成績を納めることで、スポーツのトップに君臨する」ことを実現するのは、まさに「積極的に『例外』を目指す、つまり、人のしてないことを実現する行為」そのものだ。
「平均的、統計的に行動する」という生ぬるい思考方法から、トップに君臨できる選手やチームなど生まれない。
「他の追随を許さない独自のチームコンセプト」や、「常識はずれの多額の予算」、「飛びぬけた天才プレーヤーの集結」、「無敵の先発ローテーション」、「飛びぬけたトレード戦略」、そういった「特別さ」をしっかりとキープできもしないチームが、「数学的平均」とやらに沿った行動様式を採用していて、他チームを置き去りになど、できるわけがない。
統計上の偏差の中に納まる生ぬるいプレイを重視すれば、得点が伸びて、順位が上がる、などという馬鹿げた発想は、ただの数字遊びであり、もはやスポーツですらない。


だが、世間によくいる「相関係数の単純な計算結果を提示することで、四球の重要性を持ち上げたつもりになっている輩」というのは、「相関係数さえ計算しておけば、四球の得点に対する影響力が全て計算し尽された」ように思いこんで世間に発表したりしているわけだから、本当に始末が悪い(笑)
古くからあるOPS信仰と同じで、これは本来「野球をネタにした、デキの悪い笑い話」のひとつで、こんなのは、ただの「薄っぺらな数字ごっこ」だ。
ダメ捕手、城島健司。The Johjima Problem.:指標のデタラメさ(OPS、SLG、パークファクターなど)

書いたご当人は、大真面目にこういうおかしなを信じて書いているのだとは思うが、いまだにああいう誰でも薄っぺらさが理解できるギミックを信じて野球を見ている輩がたくさんいると思うと、このブログもまったくもって安泰だ。なんの心配もいらない。好きなことだけ書いていれば、永遠に揺るぎない(笑)
こういう子供じみた数字遊びがいまだに堂々とまかり通っているのを見ると、「やっぱり『自分のアタマを使って考えることのできる人』は、実はほとんどいないのだな」と、いつも思う。



2011年にワールドシリーズに進出したテキサス・レンジャーズは、得点数はア・リーグNo.1レベルだが、そのことが特徴的なのではなくて、「ワールドシリーズ常連だったア・リーグ東地区のコンテンダーになかった、『ほとんど四球に頼らない得点パターン』を追求して、成功をおさめ、彼らからワールドシリーズ常連の座を奪い去ったこと」、ここに特徴がある。
それは、ホームランと四球の両立を追求したが、実際には得点力を大きく低下させてしまい、投手力でなんとか持ちこたえただけのタンパベイ・レイズとも、低打率ではあったがホームラン攻勢で得点数をなんとか維持できたヤンキースとも、待球を強く指示して四球と狭い球場を生かした2塁打で例年得点を伸ばすワンパターンなレッドソックスとも違った、四球大好きな東地区にない、ユニークなチーム・コンセプトだ。
(また、ヤンキースのようなチームにありがちな高い得点力と四球の多さの相関にしても、「四球が原因で、得点が結果」と、一義的に言い切れるわけではない。逆に「得点が原因で、四球が生まれる」、例えばホームランへを警戒しすぎて四球が増えるだけで、実際には、ヤンキースの得点に対する四球の本当の寄与度は、実は他チームと変わらないか、低い可能性だって無いわけではない。「事象A が 事象B を発生させている」のか、逆に「B が A を発生させている」のかは、相関係数だけで判明するわけではない)

むしろ、ユニークな攻撃パターンをとって勝ち進んだテキサスの855得点の全パターンを調べ、どの得点に、どう四球がからんだか、また、それぞれの得点において四球が果たした役割を積み上げる形で具体化することでもしないかぎり、もともと相関があるかどうかさえハッキリしない四球総数と得点総数の関係を、子供のままごとのように並べて相関係数を計算する程度の簡単なデスクワークで、「相関係数、高いでちゅね」だの、「打率より四球のほうが得点相関が高い」だのなんだの、寝言を言ってもらっては困る。


ちなみに、出塁率の高低にしても、チームごとの格差をもたらしているファクターは、四球数ではない。この点については、既に一度指摘した。もう一度書いておこう。
四球と打率とで、出塁率とより強い相関関係にあるのは、四球ではない。「打率」である

「一方で出塁率が大事だといい、他方では四球が大事だという、都合のいいデタラメな論理」は、とっくの昔に破綻していることがわかっている。もし「出塁率を向上させることが大事だ」とか言い張り続けたいのなら、打率を重視すべきと発言するのでなければ、スジが通らない。

2011ア・リーグ 打率と出塁率の比例関係(ホーム)
2011ア・リーグ 打率と出塁率の比例関係(ホーム)

2011ア・リーグ 打率と出塁率の比例関係(ビジター)
2011ア・リーグ 打率と出塁率の比例関係(ビジター)

ダメ捕手、城島健司。The Johjima Problem.:2011年9月3日、チームというマクロ的視点から見たとき、「出塁率」を決定している唯一のファクターは「打率」であり、四球率は無関係、という仮説。


あと、蛇足としていうなら、
得点の重み、必要度というものは、チームによって異なる。得点パターンも、目標とする点数も、チーム事情によって違う。いいかえると、チームによっては、無限に得点が必要なわけじゃなく、必要なだけ得点があれば十分というチームもある

例えば、先発投手に大きなウエイトを置くチームAでは、得失点1点の重みが重く、1試合あたり3点程度挙げておけば、先発投手が毎回完投してくれて、それなりの勝率が挙げられるかもしれない。
また、投手にあまりウエイトを置かず、毎日のように打撃戦を戦っているようなチームBでは、1点の重みは軽く、細かい野球など必要ないから、四球とホームランだけを狙っていく戦略が通用するかもしれない。
もちろんテキサスのように、チームによっては、四球などなくても大量点が入れられるチームもある。(だからこそ、テキサスはユニークで、ユニークだったからこそチャンピオンなのだ。マネーボールも、ボストンも、テオ・エプスタインも、もはやユニークでもなんでもない)
スラッガーを並べて四球と長打だけを狙い、大量点獲得を目指す打撃優先チームもあるかもしれないし、四球や盗塁を元に必要十分なだけの得点を狙う投手優先チームもあるかもしれない。また、四球のランナーに盗塁させるチームもあれば、そうでないチームもある。


四球の生かし方なんてものは、チーム事情によって異なる。


同地区のライバルのチームコンセプトと比較して、どう戦うとより勝ち星が増えるかも考えなくてはならないし、結局、問題なのは、非常に複雑な選択肢の中から、どれをどう選択すると最大の効果が得られるか、だ。平均的、統計的にやっていれば勝てるなんていう、なまぬるいやり方など、通用しない。
Copyright © damejima. All Rights Reserved.

チーム総得点と総ヒット数の決定係数
(2011ア・リーグ)

チーム総得点と総ヒット数の相関(2011ア・リーグ)

チーム総得点数と総ホームラン数の決定係数
(2011ア・リーグ)

チーム総得点数と総ホームラン数の決定係数(2011ア・リーグ)

damejima at 17:38

January 04, 2012

このシリーズでは「OPSのデタラメぶり」を書き続けてきている。

「種類も数値レンジも違う率と期待値を、足し算する」という、OPSのデタラメなコンセプトそのものが、もともとお話にならないものであることについては、もはやコメントする必要もない。

OPSの基礎数値のひとつであるSLGは、「長打率」と誤訳されることが多いが、実際には、単なる「打数あたりの塁打期待値」を計算しているに過ぎず、長打力そのものを示す数字でないのはもちろん、打者の得点力を直接示す数値でもない。(例:「塁打数」を計算するだけの数字であるSLGにおいては、ホームランを「」と価値評価するが、打者の得点力の統合的な算出を目指すwOBAの計算においては、ホームランにSLGの約半分、「1.95」の価値しか与えていない)

さらにSLGには、打数減少によって数値が動く欠陥がある。これは、たとえ長打がまったく増えなくても、例えば四球増加によってSLGおよびOPSを「みせかけだけ増加させることができる」という意味であり、指標として致命的欠陥といえる。

また「四球によるOPSの多重加算」は、単にOBPとSLGに二重加算を行うばかりではなく、バッターのホームラン数や四球数によって加算率が勝手に変化し、打者のタイプごとに違う率で「水増し加算」が行われる。

これらのどれもが指標として致命的といえる欠陥だが、これらの欠陥の全てがOPSという1点に集積された結果、OPSにおいては「バッターごとに、異なる判定基準が適用される」という異常事態になっている。これは、モノを測定する基準であるはずの「指標」というものにあってはならない決定的な欠陥であり、もはや救いようがない。
単一で偏りの無いのモノサシを使って選手のプレーを測定し、選手相互を比較するのが「指標」というものの基本的役割だが、「判定に使うモノサシそのものが、打者ごとに偏る指標」など、指標として意味がなく、OPSのようなものを指標と呼ぶことすらおこがましい。

OPSの計算プロセスは、一見すると単純そうに見えるが、その実、裏側では、「SLGにおける単なる塁打数の計算結果を、それがあたかも打者の得点力の表現ででもあるかのように読みかえつつ、ホームランバッター(あるいは四球の極端に多い打者)など、特定打者に対してのみ、数値が、多重、かつ、水増しされて加算される悪質な仕組み」になっていて、「ヒットですらない四球と塁打数を、長打力にみせかけて」いる

見かけ倒しのデタラメ指標であるOPSは、得点力や長打力を示すと詐称されてきたわけだが、OPSが実際にやっていることは「数値詐欺」、「指標ドーピング」と呼んでも、なんらさしつかえない。OPSはまさしく「汚れた数字」である。

ダメ捕手、城島健司。The Johjima Problem.:2011年12月20日、率と期待値を足し算している「OPSのデタラメさ」 (1)「OPSのデタラメさ」の基本を理解する

ダメ捕手、城島健司。The Johjima Problem.:2011年12月21日、率と期待値を足し算している「OPSのデタラメさ」 (2)小学生レベルの算数で証明する「OPS信仰のデタラメさ」

ダメ捕手、城島健司。The Johjima Problem.:2011年12月22日、率と期待値を足し算している「OPSのデタラメさ」 (3)OPSにおける四球の「二重加算」と「ホームランバッター優遇 水増し加算」のカラクリ



さて、ここまでOPSの「汚れた計算」を、主に「リクツ面」から説明してきたが、こんどは「ホームラン20本前後のハンパなスラッガーの打撃スタッツ」を例に、現実の打者において、OPSというデタラメ数字が、いかに四球数をみせかけの長打力に「すりかえているか」という実例をみてみる。
OPSという「打者によってモノサシの目盛りが変わる、デタラメな指標もどき」が多少マトモに機能するのは、ホームラン数の似た打者同士を相互比較するときくらいであることは、このシリーズの記事で書いてきたことをじっくり読み返してもらえば、誰でもわかると思うが、そのホームラン数が近いバッター同士の比較においてすら、OPSは現実にはまるで機能しない。以下に示すとおり、わかるのは単に、四球数をOPS数値にすりかえて長打力にみせかけるOPSのデタラメさだけだ。


以下の3グループは、2011シーズンのア・リーグの日本でもよく知られた打者のうち、OPSにおける四球の多重加算の恩恵を受けやすいホームラン数20本前後のバッターを取り出し、OPSの違いによってグルーピングしたもの。
(3つのOPSグループのスケール感をイメージしやすくする意味もあり、日本人打者から城島と松井を加えた。もちろんグループB以下に属する彼らの打撃成績の空疎さも、以下の記述から明確になる。また、以下では特に言及しないが、今回取り上げるホームラン20本前後のバッターにおける「四球によるOPS多重加算の率」と、ホームラン数の大きく異なるバッターのOPS加算率は、異なることに注意が必要だ。ホームラン数が多いほど加算率は高い一方、アベレージヒッターの加算率は低く抑え込まれている)

結果は見てのとおり。
いちいち説明しなくても意味はわかるだろう。

3つのOPSグループ間の「OPS格差」をもたらした要因は、OPSの特徴であると詐称されてきた長打の差ではない。「OPS格差」をもたらしたのは、「四球数」だ。

自分で計算してみれば誰でもわかることだが、例えば「二塁打数の差」程度では、これほどのOPS格差は生じない。(言うまでもなく三塁打の数の差も、さらにたかがしれている。二塁打については、詳しくは記事下部の計算例A、計算例Bをさらに参照されたい)
いいかえると、中途半端なスラッガーにおけるOPSなんてものは、打者ごとに大差のある「四球数」を、OPSのデタラメ計算を通じて、それがあたかも「長打力の差」ででもあるかのように「見せかけている」だけに過ぎないのである。


グループ A
〜OPS.600中盤まで
打率が極端に低く。四球も極端に少ないのが特徴
城島(2008)  7本 .227 19四球 19二塁打 OPS.609
リオス     27本 .227 27四球 22二塁打 OPS.613
オリーボ    19本 .224 20四球 19二塁打 OPS.641
ウェルズ    25本 .218 20四球 15二塁打 OPS.660
---------------------------------------------------
グループB
OPS.700〜.800あたり
四球50〜60個。二塁打20本〜30本
セクソン(2007)21本 .205 51四球 21二塁打 OPS.694
松井       12本 .251 56四球 28二塁打 OPS.696
スモーク     15本 .234 55四球 24二塁打 OPS.719
リンド       26本 .251 32四球 16二塁打 OPS.734
城島(2007)  14本 .287 15四球 29二塁打 OPS.755
アップトン    23本 .243 71四球 27二塁打 OPS.759
ハンター     23本 .262 62四球 24二塁打 OPS.765
城島(2006)  18本 .291 20四球 25二塁打 OPS.783
---------------------------------------------------
グループC
OPS.800以上
四球(60〜80)と二塁打(30〜40本)がともに多い
カダイアー    21本 .284 48四球 29二塁打 OPS.805
ゾブリスト    20本 .269 77四球 46二塁打 OPS.822
スウィッシャー 23本 .260 95四球 30二塁打 OPS.822
ユーキリス   17本 .258 68四球 32二塁打 OPS.833
クエンティン   24本 .254 34四球 31二塁打 OPS.838
ロンゴリア    31本 .244 80四球 26二塁打 OPS.850
アビラ      19本 .295 73四球 33二塁打 OPS.895



グループ間の「OPS格差」をもたらしたのが「二塁打数の差ではない」ことについて、ちょっと説明しておこう。

OPSのようなデタラメを信仰している人はいまだに多い。だから、こうして目の前に数字を見せつけられても、まだ「二塁打数に差があれば、OPSに差がつくのが当たり前だろが?」とか鼻息荒く怒鳴り散らしたがる頭の悪い人もいると思う(笑)「あらあら。残念でした」と言うほかない(笑)

なぜなら、
10本やそこらの二塁打の差くらいで、計算上、これほどのOPS格差は生まれようがない
からだ。

下記の計算例Aを見てもらってもわかることだが、「10本ちょっとの二塁打数の差」は、OPSにおいては「10を少し越える程度」の「塁打数の差」という意味にしかならない。この「10ちょっとの塁打数の増加」は、OPSの計算プロセスでいうと、「SLGを算出する割り算における分子である、総塁打数が10くらい増える」という意味なわけだが、10やそこら塁打数が増えたとしても、その程度の数字の変化では、3グループ間にこれほどの「OPS格差」がつく主原因にはならないのだ。



ここまで書いてもまだ納得がいかない人のための過剰サービスとして(笑)、以下に「OPSに影響するのが、二塁打数ではなく、四球数である」ことを示すための2つの計算例を挙げておく。

計算例Aは、二塁打の増加でSLGがどの程度の数字レンジで変化していくかを見るためのものであり、計算例Bは、四球数の増加でSLGがどう変化するかを見るためのものだ。
これら2つの計算例から、四球数の計算例Bで、OBPとSLGが同時加算され、しかもSLGが水増し加算されて増加することにより、結果的に「二塁打よりも、四球のほうが、OPS数値がはるかに大きく動くという、OPSのデタラメと異常さ」を、しっかり自分の目で確かめるといい。

計算例A 二塁打数増加にともなうSLGの変化
SLGの変化を見えやすくするため、四死球、三塁打、犠飛はゼロとし、打数600(=フルシーズン出場)、ヒット総数180、ホームラン20本の打者で、二塁打の数が、20本、30本、40本のときのSLGの変化を計算する。
現実の野球的に即して考えて、「二塁打数が増えても、ヒット総数自体は180本で、変わらない」ものとする。

二塁打20本のときのSLG
=(140+20×2+20×4)÷600
=塁打総数260÷打数600
=0.433
(このとき出塁率は180÷600=0.300だから)
OPS=OBP+SLG
   =0.300+0.433=0.733

二塁打30本のときのSLG
=(130+30×2+20×4)÷600
=270÷600
=0.450
(OBP=180÷600=0.300から)
OPS=0.300+0.450=0.750

二塁打40本のときのSLG
=(120+40×2+20×4)÷600
=280÷600
=0.466
(OBP=180÷600=0.300から)
OPS=0.300+0.466=0.766


計算例B 四球数増加にともなうSLGの変化
SLGの変化を見えやすくするため、三塁打、死球、犠飛はゼロとする。打数600、ヒット総数180、ホームラン20本、二塁打20本、シングルヒット140本の打者が、四球数ゼロ、20、40、60、80のときのSLGの変化を計算してみる。

四球数がゼロのとき
SLG=(塁打総数140+20×2+20×4)÷打数600
=260÷600
=0.433
(このときOBP=出塁数180÷打席数600=0.300)
 OPS=0.300+0.433=0.733

四球数が20のとき
SLG=(140+20×2+20×4)÷(600−20
=260÷580
=0.448
このときOBP=(180+20)÷600=0.333だから
OPS=0.333+0.448=0.781

四球数が40のとき
SLG=(140+20×2+20×4)÷(600−40
=260÷560
=0.464
このときOBP=(180+40)÷600=0.367だから
OPS=0.367+0.464=0.831

四球数が60のとき
SLG=(140+20×2+20×4)÷(600−60
=260÷540
=0.481
このときOBP=(180+60)÷600=0.400だから
OPS=0.400+0.481=0.881

四球数が80のとき
SLG=(140+20×2+20×4)÷(600−80
=260÷520
=0.500
このときOBP=(180+80)÷600=0.433だから
OPS=0.433+0.500=0.933


くどくど説明しなくても、もうわかるだろう(笑)

もういちど書く。上に挙げた3つのOPSグループに存在する「OPS格差」をもたらした主原因は、長打力の差でなく、「四球数の大差」であり、四球数の差がみせかけの長打力の差にすりかえられているだけに過ぎない。


MLBで最も多く二塁打を打てるバッターでも二塁打を10本打つには一ヶ月半以上かかるわけだが、計算Aをみればわかるように、たとえ苦労の末に二塁打を10本増やしたとしても、OPSの数値上昇はわずか0.016程度に過ぎない。
それに対して、計算Bからわかるのは、四球が20増えるごとに、OPSは0.050も増加するという「異常な事態」である。これがデタラメでなくて、なにがデタラメか。

いかにOPSというデタラメ数字が、長打と無関係な原因で増加するか、そしてひいてはハンパなスラッガーたちが、いかに「数字で甘やかされているか」が、本当によくわかる。
もし、MLBの球団が単純にOPSに応じて選手の給料を査定しているとしたら、ブログ主が打者なら、苦労してヒットや二塁打を積み重ねるより、四球だけを狙ってOPS数値を稼ぎつつ、月にほんの数本程度のホームランで体裁だけ整えて、高い給料とレギュラーポジションを確保しようと考える。そりゃ、そうだ。苦労して二塁打を40本打つより、四球を増やすほうが楽に決まっている。

まったく、くだらない。


もう一度まとめる。
四球数を、多重加算、かつ、水増し加算する「OPS計算のカラクリ」は、長打数増加など「問題にしない」くらい、四球増加によって大きくOPSを動かす。このデタラメ数字の、どこが「長打力を示す数値」なのか。
例えば上に挙げたグループAのバーノン・ウェルズ、ミゲル・オリーボと、グループCのニック・スウィッシャーでは、四球数に60以上もの大差がある。ここまでの大差になると、OPSというデタラメ数字においては、二塁打数のほんのちょっとした差などまったく意味をなさない。OPSとは、そういう指標だ。(グループCの打者が全てたいした打者ではないという意味ではない。また、個人的な好みを言っておけば、31本ホームランを打った割に低打率で四球でOPSを稼いだだけのエヴァン・ロンゴリアは別にどうでもよく、アレックス・アビラ、ベン・ゾブリスト、ニック・スウィッシャーなどの残した数字のほうこそ優れたものだと思う)

また、「現実の野球」にとって重要なことは、グループAとグループBの間に、実は本質的な差はほとんどない、ということだ。
総合的にレベル以上のスタッツを残したグループCと違い、グループBの打者は、ちょっと打撃の歯車が狂うだけで、すぐにグループAに転落する可能性がある。原因はもちろん、AとB、2つのグループ間に本質的な長打力の差などないことだ。AグループとBグループの差を作っているのは、長打力ではなく、単に「一時的な打率」や「四球数」だ。Bグループの打者は、頼みの綱にしている四球がちょっと減少すれば、たとえホームラン数が減らなくても、すぐに劣悪なグループAに転落する。こうした実例は、野球をよく見ているファンなら、両手で足りないほどの選手を思い出せるはずだ。

OPSというのは、そもそもが「ホームランをほめちぎるために作られた」指標だと思われるが、このデタラメ数字は、実は「現実の野球」においてはまるで機能していないことが本当によくわかる。



さて、ここからは今回の余談。

こうした「数字で甘やかされたハンパなスラッガー」(特にグループAとB)について考えてみてもらいたいことは、他にもある。

これらの様々な「ホームラン20本前後のバッター」のシーズンごとの打撃成績に、上昇と下降をもらたす要因は、次の2つのうち、どちらか?
1)ホームラン数の増減
(つまり、20本のホームラン数が、40本とか50本に増える、あるいは10本以下に減ること)
2)四球の増減


ブログ主の意見は、当然、「後者」だ。


よく、今年20本のホームランを打った中堅スラッガーが、来年は40本のホームラン打つ可能性がある、などと、現実離れしたことを夢想したがる人をみかける。

だが、ブログ主はそんな風に現実の野球というスポーツを考えたことは、ただの一度もない。
ホームラン20本前後がキャリアの天井である中堅スラッガーなら、上に挙げた3つのグループの間を、ただただ行ったり来たりするだけでキャリアを終わるのが「現実の野球」というものだ、と思って野球を見ている。
ミゲル・オリーボやダメ捕手城島程度の打者が、突然ミゲル・カブレラや、アルバート・プーホールズといったホンモノのスラッガーになって、ホームラン40本、打率3割の打者に変身することなど、絶対ありえないのが「現実の野球」だ、というのが、ブログ主の意見だ。
(ついでに言うなら、ドーピングでもしない限り、打率.260のバッターが突如として打率.330を打つことなど、絶対ありえないし、シーズン8勝10敗の投手がいきなり20勝投手になったりはしないのが、現実の野球だ、と、ブログ主は思っている)


たしかに「(ドーピング無しに)40本以上のホームランを打った経験のある、天性に恵まれたホンモノのスラッガー」なら、いつの日か50本、60本を打てる可能性が秘められている、とは思う。それは間違いない。

だがブログ主がよく問題にする「低打率のホームランも20本程度の平凡なスラッガー」には、そんな可能性を微塵も感じない。
彼らはホンモノではない。彼らには「天井」があるからだ。天井が低いから、バットを振り回す。振り回す割に、当たらない。
実は、彼らのコストパフォーマンスは非常に悪いのだ。
そして始末が悪いことに、ハンパなスラッガーたちの得点効率の悪さ、コストパフォーマンスの悪さは、OPSのような古くてデタラメな数値ではつかまえきれない

平凡なスラッガーは、「もしかすると、という期待感」だけで分不相応な大金を稼ぎながら、全盛期にだけホームランを20本前後打ちつつ、四球で成績をもちこたえさせながら、やがて老化によって引退に向かっていく。それが「現実の野球」のハンパなスラッガーの実態だろう。

彼らハンパなスラッガーのOPSが「それなり」に見えるのは、単に「OPSそのものが、デタラメだから」であって、20本程度のホームラン数の打者のOPSは常に四球によって偽造されている。それは、「長打率と詐称しているが、実は得点力とは直接何の関係ない、塁打期待値SLG」と「デタラメそのもののOPS」が、まやかしの高い数値をはじきだすために、まるでシーズン中に長打ばかり打って大活躍していたように見せかける「数字によるスラッガーの甘やかし」に過ぎない。


こうした「OPSというデタラメ数字によって能力が高く見せかけられているだけに過ぎない、ハンパな中堅スラッガーの打撃能力の過大評価」という問題は、もちろん球団低迷にも深く関係する。
近年、日米を問わず「数字と効率とコストを重視した球団経営」が盛んだが、頼りにするべき数字を元から間違えることによって、かえって「コストパフォーマンスが悪く、弱い、不人気低迷チームが続出している」ように見える。

例えば、球団が、ハンパなスラッガーたちの「四球でOPS数値を稼いだだけの、みせかけだけのスラッガーイメージ」を過大評価して、彼らの「みせかけだけの打撃スタッツ」に過剰なサラリーを払えば、どうなるか
中軸打者への過剰投資はチームの予算を硬直化させる原因になるだけに、大金で獲得した割に、かえって得点力の無い、弱いチームが出来て、その無様さが古くからの地元の野球ファンを失望させ続けるという「数字重視とか称するチーム運営によって、かえって、チーム力が長期にわたって損なわれるという悪循環」が生まれる。

このところ野球の現場に、数字好きの人間、というより、数字に脳をやられている人間が増え過ぎた割には、やはり彼らは、結局のところ現実の野球には疎く、まして選手の能力評価に使う数字といえば、「シチュエーションのまったく違う他人が、思いつきで昔作ったが、今となってはガラクタになりつつあるデタラメなOPSのような数字」なのでは、どうしようもない。


そう。
元をただせばは、OPSも、単に、野球好きの素人が作った「そのオッサン好みの数字」に過ぎない。OPSなどというデタラメに大金を投資するのは、馬鹿げているを通り越して、もはや球団の自殺行為だ。

Copyright © damejima. All Rights Reserved.

damejima at 15:26

December 23, 2011

「率と期待値を足し算しているOPSのデタラメさ」を書いてきたこのシリーズ記事で何度も強調しているように、OPSには何重にも「ホームランバッターを優遇する、数字の水増しカラクリ」が仕込まれている。

そのデタラメなカラクリは、ひとつだけではなくて、むしろOPSの計算プロセス全般に何重にも折り重なって仕込まれた悪質な仕組みである。この特定打者にのみ多重加算を行なう悪質なカラクリの大半は、通称「長打率」などと、実態にまるでそぐわない名称で通称されているSLGに仕込まれている。

SLGによって算出される数字は、何度も書いているように、単なる「打数あたりの塁打期待値」に過ぎない。また、ましてやSLG、ひいてはOPSは、「得点期待値」ではない
それは、単なる塁打期待値に過ぎないSLGでは、ホームランを塁打数4と計算することから単純にわかる。SLGではホームランにシングルヒットの4倍もの評価を与えるわけだが、得点期待値におけるホームランの評価は、もっとずっと低く、例えば「wOBAにおけるホームランの得点期待値は、シングルヒットの約2倍程度」に過ぎない。得点期待値の計算においては「ホームランにシングルヒットの4倍もの数値を与える」などという馬鹿げた行為は行われていない。

以下の記事(3)では、四球の影響をこそこそと多重加算しているデタラメ指標OPSのデタラメさを、小学生でも理解できる簡単な計算によって明らかにして、「OPSは、その打者の得点力を表す」などというデタラメがウソ八百であることを示す。

ダメ捕手、城島健司。The Johjima Problem.:2011年12月20日、率と期待値を足し算している「OPSのデタラメさ」 (1)「OPSのデタラメさ」の基本を理解する

ダメ捕手、城島健司。The Johjima Problem.:2011年12月21日、率と期待値を足し算している「OPSのデタラメさ」 (2)小学生レベルの算数で証明する「OPS信仰のデタラメさ」


SLGについての日本のWikiに、こんな記述がある。
長打率は四死球による出塁数を反映しないという欠陥があり、打者の総合的な打撃評価には必ずしも当たらないとする主張もある。
長打率 - Wikipedia


誰が書いたのか知らないが、アホらしいにも程がある(笑)
「SLGは四死球による出塁を反映しない」だと?(笑)
打席数からではなく、「打数」を分母にした割り算で計算されるSLGが、「打数」を思い切り左右する「四球」の影響を受けないわけがあるかっ(笑)馬鹿なことを言うな。
以下、そのことを小学生レベルの簡単な計算でわからせて差し上げよう。


いま、仮に次のようなバッターがいるとして、四球数ゼロ、60個、120個の3ケースで、それぞれのOPSを計算してみる、とする。
ホームランバッターAのケース
打席数600 ヒット総数150本
(うちホームラは30本。余計な要素を省くため、残り120本のヒットは全てシングルと仮定。また、犠打、犠飛、打撃妨害、走塁妨害は「ゼロ」と仮定) 


四球ゼロの場合
(四死球、犠打、犠飛、打撃妨害、走塁妨害が無いため、600打席全てが打数になる)
OPS=OBP+SLG
=(150÷600)+(240÷600)
0.2500.400
0.650

四球60個の場合
(四球増加により出塁数は60増える一方で、打数は60減少し、540になる)
OPS=OBP+SLG
=(210÷600)+(240÷540)
0.3500.444
0.794

四球120個の場合
(四球増加により出塁数は120増える一方、打数は120減少し、480になる)
OPS=OBP+SLG
=(270÷600)+(240÷480)
0.4500.500
0.950

一目瞭然だ。
赤色で示したSLGの増加傾向を眺めればわかるように、四球増加によるOPS加算は、OBPについて行われるだけでなく、「打数の減少」を介して、SLGに「二重に加算」されている。

(それにしても、たとえホームランを30本打っているバッターですら、もし四球が無いとなると、こういう、しみったれたOPS数値が出る(笑) これは、「OPSはバッターの長打力を表す」とかいうOPS信仰、OPS礼賛が、いかにウソっぱちであり、また、いかにOPSが「四球によって、ホームランバッターのOPS数値だけを水増しして加算するデタラメ指標」に過ぎないか、よくわかる。
「四球のまったく無いホームランバッター」のOPSが低いのは、この四球増加によるOPSの二重加算、水増し加算の恩恵を受けないからであり、ホームランだけでは、実は、OPS数値はたいして伸びない、のである。
現実の野球において、ホームランバッターのOPS数値を大きく伸ばしているのは、実はホームランによる塁打数の増加そのものよりも、この「二重加算」「水増し加算」される「四球数」だったりする。このことは次の記事で書く)

1)四球増加によるOPSへの加算は、OBPだけでなく、打数の減少を経由して、SLGにも「二重加算」されている
2)この「四球増加によるOBP・SLGへの二重加算」は、四球1個あたりに均等に加算されているのではない。また、あらゆるバッターに均等に加算されているのでもない
3)上の例でもわかるように、「四球数が増える(=打数が減る)」につれ、「四球増加による二重加算」は、加算される数値が加速度的に増やされていく。つまり、「四球が増えれば増えるほど、加算されるSLGが大きくなって、OPSが増加しやすく」なっていく。


ほんと、OPSは呆れたデタラメ指標だ。
上の計算において青色で示したOBP(出塁率)は、四球がゼロ、60、120と増加していくにつれて、0.250、0.350、0.450と、「均等に」増加する。
それに対して、赤色で示したSLGは、まったく違う。四球数がゼロから60になるときには 0.444−0.400=0.044の増加であるのに対して、四球数が60から120になるとき 0.500−0.444=0.056と、「増加量自体が加速度的に増えて」いく。
これが「OPSの算出においては、四球が増えれば増えるほど(=打席が減れば減るほど)、SLGへの二重加算が加速されていく」ということの意味のひとつである。


話はまだまだ終わらない。


同じ計算を、さきほどはホームラン30本のホームランバッターで計算したが、違うタイプ、例えば総ヒット数は同じでホームラン10本のバッターについて計算してみると、違う結果が得られ、それによってさらに興味深い「OPSのデタラメぶり」がわかる。
こんどの計算では、ホームラン数を「10本」に減らしてみる。このバッターBでも、四球数ゼロ、60個、120個の、3つのケースで、それぞれのOPSを計算してみる。
アベレージヒッターBのケース
打席数600 ヒット総数150本
(うちホームランは、こんどは30本ではなく、「10本」とする。余計な要素を省くため、残りのヒット140本は、全てシングルヒットと仮定。また、犠打、犠飛、打撃妨害、走塁妨害は「ゼロ」と仮定)


四球ゼロの場合
(四死球、犠打、犠飛、打撃妨害、走塁妨害が無いため、600打席全てが打数になる)
OPS=OBP+SLG
=(150÷600)+(180÷600)
0.2500.300
0.550

四球60個の場合
(四球増加により出塁数は60増える一方、打数は60減少し、540になる)
OPS=OBP+SLG
=(210÷600)+(180÷540)
0.3500.333
0.683

四球120個の場合
(四球増加により出塁数は120増える一方、打数は120減少し、480になる)
OPS=OBP+SLG
=(270÷600)+(180÷480)
0.4500.375
0.825


ホームランバッターAと、アベレージヒッターBの「四球増加にともなうSLGへの加算の大差」を観察すると、このOPSというデタラメな指標がいかに「打者を歪んだ視点で評価しているか」が非常によくわかる。

ホームランバッターA
四球数ゼロ 0.400
60個    0.444(四球ゼロのときより+0.044増加)
120個    0.500(四球60個のときより+0.056増加)

アベレージヒッターB
四球数ゼロ 0.300
60個    0.333(ゼロのときより+0.033増加)
120個    0.375(60個のときより+0.042増加)

打者Aと打者Bにおける「SLG二重加算量の格差」
ゼロ→60 (打者A)0.044−(打者B)0.033=0.011
60→120 0.056−0.042=0.014

SLGの数値における「0.011の差」というのは、この仮計算の打数・ヒット数の設定においては、およそ「シングルヒット約7本分程度」に相当する。いいかえると、打者Aと打者Bがゼロから60個に四球を増やしたとき、OPSというデタラメ指標は、勝手に「打者Aにだけ」シングルヒット7本分にも及ぶアドバンテージを与えているのである。
つまり、打者Aと打者Bは「同数の60四球を増加させた」にもかかわらず、打者Aは打者Bに対し「まったく何もしてないのに、シングルヒット7本分くらいのアドバンテージをもらっている」のである。逆に打者Bは、同じ数の四球を増加させたにもかかわらず、さらにシングルヒット7本程度を加えないとSLGが追いつけない、わけのわからないハンデを押し付けられている、ことになる。



2つの異なるタイプのバッターの比較をしたことで、SLG数値の二重加算パターンが、バッターのホームラン数によって、これほどまで違っていることの意味は、誰でもわかるだろう。

四球数増加に応じてOBPとSLGが同時に加算されるのが「四球増加にまつわるOPSの水増しのカラクリ」のひとつなわけだが、この「二重加算」は「あらゆる打撃成績のバッターに均等に数値が加算されるようにできているわけではない」のだ。
(もちろん、こうしたデタラメな現象は、ホームランバッターとアベレージヒッターの間にだけ起きるわけではなく、ホームランを40本打てるバッターと、20本しか打てないバッターの間でも、同じように起きる。
だが、このホームランバッター優遇水増し加算の恩恵を最も大きく受けるのは、ホームランが40本以上打てて3冠王にも手が届くような「打率の高い、ホンモノの才能に満ち溢れた、ホンモノのスラッガー」ではなく、ホームラン10数本から20数本の低打率のハンパなスラッガーたちであることは明らか。このことは次の記事で書く)


もう一度まとめなおしておこう。

こうしたデタラメなことが起きるのは、もちろん、SLG算出のための割り算における分子(=総塁打数)が大きいバッターほど、分母(=打数)の減少による恩恵を多く受けるからだ。

1)四球が増えれば増えるほど(=SLG算出割り算における「分母」である「打数」が減れば減るほど)、SLGにおける四球の二重加算は加速していく。つまり、四球の多い打者ほど、わずか1つの四球でより多くのSLG数値が水増し加算され、OPSは「みせかけだけの増加」をみせる
2)総塁打数(=SLG算出割り算における「分子」)の多いホームランの多いバッターになればなるほど、SLGにおける四球の二重加算は加速していく。つまり、ホームランの多い打者ほど、わずか1つの四球でより多くのSLG数値が水増し加算されるようになり、OPSは「みせかけだけの増加」をみせる
3)こうした「二重加算」、「水増し加算」のカラクリによって、「ホームランバッター」「四球の多いバッター」「打数の少ないバッター」のOPSは、より有利な条件で「四球増加による、OPSの加速度的な加算」の恩恵を受ける


ちなみに、「打数が極端に少ないケース」において、このOPSのデタラメなカラクリがどう働くかを、少しだけ示しておこう。
例えば、1試合4打数におけるOPSの数値変化を、手計算してみればいい。
打数が極端に少ないケースにおけるOPSのカラクリ
仮に、4打数1ホームランの打者Aと、4打数1安打でシングルヒットの打者Bがいたとして、もし、凡退した3打数のうち、ひとつだけ四球を選んだ、としたら、OPSがどう変わるか、計算してみる。
打者Aにおいて、最初「塁打数4÷打数4」だったSLGの計算は、四球を選ぶと「塁打数4÷打数3」に変わるわけだが、このときの分母の数値の変化(=打数減少によるSLGの水増し)による打者AのOPSへの加算数値は、打者Bにおいて、4打数1安打が3打数1安打1四球になることによるOPSへの加算数値より、「はるかに大きい」のである。

打者Aの「四球によるSLG加算」
「総塁打数4」のまま、「打数」だけが4から3に減少
(4塁打÷3打数)ー(4塁打÷4打数)=0.333

打者Bの「四球によるSLG加算」
「総塁打数1」のまま、「打数」だけが4から3に減少
(1塁打÷3打数)ー(1塁打÷4打数)=0.083

打者Aが、わずかひとつの四球を選ぶことで加算されるSLG、0.333は、同じように四球をひとつ増やしただけなのにもかかわらず、打者Bに加算されるSLG、0.083の約4倍も水増しして加算される。
こんな馬鹿げたことが起きるのも、もちろん、分母である打数があまりに小さいと、計算結果に打数減少の影響があまりにも過大に表れるからだ。


こんな、出来損ないのデタラメな数字を、これまで「指標」と呼んできたのだ。呆れるほどの酷さである。四球1個の増加によって引き起こされる数値の加算が、「二重に加算され」、なおかつそれで終わらず、「バッターのホームラン数によって、著しく不均等に手心が加えられ、水増しされている」ような指標に、何の意味もない。
(こうしたOPSのデタラメさを修正するために、あまりにも過大すぎるSLGの数値を、あらかじめ整数で割り算して「小さく」しておいてからOBPに加えるOPSの改良指標がある。(たとえば、SLGを整数3で割ってOBPに加えるのがNOI(New Offensive Index
もちろん多重加算の仕組みをよく考えればわかるように、そんな場当たり的な修正を試みたところで、そんな付け焼刃の計算ではSLGへの多重加算のデタラメさはまったく修正できていないのだから、何の根本的な解決にもならないことは、言うまでもない)


つまるところ、OPSというデタラメな指標は、実は、バッターのタイプ、特にホームラン数の違いによって、バッターの評価基準がバラバラになっている。だから、タイプの違うバッターを相互に比較する能力など、OPSにはハナから無かったのである。
ホームラン数の大きくかけ離れたバッター同士、あるいは、打数の大きく異なるバッター同士について比較しようという場合、バッターによって評価基準がズレるOPSを評価基準に使うことに、まるでなんの意味もない

Copyright © damejima. All Rights Reserved.

(続く)

damejima at 09:43

December 22, 2011

前記事
ダメ捕手、城島健司。The Johjima Problem.:2011年12月20日、率と期待値を足し算している「OPSのデタラメさ」 (1)「OPSのデタラメさ」の基本を理解する


前記事で書いたことは、あまりにたくさんの内容を含むので、さすがにすぐには整理しきれない。要点も非常にたくさんある。
とりわけ「長打率」と間違ったネーミングをされた指標であるSLGは、どうせ馬鹿馬鹿しい間違いと思い込みを生むだけなのがわかっているから、この「率と期待値を足し算しているOPSのデタラメさ」というシリーズ記事の中では、今後は、必要がないかぎり、「長打率」とは表記せず、「塁打期待値(いわゆる「長打率」)」、もしくは単に「塁打期待値」と表記する。

OPS=出塁率(OBP)+塁打期待値(SLG)


この、「率」と「期待値」、2つの性質の違う、しかも、相互に相関を持つ数字を単純に足し算してしまう出来そこないの馬鹿馬鹿しい足し算(笑)がカバーする領域は、実は、限られたものであること、つまり、OPSが現実の野球に沿わない部分は非常に多いことは、前記事で指摘した。
まぁ、いってみれば、日本全国カバーすると口先では豪語しながら、実際には山奥しかカバーできてない携帯電話(笑)みたいなものだ。
例えば、出塁率.300、塁打期待値.500の打者は現実の野球に頻繁に出現するが、出塁率.400、塁打期待値.400の打者は、ほぼ特異点として出現することはあるものの、ほぼ非現実の存在しない打者である。

こうしたことが起きる原因のひとつは、前記事でも指摘したように、現実の打者においては、「出塁率≦塁打期待値」となることがほとんどだ、という事実を、OPSが考慮せずに、というか、意図的に無視しているからなのだが、このことをもう少し簡単な計算で示してみたい。

こんなに「OPS神話の仕組み」をわかりやすく解説するのは、たぶん、このブログが世界初だ。


OPS=OBP+SLG
OBP≦SLG

この式を変形していくと、こんな不等号の式が出来上がる。

OBP×2 ≦ OPS ≦ SLG×2

これ、なかなか面白い。
というのも、いかにOPSが「野球という現実のスポーツを、ある特定の、恣意的視点から見た、デタラメなシロモノか」がわかるからだ。上の不等号式を言葉に直してみるとわかる。こうなる。
OPSの下限はOBPで決まり、上限はSLGで決まる。

前記事で、「出塁率と長打率の数値がほぼ同じ、なんて打者は、ほぼ出現しない」ように、「OPSは最初からできている」と書いたが、まさにその通りの意味になっている。それを以下に説明しておこう。

以下の内容は本来は、ここまでの説明で子供でもわかるはずで、いちいち書くのもめんどくさいが、ここは大事だから、誤解のないように手間を惜しまず、たとえを交えながら明記しておく。


1)現実の野球で、多くのケースにおいて「出塁率≦塁打期待値」なのは、単に「出塁率」ではじき出されてくる数値のレンジが、「塁打期待値」のレンジより小さい、ただそれだけの意味でしかない。大きい数字だからといって塁打期待値SLGのほうが「エラい」わけでもなんでもない。

うまいたとえがみつからないが、たとえば年末ジャンポ宝くじの「当選確率」は、1よりもずっと小さく、小数点以下の数字になるのが当たり前だ。しかも、おそらく小数点以下にハンパない数のゼロが並ぶはずだ。
だが、宝くじ1枚あたりの「当選金期待値」は、まったく違う。「当選確率」の数字レンジよりおそらく大きい(実際に計算したことがあるわけではない 笑)。
だが、たとえ宝くじ1枚の当選金期待値がたった1円であろうと、その数字レンジは「当選確率」よりも、はるかに「数字としては」大きい
。当たり前の話だ。


2)ところが、現実の野球においてほぼ大半のケースで「出塁率」≦「塁打期待値」となることが多いにも関わらず、デタラメなOPS計算においては、「率」である「出塁率」と、「期待値」である「塁打期待値」を、単純に「足し算」してしまう。

もちろん、そこに何の合理性もありえない。
なぜなら、これは、年末ジャンポ宝くじのたとえ話でいうなら、「当選確率」と「当選金期待値」を足し算するという無茶苦茶な計算をやったことになるからだ。
そもそも小数点以下の数字である「当選確率」と、より数字として大きな「当選金期待値」の無意味な足し算なのだから、そこには何の合理性も、現実の野球に対する妥当性も生まれるはずがない。
(たまたまOPSで説明可能なエリアが、OPSのトップクラスにあるのは、「OPSが、最初からそういう有名スラッガーをほめちぎるための指標としてつくられていたから」、ただそれだけだ。だから近年のOPS関連の数値では、すっかりバレてきたOPSにおけるSLGの過大評価ぶりを修正するために「SLGを、割り算で小さくする」という、わけのわからない子供じみた修正方法(例:NOI, New Offensive Index)を導入しているのだ(笑)。もちろん、そんな小手先程度の対症療法で、OPSがもって生まれた先天的な誤謬が修正できるわけもない。まったくもって馬鹿らしい)


ところが、ここからOPSというデタラメ数式において、奇妙な神話が誕生することになる(笑)

3)上で書いたように、数式をいじると「OBPとSLGだけから計算されるOPSは、下限はOBPで決まり、上限はSLGで決まる」。
そりゃそうだ。何度も言うように、OPSはもともと、数字として小さい「率」と、数字として大きい「期待値」を足し算して作られたデタラメな指標だから、そうなって当然だ。

4)だが、そこから奇妙な逆立ちしたヘリクツが、数式から導き出されるのである。「OPSは得点期待値を決めるのだから、他の何よりも偉い神だ。そしてOPSという数字の神の「天井」をより高くしてくれる「長打率」(=実際には塁打期待値)は、他のどんなものよりも偉いんだ。ピキピキ」。
奇妙な「OPS信仰」の始まりだ(笑)たぶん彼らはいまでも焚火の周りで、腰に毛皮を巻いてみんなで奇声を発しながら踊っているんだろう(笑)

こんなワケのわからないことが起こる原因は、もちろん、OPSそのものが「デタラメな計算で作られた」からだ。
年末ジャンポ宝くじの「当選確率」に「当選金期待値」を足し算するという無茶苦茶な計算で出来た数字なのだが、そりゃ、アタマの悪いヒトには数字レンジとして大きい「当選金期待値SLG」のほうが、数字として小さい「当選確率OBP」よりも、「エラく」見えてくる(笑)
こうして、このデタラメ数字がどういう風に出来たかを覚えてない馬鹿な人々がずっとOPSを有難がり続けたために、いつのまにか、「野球では、長打が偉いんだ」「打率なんてクソくらえ」くらいの話にエスカレートする始末(笑)

ところが、話はここで終わらない。

5)実際の野球に当てはめてみると簡単にわかることだが、スラッガーといわれる打者でも、ホームラン数(あるいは長打)などというものは、そう簡単に数を増やすことはできない。それが「現実の野球」、「現実のプレーヤー」というものだからだ。
いや、それどころか、ホームラン数こそ、才能によって、それぞれの打者の上限はほぼ決まっているのが普通だ。20本打ったから、といって、その打者が40本打てるようには「ほぼならない」のが、「現実の野球」というものだ。(このことは次回このシリーズ3番目の記事で具体例を挙げて書く)中堅スラッガーたちがドーピングでホームラン数を増やそうとする事件が跡を絶たないのも、逆にいえば、いかにホームランを打つ能力に上限があり、天井があるか、という反証である。

最初に書いたOPS信仰の神話式の変形である「OPSの下限はOBPで決まり、上限はSLGで決まる」という式に、この「打てるホームラン数の上限は、ほぼ決まってしまっている」ということをあてはめてみると、どうなるか。
実は、「OPSの数字の上限を決めている塁打期待値(SLG)は、実は、そうそう簡単に引き上げることができない」のである。

そりゃそうだ。年末ジャンポ宝くじの「当選確率」と「当選金期待値」を足し算するという無茶苦茶な計算で、自分の都合のいい数字を作っただけでもデタラメな話だが、それに加えてさらに、「当選金期待値」が簡単に上げられるくらいなら、誰も苦労しない。みんな年末ジャンポ宝くじを買って生活できるようになる(笑)
焚火の周りで踊っていたOPS信仰者は、困り抜いてここでハタと踊るのをやめ、みんな、しかめっつらで考えこんだのである(笑)

6)だが、ここで、考え込んでいた一人のOPS信仰者が、ピンとひらめいて叫んだ。
天井が上がらないなら、床を上げてやればいいじゃないか!!!
長打神話に続く、四球神話の誕生である(笑)(なぜ、貧打のオークランドにダリック・バートンみたいな1シーズンかぎりの奇妙な四球専用打者が誕生するか、ジョン・マドンのタンパベイの打者がホームランと四球だけでOPSを稼ごうとする理由、これですべて説明がつく)

彼らの考えはこうだ。
OPSの下限はOBPで決まり、上限はSLGで決まる、だが、SLGが簡単には上げられないなら、四球を増やしてOBPを意図的に上昇させれば、チームとしてのOPSの数字レンジを上昇させて、チームの得点を意図的に上昇させることが可能になるんじゃないか?


そして、悪質なことに、四球数の増加は、「たとえ長打を1本も増やさなくても」、OPSを「みせかけだけの意味で」上昇させる

なぜなら、四球数が増加すると、当然OBPが加算される。これ自体は当然だ。

だが、問題なのは、このOBP増加に平行して打者の「打数減少」が発生するために、「OBPへの加算と平行して、こっそりSLGにも加算が行われる」ことだ。これは明らかに、「四球増加によるOPSの加算」を、見えないところで「二重加算」していることになる。
「塁打期待値SLG」は「総塁打数を、『打数』を分母とする割り算によって算出する数値」だ。だから、なんと、四球数が増えれば、打数減少によってSLG算出のための割り算の分母が減少する結果、「OBPと平行して、SLGにも同時に加算されていく」というデタラメな「二重加算」現象が起きるのだ。
しかも悪質なことに、この「四球数増加によるOPS二重加算」は、あらゆるバッターに均等に二重加算されるのではなくて、むしろ、バッターが長打を打つタイプであるほど加算率が大きく加算されるという意味不明の「不均等加算」のである。(詳しく言うと、「ホームランバッター」や「打数の少ない打者」ほど、この「四球数増加による打数減少で起きるSLG加算」の恩恵を受けるのだが、このデタラメな仕組みについては次の記事で書く)

つまりデタラメ指標OPSには、もともと、「四球増大におけるOBP・SLG同時平行加算によって、四球数増加の影響ををOBPとSLGに二重加算するカラクリ」があるだけでなく、さらには、「ホームランバッターや打数の少ない打者ほど高くOPSを二重加算する「不均等加算するカラクリ」すら備わっているのである。

こんな馬鹿げたことが起きるのも、その原因はもちろん、相互に相関があり、また、数値レンジに差のあるOBPとSLG、2つの指標を、単純に足し算するという馬鹿げた計算方法をとる「OPSのデタラメさ」そのものに根本原因がある。
OPSというデタラメな指標においては、四球数増加の効果は、OBPにだけではなく、SLGにもこっそり二重に加算されている。そればかりか、この「四球増加による二重加算」は、ホームランバッターになればなるほど「加算率が高くなるように」設計されている。
その結果、「四球増加によるOPSの増大があった場合、あたかもホームランバッターが長打を生産したことによって発生するSLG増大がいかにもOPSを押し上げる主要因であるかのようにみせかけるOPS上昇カラクリ」を、OPSというデタラメ指標は常に隠蔽してきたのである。

いってみれば、この「四球増加で、みせかけだけSLGを伸ばすテクニック」は、まさに「数字によるドーピング」といっていい。
こんなまやかしが可能になるのは、OPSという指標が「ほんのちょっと床を上げると、自動的に天井が大きく上がるように出来た、まやかしだらけの家」だからだ。


(笑)

だが残念でした(笑)
既にこのブログで一度書いたように、実は現実の野球における「チーム出塁率」は、「四球」にはほとんど依存しない。現実の野球における「チーム出塁率」を大きく左右しているのは、「四球」ではなく、むしろOPS信仰が排除しようとやっきになってきた「打率」にほとんどを依存しているのである。
だからチーム打率が上昇してこないかぎり、通常、チームの出塁率は上がってこないし、「四球増加によるSLG上昇とOPS上昇のような、みせかけとまやかし」でない本当の意味の打撃の底上げはありえない
ダメ捕手、城島健司。The Johjima Problem.:2011年9月3日、チームというマクロ的視点から見たとき、「出塁率」を決定している唯一のファクターは「打率」であり、四球率は無関係、という仮説。

この不可能とも思われた「チームの四球を無理矢理に増加させる道」を選んだのは、2011シーズンのタンパベイのジョン・マドンだ。彼は確かに、四球数増加とそこそこのホームラン数を同時に実現することを、ほとんどのチームの中軸打者たちに強要したことで、地区2位のボストンを逆転し、ポストシーズン進出をモノにしたが、その結果としてチーム打率は崩壊し、チーム打率の低迷の結果、OBPの上昇はたいしたものならず、またポストシーズンでは惨敗した。当然の結果だ。数字で選手個人の能力と野球そのものを「狭い型に閉じ込めた」のだ。
この記事の最後の部分は、シアトルのズレンシックもウェッジもまったく理解してない。彼らは、主軸にホームラン20本程度打てて選球もできる打者をズラリと揃えているタンパベイと同じ野球ができると、ありもしない夢ばかり見ている。

Copyright © damejima. All Rights Reserved.


(続く)

damejima at 09:43

December 21, 2011

11月に書いた記事で、ビル・ジェームステオ・エプスタイン過大評価ぶり、そして現状の単純すぎるパークファクターの数値としてのいい加減さと、その使われ方のデタラメさについて書いた。

こんどはホームランをもてはやすのによく使われる指標、OPSの「デタラメさ」について、ちょっと書いてみる。

ダメ捕手、城島健司。The Johjima Problem.:2011年11月8日、ボストンの2004年ワールドシリーズ制覇におけるダン・デュケットの業績を振り返りつつ、テオ・エプスタイン、ビル・ジェームス、マネーボールの「過大評価」を下方修正する。

ダメ捕手、城島健司。The Johjima Problem.:2011年11月10日、「パークファクター」という数字の、ある種の「デタラメさ」。


ブログ主は、ホームラン20本程度の打者のうち、低打率で、ただただバットを振り回したがるだけの低脳スラッガーが非常に嫌いだ。
この手のハンパ打者を甘やかすモノの見方をしたがるタイプのハンパな野球ファンは、日本でもアメリカでも、またファンであれメディアの記者であれ、実に多い。彼らは、たとえ打率が2割ちょっとか、2割半ばくらいしかなく、週に1本打つか打たないかのホームラン数でも、なにかシーズン中ずっと活躍していたかのように言いたがる。実にアホらしい。

こういう「デキそこないの子供に大金を与えて甘やかす、デキそこないの、ダメ親」みたいな現象が起きる原因は、たとえばOPSのような、「出来た当初こそ、画期的な部分があると思われたが、時間がたってから見てみると、作った人間の好みの野球の反映にすぎないシロモノであることがバレバレの、まるで都会に戻ったら相手がいかに不細工だったかがわかるリゾラバみたいなギミック(笑)」が、ああいう輩に意味不明の自信をつけさせ増長させた点も見逃せない。
あたかも「現実を数多くプロファイリングし、その積み重ねから野球という現実全体に通用する有用な法則を作りあげた」ように見せかけていたわけだが、実際にやっていることといえば、「単に長打を礼賛したいだけ」のために、「現実は最初から無視して、最初から長打を礼賛したい自分の好みに都合のいいレトリックを作っただけ」だったりするのは、本当に困りものである。



例えばOPSに関する日本のWikiに、次のような記述がある。
「例えば出塁率.400、長打率.400の打者でも、出塁率.300、長打率.500の打者でも、同じ.800という数値が出る。」


もっともらしく書いてある(失笑) 多少野球の数字をかじった人は、「その記述どおりでしょ。何か問題でも?」とか思って読むに違いない(笑)いやー、笑える(笑)馬鹿か、と言いたい。

この記述、実は現実の野球にあてはめると、非常に馬鹿馬鹿しいのである。特に「出塁率.400、長打率.400の打者」なんていう記述の馬鹿馬鹿しさ、数字のまやかしに、これまで誰も気づかなかった。
ちょっと、いつぞや書いた「iPodの原型は、ウォークマンである」というロジックの単純さに似てなくもない。(この「ウォークマンとiPodの件」についても、そのうち続編を書く)
ダメ捕手、城島健司。The Johjima Problem.:2011年10月9日、「iPodの原型は『パソコン』であって、ウォークマンではない」ことが瞬時にわかるのが、「パソコン以降の文化的視点」。


この手の「現実離れした、粗末なヘリクツ」が、日本でもアメリカでも、大手を振ってまかり通ってきた原因は、Wikiを書いた人間のロジックがあまりにも巧妙だから、言っていることの「矛盾」や「あまりにも辻褄が合わない部分」に気づかないのではなくて、むしろ、こういう風に、「数字の側から、野球という現実を見て判断することは、常に正しい」と自分勝手に思いこんでいる馬鹿があまりにも多くなりすぎた、という点にある。
表向きでは「野球という現実を、データとして数多く統計的に蓄積、プロファイルして、その結果の精密な分析からみえてきた法則性を、指標という形式にとりまとめた」ように見せかけているが、その実、実際の算出手法と、その根底にある思考回路は、まるっきり逆だ。
この『数字』にあてはまる『現実』は、野球というスポーツのほんの一部でしかない」のである。


例えば「出塁率.300、長打率.500」という部分だが、それに近いタイプの打者を、この2シーズンのア・リーグの打者から探してみると、2011年でいうと、この設定にかなり近いバッターは、ネルソン・クルーズ(出塁率.312/OPS.509)を筆頭に、J.J.ハーディー(.310/.491)、マーク・レイノルズ(.323/.483)、マーク・トランボ(.291/.477)と、まぁ、けしてサンプル数が無限にあるとまでは言えないにしても、「探せば、有力プレーヤーに何人かサンプルを見つけられる」レベルにはある。また2010年ア・リーグの例では、多少「出塁率.300、長打率.500」という設定からは遠ざかるが、カーティス・グランダーソン(.324/.468)、マイク・ナポリ(.316/.468)と、なんとか数字的に近い打者を見つけることができる。(しかも近年のペナントの行方を左右した選手の名前も多い)

つまり、言いたいのは、「出塁率.300、長打率.500の打者」というレンジ設定は、「野球という現実を、多少なりとも反映している」ということだ。


これに対して、「出塁率.400、長打率.400の打者」という部分については、OPSは同じ.800でも、話はまったく異なる。なぜなら、出塁率.400、長打率.400という設定にあてはまる打者を、ほとんど見つけることができないからだ。
理由はハッキリしている。
出塁率.400、長打率.400なんていう打撃スタッツの打者は、現実の野球には、ほとんどありえない
からだ。出塁率.400、長打率.400などというレンジ設定自体が現実離れしているのである。
(たとえば「出塁率.400、長打率.400の打者」といえるのは、2010年のオークランドの一塁手ダリック・バートンだが、OBP.393、SLG.405 四球110と、あまりにも奇妙な打撃スタッツだ。たぶんこの「ダリック・バートン」なんて名前、おそらく日本のMLBファンの大半が記憶に無く、またこの選手がOPS.800を記録したからといって、ほぼ同じOPSのネルソン・クルーズに匹敵する打者だとは、誰も思わない。さらにダメなのは、バートンが2010年以降も似たような打撃スタッツを続けられるわけがないことだ。つまりバートンの成績には「再現性」が全く無いのである。「再現性」がない現象は、単なる偶然か、ドーピングによる作為でしかなく、それを「法則の一部」とみなことなどできるわけがない。)


どうしてまた、こういう奇妙なことが起きるのか。


これを検討するためには、以下のような諸点などを十分に検討して話を進めていかなければならないので非常にめんどくさい。(だからすべての議論を一度にひとつの記事に詰め込むことは、すぐにはできない)

1)「長打率(Slugging Percentage)」とか「自称」している数字は、そもそも「打数あたりの塁打期待値」である。
長打「率」なんて完全に間違ったネーミングのせいで誤解されているだけで、長打率は「長打だけに関する打率」でもなんでもないのだ。
だいたい、そもそも長打率は「率」ですらない。「期待値」は「率」ではないのだ。また、「長打のみについて抜き出して算出された数字」ですらない。

1の余談)ちょっと細かい話になるが、「シングルヒットでも長打率が上がるから、OPSには欠陥がある」だのなんだのいう「OPS批判にみせかけたシングルヒット批判」は、長打率が本当は塁打期待値で、得点期待値ではないことの意味をちょっと考えれば、それがある種の大ウソに過ぎないことは、すぐにバレる。
塁打数を計算する数値である長打率は、当然ながら「どの種類のヒットを打つか」によって、数値の変化度合は違うわけだが、仔細に見てみると、長打率の仕組みそのものが、主にホームランだけが数値を押し上げる要素になるように「仕組まれた数値」でもある。例えばある打者がある試合で4打数1安打でシングルヒット1本だとして、たとえそのシングルが試合を決める2点タイムリーだったとしても、その日の塁打期待値そのものはたった.250に過ぎない。シングルヒットは長打率を押し下げる要素としてしか計算されないし、また、シングルヒットは塁打計算においては得点期待計算より半分の評価しか与えられない。
そのため、打者の長打率によっては「シングルヒット、場合によっては二塁打を打ってさえも、長打率は下がりさえする」のである。だから、ヒットを打てば打つほどOPSも大きく上昇する、とは限らない。
原因は簡単だ。塁打数としてだけの意味では、ホームランの「4」に対し、シングルヒットは「1」、二塁打は「2」としか評価されず、その一方でそれぞれのイベント発生頻度、つまり、シングルヒットや二塁打の発生度数の多さはまったく考慮されない。だから「シングルヒットが塁打期待値を押し下げる方向にだけしか働かないように設計された数値」においては、「シングルヒットを打てば打つほど、数値が下降」していく珍現象が起こる。逆に「ホームランは、発生頻度が非常に低いのに、数値が大きく上昇する」。そういう風に設計されている塁打期待値を、発明者は恣意的に『長打率』と呼びならわし、しかもあたかも得点期待値でもあるかのような印象づけを試みた、のである。
現実の野球では、シングルヒットに意味がないなどということは有り得ないことなど、あえて言うまでもない。シチュエーションと打者によっては、ホームランより出現頻度の高いヒットのほうが得点期待値が高いことすらある。(例えば第2回WBC決勝)
得点期待値の算出においては、ホームランとシングルヒットの比重が現実の野球に近くなるように考慮されているため、長打率のようなこうしたデタラメは起こらない。

2)長打率の算出根拠は、「塁打数」であるために、近年の打撃スタッツの得点貢献度の算出における計算手法より、ずっとホームランを過大に計算している
そのため、あたかも「長打率 イコール 得点期待値」と他人に思いこませたいだけの悪質なスラッガー好き人間と、ホームランを礼賛したいだけの無能ライターの格好のエサになって、根本的に間違えた議論の格好の材料になっている。
例えばOPSの基礎になる長打率では、ホームランを4、二塁打を2、ヒットを1などとして、打数あたりの「塁打数」を計算するわけだが、こうした「塁打数」は「得点期待値」とイコールではない。例えば「シングルヒットで2点入る」こともあれば、「ホームランで1点しか入らない」こともあるように、「塁打数は、得点期待値には、直結しない」。
例えば近年WARのような指標の計算も盛んだが、ここでも0.72BB+0.75HBP+0.90単打+0.92エラー出塁+1.24ニ塁打+1.56三塁打+1.95HRなどという計算式(これはwOBAの計算方式だが、この加重の方法を絶対的なものと考える必要はまったくない。あくまで例に過ぎない)があるように、得点貢献度の計算においては、ホームランとシングルヒットの得点貢献度の比率は、およそ「2対1」であり、長打率のように、ホームランを「4」、シングルヒットを「1」などと、ホームランとシングルヒットの比率を「4対1」とか、ホームランについて過大な計算をしてはいない。

3)OPSは、2種類の性質も母数も違う数字同士を、単純に足し算しているが、その「違う種類の数字を、足しても問題ない、足しても意味が成り立つ、という根拠」が、まるで明確でない。2種類の性質の異なる数字を、「補正も何もせずに、ただ単純に足し算する行為の正当性がほとんど不明であること」は、数値として「デタラメをやっている」としか言えない。
「出塁率」は「率」であり、「長打率」はグロスの「期待値」である。だから、それぞれの数値の性格がまったく違う。また、この2つの数値は、数値算出のための母数が異なる。また数値がカバーしている現実の野球のレンジも異なる。

4)OPSは、母数が違う数字同士を単純に足し算している。
出塁率の計算における母数は「打数+四球+死球+犠飛」などと、ほぼ「打席数」に近いものだが、長打率の計算の母数は「打数」であり、打席数ではない。

5)OPSは、相互に相関のある数字同士を足し算している。ちょっと考えれば誰でもわかることだが、相互に独立しておらず、相関の存在する2種類の数値同士を、単純に足し算する行為は、数値の算出の元になる素材の「ダブり」を生む
たとえ話として、企業会計にたとえるなら、「打撃能力による収益を、特定部分だけ、重複して計上する」行為だ。当然のことながら、「重複して計上された素材(=例えばホームラン)については、明らかに帳簿上の収支が高く見せかけられている」ことになる。
これは、明らかに「出塁率と長打率の間に隠れて存在する計算素材のダブりを利用したデタラメな手品」である。

また、四球数の増加によって、当然、打数は減少するが、そうなれば当然、「打数を母数に計算される塁打期待値」である「長打率」はモロに影響を受け、増大する。つまり、「たとえ長打数に変化がなくても、四球を増やすことで打数を減らすことによっても、みせかけの長打率を上昇させることができる」し、OBPよりも数値上昇が大きく表現されやすいSLGが上昇すれば「OPSを増加させたようにみせかけることができる」のである。(それはチーム戦略として、勝つためにプレー内容の質と量を向上させる戦略的行為では、まったくなく、単に見栄えのいい数字を得るために数字そのものをいじるだけの「帳簿上の見かけの操作」に過ぎない)

6)OPSは打率を欠陥指標として「打率」を排除したとよく言われる。だが、OPSの計算式の内部では、排除どころか、むしろ打率に依存した一面も持ちあわせている。
例えば、出塁率についてだが、一度このブログで書いたように、「現実の野球におけるチーム出塁率は、実はチームの四球数にほとんど無関係で、大半はチーム打率に依存している」。つまり、「出塁率を左右するのは、結局は打率」なのである。また現実の野球において長打率の意味するところは、実際には打席あたりの出塁可能性でもあることを考えると、現実の野球においては、長打率が打率とまったく無関係と考えるのは馬鹿げている。
つまり、OPSは、タテマエとして打率を欠陥指標として排除したように見せかけているが、裏ではこっそり依存している部分が多々ある
ダメ捕手、城島健司。The Johjima Problem.:2011年9月3日、チームというマクロ的視点から見たとき、「出塁率」を決定している唯一のファクターは「打率」であり、四球率は無関係、という仮説。

7)「出塁率.400で、長打率.400」というバッターがほとんど実在していないことからわかるように、OPSという数字の仕組みで、現実の野球全体が説明できるわけではない。むしろそれどころか、OPSで非常にうまく説明される打者は、実は、非常に限られている。
あたかもOPSが現実の野球のすべてを説明するかのように思われがちだが、実際には逆であり、おそらくOPSの作者は自分好みのリーグのトップクラスのバッターだけしか着目せず、彼らの優秀さを礼賛するのに都合のいい数値を作ってみただけのことであると推定される。

8)細かいことを言えば、現実の野球においては塁打数の計算においてすら、打率が大きく関係してくる。打席ごとに長打を打てるかどうかは、毎打席ごとの確率の問題であり、打率が無関係になることなど、ありえない。
例えば、「600打数の打者が、20本程度のホームランを含め、ヒットを180本打つ」、という行為は、「あらかじめ1から4の数字が書かれた当たりくじ180個を含む600個のくじを入れた箱に、手を突っ込んで、1個だけを取り出し、そのくじを元に戻さないで、順に全てのくじを引いていく」という意味のわからない予定調和ではない。
現実の野球はむしろ、「まず、600個のうち180個の当たりの入った箱に手を突っ込んで、幸運にも当たりを引くことができたら(=ヒットを打てたら)、その『一度目のくじ』を元に戻して、こんどは、1から4、4つの数字の入った箱に手を突っ込んで、数字を決めるための『二度目のくじ』を引き、獲得できた数字(=塁打数)を確定する」という感覚のほうが近い。この2つの行為の差が、OPSにはまったく反映されていない。


OPSのWikiでの記述の話に戻る。

そもそも「出塁率.400前後の打者」といえば、近代野球の場合、各リーグにほんの数人しか出現しない素晴らしい出塁率である。そして、その素晴らしい数字だからこそ、むしろ問題になる。
というのは、「出塁率.400前後の、出塁率がリーグで5本指に入るようなトップクラスのバッター」というのは、ほぼ例外なく「それなりの数のホームランや二塁打を打ち、それなりの数の四球も選ぶのが、むしろ当たり前」だからだ。
つまり、OPSの言う「出塁率.400、長打率.400の打者」というのは、「野球という現実」を、まるで反映してない
現実の野球」に実在するのは、現実にはありえない空想といっていい「出塁率.400、長打率.400のバッター」ではなく、「出塁率.400、長打率.500前後のバッター」なのだ。

さらに、それだけではない。
ここまで書いてきた「出塁率と長打率の両方に隠れて存在する計算素材のダブりをこっそり利用したデタラメな手品」によって、大半の打者の打撃スタッツにおいて、「出塁率よりも、長打率のほうが大きい」という状態が成立する
これは、現実の打者がそうなることが経験上多いというリアルな意味ではない。計算上のみせかけのレトリックによってそうなる、のである。
数字の成り立ちからして、出塁率と長打率との間には相関関係が存在していて、2つの数字は相互に独立していない。上でも書いたことだが、相互に独立していない数値同士を足し算すれば、「多数の四球が長打率を押し上げてしまうという例」があるように、出塁率と長打率に内在する相関関係が原因で、「みせかけだけのOPS上昇」が発生し、「出塁率をやや上回る長打率が、自動的にはじき出されて」きてしまう。
常に「出塁率よりも、長打率のほうが大きい」という状態が成立するのは、単なる「計算上のまやかし」に過ぎない。

そりゃそうだろう。
率より塁打期待値のほうが、普通、数値としてデカいに決まっている。

OPSが「デタラメ」になっている主な原因は、「ホームランについて過大な評価が与えられていて、実は「率」ですらない長打率を、なんの補正せず、そのまま計算に採用し、「率」である出塁率と故意に、なんの理由もなく混ぜ合わせる「まやかしの手品」によって、あたかもホームランだけが得点を大量生産できる有効かつ最良の手段ででもあるかのように、「数字的にみせかけていること」にある。
だからこそ、「出塁率と長打率の数値がほぼ同じ、なんて打者は、ほぼ出現しない」ように、「OPSは、最初からできている」のである。この「巧妙なまやかし」が理解できないかぎり、この「OPSのデタラメさ」を理解できないだろう。


言い変えると、OPSという指標は、ある日突然「得点相関の高いと思われた2つの数字、出塁率と長打率(=実際には打数あたりの塁打期待値)を足し算してみることを、突然思いついたオッサン」が、「野球という非常に幅の広い現実のうち、自分好みの特定部分(たぶんそれはトップクラスのホームランバッター数名)を故意にクローズアップし、大好きな彼らのバッティングを褒めちぎるのに最も都合のいい恣意的な数値を作り上げた」ということでもある。

Copyright © damejima. All Rights Reserved.


(続く)

damejima at 09:43

November 11, 2011

最近野球の話題でよく「パークファクター補正」なんて言葉を耳にすることがあると思うが、この「パークファクター」という指標は「2つの要素」がごちゃごちゃに混ざった数字であって、ある意味「単なるデタラメな数字」に過ぎない。

例えばホームランについてのパークファクター(以下、適宜PFと略す)の計算において「分母」になっているのは「特定スタジアムでの、1ゲームあたりのホームラン数」だが、この数字には、以下の2つの要素が、何の基準もないまま混ざってしまっている。
1)自軍バッターが「打った」ホームラン
2)自軍ピッチャーが相手チームに「打たれた」ホームラン

中学生でもわかることだが、これでは「自軍が「打った」ホームラン、相手チームに「打たれた」ホームラン、その2つの数値のうち、どちらが増加しても、結果的にそのシーズンのパークファクター数値は大きくなってしまう」という、妙な現象が生じてしまう。

これではあまりにも雑すぎる。

よく、「パークファクターはスタジアムごとの物理的な構造の差異、特にスタジアムごとに違う外野の広さや外野フェンス高さの違いによって生じる、『ホームランやヒットの出にくさ』を表現した、人間の主観の入り込む余地の無い、非常に理論的な数値」だと思いこんでいる人がいる(笑)
だが、実際にはパークファクターはスタジアムの物理的特性だけで変化するわけではなく、スタジアムの物理構造にまったく関係ない「チームの戦力の変化という『人的要因』」によって大きく左右される数字でもあり、また、戦力、つまり投打のどちらに依存して変化したのかがきちんと定義も明示もされていない数字だ。
そういう意味では、現状のパークファクターなんてものは、理論的どころか、非常に恣意的な数字にすぎない。

たとえば、改修などをまったく行わず、スタジアムの構造がまったく変化しなくとも、シーズンによっては、打線が異常に大活躍して「ホームランを打ちまくる」こともあれば、投手陣があまりにも酷すぎて「ホームランを打たれまくる」ことも、それぞれ逆もありうる。
その、どのケースでも、パークファクターは上昇(あるいは下降)するわけだが、パークファクターから「数値の変化をもたらしたのが、いったい打線なのか、投手なのか」を見分けることができない。
また、同一シーズンに、投手陣が壊滅していてホームランを打たれまくったAチームと、打撃陣が異様に絶好調でホームランを打ちまくったBチームがあったとすると、AとBの本拠地のパークファクターは、どちらも上昇をみせる。この場合、2つのスタジアムAとBとでパークファクターの上昇が見られるわけだが、その数字の変化の意味がまったく違うのにもかかわらず、それをパークファクターから読み取ることができない。
さらにいけないのは、例えばたとえ「パークファクターの上昇が投手陣の壊滅でもたらされた場合」であっても、それを打者の打撃スタッツの補正に用いたりすることだ。そういう行為にはほとんど何の意味もない。逆もまたしかり。


実際、下記に挙げたテキサス・レンジャーズの例でわかるように、「パークファクターの数値の増減には、シーズンによって、自軍の打ったホームランが大きく寄与するシーズンもあれば、相手に打たれたホームランの多さが寄与するシーズンもある」。
そのため、「パークファクターだけでは、自軍の投・打、相手チームの投・打、この4つのうち、どれが主に寄与してその数値が成立したのか、さっぱりわからない」。
なのに、数字オタクどもときたら、「打者が寄与したのか、投手が良かったのか、自軍の戦力アップのおかげなのか、はたまた相手チームにやられたせいなのか、まるで確かめようがない恣意的な数字を使っている」くせに、「あらゆるシーズンの数字を十把ひとからげに『パークファクター』と呼んですませて」、なおかつ、「パークファクターとやらを、スタッツ補正にも使いまくって、あらゆるスタッツを誰よりも正確に把握できていると自称して、鼻高々になったりしている」のである(笑)


これだけでは何を言っているのかわからないと思うので
ちょっと、実例を見てみよう。

以下に、テキサス・レンジャーズのホームグラウンド、レンジャーズ・ボールパーク・イン・アーリントンのホームランに関する2001年から2011年のパークファクターと、テキサス自軍の打者のホームラン率(=1ゲームあたりのホームラン数)をグラフにしてみた。
ここでいうホームラン率はホームだけの数字ではなく、ビジターも含めた数字であることに注意してもらいたい。また、以下で特に注釈を設けない限り、パークファクターといえば、「ホームランについてのPF」のみを指す。またアーリントンの外野フェンス等の改修工事の有無については検討から除外する。さらに、年度別のPFを相互比較するのは無意味という議論は、この際あえて無視してもらいたい(笑)
Texas Rangers Team History & Encyclopedia - Baseball-Reference.com
赤い折れ線=アーリントンにおけるホームランのパークファクター
緑の折れ線=テキサス打線の「打った」1ゲームあたりホームラン数
テキサスのPFとHR率 2001年から2011年まで

このグラフの上がり下がりの方向の一致・不一致と、変動幅の大きさを見るだけで、テキサス・レンジャーズのパークファクターが、次の2つの時期に大別できることは、中学生でもわかると思う。(さらに詳細に見れば、「2004年以降」というカテゴリーが、さらに「2004年2005年」と「2006年以降」の2つに細分化することができることもわかるだろう)
1)2001年〜2003年まで
2)2004年以降

2003年までのグラフは、パークファクター()と自軍のホームラン率()の上下動が、まったく逆向きになっている。
明らかにこの時期のパークファクターを左右しているのは、「自軍バッターの打ったホームラン」ではなく、おそらく「自軍ピッチャーの打たれたホームラン数」だろう、という推測が成り立つ。
実際、2001年から03年までのテキサスのチーム防御率は、5.71、5.15、5.67と、それはもう酷い数値であり、シーズンで打たれたホームラン数は、その3年間それぞれ、222本、194本、208本で、2001年の被本塁打222本、被ホームラン率1.39などは、1961年のテキサス・レンジャーズ創設以来、最悪の数値を記録している。

ところが、2004年以降になると様相がガラッと一変してくる

まず2004年に、パークファクターと自軍のホームラン率の「数値の上げ下げの向き」が、同じ方向に揃った。これは、打線の改善によって「自軍の打ったホームランがパークファクターを左右する時代が到来した」と推測される。(具体的に言うと、2003年終了後にFA移籍したラファエル・パルメイロ、ヤンキースにトレードしたアレックス・ロドリゲス、2人のホームランバッターの移籍でできた穴を、2004年のアルフォンソ・ソリアーノや、生え抜きのマイケル・ヤングマーク・テシェイラが埋めたために、チームのホームラン数を思ったほど減らすことなく、新生テキサス打線が生まれ、育てられていった)

ただし、2004年から2005年までは、パークファクターと自軍バッターのホームラン率の変動の「向き」は同じとはいえ、2つの数字の「変動幅」にはまだまだ大きな差がある。
このことは、これら2シーズンが、「たしかに自軍のバッターもホームランをたくさん『打った』が、同じように、相手チームにもホームランをしこたま『打たれた』シーズン」だったことが、なんとなく想像できる。(実際、2003年の先発5人をみると、ディッキーベノワパク・チャンホの3人が揃ってERA 5点台と、まだまだ酷い投手陣だった。セットアッパーレベルの投手を3人も先発させているのだから、この当時のテキサスの投手陣は火の車なのだ)

これが2006年以降になると、2004年2005年と同様に、パークファクター()と自軍の「打った」ホームラン率()のグラフの上げ下げの向きが同じ方向に揃っている状態が維持されただけでなく、2つの折れ線グラフの振幅がお互いに近くなってきていて、2つの数字の乖離は非常に小さくなってくる。
これは、明らかに、2000年代中期の打線改良に引き続いて、こんどはテキサスが先発投手陣のリフォームに手をつけ、「ホームランを打てる打線、なおかつ、ホームランを打たれない投手陣」という理想的なバランスが多少もたらされつつあったことを意味する。(具体的には、2006年にケビン・ミルウッドビンセント・パディーヤを補強したことで、先発投手陣の立て直しに光明が見出された時期にあたる)

そして2年連続でワールドシリーズに進出した2010年、2011年のテキサスのチーム防御率は、3.933.79と、2年続けて4点台を切っている。そこにはもう最悪の投手陣だった2001年の陰はない。
この「2年連続防御率3点台」は、1989年〜1990年以来、20年ぶりに達成された出来事で、2009年からテキサスの投手コーチをしているマイク・マダックス(名投手グレッグ・マダックスの兄)がテリー・フランコーナの後任としてボストンの監督候補に名前が上がるほど高い評価を得ているのは、こうした点なのかと思わせる数字だ。(だが、以上の記述からもわかるとおり、テキサスの投手陣の改革が始まったのは、2009年のマイク・マダックスの投手コーチ就任以前の、2006年あたりから既に始まっているのであって、マイク・マダックスだけの功績とは言い難い)


もう少し説明を加えるために、
上の「パークファクターと、自軍の打ったホームラン率」のグラフに、さらに被ホームラン率、つまり「ホームランを打たれた率」を加えてみる。
赤い折れ線=パークファクター
緑の折れ線=テキサス打線「打った」1ゲームあたりのホームラン数
青色の折れ線=テキサス投手陣の「打たれた」ホームラン率(HR/9)
テキサスのPFとHR率・被HR率 2001年から2011年まで

2001年から2003年の赤と緑のグラフの「上下動の方向」と「変動幅」が一致しているのがわかるだろう。この3年間のパークファクターは「打ったホームラン」だけでなく、「打たれたホームランの多さ」にも大きく左右されている。
これが、2005年になると、赤と緑の線、つまり、パークファクターと、「打った」ホームラン率が揃って急上昇しているにもかかわらず、青の線、打たれた」ホームラン率だけが急激に低下しているのが、実に印象的だ。
青い線の動きをトレースしてみればわかるように、2001年に球団創設以来最悪の酷い状態にあったテキサスの投手陣の被ホームラン率は、2000年代中期以降に改善し、その状態を現在までなんとか維持し続けている。
たとえ本来はホームランの生まれやすいホームパークであっても被ホームラン数を極力抑え込むことに成功したテキサスは、長い時間をかけて投打のバランスを修正したことで、ワールドシリーズに行けるチームに変貌したのである。


ちょっとまぁ、いつものように話が長くなってしまった(笑)が、「打った数字」も「打たれた数字」もいっしょくたのパークファクターなんてシロモノが、どれだけ「データとしてだらしない」か、わかってもらえたら、それで十分だ。
これからは、その頼りない数値で補正、補正と、鬼の首をとったように喜んでいる馬鹿を見つけたら、思い切りせせら笑っておけばいい(笑)

2011年のセーフコのホームランのパークファクターは1.037という数字らしいが、それが「チーム打率が2割ちょっとしかないシアトル打線の打ったホームランによるものなのか」、それとも「ヘルナンデスをキングとか称して持ち上げまくった一方で、フィスターを安売りしたシアトル投手陣の打たれたホームランによるものなのか」、そしてこの10年のセーフコのパークファクターの軌跡の意味くらいは、それぞれが自分の頭を使って考えたらいい。
2011 MLB Park Factors - Home Runs - Major League Baseball - ESPN
さらに言えば、投手有利と言われてきたホームパークを持ち、超守備的チーム編成を目指すと自称しながら、このパークファクターとは、いったいシアトルのGMは何をやっているのか、こんなGMに複数年契約をくれてやって、馬鹿なのか、と言われて当然だ、くらいのことも、ついでに頭に入れておくといいだろう。



damejima at 09:35

September 04, 2011

経済学にはミクロ経済学とマクロ経済学があって、それぞれに固有のロジックがあることはよく知られているわけだが、野球のスタッツの評価方法やチームマネジメントのロジックについても、「プレーヤー個人」から見る場合と、「チーム」や「リーグ」など鳥瞰的、俯瞰的な視点から見る場合とでは、大きく違うわけだが、実際にはどうかというと、常に非常に混同されたまま、さまざまな話題が混乱のうちに語られて続けている。

たとえば出塁率がそうだ。

プレーヤー個人だけで見ると、あたかも、大から小から、さまざまなタイプがいるように思われている。
例えば、2007年のリッチー・セクソン(打率.201 出塁率.295)や、2011年のジャック・カスト(打率.213 出塁率.344)のように、打率がわずか2割ちょっとしかないにもかかわらず、四球数が多いために、出塁率が.300を越えているバッター、つまり、出塁率と打率に大きなギャップのあるバッターがいる。
一方で、2011年のウラジミール・ゲレーロ(打率.280 出塁率.311)のように、打率がいちおう.280あるのに、出塁率が.311と、出塁率と打率の差が小さいバッターもいる。
(前者のケースの打者は、打率が低すぎることも多いわけであって、本来はスタメンにいられるレベルじゃないのに加えて、「出塁率と打率に大きなギャップのある打者」が必ずしも長打力があるという意味にはならないし、そういう打者の長打力がサラリーや打順にみあうなんて意味にはならないのに、そこを無視して、出塁率、つまり四球数を評価すべきだのなんだの、自分の思い込みのみで主観的に語る人があまりにも多い。
個人で同じ出塁率なら、打率の高い人のほうを評価すべきだが、その理由の一端は以下にも書くので読み取ってもらいたい)


こういうプレーヤーごとのバラつきのようなミクロ的な差異を、チーム全体、リーグ全体からマクロ的に見ると、ようやく「プレーヤー個人の良し悪し」をファンやアナリストが自分の好き嫌いを自分勝手に織り交ぜながら混乱した評価を下すのではなくて、チームとしての法則性からきちんと評価できる視点も見えてくる。
以下に簡単な例で示してみる。


以下に、とりあえず2011年ア・リーグのチーム別出塁率とチーム打率の関係を、ホームゲームとビジターに分けて示してみた。(他の年度や、ナ・リーグのデータ、日本のデータなども調べてみないと、以下の話はまだ「常に、そうだ」と断言できる段階ではないことには注意してもらいたい)
元資料:American League 2011 Batting Splits - Baseball-Reference.com

ホームとビジターで比例関係の強さにわずかな差はあるものの、ひと目で、「出塁率と打率とが、非常に綺麗な比例関係にある」ことがわかる。つまり上のグラフは「チーム出塁率は、チーム打率のみによって決定されている」ということを示している。2つの数字の関係は、相関を計算する必要がまったく無いほど、強い。
「チーム出塁率」は、「チーム打率」に、「定数」として、6分から7分、数字でいうと0.06から0.07を加えた数字になっている。「チーム出塁率」と「チーム打率」の比例関係を数式にすると、こうなる。
「チーム出塁率」=「チーム打率」+「定数」
(定数=0.06〜0.07 四球や犠飛を意味する)

定数部分をもう少し詳しく言うと、チームバッティングにおいて、四球や犠飛の占める割合(チームのIsoDといいかえてもいいが)は、どんなチームでも常に一定の割合、すなわち、全体の6から7%であって、ほとんど変動しない、という意味。
このチームバッティングにおける四球率が一定になる現象は、打席全体に占めるホームラン率における現象に似ている。ホームラン率も、個人でみるとバラバラだが、チームでみるとほぼ一定になる。ホームランや四球は「十分たくさんの打席を検証すると、一定割合で出現する事象」というわけだ。
簡単なたとえ話で言うなら、「むやみやたらとフライばかり打っていると、一定の割合のフライは必ずホームランになる」ということだ(笑)

チーム出塁率の定数部分の中身は、実際のゲームでは四球や犠飛なわけだが、この定数部分は、2011ア・リーグの数字を見る限り、チームごとの打撃力の差や、そのチーム戦力のタイプの違い、あるいはパークファクターに、まったく左右されない。
だからこそ「チーム出塁率は、チーム打率に完全に比例する」なんて大胆なことが言える(笑)

2011 ア・リーグ
チーム別「出塁率と打率の比例関係」(ホーム)

2011ア・リーグ 打率と出塁率の比例関係(ホーム)

2011 ア・リーグ
チーム別「出塁率と打率の比例関係」(ビジター)

2011ア・リーグ 打率と出塁率の比例関係(ビジター)


様々なタイプのパークファクターをもったたくさんの球場でのゲームデータを集計した「ビジター」データは、当然のことながら、単一球場のデータである「ホーム」のデータより、チーム間格差が平準化、平らに均(なら)されるわけだから、ホームよりもビジターのほうが、グラフの右下がりの傾斜はより緩くなって、より平らなグラフになる。
別の言い方をすると、データの「右下がりの傾き」が強い「ホームゲームのデータ」は、「各チームのチーム出塁率の絶対値は、それぞれのチームのホームスタジアムのパークファクターに大きく影響される」ことを示している。四球率はパークファクターには左右されないが、出塁率はパークファクターに大きく左右される。

それはそうだろう。
前提として「チーム出塁率が、チーム打率にほぼ完全に比例する」として話をしているのだから、「ヒットの出やすいホームスタジアムのチームほど、チーム出塁率が高くなる」、「ヒットの出にくいホームスタジアムのチームほど、出塁率が低くなる」のは当然だ。
この説明手法を使うと、例えば、ボストンのチーム出塁率がア・リーグトップなのは、ボストンの打者たちが待球ができて、選球眼もよく、たくさんの四球が選べるから、なんて、もっともらしい理由(笑)では全くなくて、単に「フェンウェイパークが、あまりにもヒットが生まれやすいヒッターズ・パークだから、打者の打率が高く、その結果、チーム出塁率が良いというだけ」、ということになる(笑)


ただ、問題はこれだけでは済まない。
チーム運営という視点から、あるいは選手の評価という面からも、これまでの指導常識を疑う疑問が数多く派生してくるからだ。


●もし「チームの出塁率がチーム打率によってほぼ決まる」としたら、チームの監督が四球増加を目的に、自分のチームのプレーヤーに待球を強制する戦略は、実は「まるで無意味」なのではないか?

●もし「チームの出塁率がチーム打率によってほぼ決まる」としたら、出塁率向上のために最も意味のあるチーム方針とは、「打率を上げることのみだけしかない」のではないか?(実際には、もうひとつ、パークファクターを変えるためにスタジアムを改装する、という手もあるが 笑)

●よく、四球を積極的に選ばないアベレージタイプの打者をむやみに批判する人がいるが、「チームの出塁率がチーム打率によってほぼ決まってしまう」としたら、チームの打率を向上させないと話にならないのだから、そうした批判は「根本的に的外れ」なのではないか?

●もし「チーム出塁率からチーム打率を引いた数字が、ほぼ0.06から0.07の間で一定」なのだとしたら、チームの総打席数に占める四球や犠飛の割合は、どんな戦力のチームであっても一定割合になるのだから、「GMが、四球増加を目的に、四球を選べるプレーヤーを獲得してきた」としても、そのことでチームの出塁率が劇的に上昇することは、全くありえないのではないか?

●チームを支配しているマクロの論理は、どのくらいプレーヤー個人に影響を与えているものなのか。マクロ的野球とミクロ的野球との、接点、違い、お互いの影響力はどうなっているのか。


こうして書いてても、湧き起ってくる疑問点は実は非常に多くて、シアトル・マリナーズってチームはホントにチームマネジメントの失敗だらけなのがよくわかって、書いていて疲れるほどなのだ(笑)
なんかこう、難しいことを書いているように見えるかもしれないが、実はそうではない。言いたいことは、ひとつしかない。

「チームというマクロ的視点から見ると
 ヒットを打てない打者をいくら揃えても、
 出塁率は向上したりはしない」


イチロー
天才に決まってるじゃん。議論なんか必要あるわけない。

前に書いたように、「ヒット」っていう事象は、ベースボールが出来た創世記からもともとあったプレー要素で、それは「アウトにならないこと」を指す、最も重要で根源的なプレーであったわけで、なにもセイバーの数字オタクたちがまるで自分たちが見つけた新発見みたいに自慢しなくたって、もともと野球というゲームでは「アウトにならないこと」は「最重要プレー」だったわけね。
その一方で、もともと「四球」が4ボールではなく、9ボールだったように、四球ってものは歴史的に重要視なんかされてこなかった「サブ的なゲーム要素」だった。
「ヒット」はプレーの目的そのものだけど、「四球」はプレー結果のひとつなだけであって、野球をやる目的じゃない。
四球が無意味だと言いたいわけじゃなくて、正確にいうと、「出塁率、出塁率って、いちいち、うっさいよ。100年も前からある野球ってゲームで、100年後にあらためて『アウトにならないこと』を重視したいと思ったんなら、歴史的にもデータ的にも重要なのは、四球じゃなくて「ヒット」なんだから、なぜヒット絶対主義にならないのか、不思議でたまらない。ヒット絶対主義で、まったく問題ないでしょ。あんたら、アホなの? 」ということ、なんだな。
イチローが四球を選ぶとか選ばないとか、重箱の隅つついてんじゃねぇよ。くだらない。
ダメ捕手、城島健司。The Johjima Problem.:2011年8月18日、『アウトでないもの』〜ヒットの副次性。

まぁ、読んだ人が自分なりに自分の問題意識に照らして読んだらいいと思うが、この指摘、単純なように見えて、けっこう噛めば噛むほど味のでる指摘なのだ、よく読んでもらいたい(笑)



damejima at 05:55

September 04, 2010

もうすぐ始まるトロントとヤンキースのゲームに、ブランドン・モローが先発。モローは今シーズンすでにNYY戦に4回も先発しているが、けっこう打たれてもいるわりには、どういうものか、一度も負けがついていない。
今日も頑張ってほしいものだ。
Toronto Blue Jays at New York Yankees - September 3, 2010 | MLB.com Gameday

8月のモローは3勝、負けなし。タンパベイ相手に準ノーヒット・ノーランをやってからも好調を維持している。(ダメ捕手、城島健司。The Johjima Problem.:2010年8月8日、トロントに移籍したブランドン・モロー、東地区2位のタンパベイ相手に9回2アウトまでノーヒット・ノーラン。17三振を奪う。
もしも8月が4勝だったら、月間最優秀投手もあったかもしれない。惜しいことをした。
Brandon Morrow Game Log | bluejays.com: Stats


ちみみに今年6月の月間最優秀投手はシアトル在籍時のクリフ・リーだったのだが、シアトルファンですら覚えてない人が大半なのだから、ちまたのシアトルファンだの、データマニアだのなんだのもたいしたことはない。
クリフ・リー自身の月間最優秀投手受賞は、2008年1月と8月に続いて、3回目。ロブ・ジョンソンが受けた投手が月間最優秀投手受賞を受賞するのは、2009年6月・9月のヘルナンデス、2009年7月のウオッシュバーンに続いて、4人目。
ダメ捕手、城島健司。The Johjima Problem.:2009年6月・7月・9月「月間最優秀投手」と「ロブ・ジョンソン効果」
クリフ・リーの場合もそうだったが、例えばFIPがちょっと悪くなると、やれトレードが当たり前だの、こいつは必要ないだのなんだの、データ馬鹿はウザいったらありゃしない。
指標1つで人間の未来までわかるつもりになっているのは、笑止千万。
Hamilton, Lee honored as AL's best in June | MLB.com: News

2009年ブランドン・モローの成績はこんなふうになっていた。
ERA 4.39
FIP 5.05
xFIP 4.89
ERAは4点台前半だが、FIPは5点台、xFIPも5点に近い4点台で、これはデータ馬鹿の大好きな「見た目のERAより、予測であるFIPが悪い」という状態だった。FIPやxFIPだけ見て選手の将来をあれこれ言いたがるような単細胞な人がこれをみれば、「モローなんて来年はとても使えない。トレードしてしまえ」とか、すぐに言い出す。実際、2009年の「城島問題」に無関心なメディアと日本のシアトルファンはそういう声の大合唱だったものだ。

もちろん、現実のモローは違う。

2009年までのモローには「シアトルが全く実力を発揮する機会を与えない、それどころか、フタをしている」という単純な事情があって、あの成績だった。
問題は主に2つあった。ひとつはシアトルが若い選手の起用法や育成法が伝統的に下手だ、という問題、もうひとつは「城島問題」であり、モローは実力を発揮しようにも、あんな環境ではできるわけがなかった。
既に何度も書いたことだが、ボルチモアにトレードされる前のアダム・ジョーンズがそうであったように、シアトル時代の新人モローに対する処遇はあまりに酷かった。
シアトルはきちんと育成する能力もないクセに、マイナーとメジャーの間を行ったり来たりさせまくって、さらにそれだけでなく、メジャーに上げたときには、それがモローにとっての数少ないチャンスの場であるにもかかわらず、リードの最悪なダメ捕手城島とばかり組ませて、炎上させてはすぐにマイナーに落とすという無駄な繰り返しを彼に強制していたのである。

結局シアトルのブランドン・モローは、「チームの育成の下手さ」と、「ダメ捕手城島」が「二重のフタ」をして、「彼の才能の芽を摘み取られ続けていただけ」なのである。


FIP関連の役に立たない予測(笑)を尻目に、実際の2010年モローはここまで、すでに143.1イニングを先発投手として、ローテを守り、投げぬいてきて、10勝6敗と、素晴らしい成績を残している。
2010年ブランドン・モロー(2010年9月3日まで)
ERA 4.27
FIP 3.16
xFIP 3.61
今年のFIPは3.16、xFIPは3.61とか、「いい数字」が出ているが、成績の改善された年の数字を二次的にいじくったら、そりゃ、いい数字が出るに決まってる。だから、こんな数字、どうでもいい(笑)来年は東地区のライバルチームが綿密にスカウンティングしてくるなら打たれる可能性も高いのに、3点台とか何を言ってるんだ、FIP(笑)
こういうアテにならない数字を素直に信じる人が、過去のデータからギャンブルに手を出して破産したりするのだ。まるでどこかのGMみたいだ(笑)
Brandon Morrow » Statistics » Pitching | FanGraphs Baseball


ブランドン・モローのデータは非常にユニークだ。
というのも、ERAだけ見ると、モローの成績は2009年と2010年とではほとんど変わってないのに、結果は大きく違っている。それは「ピッチングの中身」「ピッチングの質」が全然違うからだ。

ダメ捕手城島から解放されて以降のモローは、三振をとれる率、四球を出す率、ホームランを打たれる率、それら全てが改善されている。つまり「ピッチングの質」がまったく変わったのである。
これだけ良くなったのだ。だから、ERAは同じでも、実際の「リアルなゲーム内容」はびっくりするほど変わるのが当たり前。ゲームを見れば誰でもわかることだが、xFIPだけ見ていてもわかるわけがない(笑)
宝くじの過去の当選番号や、競馬の過去の当たり数字をいくらデータ化しても、まともに予測できないのは、「過去をいくらパターン化、数値化できても、未来の予測はできない」という単純な話だ。

2009年
K/9 8.14
BB/9 5.68
HR/9 1.29

2010年
K/9 10.93 (三振は2009年の約40%増し)
BB/9 3.96 (四球は約3分の2)
HR/9 0.69 (ホームランは約半分)


FIP(Fielding Independent Pitching)は「奪三振、与四死球、被本塁打のみを投手の責任として将来のERAを予測する」わけだが、例えばホームランだが、「これはチームの守備力と関係なく投手単独の能力で左右される要素だ」と決めつけて、その上で「投手の絶対能力を測定する基準として使うんだ」と力んでみたところで、じゃあ、たとえば「ダメダメなキャッチャーのサインが大きく寄与して、毎試合のようにホームランを打たれ、四球を出しまくって、防御率が肥大している」というケースについては、どうなんだ?、という疑問が残る(笑)
つまり、FIPという指標は、投手の成績に対するキャッチャーの影響を軽視しすぎている。

まぁ、ちょっと大げさな比喩になったが、無能なキャッチャーのせいでフォアボールの数にもホームランの数にも、防御率にもFIPにも大きな影響が出る「城島問題」にかかわりのない他のチームの投手はともかく、2009年まで「ダメ捕手城島と関わりをもたされた不幸な投手」のひとりであるブランドン・モローには、関わりを断ち切ることができた今年にかぎっていえば、「FIPの判定」など、まるで関係ないのである。

「城島問題」のマイナス面を十分考慮し、適正に「城島補正」を加えてプラス評価した上で投手の能力を見定めることを怠ったシアトルと無能なズレンシックは、能力ある選手を何人も放出しては、必要の無い、能力もない選手をたんまり連れてきて、2010年を大敗したのである。

ダメ捕手、城島健司。The Johjima Problem.:2010年8月8日、ブランドン・リーグとの交換でトロントに移籍したブランドン・モローのここまでの好成績と、ダメ捕手城島のモローに対する配球の無能ぶりをあらためて振り返る。


ちなみに、シアトルの今年の投手の中で、ERAマイナスFIPの数値が最もいいのは、コロメ、コルデロ、テシェイラの3人、だそうだ(笑)
Mariners » 2010 » Pitchers » Advanced Statistics | FanGraphs Baseball






damejima at 02:43
ハワイ移民150周年
No Ichiro, No watch.

Play Clean
日付表記はすべて
アメリカ現地時間です




Twitterボタン

アドレス短縮 http://bit.ly/
2020TOKYO
think different
 
  • 2014年10月31日、PARADE !
  • 2013年11月28日、『父親とベースボール』 (9)1920年代における古参の白人移民と新参の白人移民との間の軋轢 ヘンリー・フォード所有のThe Dearborn Independent紙によるレッドソックスオーナーHarry Frazeeへの攻撃の新解釈
  • 2013年11月8日、『父親とベースボール』 (8)20世紀初頭にアメリカ社会とMLBが経験した「最初の大衆化」を主導した「外野席の白人移民」の影響力 (付録:ユダヤ系移民史)
  • 2013年11月8日、『父親とベースボール』 (8)20世紀初頭にアメリカ社会とMLBが経験した「最初の大衆化」を主導した「外野席の白人移民」の影響力 (付録:ユダヤ系移民史)
  • 2013年11月8日、『父親とベースボール』 (8)20世紀初頭にアメリカ社会とMLBが経験した「最初の大衆化」を主導した「外野席の白人移民」の影響力 (付録:ユダヤ系移民史)
  • 2013年6月1日、あまりにも不活性で地味な旧ヤンキースタジアム跡地利用。「スタジアム周辺の駐車場の採算悪化」は、駐車場の供給過剰と料金の高さの問題であり、観客動員の問題ではない。
  • 2012年7月3日、『父親とベースボール』 (2)南北戦争100年後のアフリカ系アメリカ人の「南部回帰」と「父親不在」、そしてベースボールとの距離感。
  • 2012年7月3日、『父親とベースボール』 (2)南北戦争100年後のアフリカ系アメリカ人の「南部回帰」と「父親不在」、そしてベースボールとの距離感。
  • 2012年6月29日、『父親とベースボール』 (1)星一徹とケン・バーンズに学ぶ 『ベースボールにおける父親の重み』。



Categories
ブログ内検索 by Google
Google

livedoorブログ内検索
Thank you for visiting
  • 今日:
  • 昨日:
  • 累計:

free counters

by Month