January 29, 2014

Baseball Analyticsが1月22日付の記事で、ヤンキース黒田について記事を書いている。
記事の要旨は要するに、「2013シーズン、黒田は、4月から7月まではストライクゾーンで勝負できていたが、8月以降にゾーンで勝負する率が劇的に下がってしまい、その結果、投手としての成績がガタガタになった」と言いたいらしい。
Hiroki Kuroda and Throwing in the Strike Zone - Baseball Analytics Blog - MLB Baseball Analytics

いつものように結論からいわせてもらえば、少なくとも、こんな出来そこないの無根拠な話から 「黒田という高給取りのピッチャーのピッチングの質が悪い理由」 がみえてきたりはしない


たいていの場合、こういう「ごたいそうなグラフ」を見せられると、「ほほぉ・・・・。そうなんだ」と思って信じてしまう人が大勢いる。困ったものだ。
相関係数なんていう取扱いに独特のクセのあるものを安易に野球にあてはめて、鼻高々に野球というゲームのファクターを説明したつもりになっている馬鹿がひとりでも減るように、簡単に説明しておくことにする。
(なお以下のグラフは、オリジナルをより見やすいように改造している。オリジナルはY軸の位置が上下で揃っていないのと、軸の太さが細すぎるため、非常にわかりづらい)

2013MLB BABIPとゾーン率の相関マップ


図中に、やや右下がりの赤い直線がある。
これはおそらく「近似直線」だろう。

近似直線や近似曲線は、グラフ上にマッピングされたデータの細部を思い切って捨象することで、「事象Aと事象Bの相関関係の様相や濃さ」などを可視化して見えやすくするために用いられる表現手法だ。(グラフに近似直線を書き加える機能は、例えばパソコンソフトのエクセルなどにも備わっているので、誰でも取り扱うことができる)

例えば野球ブログで、「得点とOPSの相関関係」や「得点と四球の相関関係」のような「2つの事象の相関」を取り扱う場合、使われてきた手法は、そのほぼ全てが「直線という表現を使う『線形近似』」であり、ブログ側の人間はその程度の曖昧な数字を根拠に鼻高々に語ってきた(笑)

だが、「近似の程度」を示す表現手法には、多項式近似によって「曲線」として表現するなど、さまざまなパターンがあるのであって、相関関係を「直線」として表現する方法なんてものは、たくさんある近似の表現のひとつに過ぎない。


さて、上の図の場合でいうと、X軸の事象であるZone%と、Y軸の事象BABIPとの相関関係は、やや右下がりの、平坦な直線として表現されている。
これは、どういう意味になるかというと、Zone%とBABIPという2つの事象の間に、「Zone%が上昇すると、BABIPが低下するという関係が、ほんのわずかならありうること」を示している。
もっと平たく言うと、「投手がストライクゾーンにより多く投げれば投げるほど、バッターに打たれないですむ傾向」が、「ほんのわずかならありうること」を意味している。


いま、「ほんのわずかなら」と書いたことには、もちろん重要な意味がある。

というのは、上の図の上にマッピングされた個別データの分布には、「個別データが、グラフ全体に、しかも、まんべんなく広がっている」というハッキリした特徴があるからだ。


こうした「法則性がほとんどみられないデータ分布」が意味するのは、「なにもわざわざ線形近似などみなくても、X軸とY軸で示された2つの事象の間に明瞭な相関が存在しないのは、明らかだ」ということだ。
つまり、「Zone%とBABIPとの間に、強い相関関係などそもそも存在していない」という意味であり、もっと具体的にいえば、「MLBの投手において、ストライクゾーンに投げれば投げるほど、それがそのまま、より多くの打者を凡退させられるという好結果につながる、という関係が成立する可能性は、非常に低い」という意味だ。

もしZone%とBABIPの間に強い相関関係があるなら、データの分布は、例えば「データが、右下がりに45度傾いた直線に沿って、右下がりにきれいに並ぶ」というように、ハッキリした「傾向」を示す。
だが実際には、こういうふうにデータがグラフ全体にまんべんなく広がって分布している。明確な相関関係が存在するわけがない。
上の図はそもそも、「世の中にはいろんなタイプのピッチャーがいる」という、ごく当たり前のことを言っているにすぎず、Zone%とBABIPの相関関係の強さを保障したりするどころか、まったく何も証明できていないまま、勝手に結論を導きだしているのである。


だから、この「Zone%とBABIPの関係を示したグラフ」とかいう「いい加減な基準」を使って、「2013黒田の成績がシーズン後半に大きく崩れたのは、彼がストライクゾーンに投げなくなったからだ」だのなんだのと、ごたいそうに結論づけるのは、いい加減なものさしを使って、長さを測定し、結論を導いていることにしかならない。
このロジックは「ものさし」そのものがいい加減なのだ。だから、そこから引き出された結論など、信じるわけにはいかない。当然のことだ。


このブログでは、2013シーズンの黒田のピッチングの「質の悪さ」については2013年9月にとっくに書いている。
Damejima's HARDBALL:2013年9月13日、黒田という投手を評価しない理由。そして、なぜジラルディは満塁ホームランを打たれるような場面を自ら演出してしまうのか、について。

このブログの記事では「黒田が先取点を安易に取られ過ぎるピッチャーだ」という論点から書いたわけだが、月別にみると、「黒田が先取点を取られる傾向」は、Baseball Analyticsが黒田のZone%が良かったとする「4月から7月」にも存在するし、また、Zone%が悪化したとする「8月以降」にしても、同じようにみられる。
だから、「4月から7月までの黒田と、8月以降の黒田は、まったく別人のような投球をしていた」というBaseball Analyticsの主張には、なんの説得力も感じない。単に7月だけが異常に良かっただけの話だ。
(以下の自作グラフでみてもらうとよりわかりやすいが、青色のセル部分は、4月から6月にも大量にあるし、また8月以降にもある。黒田が給料にみあう仕事をしていたのは、7月のみに過ぎない)

資料:2013黒田 全登板 ©damejima

図で、青色のセルで示したのは、「黒田が先取点をとられたゲーム」。(4月8日クリーブランド戦含む。この試合では、1回表ヤンキースが3点先制したが、1回裏に3失点している) また赤色のセルは、「ヤンキースが先制しながら、黒田が打たれて逆転負けした試合」を意味している。
黒田登板ゲームの詳細data generated by Hiroki Kuroda 2013 Pitching Gamelogs - Baseball-Reference.com


何度も書いてきたことをまた書くのは本当にうんざりだが、MLBのピッチャーにはたしかに「ものすごくストライクばかり投げて、なおかつ打たれないピッチャー」や、「ものすごくボールを投げて、それでも失点しないピッチャー」がいる。前者の代表はクリフ・リーであり、後者の代表は引退したマリアーノ・リベラだ。
Damejima's HARDBALL:2013年7月8日、グラフひとつでわかる「ボール球を振らせる投球哲学」と、「ストライクにこだわりぬく投球哲学」 常識に縛られることなく投球術の両極を目指すマリアーノ・リベラと、クリフ・リー。


だが、何度も書いてきたことだが、ストライクの鬼神クリフ・リーのような「非常に特別な投手」は、野球世界の頂点であるMLBにさえ、ほんのわずかしか存在していない。
他の投手たちの「投球術」というものは、どれも似たり寄ったりで、たいして違わない。たとえ好投手といえど、十分すぎるくらい「平凡」なのが普通なのだ。

昔の記事に次のような記述をしておいた。気になる人はあらためて読み返してもらいたい。
2013ア・リーグで「ボール球を振らせる率の高い投手ベスト20」のほとんど全員は、「非常に狭いエリア」に固まって存在している。そして、その大半は「ア・リーグ奪三振ランキングベスト20」とダブっている。

一部例外を除き、大半の投手の数値は似たり寄ったりであり、全投球に占めるストライクは42〜46%、「32〜35%前後のボール球」をバッターに振らせている。
つまり「ボール球を振らせることのできる率の高い優秀な投手」のほとんどは、「奪三振数の多い投手」でもあり、しかも彼らの投げるストライクとボールの比率はかなり共通した数値になる。
彼らのような奪三振系ピッチャーの投球術には、実は思ったほど相互に差異はなく、似たり寄ったりである

O-Swing%とZone%

X軸:O-Swing%(ボール球を振らせる率)
Y軸:Zone%(ストライクゾーンに投げる率)
青い点:O-Swing率の高いア・リーグ先発投手ベスト20
ソース:Fangraph(データ採集日:2013年7月5日)


投手にとって大事なことは、Baseball Analyticsのおざなりな記事がいうような「ストライクゾーンにどれだけ投げられるか」などという、低次元な話ではない。
ほんと、よくそんな素人分析で野球を解析できると思い込めるものだ。そんな低レベルの話でいいなら、誰も苦労なんてしない。

とりあえず、MLBでいい投手になるための出発点は、
ゾーンに投げても痛打されない、質のいいストライク
思わず打者が手を出したくなる、質のいいボール球
この「2つ」を持った投手になることだ。

もちろん、この「2つ」をモノにできたからといって、そのピッチャーがなれるのは、ごく普通の「三振がとれるピッチャー」に過ぎない。その程度の、どんな時代にも3人や5人はいるピッチャーに、みんながみんな殿堂入りされたんじゃ、たまったもんじゃない。

平凡な先発ピッチャーが、配球の天才ロイ・ハラデイやストライクの鬼クリフ・リーのような、個性ある名投手になろうと思えば、まったく別次元の高さのハードルが待っている。ちょっとくらい三振が人より多くとれた程度のことで、その投手が天才や名投手になれるわけじゃない
それは、Baseball Analyticsがいうような「ストライクゾーンに投げれば投げるほど、打者を打ち取れる」などという、子供じみた、嘘くさい分析で理解できるレベルの話ではない。


Play Clean
日付表記はすべて
アメリカ現地時間です

Twitterボタン

アドレス短縮 http://bit.ly/
2020TOKYO
think different
 
  • 2014年10月31日、PARADE !
  • 2013年11月28日、『父親とベースボール』 (9)1920年代における古参の白人移民と新参の白人移民との間の軋轢 ヘンリー・フォード所有のThe Dearborn Independent紙によるレッドソックスオーナーHarry Frazeeへの攻撃の新解釈
  • 2013年11月8日、『父親とベースボール』 (8)20世紀初頭にアメリカ社会とMLBが経験した「最初の大衆化」を主導した「外野席の白人移民」の影響力 (付録:ユダヤ系移民史)
  • 2013年11月8日、『父親とベースボール』 (8)20世紀初頭にアメリカ社会とMLBが経験した「最初の大衆化」を主導した「外野席の白人移民」の影響力 (付録:ユダヤ系移民史)
  • 2013年11月8日、『父親とベースボール』 (8)20世紀初頭にアメリカ社会とMLBが経験した「最初の大衆化」を主導した「外野席の白人移民」の影響力 (付録:ユダヤ系移民史)
  • 2013年6月1日、あまりにも不活性で地味な旧ヤンキースタジアム跡地利用。「スタジアム周辺の駐車場の採算悪化」は、駐車場の供給過剰と料金の高さの問題であり、観客動員の問題ではない。
  • 2012年7月3日、『父親とベースボール』 (2)南北戦争100年後のアフリカ系アメリカ人の「南部回帰」と「父親不在」、そしてベースボールとの距離感。
  • 2012年7月3日、『父親とベースボール』 (2)南北戦争100年後のアフリカ系アメリカ人の「南部回帰」と「父親不在」、そしてベースボールとの距離感。
  • 2012年6月29日、『父親とベースボール』 (1)星一徹とケン・バーンズに学ぶ 『ベースボールにおける父親の重み』。
Categories
ブログ内検索 by Google
ブログ内検索 by livedoor
Thank you for visiting
  • 今日:
  • 昨日:
  • 累計:

free counters

by Month