sparse-dense by FoYo: MLB主審が誤審したと思われる「ストライク」の球面SOMでの表示

【what is this】前回の記事では、MLB投球の球種分析を球面SOM（自己組織化マップ）[1]で行いました。今回は、主審が誤審して「ストライク」コールしたと思われる投球について、球面SOMで可視化して眺めてみました。（信憑性に欠けるか、誤った論述になっている部分があると思いますが、後日、自分のための何らかのヒントになり得ると考えて書き留めます。）

■ 主審が誤審したと思われる「ストライク」309球の球面SOM表示
　以前の記事で、MLBでの多数の投球判定[2]のうち、主審が誤って「ストライク」コールしたと思われる309球の分析を示しました。「誤審」と思われる根拠についても、その記事で述べました。

　今回は、その309球のデータ（５features = ５成分から成る）を球面SOMで分析しました。図１をご覧下さい。これは、各成分毎に（各成分を軸として）この309球のデータをクラス分けした（はずの）図です。簡単な場合から行きます。例えば、成分５は、左打者か右打者かの２値を取ります。誤審したストライクを、左打者、右打者毎に分離してもいびつにならない（明瞭にクラス分け可能）。すなわち、そのように分離しても、類似性の高いデータ（５次元ベクトル）同士は近くに集まって表示される。図はそれを示しているようです。右打者の方が数が多いので、奥のキノコ状の球面が大きいようです。

　また、ストライクゾーン面を通過したｘ座標とｙ座標である、成分１と成分２についても、大きなキノコ状の球面２つがほぼ明確に分かれています。これは、ストライクゾーンの左右方向（成分１）と上下方向（成分２）に関して、誤審されたストライク球のデータをほぼ明瞭にクラス分けできることを示しているようです。

　これらに反して、成分３（ストライクゾーンの上辺の高さ）と成分４（ストライクゾーンの下辺の高さ）に着目した場合は、明瞭に区分けすることが困難なようです。すなわち、分離しようとしたクラスが複雑に混じり合っている。こうなると、主審も判断に迷う場合が多いはず。これは打者（の姿勢）によって、ストライクゾーンの高さ方向が変化することに起因するはずです。

■ まとめ
　ここまでを纏めると、かなり乱暴ですが（また適切な表現かどうかも分かりませんが）、以下のように言えそうです。

横方向に関する誤審の多くは、主審の確信犯的な判定によるようである。（実際、例えば、２ストライク後は、投手に有利な方向でストライク判定される傾向があるとの調査結果もあります。）
一方、縦方向の誤審は、ストライクゾーン縦方向の見極め自体が難しいことで起る場合が多いのではないか。

　このことは、（以前の記事で示した）以下の図２が裏付けているようです。緑の枠線は、打者毎に変化するストライクゾーン（主に縦方向）を示しています。たくさん重なっています。赤丸は、主審がストライクコールしたのですが、それは誤審と考えられる投球を示しています。

参考資料

[1] 大北正昭、徳高平蔵、藤村喜久郎、権田英功：自己組織化マップとそのツール、シュプリンガージャパン、2008年12月

[2] Predicting balls and strikes using TensorFlow.js
https://medium.com/tensorflow/predicting-balls-and-strikes-using-tensorflow-js-2acf1d7a447c

2021年11月30日火曜日

MLB主審が誤審したと思われる「ストライク」の球面SOMでの表示

0 件のコメント:

コメントを投稿