データとバスケ」カテゴリーアーカイブ

機械学習でB1の選手をクラスタリングしてみた(2022-23バージョン)

以前にも似たようなネタをやっているのですが、B1全選手を2022-23シーズンの総計スタッツを利用し、機械学習でクラスタリングを行ってみました。

利用したスタッツの項目は以下です。すべての標準化(standardization)をしてから利用しスケールを揃えています。

  • 出場試合数
  • スターター出場試合数
  • プレイ時間
  • 平均プレイ時間
  • 平均得点
  • 平均2点フィールドゴール成功数
  • 平均2点フィールドゴール試投数
  • 平均3点フィールドゴール成功数
  • 平均3点フィールドゴール試投数
  • 平均フリースロー成功数
  • 平均フリースロー試投数
  • 平均オフェンスリバウンド数
  • 平均ディフェンスリバウンド数
  • 平均リバウンド数
  • 平均アシスト数
  • 平均ターンオーバー数
  • 平均スティール数
  • 平均ブロックショット数
  • 平均被ブロックショット数
  • 平均ファウル数
  • 平均被ファウル数
  • +/-(プラスマイナス)

今回はいわゆる凝縮型の階層的クラスタリングを行いました。簡単に説明すると

  1. 選手ひとりひとりをひとつのクラスタと見做す
  2. 上述のスタッツ項目を使い各クラスタ間の距離を計測する
  3. 一番距離が近かったクラスタをひとつのクラスタと見做す
  4. 2に戻る

というような手法でクラスタを作っていきます。専門的な話ですが、距離はユークリッド距離を用い、クラスタの連結にはウォード連結法を使用しました。

出来上がったクラスタを、デンドログラムという樹形図で表現します。トーナメント表のようですが、繋がっている選手同士はスタッツが似ている、そしてトーナメント表の高さが低いほど似ている度が高い、という意味です。

以下、とても大きくなってしまいましたが全体像です。

いくつかの箇所をピックアップしてみます。まずは河村勇輝を見てみましょう。

これの意味するところは、河村と一番スタッツの類似度が高いのがDJ・ニュービルで、その二人に一番近いのがマイルズ・ヘゾンだということです。その下にダーラム、エバンス、ガードナー、トレイ・ジョーンズ、ファジーカス、ビュフォードなどMVPクラスの選手たちがクラスタを成していますが、これらのクラスタが河村・ニュービル・ヘゾンのクラスタに近いということです。

ちなみにもっと大きく見ても、河村は外国籍選手が織りなす大きなクラスタに唯一属する日本人選手であり、やはりスタッツの上からも別格の存在だったことが伺えます。

次にこちらを見てみましょう。

こちらではエース級の日本人選手たちがひとつのクラスターを成していました。富樫勇樹と安藤誓哉が近いというのは感覚的に納得する人も多そうな結果です。

その少し下にはこんなクラスタもありました。

サーディー・ラベナと岡田侑大、キーファー・ラベナと佐々木隆成、鵤誠司と中東泰斗、ベンドラメ礼生と寺嶋良、納得できるような、できないような、そんな組み合わせが出来上がっていて面白いです。

書評「Unguarded」(Scottie Pippen)

最近はバスケ関連本の感想ブログと化している当ブログですが、とりえあずこの『Unguarded』で書評はひとまずお休みにしようかなと思っております。NBA関連の本をちょっと原著で読んでみようかなと最初に考えたとき、この本が実は第一候補だったのですが、ペーパーバック版がまだ発売されていなかったので後回しにしていました。ハードカバーって実は読み辛くてちょっと苦手です。

本書の冒頭で説明されているのですが、この本はNetflixでヒットしたマイケル・ジョーダンの『THE LAST DANCE』のカウンターパンチ的に著されたものです。ピッペンに纏わる逸話にはいくつかそのような話がありますが、『THE LAST DANCE』でもジョーダンの視点からブルズの栄光が描写されており、自分が得るべき賞賛が十分に表現されていないと感じたことがきっかけになっているようです。

私が本書を通して感じたのは、例えばジョーダンの陰に隠れて過小評価されていたり、ブルズとの契約の絡みで得るべき額のサラリーを得なかったりといった話は、むしろピッペンを特別な存在として際立たせるストーリーだなということです。ピッペンはもちろんNBA史上に名を残す偉大なプレーヤーですが、そういったストーリーが更に彼というプレーヤーの存在を特別なものにした、そのように感じました。サラリーに関しても当然 underpaid だったことは間違いないですが、誤解を恐れずに言えばその話題が今なおこうして話題に出来る事を考えれば「元が取れた」と言えるかもしれません。

それに私のような90年代NBAファンからすれば、ピッペンは彼が思うほどには過小評価されていないと感じます。ライト層からは『ジョーダンの右腕』くらいの印象を持たれているかもしれませんが、ドリームチームでの活躍を含め、当時のNBAを沸かせたバークリー、ロビンソン、ユーイング、オラジュワン、ストックトン、マローン等々に比肩するどころか、6度のチャンピオンに輝いた正真正銘のスーパースターです。おそらく世界中の多くのバスケファンの中で同じ認識でしょう。

ピッペンがNBA入りしてからの話は大枠で知っていることが多かったのですが、ピッペンの幼少期についてはまったく知識がありませんでした。以前に読んだヤニスの生い立ちと同様、かなり厳しい暮らしをしていた少年時代について知ることができたのは良かったです。今ではピッペンの長男さんがNBA入りを目指してGリーグでプレーしているのですから、時が流れるのは早いものです。

書評「Eleven Rings」(Phil Jackson)

1990年代、2000年代のNBAを語る上で無視することは出来ない名将フィル・ジャクソン、本書はそんなフィルのキャリアを振り返るメモワールという形で書かれた、名将のチームマネジメントやリーダシップにおける思考に迫る内容となっております。表紙に並んだチャンピオンリングで読む前から読者を圧倒する雰囲気を放っていますね。*1

その時代に活躍した多くのプレーヤー、コーチがブルズ、レイカーズに限らず登場しますし、鍵となったゲームについて具体的に振り返る内容も多いので、1990年代や2000年代のNBAのファンの方が面白く読める可能性は高いと思いますが、そういった箇所を飛ばしながらチームマネジメントやリーダーシップのエッセンスを得るための教科書として読むことも出来る内容だと思います。

一バスケファンの立場からはHCというと、例えばオフェンスやディフェンスの選択だとか、選手の起用方法だとか、私はそういった所に注目しがちでしたが、本書を読んで一番感じたのは「そういった部分はHCという仕事の表層的なものに過ぎないのだな」ということです。チームビルディングについてこんな根底から考えて実行しているのかと驚くようなエピソードがいくつも紹介されていました。

例えばフィルは、チーム内にどうしたら強い結束、それも戦地で兵士たちの間に生まれるようなレベルのとてつもない結束をもたらすことができるのかについて深く考えています。そしてチームは結束したひとつの部族(tribe)のようであるべきだと考え、実際にラコタというネイティブアメリカンの部族から慣習等をチームに取り入れていきます。このエピソードはおおよそ私がHCの仕事として想像するものを遥かに超えていました。ちなみにブルズには実際に部族をイメージしたチーム用の部屋があるようです。*2

フィルが禅に造詣が深いことは有名だと思いますし本書でも随所で禅の考えが紹介されています。禅については私の生きるソフトウェアの世界だと故スティーブ・ジョブズを思わせる内容だと感じました。問題児であったデニス・ロッドマンを管理監督する立場として、禅の教えの一部が役に立ったという話には苦笑してしまいました。曰く、例えばロッドマンのような人物を管理監督する場合、やらかしてしまうことがあってもまずは好きにさせて、無視をせず、かといって強制するでもなく、その後きちんと目を向けておく事が要諦だという事です。

怒りについて書かれた章も、昨今のスポーツ界のパワーハラスメントに関するニュースなどを背景に、とても興味深く読めました。フィル曰く怒りのコントロールというのはコーチにとって最も難しい仕事のひとつであるとのことです。何故ならばチームを鼓舞し焚き付け勝利に導く為に必要なある種の激しさと、単なる破壊的な怒りは本当に紙一重だからだそうです。これはスポーツ界にパワハラが根付きやすい根本的な原因だと思います。この激しさをポジティブな方向にのみ昇華させるとうのは至難の業であるということは、関係者のみならず我々外野のファンも認識しておきたいと思いました。

結構読んだら読みっぱなしの読書の仕方をすることが多いのですが、上述のものも含めて響く文章が多かったので、本書には付箋をペタペタと貼りながら読み進めていました。ときどきその部分を読み返せたらと思います。

ちなみに今のところ一番良いと思ったのは以下の部分で、これはNBA選手のみならず我々一般人の仕事にも通じる所が多くあると思いますし、バスケで言うと我らが渡邉雄太選手を想像せずにはいられませんでした。

それにしてもNetflixで「THE LAST DANCE」を観たときもそうでしたが*3、本書を読んだせいで昔のNBAのゲームがまた観たくなってしまいました。YouTubeに違法アップロードされている様ものを除けば観られるのはNBA楽天で公開されているいくつかのものだけかもしれませんが、時間を見つけて観戦してみようかと思います。何だか無性にトライアングルオフェンスを楽しみたい気分です。

*1:ところで邦訳版(イレブンリングス 勝利の神髄)は絶版になっているようですが、恐縮ながらいまいち書籍の見栄えが格好良くないですね。。。

*2:フィルはTribal Leadership: Leveraging Natural Groups to Build a Thriving Organization (English Edition)という書籍に影響を受けているようです。この本も面白そうです。

*3:ちなみに本書のちょうど真ん中あたりの13章のタイトルは『THE LAST DANCE』です

書評「NBAバスケ超分析 語りたくなる50の新常識」(佐々木クリス)

佐々木クリスさんはNBA解説者、もしくはNBAアナリストという肩書でお仕事をされていると思いますが、常々私の属する業界の言葉を使うとすれば『NBAエバンジェリスト』と呼ばれるべきだなと思っています。『ソフトウェアを開発、運用する為のソフトウェア』を技術者さんに対して商売をしている企業群の中ではエバンジェリストさん達の役割は大きく、彼ら彼女らは営業であり、自らも技術者であり、多くの場合に同じ技術を使う技術者コミュニティーのリーダー、インフルエンサーでもあるという多面的な役割を担いますが、これはまさに佐々木クリスさんが日本NBAファンに対して担っている役割だと思います。

本書『NBAバスケ超分析 語りたくなる50の新常識」はそんなNBAエバンジェリスト佐々木クリスがNBAというリーグの面白さを更なる多くのポテンシャルファンに届けるべく、本人が培ってきたバスケットボールという競技を観る技術を惜しみなく提供し、我々バスケファンひとりひとりをNBAエバンジェリストに変えてやろうという野心作だと感じました。この書籍を読む前と後ではコーナースリーが、オフェンスリバウンドが、ピックアンドロールのディフェンスが、全て違うものに見えるようになっていることでしょうし、その面白さを語りたくなる衝動に駆られているに違いありません。

以下には内容について個人的な感想をいくつか。

私はNBAに限らず国内外の色々なゲームをそれなりに観ているつもりですが、NBAを観ていていると、私の好きなハードショー、ブリッツ、オールコートプレスなど積極的に仕掛けるディフェンスが少ないという感想はずっとあって、そこに物足りなさを感じることもあります。きっと「デメリットがメリットを上回ると判断されているのだろう」とぼんやりと想像はしていたのですが、本書のNo. 17『NBAではリターンよりリスクが大きいハードショー』で数字と共に解説されており、すっきりすることができました。

次はNo. 31.の『すべてを守れる究極のオールラウンダー! 目指せ万能ナイフ』についです。万能ナイフ(英語だとSwiss Army Knife)という言葉は、しばしばソフトウェアの世界では『利用の用途が定められていない悪いデザイン』を示すネガティブなメタファーとして用いられます。私はアメリカは個人的にはそういうアメフト選手的世界観というか、スペシャリストが分業して働く世界観を好む傾向があると感じています。そして本書でも解説されているように、ひと昔前のNBAはその世界観の中にあったと思います。この『万能ナイフ』という言葉がここでポジティブに使われていることこそが、如何に現代のバスケットボールにおいてオールラウンドの活躍ができる選手が求められているのかという象徴だと感じました。

最後に私のブログではたま取り上げる話題ですが、是非Bリーグの方には本書を手にとって頂き、Bリーグについて同様の本を書いてもらうためにはどのような投資をしていくべきなのか、考えるための一つの材料にして頂きたいと思いました。もちろん一夜にしてNBAのようなデータ環境は整備できませんが、一歩ずつであれば必ず近づいていけるはずです。以前の記事でも書いたように、データ環境の拡充はエコシステムの拡大に好影響を与えるはずです。本書が良い例です。NBAがデータに投資していなければデータを駆使するNBAエバンジェリスト佐々木クリスは生まれていないと思いますし、本書も執筆されていないと思います。未来を見据える意味でも是非とも目を通して頂ければ。

NBAデータ取得用のExcelツールを2022-23シーズン用に更新しました

NBAデータ取得用のExcelツールを2022-23シーズン用に更新しました(更新と言っても定数の値をいじくるだけなんですが)。ファイルは以下より取得できます。バージョンは1.7です。

ツールの詳細については以下の記事をご覧ください。

※シーズンの序盤、データを取得しようとしたチームがまだクラッチタイムを経験していない場合、ツールがエラーを出します。が、使用には影響はないはずです。

『Wリーグ選手名辞書』の2022-23バージョンを公開しました

オコエ桃仁花のギリシャ移籍が急遽発表されるなどしましたが、Wリーグの2022-23シーズンロスターもほぼ固まったと判断したので、今シーズン向けに選手名辞書を作成しました。今シーズンから新たに参入する姫路イーグレッツの選手名にももちろん対応しております。

使用方法など、詳細は以下の記事をお読みください。

2022-23シーズン用のスケジュールお知らせbotを開始しました

毎年行っていますが、2022-23シーズン用のスケジュールお知らせbotを開始しました。B1、B2、B3、そしてWリーグのその日の試合を朝6:30~7:00くらいまでの間にお知らせするTwitter用のbotです。

B3のbotはパラメータの変更のみ、Wリーグbotはマイナーチェンジ、そしてB1、B2用のbotはホームページのリニューアルにより結構な修正が必要となりました。おかげでシーズン開始に間に合いませんでした。botのソースコードは以下のリポジトリに上げてありますので、興味のある方がいらしたらこちらをご参照ください。

書評「Giannis」(Mirin Fader)

通勤を少しずつ再開し始めたので、電車の中で読む本にと買ったものだったのですが、気が付けば久し振りに夢中になって読書をしていました。

タイトルの通り本書はヤニス・アデトクンボという稀有なバスケットボールプレイヤーの稀有なバスケットボールキャリア、そしてその稀有な人生をヤニスの誕生前からNBAでチャンピオンになるまでについて書かれたものですが、どちらかというとその稀有な人生を通して世の中の変遷を書くような作りになっていると感じました。

実際にヤニスのご両親がギリシャに来る前のナイジェリアの経済状況ですとか、ギリシャに来た後の経済的困窮や黒人移民への差別、ギリシャ危機、アメリカに渡った後はコロナウイルスによるパンデミックやBlack Lives Matter運動、ヤニスがアメリカでヒーローになった後も続くギリシャの極右団体による変わらぬ人種差別など、そのような背景の説明に多くのページが割かれている印象でした。

印象に残ったエピソードをいくつか。

まずはヤニスのご両親、特にお父様の人柄です。経済的にはとても成功したとは言えず、家族は常に困窮状態にあったようですが、それでもヤニスをはじめ子供達は父親を大変尊敬していたようですし、ヤニスの飾らない驕らない人柄もお父様の人柄に大きく影響を受けていることは間違いないと思いました。ヤニスとお父様のエピソードを一通り読んだあとに、ヤニスがNBAで初めてMVPを取ったときのスピーチを聞き返すと涙腺が緩んでしまいます。

バスケットボール的には、ギリシャの2部リーグでプレーしていた無名のヤニス・アデトクンボの噂を聞きつけ、バスケゴールのひとつが壊れていたくらいの体育館でプレーするヤニスを見にNBAのスカウトがギリシャの町に集まってきたという話が一番印象的でした。NBAのスカウトについてあまり多くを知りませんが、おそらく少しでも有望な選手についての噂を耳にすれば、世界の果てにでもその確認に行くような仕事なのではないかと推測します。実際に、そういう活動が無駄足に終わるような事も多いと本書にも書いてあった気がします。あとドラフト直前にいくつかのチームと密会するシーンはスリリングに書かれていてよかったです。

ヤニスがアメリカに渡った後、アメリカのカルチャーに非常に興奮して楽しみ、そして親しみ、しばらく経った後に強烈なホームシックになるという流れは、自分も留学や駐在を経験した立場からはよく分かるような気がしました。あとヤニスが購入したプレーステーションを返却するというエピソードが出てくるのですが、ヤニスの性格、人柄については本書の中でかなり細部まで書かれているものの、このエピソードが私にとってはもっとも「ヤニスらしい」ものとして印象に残りました。

普通に面白かったので、ヤニスやミルウォーキーのファンはもちろんのこと(ちなみにミルウォーキーという町とバックスの歴史、そしてそこに現れた『希望』としてのヤニスについても多くのページが割かれています)、バスケ好きならとても面白く読めると思うのでお勧めしたいです。より多くの方に読んでもらうためにも、邦訳も出版されるといいですね。

2016-17シーズンからの6シーズンで1試合辺りの6本も多くスリーポイントが放たれるようになっている

Bリーグ(B1、B2合わせて)にて1試合当たりに1チームが放ったスリーポイントの数の推移を見ていくと、2016-17シーズンから2021-22シーズンにかけて中央値で21本→24本、平均値でも20.9本→24.0本と約3本も増加しています。両チーム合わせると1試合当たり約6本もスリーポイントが多く放たれるようになった事になります。

おそらく2022-23シーズンは中央値、平均値で1チーム当たり25本を超えてくるのではないでしょうか。40分間の間に50回のスリーポイントが放たれるということは、24秒に0.5回のスリーポイントという事になりますから、単純に考えればどちらかのチームのオフェンスはスリーポイントが放たれることになりますね。

反比例するように2点ショットが試投数は同時期に中央値で45本→41本、平均値で45.4本→41.1本と、4本あまり減少しています。今回は計算していませんが、所謂ペイントエリア外の2点ショットの推移を見れば更に顕著な傾向が出ている事が予想されます。

期待値の高いショットであるスリーポイントとペイントエリア内のショットを多く打つ戦術で戦うのはもはや常識ですが、各チームの個性がそこに埋もれないようなバスケットボールを観ることが出来ると嬉しいですね。

エコシステムを拡大する為に、Bリーグがデータ絡みで投資するべきポイントを勝手に整理してみる

完全に個人的な意見ですが、スポーツにおいてリーグや協会がデータに投資する目的は「エコシステムの拡大」です。それに尽きます。日本語で言うなら「たくさんの人を巻き込もう」という事です。しかも受け手としてではなく伝え手、発信者として巻き込む。これです。例えばなんですけれど、もしNBAがデータに投資していなかったとしたら、データを駆使するNBAアナリストである佐々木クリスは生まれていなかったかもしれないじゃないですか?*1そしてもしそうだとすると、佐々木クリスさんの解説やYouTubeでバスケの更なる奥深さに気付いた人達も出なかったかもしれないじゃないですか?データに投資して期待するリターンというのは、そういう波及効果だと思います。

今回はBリーグがそのエコシステムを拡大する為に、主にスタッツなどのデータ絡みで投資するべきポイントを勝手に整理してみました。カテゴリをデータの受け手の役割で分類していますが、当然オーバーラップする部分も多いと思います。*2

メディア・記者さん向け

メディアや記者さんはストーリーの伝え手としてBリーグエコシステムに貢献してくれる存在です。ストーリーをサポートする情報として選手やチームの過去の記録は重要ですし、ときには過去の記録からストーリーが起草されることもあると思います。

ポイント

「過去の成績を調べるのが面倒臭すぎるから(もしくは正確か分からないから)このバスケのコンテンツやめた!」と思われない為の、早くて探しやすくて、そして公式なデータ提供。

提供したいデータの例

  • 選手の過去のスタッツ・出場歴・受賞歴
  • 選手の通算記録
  • 選手のチーム所属歴
  • リーグ、チームの過去成績・スタッツ・出場歴・受賞歴

データ取得の技術的要件

WEBブラウズさえ出来れば。

実況者・解説者さん向け

実況や解説が映像越しのスポーツ観戦の善し悪しに多大な影響を与える事は述べるまでもありません。実況者さんや解説者さんはより良い観戦環境の提供を通してBリーグエコシステムに貢献してくれますし、私は素晴らしい実況・解説というのは観戦者の”観戦眼”すら養うと思っているので、一時的な影響だけではなく、永続的な影響すら与え得るものだと思います。

ポイント

Excelでデータをこねくり回したり、自ら過去の試合をまとめ上げたりしなくても、実況・解説を色付ける数値情報が準備できること。現場で起こること(例えば選手の欠場とか)にまつわる数値情報を素早く確認できること。

提供したいデータの例

  • チーム、選手の直近N試合の平均スタッツ
  • 対戦カード直近N試合の両チームの対戦成績、平均スタッツ
  • 各選手がオンコート時、オフコート時のレーティング (欠場・復活した選手の影響が説明できるイメージ)

データ取得の技術的要件

WEBブラウズさえ出来れば。

Bリーグクラブ向け

ちょっと番外編ではありますが、リーグ自体がデータ関連のエンジニアリングに投資しておくと、スタッツの分析等に積極的に投資できるクラブとそうでないクラブとの間の差が埋めやすくなるのではと思います。イメージとしては、ExcelでCSVをこねくり回せるスタッフがいればなんとか勝負になる、くらいの所までサポート出来るといいです。クラブの競争力が増すことは、もちろんBリーグエコシステムにとって重要です。

ポイント

エンジニアリングに投資できないチームでも、最低限のデータの取得はサポートしてあげたいです。もちろんそれを有効活用する為に投資は必要ですが、取得のコストが下がるのは大きいと個人的には想像しています。「プログラミングを書けなくても何とかなるように」と言い換えてもいいかもしれません。

提供したいデータの例

  • 指定した試合分すべてのスタッツやPlay by Play(試合ごと等ではなく、一括でまとめて取得できるイメージ)

データ取得の技術的要件

取得はWEBブラウズさえ出来れば。その後はExcelでCSVをこねくり回せれば。

野良広報・野良アナリスト向け

昨今ではUser Generated Content、つまり消費者側である人間が作り出すコンテンツなんて当たり前の存在です。まったくバカに出来ないどころか、Bリーグの小規模クラブくらいであればブースターの方が書かれている個人ブログがそのチームの広報活動として大きな存在感を放っている例はそんなに珍しくないと思います。また私もその一人という事になると思いますが、最近ではプログラミングなどを駆使し、公式サイトでは見られないアドバンススタッツを計算してランキングを発表したり、独自の観点から指標を作り出したりする方もいらっしゃいます。

こうした方々の熱意を最大限Bリーグエコシステムの拡大に繋げていく為、彼らの活動をサポートする仕掛けは欲しい所です。

ポイント

多少複雑だったり面倒でもいいので、『調べようと思えばどこまでも細かく調べていけるサイト(NBAのスタッツのページのイメージ)』と、それをプログラミングで取得したい人用のAPIを用意するイメージです。

提供したいデータの例

  • その他のカテゴリで述べたもの全て
  • “生”のデータ、もしくはそれに近いデータ(整理された形で提供できれば最高だけど、熱意がある人なら何とかするので最悪そうでなくてもよい)
  • 簡潔に言うなら「あるもの全部出せ」

まとめ

誰得なのか一切分からない記事になってしまいました。

*1:この世界線でも、おそらく別の形で最高のNBAアナリストではあったと思いますが。

*2:オーバーラップする人が多くなると面白いですよね。めっちゃデータ分析に長けた記者さんとか出てきたりとか。