月別アーカイブ: 2022年6月

2016-17シーズンからの6シーズンで1試合辺りの6本も多くスリーポイントが放たれるようになっている

Bリーグ(B1、B2合わせて)にて1試合当たりに1チームが放ったスリーポイントの数の推移を見ていくと、2016-17シーズンから2021-22シーズンにかけて中央値で21本→24本、平均値でも20.9本→24.0本と約3本も増加しています。両チーム合わせると1試合当たり約6本もスリーポイントが多く放たれるようになった事になります。

おそらく2022-23シーズンは中央値、平均値で1チーム当たり25本を超えてくるのではないでしょうか。40分間の間に50回のスリーポイントが放たれるということは、24秒に0.5回のスリーポイントという事になりますから、単純に考えればどちらかのチームのオフェンスはスリーポイントが放たれることになりますね。

反比例するように2点ショットが試投数は同時期に中央値で45本→41本、平均値で45.4本→41.1本と、4本あまり減少しています。今回は計算していませんが、所謂ペイントエリア外の2点ショットの推移を見れば更に顕著な傾向が出ている事が予想されます。

期待値の高いショットであるスリーポイントとペイントエリア内のショットを多く打つ戦術で戦うのはもはや常識ですが、各チームの個性がそこに埋もれないようなバスケットボールを観ることが出来ると嬉しいですね。

エコシステムを拡大する為に、Bリーグがデータ絡みで投資するべきポイントを勝手に整理してみる

完全に個人的な意見ですが、スポーツにおいてリーグや協会がデータに投資する目的は「エコシステムの拡大」です。それに尽きます。日本語で言うなら「たくさんの人を巻き込もう」という事です。しかも受け手としてではなく伝え手、発信者として巻き込む。これです。例えばなんですけれど、もしNBAがデータに投資していなかったとしたら、データを駆使するNBAアナリストである佐々木クリスは生まれていなかったかもしれないじゃないですか?*1そしてもしそうだとすると、佐々木クリスさんの解説やYouTubeでバスケの更なる奥深さに気付いた人達も出なかったかもしれないじゃないですか?データに投資して期待するリターンというのは、そういう波及効果だと思います。

今回はBリーグがそのエコシステムを拡大する為に、主にスタッツなどのデータ絡みで投資するべきポイントを勝手に整理してみました。カテゴリをデータの受け手の役割で分類していますが、当然オーバーラップする部分も多いと思います。*2

メディア・記者さん向け

メディアや記者さんはストーリーの伝え手としてBリーグエコシステムに貢献してくれる存在です。ストーリーをサポートする情報として選手やチームの過去の記録は重要ですし、ときには過去の記録からストーリーが起草されることもあると思います。

ポイント

「過去の成績を調べるのが面倒臭すぎるから(もしくは正確か分からないから)このバスケのコンテンツやめた!」と思われない為の、早くて探しやすくて、そして公式なデータ提供。

提供したいデータの例

  • 選手の過去のスタッツ・出場歴・受賞歴
  • 選手の通算記録
  • 選手のチーム所属歴
  • リーグ、チームの過去成績・スタッツ・出場歴・受賞歴

データ取得の技術的要件

WEBブラウズさえ出来れば。

実況者・解説者さん向け

実況や解説が映像越しのスポーツ観戦の善し悪しに多大な影響を与える事は述べるまでもありません。実況者さんや解説者さんはより良い観戦環境の提供を通してBリーグエコシステムに貢献してくれますし、私は素晴らしい実況・解説というのは観戦者の”観戦眼”すら養うと思っているので、一時的な影響だけではなく、永続的な影響すら与え得るものだと思います。

ポイント

Excelでデータをこねくり回したり、自ら過去の試合をまとめ上げたりしなくても、実況・解説を色付ける数値情報が準備できること。現場で起こること(例えば選手の欠場とか)にまつわる数値情報を素早く確認できること。

提供したいデータの例

  • チーム、選手の直近N試合の平均スタッツ
  • 対戦カード直近N試合の両チームの対戦成績、平均スタッツ
  • 各選手がオンコート時、オフコート時のレーティング (欠場・復活した選手の影響が説明できるイメージ)

データ取得の技術的要件

WEBブラウズさえ出来れば。

Bリーグクラブ向け

ちょっと番外編ではありますが、リーグ自体がデータ関連のエンジニアリングに投資しておくと、スタッツの分析等に積極的に投資できるクラブとそうでないクラブとの間の差が埋めやすくなるのではと思います。イメージとしては、ExcelでCSVをこねくり回せるスタッフがいればなんとか勝負になる、くらいの所までサポート出来るといいです。クラブの競争力が増すことは、もちろんBリーグエコシステムにとって重要です。

ポイント

エンジニアリングに投資できないチームでも、最低限のデータの取得はサポートしてあげたいです。もちろんそれを有効活用する為に投資は必要ですが、取得のコストが下がるのは大きいと個人的には想像しています。「プログラミングを書けなくても何とかなるように」と言い換えてもいいかもしれません。

提供したいデータの例

  • 指定した試合分すべてのスタッツやPlay by Play(試合ごと等ではなく、一括でまとめて取得できるイメージ)

データ取得の技術的要件

取得はWEBブラウズさえ出来れば。その後はExcelでCSVをこねくり回せれば。

野良広報・野良アナリスト向け

昨今ではUser Generated Content、つまり消費者側である人間が作り出すコンテンツなんて当たり前の存在です。まったくバカに出来ないどころか、Bリーグの小規模クラブくらいであればブースターの方が書かれている個人ブログがそのチームの広報活動として大きな存在感を放っている例はそんなに珍しくないと思います。また私もその一人という事になると思いますが、最近ではプログラミングなどを駆使し、公式サイトでは見られないアドバンススタッツを計算してランキングを発表したり、独自の観点から指標を作り出したりする方もいらっしゃいます。

こうした方々の熱意を最大限Bリーグエコシステムの拡大に繋げていく為、彼らの活動をサポートする仕掛けは欲しい所です。

ポイント

多少複雑だったり面倒でもいいので、『調べようと思えばどこまでも細かく調べていけるサイト(NBAのスタッツのページのイメージ)』と、それをプログラミングで取得したい人用のAPIを用意するイメージです。

提供したいデータの例

  • その他のカテゴリで述べたもの全て
  • “生”のデータ、もしくはそれに近いデータ(整理された形で提供できれば最高だけど、熱意がある人なら何とかするので最悪そうでなくてもよい)
  • 簡潔に言うなら「あるもの全部出せ」

まとめ

誰得なのか一切分からない記事になってしまいました。

*1:この世界線でも、おそらく別の形で最高のNBAアナリストではあったと思いますが。

*2:オーバーラップする人が多くなると面白いですよね。めっちゃデータ分析に長けた記者さんとか出てきたりとか。

書評「データで強くなる! バスケットボール最強の確率」(小谷究 、木村和希)

遂に日本でバスケのデータ分析に関する書籍が出版される

勝手ながら「遂に日本でもバスケットボールのデータ関連の書籍が出版されたか」と本書を手にして感慨にふけっておりました。本書はバスケットボール関連の書籍ではお馴染みの小谷究さんと、千葉ジェッツでアナリストとして活躍されています木村和希さんの共著となります。

木村さんに関しては以下の記事なんかに詳しいですし、私もTwitterではフォローさせて頂き、勉強させて頂いてます。


さて本書ですが、まずはっきり言ってしまうと上記の記事や木村さんのSNS等で日々情報を追っている方であるならば、目新しい情報や手法や考え方がたくさん載っているという事はないと思います。ただネットというのはどうしても情報を体系的に掴むのには向いていない所がありますし、このように一つの書籍として物理的にまとまるという事は非常に意義の大きい事だと思います。

指導者の、選手の、アナリストの、バスケファンの、ふと手が伸ばせる所にバスケデータ分析の書籍がある、それがこの先に与える影響はとてもポジティブなのではないでしょうか。

目新しい事はないと言いましたが、とは言え本書を読んで「面白いなぁ!」と思った事改めて感心した事も多かったので、3つに分けてご紹介したいと思います。

日本でトップクラスのヘッドコーチのアナリスト感、スタッツ感が知れる

一つ目ですが、序章として掲載されている大野篤史元千葉ジェッツHCによる『ヘッドコーチのアナリストやスタッツとの付き合い方』が非常に面白いです。正直言って、この序章だけでもお金を払う価値があると思ったくらいです。

バスケの世界においてもアナリストという存在は近年どんどんとその役割や重要性が認知されてきていると思いますが、では実際にその役割がチームの最終決定にどのような影響を及ぼしているのか、という事が意思決定者の視点から語られた情報はこれまであまりなかったように思います。それをBリーグのトップHCのひとりである大野さんが、アナリストとどのように働いているのか、アナリストに何を求めているのか、アナリストから出てくる数字をどのように意思決定の為に解釈、消化しているのかなどの観点から話しているのですから、面白くない訳はありません。

まずは手元にあるデータから始められる内容になっている

二つ目ですが、この書籍が「とりえあず手元にあるデータから始めてみよう」という作りになっていることです。これは三つ目のポイントにも関連する内容ですが、分析をする為のデータがどのようなチームにも潤沢に用意されている訳ではありません。それはプロチームとて例外ではないと思いますが、プロ未満のカテゴリーであれば尚更ではないかと思います。本書はいわゆる『オフィシャルスコア』を使った分析から話題が始められており、個人的には「まずは手元にあるデータを何とか有効活用するべし」というメッセージだと解釈し、とても好感を持ちました。近年では技術の進化により、ビデオの撮影も、それを使った映像のタグ付けも決して特別な事ではなくなりましたが、データ分析を始めるのであれば、そういう所に投資する前にまずは手元にあるものの有効活用から始めてみるべきだと個人的には思います。

Bリーグトップクラスの分析の仕事が可視化されて、今後のデータ分析への投資が促進される事が想像できる

三つ目ですが、それは色々な角度からこの書籍がバスケ界のスタンダードを押し上げるだろうという事が想像できることです。冒頭の大野さんの章を読めば、若きコーチや、コーチを目指す人材たちが刺激されるのは間違いないと思います。自分のコーチとしてのスタッツとの付き合い方は正しいのか、そう問い直す方もいることでしょう。

またPart 3『アドバンススタッツから読み取れること』あたりからは木村さんが日々千葉ジェッツにて着目している指標や値が説明されていますが、これらの内のいくつかは千葉ジェッツというチームに木村さんという人材がいたから有効活用されているという点は無視できないと私は考えます。例えばデータ分析をする為にはデータの取得が必要な訳ですが、私が知っている限り(そして想像し得る限り)、まだまだBリーグ内ではこの「データの取得」に関する敷居が残念ながら高く*1、たまたまその敷居を超える為のエンジニアリングに投資できる組織であるとか、たまたまアナリストがそういうスキルセットを有していたとか、そういう事でもない限りはBリーグのチームであってもこの書籍で説明されている内容まではなかなか到達できていないだろうというのが私の見解です。つまり、この書籍の内容で、この分野のリーグトップクラスの仕事を垣間見ることが出来ると考えています。そしてこうして可視化されてしまったことで、否応なく自チームとの差について考えざるを得なくなるだろうと予想しています。

そうして本書をきっかけに分析について考えるヘッドコーチ、GM、オーナー、社長、スタッフ、選手、そしてブースターが更に多くなり、結果としてこのエリアへの新たな投資に繋がっていくのではないでしょうか。長いシーズンを戦っていく上で選手やコーチ以外の力が重要になってくるのは当然の事ですが、データ分析の相対的な重要性に光が当たる、そんなきっかけになる書籍なのではないかと思います。

まとめ

Bリーグファンなのに、まだ『木村本』持ってないの?

*1:これはBリーグさんが、もっとみんなが簡単にデータを取得できるように頑張らなければならない部分でもあります。

WリーグのTwitterフォロワー数通知botを作成しました

Wリーグも全チームTwitterアカウントが揃ったようなので、Bリーグと同じくフォロワー数の監視botを作成してみました。

現時点でのフォロワー数を眺めていても結構面白くて、高田真希や馬瓜エブリンの知名度がお茶の間に浸透していく一方、デンソーやトヨタ自動車はその印象に比べるとフォロワー数が多くないです。インスタグラム等ではもしかしたら多いのかもしれませんが、東京羽田やシャンソンよりも少ないというのは意外でした。

しかし東京羽田ヴィッキーズはフォロワー数が1万超えていて2番手とは結構凄いですね。同チームの歴史には詳しくないですが、決して現時点では知名度が高めのチームではないと思うので、どのようにここまで伸ばして来たのかは興味深いです。あ、でもときどき同チームからいいねをもらったりするので、SNS担当者がしっかりと活動されている結果かもしれないですね、単純に。

2022-23よりWリーグに参入予定の姫路イーグレッツはまだ1000フォロワーにも満たないようなので、バスケファンの皆様はよろしければフォローよろしくお願い致します。

『Wリーグ選手名辞書』を公開しました

PCやスマホにてWリーグの選手名をより簡単に間違いなく入力する為の、いわゆるIME用の辞書を作成し公開しました。以下のgithubのリポジトリからダウンロードして利用可能です。

この辞書ですが、このブログ執筆時点でWリーグの公式ページから辿って見つかる208名の選手を対象に作成しています(おそらく2021-22シーズンのロスターだと思います。)漢字の表記などは公式ページに記載されているものをそのまま採用しています。

例えば私のWindows PCのMSIMEにユーザー辞書として選手名を登録した所、以下のような文章が一発変換できるようになりました。正直こんな文章を書くことは中々ないのですが、それでもバスケ選手の名前が一気に変換されるとちょっと感動です。

日本代表のスターティングファイブは町田瑠唯、林咲希、宮澤夕貴、オコエ桃仁花、そして渡嘉敷来夢だった。

スマホでもこんな感じでガンガン変換予測にWリーグの選手の名前がサジェストされるようになりました。バスケツイ廃のQoLもこれで爆上げしそうです。

各ファイルの説明

githubにある各ファイルの説明は以下です。各IMEへの登録方法はウェブで検索するなどして調べて頂ければと思います。ATOKやBaidu IMEなどは個人的に使ったことがないのですが、辞書のフォーマットにしろ登録方法にしろどれも似たり寄ったりだとは思います。

  • Scraper.R
  • WLeaguePlayerNameDictGenerator.Rproj

公式ページをスクレイピングして辞書データを作るためのプログラムです。もしプログラム自体をご覧になりたい方がいましたらこちらをどうぞ。

  • WLeaguePlayerNameDict_202122_CSV_UTF8_RawData.csv

辞書の元データです。自分で辞書のフォーマットに合わせて辞書データを作成したい場合にお使い頂けます。

  • WLeaguePlayerNameDict_202122_TSV_UTF16LE.txt

UTF-16LE(リトルエンディアン)でフォーマットしたタブ区切りのファイルです。品詞の情報も入っています。Windows標準IMEであるMSIMEにユーザー辞書として登録するテキストファイルとしてお使い頂けるはずです。

  • WLeaguePlayerNameDict_202122_TSV_UTF8.txt

UTF-8でフォーマットしたタブ区切りのファイルです。品詞の情報も入っています。PCやスマホで使えるGoogle日本語入力のユーザー辞書として登録するテキストファイルとしてお使い頂けるはずです。

P.S.

本当はBリーグでも同様の辞書を作りたいのですが、Bリーグは公式ページに名前の『読み』の情報がローマ字でしか公開されていないんですよね。よってローマ字から仮名に変換する処理を書く必要があり、それを書いた暁にはBリーグ選手名辞書も作りたいと思います。

追記

よくよく考えたら、ローマ字を読みに変換するのは機械的には出来ませんね。なのでBリーグさん、是非読みのデータを公開してください!

BリーグTwitterフォロワー数通知botにFE名古屋と仙台を追加しました

B1の各チーム公式Twitterアカウントのフォロワー数を通知するbotを作ってから等しいですが、2021-22シーズンの結果を踏まえFE名古屋と仙台をそこに追加しました。

新たな2チームを追加する為に色々と文言を削ったりしたのですが、もはやTwitterno文字数制限ぎりぎりなので、何処かのチームでフォロワー数の桁が増えると更なる調整が必要になりそうです。

なお、オフシーズン中にWリーグの各チームについても同様のbotで通知できればと思っております。

bleaguerのデータ更新は2021-22シーズンを以って終了しました

表題の通りなのですが、私が作ったB.LEAGUEデータ分析用Rパッケージ『bleaguer』のデータ更新を、先日行った2021-22レギュラーシーズン、ポストシーズンのデータを反映を以って終了することにしました(ちなみに『ビーリーガー』じゃなくて『ビーリーグアール』と読みます。)

2021-22のデータも、延長の表記が”EX”から”OT”に変わっていたりしてマイナーな対応が必要だったり、4Qのデータが欠損しているゲームが2試合ほどあったりしたのですが、いずれにせよ(多分)すべてのゲームのデータをスクレイピングすることが出来ました。

bleaguerを公開したのは2019年の1月なので、約3年半ほど開発・保守・データ更新をしていたことになります。公開は2019年ですが、データ自体は初年度分(2016-17)から2021-22まで6シーズン分のデータが入っております。

元々は自分が趣味でやってるデータ分析作業を楽にする為に自分用に作ったパッケージでしたが、作っているうちに「いつかどっかの大学生が研究用にでも使ってくれたりして」なんて考えも出てきましたし、実際にそのような用途でご利用頂いたこともありました。それは個人的にはとても嬉しい経験でした。ありがとうございます。

データ更新を終了する理由

データ更新を2021-22シーズンで終了する理由ですが、まず一つ目の理由は今オフシーズンにBリーグサイトのリニューアルが予定されている事です。

スクレイピングは相手のページ変更にひたすら対応する必要がある作業です。上述の件も含めて、これまでの3年半でもいくつかのマイナーチェンジに対応してきたのですが、今度のリニューアルはちょっと大きな変更だと予想しております。それに対応する時間もモチベーションもないだろうというのがまず一つ目の理由です。*1

二つ目の理由ですが、もうこの作業からプログラミングの知識、技術の観点において学べる事が少なくなってきたという事です。正直Rのパッケージ作り方どころか、当初はRもそんなに使ったことがありませんでした。スクレイピングもやりこんだ事もありませんでしたし、Dockerを使った事もなかったですね。そう考えるとこの活動を通して随分と色々な事を学べました。自分で始めたことですが、とても勉強になり感謝の気持ちです。

プログラミングではなくバスケのデータという観点においても、Bリーグさんが提供してくれるデータが変わらない以上、そろそろそこから得られるものというか、面白いと感じられることが少なくなりつつありました。Play by Playなんかをこねくり回してアドバンスドスタッツやそれに類するものを作り出したりして、そういうときが一番楽しかったのですが、自分の中ではそういう活動もひと段落ついたかなという気持ちです。*2

三つ目の理由は、単純に2022-23シーズン中はちょっとプライベートが忙しくなりそうだという事です。

もちろんこれからも変わらずバスケファンですし、これからも変わらずソフトウェアエンジニアなので、例えばBリーグのデータプラットフォームが変更されて新しい事が出来るようになったとか、何かバスケ関連で面白いソフトウェアのアイデアが思いついたとか、そういう事があればまた新しい活動をしようという気持ちはあります。モチベーションが刺激されるような何かがあるか、それにすべてがかかってますね。それとは別に、いつかNBAみたいにデータがAPIで取得可能になったりしたら、サンプルプログラムの作成なんかでエコシステムの拡大に協力できればとも思っています。

以上です。何かの縁でbleaguerを目にしてくださった皆様、ありがとうございました。

参照

以下がbleaguer関連のコードの全てです。私なんかの作品でも誰かしらの勉強になったり参考になったりするかもしれないので、こちらにリンクを置いておきます。*3

*1:余談ですが、データをほぼ即日反映させていたバスナビDBさんは本当に凄いです。私は最初は毎週データ更新をかけてましたが、月一になり、隔月になり、最後はシーズンに2回とかになってました。スクレイピングはコマンドひとつで自動なのにも関わらずです(笑)

*2:これも余談ですが、ここは一部のバスケファンはBリーグさんに期待している部分のはずです。既にあるデータの組み合わせで作り出せるアドバンスドスタッツは勿体ないのでファンが普通に見られるようにした方がいいと思いますし、既に計測しているのにも関わらずまだ見られないものがあるなら(いや、あるよね?)早く見られるようにしたいですね。リニューアル、その後の改善サイクルまで含めて期待しています。

*3:こうやって公開したものから学びあったり、協力しあったりするのが、ソフトウェアエンジニア的世界観の美しさだと信じています。