協議項目:バレーボールのデータ環境が抱える問題

提供: e-Volleypedia(eバレーペディア)
移動: 案内検索

バレーボール記事

   バレーボールのデータ環境が抱える問題   




   佐藤 文彦       (アナリスト)   





バレーボールのデータといったら何を思い浮かべますか?

イメージは人それぞれですが、コートエンドからデータを集めているアナリストと呼ばれる人を思い浮かべる人が多いかもしれません。彼らは主にデータバレーと呼ばれるソフトを駆使してデータを集めているわけですが、データバレーを使っている人の数はバレーボールに関わる人の中ではごく一部です。バレーボールのデータは、このようなごく一部の限られた人達の物なのでしょうか。

心配には及びません。バレーボールにもちゃんと開かれたデータはあります。それは、「帳票データ」と呼ばれる試合ごとの記録で、公式サイトから見ることができます。FIVBの管轄の試合ではVIS(Volleyball Information System)、日本国内の試合ではJVIS(Japan Volleyball Information System)という形式で公開されています。

帳票データは、データの詳細さではデータバレーには及びませんが、一般に公開されており、大会全体の試合を網羅しているというメリットがあります。このメリットは小さいものではありません。例えば、Vリーグは1シーズンで全100試合ほどありますが、仮に奮発してデータバレーを購入したとしても、これらの試合を全て見てデータを集めるのはかなりの労力になるからです。

そんなにたくさんの試合のデータを集めなくても、自分たちのチームだけでも集めればいいのでは?と思われる方もいるかもしれません。確かに、1チーム分のデータがあれば、それなりの分析は可能です。しかし、データというものは、全体像が判明することで初めて個々のデータの意味が見えてくるものです。

例えば、以下の図1に2014年のワールドリーグでの男子日本チームの大会通算のアタック決定率(得点÷打数)と失点率(失点÷打数)を示します。

バレーボールのデータ環境-図1.png

さて、この日本の成績は良い成績なのでしょうか、それとも悪い成績なのでしょうか?

そんなことは数値を見ればだいたいわかるという人もいるとは思いますが、データを経験則で判断することは、客観的なデータを主観的に判断するということです。それでは折角のデータの客観性を損なってしまうことにもなってしまいます。

では、この成績を客観的に判断するにはどうするかというと、他のチームを含めた大会の全体的な傾向の中で判断します。以下の図2には、先ほどの日本の成績に加えて、2009年から2014年までの他の参加チームのデータも加えます。

バレーボールのデータ環境-図2.png

このように、他のチームとの相対的な位置づけを比べることで、日本の成績の良し悪しというものが見えるようになると思います。また、他のチームのデータも集まることで平均データも計算することができ、平均からの比較も可能になります。日本の場合、決定率は平均以下ですが、失点率は平均並みということがわかります。

このようなことがあるので、やはり大会を網羅するような大規模なデータが必要となるわけです。VISとJVISという形でのこのようなデータが公開されているということは、バレーボールのデータ環境は他の競技と比較しても恵まれているといえます。この手の記録がさっぱり公開されていない競技も少なくないからです。

前置きが長くなりましたが、ここからが本題です。このようにバレーボールのデータ環境は比較的恵まれていますが、問題もあります。


公開されているVISとJVISデータは、そのままでは分析に使用することができないことです。


どういうことかというと、先ほどの図2を作成した元のデータを以下に示します。

バレーボールのデータ環境-図3.png

これは、各チームのアタックの大会通算データを一括してまとめたものの一部です。このように、データを活用するためには、試合ごとに公開されているVIS・JVISデータを1つのファイルにまとめておく必要があります。

公開されているデータを活用するためには、「集計」というひと手間が必要ということです。ひと手間といいますが、それほど楽な作業ではありません。自分の場合は、VISデータを集計するために、試合ごとの帳票(PDFファイル)をダウンロードし、エクセル形式にファイルを変換、プログラムを組んで一括集計という手順を踏んでいます。他にもやり方はありますが、どれもそれなりの労力が必要です。それでも、帳票とにらめっこをしながら、1つずつデータを人間の手で入力するよりはずっと楽なのですが……。


バレーボールのデータに興味を持ち、自分でもやってみたいと思った人がいたとしても、データを活用する前にこのような作業がハードルとして待っているのが現状です。


こうしたハードルがあるからでしょうか、バレーボールのデータを扱った分析では、小規模なデータ(サンプルが少ない)によるものが少なくありません。扱うデータが小規模であることの問題は、先ほどの図1と図2でも示したところですが、それだけではなく、サンプルが少ないと実施できる分析方法に制限がかかります。これが分析の上での足枷となり、ひいてはバレーボールの理解と発展を阻害します。

また、仮にデータを分析するスキルを持った人がバレーボールに興味を持っても、このような作業が必要なために手を引く可能性もあります。これもまた大きな損失です。

以上のように、バレーボールという競技は、記録が充実しているようでいて、それを活用するには大きなハードルが邪魔をしているというのが現状です。


この状況を改善するにはどうしたら良いものでしょうか?