数量化1類では予想対象は速度となりますが、数学的表現では従属変数とか目的変量(変数)とか外的基準とか呼ばれる実数で、量的データとも言われ、Kg、m、Km/hrなどの単位を持つ連続変数となります。競馬では具体的には3つ存在します。一つ目はゴール前600m(3ハロン)の速度です。通常上がり3ハロンタイムと表記されています。例えば36.0秒などになります。この場合の速度は秒速であれば16.67m/sec、分速であれば1000m/min、時速であれば60Km/hrとなります。速度理論では上がり3ハロンタイムから求めた速度を上がり速度と表現します。
二つ目はスタートからゴール前600m地点の速度です。速度理論ではペース速度と表現します。例えば2000mを2分00.0秒で走破した場合、スタートからゴール前600m(3F地点)前までの距離は1400mとなり、上がりが36.0秒であれば、1400mを84秒で走破した事になります。その時の速度は秒速では16.67m/sec、分速では1000m/min、時速では60km/hrとなり、これがペース速度となります。
三つ目は全距離を走破した場合の速度です。速度理論では走破速度と表現します。前述の2000mを2分00.0秒で走破した場合は、秒速では16.67m/sec、分速では1000m/min、時速では60km/hrとなり、これが走破速度となります。
私のロジックでは、この3つの速度を別々に計算しています。特に上がり速度とペース速度は非常に多彩で興味ある情報を与えてくれます。走破速度は上がりとペースの情報が相殺されて余り面白い情報では有りません。例えば走破タイム(速度)が同じでも、前半ハイペースで上がりが掛かっていいる場合と前半スローペースで上がりを短いタイムで突っ切って場合もありますので、走破速度ではレースの内容を現しきれないません。そこで速度理論では走破速度(走破タイム)を上がり速度とペース速度から求めています。別個に計算した走破速度は予想ロジックの中では使用せずに参考値として用いています。上がり速度とペース速度から求めた走破速度(走破タイム)は別個に計算した物と区別する為に合成速度(合成タイム)と表記しています。
それでは、予想因子とは何かですが、要因、因子、説明変数あるいはファクターと呼ばれていますが、数量化1類では”アイテム(item)”と言われています。数学的な表現では質的データと呼ばれ、性別、職業など単位(Kg、mなど)を持たない離散変数となります。ところで性別では普通男と女に区分けされますが、この男と女の区分を、数量化1類では”カテゴリー(category)”と言います。競馬予想では、アイテムは騎手、調教師、種牡馬(父馬、母父馬)などとなり、カテゴリーは騎手と言うアイテムの中で武豊、安藤勝巳などの個々の騎手に相当します。ウエイトとはカテゴリーの影響度の事で、競馬では武豊の影響速度などと表現しします。具体的には武豊は他の騎手よりどれだけ、例えば時速で1km/hr(他の騎手であれば60Km/hrであるが武豊が騎乗すれば61Km/hrとなる)だけ速く走らせる事を意味します。なお、数量化1類ではウエイトの事を”スコア(score)”と表現します。また、カテゴリーの事をダミー変数と言う場合もあります。
今回、速度理論と数量化分析に使用しているモデル構造と予想パラメータの全てを公開します。これは私のソフトの心臓部分で、実際に組み込まれているものです。公開した理由は速度理論・数量化分析と一般の指数理論を差別化するためです。私の理論のルーツは1970年代に勤めていた会社と関係があった英国原子力公社のRadiochemical Centreが研究者向けに出していたパンフレットに掲載されていた非線形回帰のプログラムにヒントを得たもので、競馬とは全く関係しない分野からの発想です。ダウンロードできるファイルの内容はエクセルファイルです。さらにF27に定義されている基礎牝馬を見つけ出す為の母母母***12代母まで探れるデータテーブルです。これはミトコンドリア因子を想定しました。
なお、エクセルファイルの内容を見れば分かりますように、予想因子は質的データであり、単位を持たない離散変数と言って置きながら、大量の量的データ(馬体重、ハンデキャップ-Kg)を扱っているではないかと言う疑問が湧くと思います。量的データをカテゴライズ(例えば、馬体重を430Kgから10Kg刻みで区分)して質的データとするのは理論上間違いではありませんが、このような分析手法は実験計画法に代表されるように非常に少ないサンプルを有効に利用する観点からすれば情報の取りこぼしを起こし邪道と見られています。しかし、現在では社会・経済現象あるいはグーグルの検索などサンプル数は大量に確保できる対象を分析する要求が広がって来ており、量的データをカテゴライズして質的データとして扱うのは時代の流れのような気がします。競馬データでは芝コースを例にとりますと3年で70000データ、5年では100000データ以上が確保出来ますので量的データをカテゴライズしても十分なサンプル数を供給できると考えます。
実際に速度(タイム変換可能)を求める具体的な数式は前述のエクセルファイルに纏めました予想因子のカテゴリーウエイト(スコア-影響速度)を加算するわけです。即ち、上がり速度=F1〜F30の対応するカテゴリーのウエイト(影響速度)の合計となります。ペース速度も同様です。最後に合成速度=f(上がり速度、ペース速度)として求め必要ならばタイムにも変換します。f関数は上がり3Fの距離が600mと分かっていますので、それ程難しくはないと思います。