当ページには広告が掲載されております。

競馬のデータ予想と情報収集【マイニングの意味なくすタイムラグとノイズ】

競馬のデータ予想と情報収集【マイニングの意味なくすタイムラグとノイズ】

 

「競馬のデータ予想。正確に数字であることに疑いはない。情報収集する手段、方法、コツは様々。しかし、競馬のデータにマイニングの意味をなくすタイムラグとノイズは必ず生じてるとしたらどう考えるでしょう。

 

日頃頼りにしている競馬予想データにしても、有料無料、どんな集め方をして情報収集分析するにしても。データ分析にpythonを使うにしても。また、マイニング的なことをしない、自作でアナログに法則を見つけるとしても。

 

どれだけ競馬のデータを収集、集計して解析しても、分析や見方を考える上で変わらない大切なことは、タイムラグから生じるノイズを取り除かないと競馬のデータとして使い勝手が悪くなることです。データにある回収率的中率にノイズが混じってるが基本という話。気をつけることとも言えます。

 

どんな方法や手段、サイトで手に入れた競馬情報も、スマホアプリもエクセルで整えてたとしてもです。競馬aiや人工知能のする機械学習の方向性おかしくするのも、タイムラグとノイズのせいでしょう」。

 

【競馬まとめ】
競馬まとめ【競馬予想・馬券の買い方・確率の上げ方など、記事数豊富】

「競馬予想方法のまとめ」「競馬のやり方のまとめ」「馬券に関わるまとめ」「競馬の確率を上げるまとめ」などなど。「競馬データを細かく見てしまう人のまとめ」です。「競馬のデータを大きな数字の偏りだけで見ていない人のまとめ」と言った方がいいかもしれません。競馬の1事象、1事象見てまとめる感覚です。「マニアックなまとめ」になってます。

競走馬レース映像分析【50音順一覧】
競走馬レース映像分析【50音順一覧】

「競走馬レース映像分析の【50音順一覧】です。「馬券になった前走分析」のリスト。どの騎手が、どの産駒が、どの競馬場のどのコースの前走だった馬が今回馬券になったのか。今回予想している馬に近しい馬はいないか。「レース映像分析」は手間のかかる競馬予想であるものの「パターンは繰り返す」」。

中央競馬・地方競馬・競馬場別一覧【レース・コースの特徴・傾向を結果から映像分析まとめ】
中央競馬・地方競馬・競馬場別一覧【レース・コースの特徴・傾向を結果から映像分析まとめ】

「中央競馬(JRA)・地方競馬(NAR)の競馬場別【レース・コースの特徴・傾向を結果から映像分析まとめ】一覧。レースやコースの特徴・傾向をレース映像分析したまとめの「中央競馬(JRA)の競馬場別、地方競馬(NAR)の競馬場別」一覧です。東京競馬場・中山競馬場・阪神競馬場・京都競馬場・中京競馬場・新潟競馬場・福島競馬場・小倉競馬場・函館競馬場・札幌競馬場・大井競馬場・川崎競馬場・船橋競馬場・浦和競馬場」

 

スポンサーリンク



 

競馬のデータがあてにならない、意味がないと思われる要因はある

競馬のデータがあてにならない、意味がないと思われる要因はある

競馬のデータを収集して、集計して、解析することは安価にできます。

 

しかし、より使える状態にするのには手間がかかります。競馬のデータに意味を持たせるのにはデータそのものでは不十分になってるということです。期待値を見てもデータの期待値とデータ入力、分析を泥臭くした人の期待値は別物です。

 

その分析や作業を競馬予想と言っても悪くはないわけで……。

 

競馬情報を収集した手段や方法をよりよくするヒントとアイデアについて書きました。

 

競馬のデータがあてにならない、意味がないと思われる要因でもあるかと。

 

データは過去の結果を見ていて、収集習得されて抽出されているもの。データとデータの間はあまり見られていなく……。

 

スポンサーリンク



 

中央競馬(JRA)も、地方競馬にしてもデータ情報は、かなり揃っている現代競馬

中央競馬(JRA)も、地方競馬にしてもデータ情報は、かなり揃っている現代競馬

なんとも、競馬のデータ予想をする上で不気味なタイトルの本を紹介します。

 

アンディ・ミリガン他『できない人ほど、データに頼る』(ダイヤモンド社)

 

競馬予想している人からすると、ムッとする人がいるかもしれません。

 

競馬のケの字も出て来ない本ですが、関係のない話かというとそうでもない。競馬にはデータはつきものですから。条件別データ、出遅れ、前半3ハロン、ラップタイムなどなど。馬柱はデータの固まりに間違いない。

 

データのあるところ、分析や味方はあるもの。最終的に予想するわけで、競馬とは関係がある話です。

 

スポンサーリンク



 

競馬のデータを確認しやすい時代になった

競馬のデータを確認しやすい時代になった

競馬の予想において、数字で馬券を買えるか買えないか、これをパッと表してくれるデータはとてつもなくありがたいもの。このデータがないと予想できないよ、そんなデータは予想する人にあるでしょう。

 

オッズ、過去10年、騎手、クラス別、血統傾向、種牡馬傾向レース結果コース枠、東京、中山、京都に阪神データ、新馬戦に障害戦、ハンデ戦。

 

データというデータは大抵あります。

 

ハズレ馬券裁判の卍氏はこのデータ分析をうまくやって馬券で儲けました。

 

スポンサーリンク



 

競馬のデータ予想しやすくなった

競馬のデータ予想しやすくなった

JRA中央競馬の売り上げも底を打って上昇ムード。地方競馬の売り上げはどんどん良くなっていってるのもうなづけます。

 

良くなっていった影響として、競馬予想のデータを見やすくなった(そういう競馬ソフトがたくさん出て来た)ことはあるでしょう。データ分析の見方やり方がしやすくなれば参加者も増えます。

 

参考になるデータは欲しいものです。赤ペンで線引いたり、枠でかこったり。

 

しかし、できない人ほどデータに頼ると言われるとドキッとします。ページめくるのがちょいとコワイヨ。

 

スクレイピング!(呪文じゃねぇーよ)。

 

スポンサーリンク



 

データに生じるタイムラグの話は競馬予想にも通ずる

データに生じるタイムラグの話は競馬予想にも通ずる

「多くのチェアマンやCEOは、市場調査や損益計算書といったデータを頼りにしています。しかし、グリーンはデータが必要なことは理解しつつも、同時にそれだけでは足りないこともわかっています。データには必ずタイムラグが生じるので、実際に店舗を見て確認しないと不足している情報を見つけられないのです。経営がうまくいってる店とそうでない店の違いは、実際に自分の目で確かめない限りわかりません。グリーンは仕入れから店舗設計、マーチャンダイジングまで、すべてのプロセスに携わることでもよく知られています」。

 

(※ グリーンとは、フィリップ・グリーンのこと)

 

アンディ・ミリガン他『できない人ほど、データに頼る』(ダイヤモンド社)32-33p より

ありとあらゆるデータにおける、タイムラグ。生まれてしまう、時間差。時間のずれ。

 

それを精査するには実際に自分の目で確認する必要がある……。データの最前線、まさに積み重なっていこうとしている場所を見る。

 

競馬予想のデータはその点で取得は間接的に出来てる。

 

競馬のデータと大数の法則

競馬のデータと大数の法則

『できない人ほど、データに頼る』を読んでて、以前、競馬のデータの回収率を保証するのに「大数の法則」を持ち込むのは正しいのか。という記事を書いたのを思い出したのです。

 

「コイン投げやポーカーに使う、コインやトランプには「体力」「気力」という概念はありません。物ですから、消耗という概念はありますが、トランプの体力の回復を待ってポーカーをなんて言いません。だから、短時間に回数をこなすことが可能です。

 

1日に何百、何千とゲームをカジノで行うことは言うまでもなく可能で、今この時間でも世界のどこかのカジノにてゲームは行われているでしょう。その上でのデータ集積もできる。コインやトランプの都合なんて考えなくていいのです。

 

ところが、競走馬はどうでしょうか。

 

一度、1600mなり2000mなり全力疾走した馬が3分後また走るということはありません。レース前に馬場に入って騎手を振り落とし、それなりの距離を走った馬は競走除外となることもしばしば。それは「体力」という概念があるからです。

 

レース前にたくさんの距離を走ってしまうと、公平な競走に支障を来すから、競走除外になるのです。言うまでもなく、データは取れません。

 

騎手も同様でしょう。体力を必要としています。数レースひっかかりっぱなしな馬に続けて騎乗したら腕の疲労度ははんぱないはずです。ズブイ馬を追いまくった場合も同様。

 

人間(賭けに参加する人・体力)×人間(騎手・体力)+馬(体力)……出走させるために関わる人たち

 

次のデータを蓄積するまでに「体力」を回復させる必要がある。データのひとひとつを蓄積するのにとにかく時間がかかる。

 

ゆえに、体力という概念がないものほど、薄いものほど大数の法則として精度が増すのではないだろうかというわけです(いろいろ調べれば面白い表が作れそうな話だな……)」。

 

競馬予想に大数の法則(確率)を応用すると、データが簡単に意味を持つのか。回数増やして成績・結果がわかりやすくなるのか?

競馬のデータは1件1件集めるのに時間がかかります。

 

1件と1件の間に「体力の回復」という時間差が生まれる形で集積されてゆきます。タイムラグが生じます。ノイズが生じます。

 

スポンサーリンク



 

サイコロやコイン、トランプと同じ形でデータ集積されない

サイコロやコイン、トランプと同じ形でデータ集積されない

サイコロやコイン、トランプと同じ形ではデータは集積されません。

 

ロト6やロト7、ミニロトにナンバーズ、ビンゴ5とは考え方が違います。競馬のデータをコイン投げやサイコロを振ることと同じような概念で収集していると考えていたらそれは大きな間違いです。

 

どうやっても、競馬のデータには体力という概念がある以上、無理です。コイン投げ同様の考えをしていたら、競走馬が壊れてしまいますし、騎手も疲弊します。競輪、競艇、ボートレース、toto、プロ野球のデータ予想も同様。

 

ゆえに、生き物×生き物な競馬のデータというのはタイムラグが生じる形でないとデータを集めることができないのです。どの競馬のデータにもノイズが混じってるということです。

 

その上で、回収率ありますよという切り口が提示され、数字が現れるというわけです。「いいですよ、わるいですよ、どうですか?」。

 

そこで恐いポイントは、何度も書いてるとおり、データ収集に時間差があることによって「ノイズがまじってる」ということ。

 

競馬データには確実にタイムラグがあって集計されてる前提でノイズを除去していく行為が、競馬予想である

競馬データには確実にタイムラグがあって集計されてる前提でノイズを除去していく行為が、競馬予想である

いくら有益性があると提示されてても、実際に有益にしようとした場合ノイズと取り除く作業をする必要が出て来る。それが、競馬予想におけるデータです。

 

どれだけ競馬のデータを収集して、集計して、解析、分析して、見方を作り上げていたとしても、タイムラグによるノイズを取り去っていないデータを使い続けると天井(上限)は見えてしまう。回収率の上限は見えてしまってるというわけです。

 

馬券がより当たるようにはならない。利益が増して行かない。

 

ベタ買いで回収率が高かったとしても、ノイズを取り除くことができれば、もっと儲けが増すはず。

 

スポンサーリンク



 

馬券上手はデータのノイズを取り除く

馬券上手はデータのノイズを取り除く

別のいい方をすれば、ノイズの取り除き方がうまくなるかどうか。そういう人を馬券上手というのだろうと。外れ馬券裁判の卍氏が惜しいなぁと思うのは、ノイズをあまり取り除いてないデータを使ってたからじゃないかな……と推測するのです。

 

競馬のデータにあるノイズをうまいこと取り除いてる人たちは、回収率が微妙なデータでもよく見立てて、使える状態に持って行けるでしょう(複勝回収率が微妙でも、複勝率があるデータは特に)。

 

競馬予想というのは有益なデータからノイズを取り、使えるデータにする作業とも言えます。

 

データの中にどのようなノイズが混じっているのか、また、混じりやすいのか。

 

いやはや、試行錯誤という絶大な楽しみは続きます……。

 

以上、競馬のデータ予想と情報収集【マイニングの意味なくすタイムラグとノイズ】でした。

 

複勝とは。競馬予想の回収率、的中率を上げる馬券術。投資の勉強?馬券生活?儲ける計算、買い方勝ち方。ワイド【必勝法】
競馬の複勝とは【オッズの見方を勝ってる人に近づける馬券・買い方】

「競馬の複勝とはオッズの見方を勝ってる人に近づける馬券-買い方-。複勝とは競馬と馬券の基本です。オッズに振れ幅(1.1〜1.3)があり、買い方を考えていく参考になります。回収率、的中率をあげる一番有効な馬券が複勝。時間はかかりますが、オッズの見方を勝ってる人の買い方へ近づける可能性のある馬券です」。

「新馬戦予想法」買い方のコツ。競馬の評価と傾向。今週の想定にデビュー予定待ち遠しい
新馬戦予想法・買い方のコツ【競馬の評価と傾向。今週の想定にデビュー予定待ち遠しい】

「新馬戦予想法。買い方のコツ。競馬の評価と傾向。今週の想定にデビュー予定待ち遠しい。中央競馬(JRA)、地方競馬の新馬戦は春過ぎから始まります。2歳新馬、3歳新馬。今週の想定にデビュー予定待ち遠しい日々が続きます」。

3連複フォーメーションとボックスは点数考え、競馬必勝法と買い方を確率高く作っていける
3連複フォーメーションとボックス【点数考え、競馬必勝法と買い方を確率高く作っていける】

「3連複フォーメーションとボックスは点数考え、競馬必勝法と買い方を確率高く作っていける。3連複の買い方で、3連複フォーメーションは点数数える手間はあるもののその人の競馬必勝法を作っていく上で具合がいい。自分の予想を流す仕組み作り、3連複フォーメーション。選び方がある程度決まってくる感じがあります」。

 

おすすめ競馬予想本・馬券本

JRA公式データを用いたデータ分析マニュアル

数式を使わないデータマイニング入門~隠れた法則を発見する~ (光文社新書)

実践データマイニング―金融・競馬予測の科学

 

【競馬ネタ】おすすめ記事

『経済は感情で動く。はじめての行動経済学』マッテオ・モッテルリーニ。仕事もお金もギャンブルも!
『経済は感情で動く。はじめての行動経済学』マッテオ・モッテルリーニ【仕事もお金もギャンブルも!】

2023/9/20

「『経済は感情で動く。はじめての行動経済学』マッテオ・モッテルリーニ。仕事もお金もギャンブルも!日常にある意思決定心理学。マッテオ・モッテルリーニ『経済は感情で動く はじめての行動経済学』(紀伊國屋書店)。おすすめ本・レビュー【面白い作品】。行動経済学。確かに、経済が感情で動いているところはある」。

馬のしっぽに赤いリボンは蹴り癖感情サイン。英国ではテールライトを装着【競馬】
馬のしっぽに赤いリボンは蹴り癖感情サイン【英国ではテールライトを装着・競馬】

2023/9/23

「馬のしっぽに赤いリボンは蹴り癖感情サイン。英国ではテールライトを装着【競馬】。馬のしっぽに赤いリボンは蹴り癖のサイン。競走馬も感情あります。競馬知識として知ったのはいつだったか。馬のしっぽに赤いリボンの理由を知っても競馬予想には活かせないけど……」。

競馬好きな人への、誕生日プレゼントに。男性、女性問わない「ポンピン堂」のおすすめ、守袋。友達に、彼氏彼女に。もらって嬉しいアイテム。還暦祝いにも
競馬好きな人への、誕生日プレゼントに【男性、女性問わない「ポンピン堂」のおすすめ、守袋。友達に、彼氏彼女に】

2023/9/20

「競馬好きな人への誕生日プレゼントに是非。「ポンピン堂」の守袋。競馬を趣味としている人たち、競馬好きな人たちがもらって嬉しいプレゼントでしょう。競馬予想が趣味という方々のプレゼントに。競馬好きな、両親、男性、女性問わず。彼氏、彼女、友達の誕生日プレゼントに」。

2020年馬券的中レース一覧 後半
2020年【馬券的中レース・ツイッターつぶやき一覧】後半

2023/9/20

  目次2020年馬券的中レース一覧 後半2020.112020.102020.92020.82020.7【競馬ネタ】おすすめ記事【競馬レース映像分析】おすすめ記事 2020年馬券的中レース一覧 後半 自己満足記事でございます。   2020年Twitterなどにあげてた馬券的中 ...

 

スポンサーリンク



 

【競馬レース映像分析】おすすめ記事

レッドバロッサ-競馬成績に特徴あるレースを映像分析-
レッドバロッサ【競馬成績に特徴あるレースを映像分析】

2023/9/25

「レッドバロッサ(ドレフォン産駒)。前走レースの競馬成績に特徴あると気になった馬。前走7着。次走、2歳未勝利戦(阪神競馬場・阪神ダート1800m・不良馬場・先行馬)1番人気1着(C.デムーロ騎手・音無秀孝厩舎)。(コーナー増の距離延長)【阪神競馬予想】」。

【アズマクィーン】-競馬成績に特徴あるレースを映像分析-
アズマクィーン【競馬成績に特徴あるレースを映像分析】

2023/9/27

「阪神競馬場・「阪神芝1800m」。10番人気で2着に来たのは、「アドマイヤムーン産駒」のアズマクィーン(河内洋厩舎・菱田裕二騎手)。アズマクィーンの馬券、2番人気、3番人気が飛んで複勝は2020円に。複勝の4ケタオッズでございます。前走、不利のあった馬の距離延長【阪神競馬予想】」。

中山牝馬ステークス2019・2着ウラヌスチャームの前走レース映像分析
中山牝馬ステークス2019・2着ウラヌスチャームの前走レース映像分析

2023/9/26

「ウラヌスチャーム(ルーラーシップ産駒)。2019年中山牝馬ステークス2着(中山競馬場・中山芝1800m・ミナリク騎手・斎藤誠厩舎)の前走レース映像分析。前走は、愛知杯(中京芝2000m)4着【中山競馬予想】」。

ニュージーランドトロフィー2017・1着ジョーストリクトリの前走レース映像分析
ニュージーランドトロフィー2017・1着ジョーストリクトリの前走レース映像分析

2023/9/27

「ジョーストリクトリ(ジョーカプチーノ産駒)。2017年ニュージーランドトロフィー1着(中山競馬場・中山芝1600m・シュタルケ騎手・清水久詞厩舎)の前走レース映像分析。前走は、ファルコンステークス(中京芝1400m)6着【中山競馬予想】」。

 

「レース映像分析の見方 発売中」

-無料競馬予想【JRA中央競馬・地方競馬】