繰り返しの謎解き商会

*

競馬のデータに必ず生じる、タイムラグとノイズ除去の話。どれだけ収集、集計して解析しても、分析や見方を考える上で変わらない大切なこと

      2017/09/24

競馬のデータは正確に数字が出されてることに疑いはありません。しかし、競馬のデータにタイムラグとノイズは必ず生じてるとしたらどう考えるでしょうか。競馬予想に日頃頼りにしているデータにです。どれだけ競馬のデータを収集、集計して解析しても、分析や見方を考える上で変わらない大切なことは、タイムラグから生じるノイズを取り除かないと競馬のデータとして使い勝手が悪くなるということ。

 

競馬のデータを収集して、集計して、解析することは安価にできます。しかし、より使える状態にするのには手間がかかります。しかし、その分析や作業を競馬予想と言っても悪くはないわけで……。

 

スポンサーリンク




中央競馬(JRA)にしても、地方競馬にしてもデータは、かなり揃っている現代競馬。

できない人ほど、データに頼る

なんとも、不気味なタイトルの本を紹介します。アンディ・ミリガン他『できない人ほど、データに頼る』(ダイヤモンド社)

 

競馬予想している人からすると、ムッとする人がいるかもしれません。

 

ブログの更新量を上げるのに、ネタ探しネタ探しと、ルーズリーフに書いてた読書ノートを出してきて、読んでいたら、この本の読書ノートを発見しました(読書ノートって、最近はさぼってますが、書いておくものですね、ネタになる……。発見がある)。

 

競馬のケの字も出て来ない本ですが、関係のない話かというとそうでもない。競馬にはデータはつきものですから。馬柱はデータの固まりなのは間違いない。

 

競馬のデータを確認しやすい時代になった。馬券の売り上げもあがってる……

競馬の予想において、数字で行ける、行けない、馬券を買えるか買えないか、これをパッと表してくれるデータはとてつもなくありがたいものです。このデータがないと予想できないよ、そんなデータは予想する人にひとつふたつ、いやもっとあるでしょう。

 

種牡馬成績、騎手成績、馬場、調教師、馬主、競馬場、ダート芝、距離、枠順、調教、脚質……。

 

今はネットでスマホで馬券を買える時代です(IPATの便利なこと、便利なこと。楽天競馬にオッズパーク、SPAT4……馬券買ってポイント付くとは……)。

 

そして、各種データを見るにしても、パソコンから大きい画面で見られたり。大量のデータ処理も早くできたり。欲しい情報を見つけるのも簡単です。データがふんだんにあるから、予想をする気にもなる。その気持ちの増幅は便利になればなるほど増していきます。事象のデータを収集できますし、集計して分析もできる。

 

ハズレ馬券裁判の卍氏はこのデータ分析をうまくやって馬券で儲けました。

 

関連→卍氏の競馬と追い下げな馬券の買い方推測「馬券裁判男の予想法を解明する本」感想。JRDBファクターシミュレーション。稼げる買い方にするには、工夫が必要?

 

関連→卍氏こと馬券裁判男ブログの存在に驚く。競馬予想で指数に興味はないけど…。作り方や出し方、算出方法の細かい話が重要なので…。精度を上げる理論を読みたいな

 

関連→競馬・馬券の破産確率。購入資金配分、分割比率について学ぶ。『馬券裁判ー競馬で1億5000万円儲けた予想法の真実ー/卍著』感想。負けを先延ばしにする方法

 

JRA中央競馬の売り上げも底を打って上昇ムード。地方競馬の売り上げはどんどん良くなっていってるのもうなづけます。その良くなっていった影響として、データを見やすくなった(そういう競馬ソフトがたくさん出て来た)ことはあるでしょう。

 

参考になるデータは欲しいものです。赤ペンで線引いたり、枠でかこったり。

 

しかし、できない人ほどデータに頼ると言われるとドキッとします。ページめくるのがちょいとコワイヨ。

 

 

データに生じるタイムラグの話は競馬予想にも通ずる

多くのチェアマンやCEOは、市場調査や損益計算書といったデータを頼りにしています。しかし、グリーンはデータが必要なことは理解しつつも、同時にそれだけでは足りないこともわかっています。データには必ずタイムラグが生じるので、実際に店舗を見て確認しないと不足している情報を見つけられないのです。経営がうまくいってる店とそうでない店の違いは、実際に自分の目で確かめない限りわかりません。グリーンは仕入れから店舗設計、マーチャンダイジングまで、すべてのプロセスに携わることでもよく知られています。

 

(※ グリーンとは、フィリップ・グリーンのこと)

 

アンディ・ミリガン他『できない人ほど、データに頼る』(ダイヤモンド社)32-33p より

ありとあらゆるデータにおける、タイムラグ。生まれてしまう、時間差。時間のずれ。それを精査するには実際に自分の目で確認する必要がある……。データの最前線、まさに積み重なっていこうとしている場所を見る。

 

この部分を読んでて、以前、競馬のデータの有益性や無益性を保証するのに「大数の法則」を持ち込むのは正しいのか。という記事を書いたのを思い出したのです。

 

コイン投げやポーカーに使う、コインやトランプには「体力」「気力」という概念はありません。物ですから、消耗という概念はありますが、トランプの体力の回復を待ってポーカーをなんて言いません。だから、短時間に回数をこなすことが可能です。

 

1日に何百、何千とゲームをカジノで行うことは言うまでもなく可能で、今この時間でも世界のどこかのカジノにてゲームは行われているでしょう。その上でのデータ集積もできる。コインやトランプの都合なんて考えなくていいのです。

 

ところが、競走馬はどうでしょうか。

 

一度、1600mなり2000mなり全力疾走した馬が3分後また走るということはありません。レース前に馬場に入って騎手を振り落とし、それなりの距離を走った馬は競走除外となることもしばしば。それは「体力」という概念があるからです。

 

レース前にたくさんの距離を走ってしまうと、公平な競走に支障を来すから、競走除外になるのです。言うまでもなく、データは取れません。

 

騎手も同様でしょう。体力を必要としています。数レースひっかかりっぱなしな馬に続けて騎乗したら腕の疲労度ははんぱないはずです。ズブイ馬を追いまくった場合も同様。

 

人間(賭けに参加する人・体力)×人間(騎手・体力)+馬(体力)……出走させるために関わる人たち

 

次のデータを蓄積するまでに「体力」を回復させる必要がある。データのひとひとつを蓄積するのにとにかく時間がかかる。

 

ゆえに、体力という概念がないものほど、薄いものほど大数の法則として精度が増すのではないだろうかというわけです(いろいろ調べれば面白い表が作れそうな話だな……)。

 

競馬予想に大数の法則(確率)を応用すると、データが簡単に意味を持つのか。回数増やして成績・結果がわかりやすくなるのか?

競馬のデータは1件1件集めるのに時間がかかります。

 

1件と1件の間に「体力の回復」という時間差が生まれる形で集積されてゆきます。タイムラグが生じます。ノイズが生じます。

 

サイコロやコイン、トランプと同じ形ではデータは集積されません。競馬のデータをコイン投げやサイコロを振ることと同じような概念で収集していると考えていたらそれは大きな間違いです。

 

どうやっても、競馬のデータには体力という概念がある以上、無理です。コイン投げ同様の考えをしていたら、競走馬が壊れてしまいますし、騎手も疲弊します。

 

ゆえに、競馬のデータというのはタイムラグが生じる形でないとデータを集めることができないのです。どの競馬のデータにもノイズが混じってるということです。

 

その上で、有益性・無益性がありますよという切り口が提示され、数字が現れるというわけです。「いいですよ、わるいですよ、どうですか?」。

 

そこで恐いのは、何度も書いてるとおり、データ収集に時間差があることによって「ノイズがまじってる」ということ。

 

競馬データには確実にタイムラグがあって集計されてる前提でノイズを除去していく行為が、競馬予想である

いくら有益性があると提示されてても、実際に有益にしようとした場合ノイズと取り除く作業をする必要が出て来る。それが、競馬予想におけるデータです。

 

どれだけ競馬のデータを収集して、集計して、解析、分析して、見方を作り上げていたとしても、タイムラグによるノイズを取り去っていないデータを使い続けると天井(上限)は見えてしまう。回収率の上限は見えてしまってるというわけです。

 

馬券がより当たるようにはならない。利益が増して行かない。

 

ベタ買いで回収率が高かったとしても、ノイズを取り除くことができれば、もっと儲けが増すはず。

 

別のいい方をすれば、ノイズの取り除き方がうまくなるかどうか。そういう人を馬券上手というのだろうと。外れ馬券裁判の卍氏が惜しいなぁと思うのは、ノイズをあまり取り除いてないデータを使ってたからじゃないかな……と推測するのです。動かしたお金に対する利益をみてて、全然一攫千金じゃない額でしたから……。儲かってることには変わりないのだけど……。

 

賭けた金額の倍にせめてなってくれないと……。

 

競馬のデータにあるノイズをうまいこと取り除いてる人たちは、回収率が微妙なデータでもよく見立てて、使える状態に持って行けるでしょう(複勝回収率が微妙でも、複勝率があるデータは特に)。

 

競馬予想というのは有益なデータからノイズを取り、使えるデータにする作業とも言えます。

 

参考→競馬のデータは、的中率・回収率などの確率が高くても事象の集まりにすぎない。どうしてそうなるのか/そうならないのか、意味は答えてくれない

 

データの中にどのようなノイズが混じっているのか、また、混じりやすいのか。

 

いやはや、試行錯誤という絶大な楽しみは続きます……。

 

以上、競馬のデータに必ず生じる、タイムラグとノイズ除去の話。どれだけ収集、集計して解析しても、分析や見方を考える上で変わらない大切なことという話でした。

 

 

プロフィール(ブログを書いてるたけたけっとは?)・Twitter

たけたけっのプロフィールページ(ブログを書いてるたけたけっとは? まとめ)

たけたけっのTwitter

 

スポンサーリンク




競馬ネタ・おすすめまとめ【馬券初めて入門中、初心者(ビギナー)、やり方模索中の方、参考になれば】

【競馬予想の楽しみ方や知識を増やして、馬券成績・回収率上げる研究とコツ。大穴・人気薄。レース映像(動画)を見ながら、など】

穴馬券の謎を探る、競馬予想「方法と復習」のコーナーはこちらから、どうぞ(レース映像分析と勉強!)

 

【今週も、今日も明日も明後日も。土曜日・日曜日。もちろん、来週も……JRAと仲良く! 馬券で負けないポイントを作る考え方・複勝馬券】

複勝馬券とは競馬予想の儲けを近づける、勝てる買い方。人気に関わらず狙い、的中率を上げ負けなくして、ワイド・三連複に繋げる。安定感ある極意・コツであり必勝法

 

【G1・重賞・未勝利! 馬券術の選択。情報・データの選択。ファクター(要素)は何を見て、重視して予想する? その基礎。血統・調教・騎手・ラップタイム……】

競馬予想に大数の法則(確率)を応用すると、データが簡単に意味を持つのか。回数増やして成績・結果がわかりやすくなるのか?

 

【競馬場、ウインズ(wins)、パソコン・スマホ(ネットオンライン・IPAT、A-PAT・即PAT)どこで馬券買っても】

競馬予想の当たる確率、的中率をあげる方法とコツ。数字、人気、オッズ、データの考え方。馬券で勝つ。収支を良くする。組み合わせは大事【ファクター・要素】

 

【JRAの競馬場、東京・中山・阪神・京都・中京・小倉・新潟・福島・函館・札幌……コースの特徴・外枠内枠・有利不利】

馬券初心者は、JRA競馬場で内枠不利な特徴・傾向のあるコースデータを調べて覚えて予想したほうが良い

 

【馬券の買い方、金額の重要ポイント。的中率をあげるための精神的スタンス(なかなかできないけど……)】

競馬で破産しない方法。馬券が外れて授業料になってもいいお金を、購入金額にする。そして、予想を当てる確率高くして授業料回収

 

おすすめ競馬記事

オッズを先行させて予想し続けると、馬券を当てる力はつきにくくなる【競馬・馬券】

JRAのホームページで、中央競馬のレース映像、全レース視聴できるように。これは、良いぞ!【競馬・馬券】

サウンズオブアース・ダービー直線詰まって、抵抗できずにいたけど、神戸新聞杯で来た2着【競馬・馬券】

 

スポンサーリンク




この記事はいかがでしょう

引越し準備の時間なく、費用のお金もない。3LDKアパートに貯めた大量の雑誌、CD、本をブックオフへクリスマスに処分。粗大ゴミはそのあと…【読書・競馬】

山下達郎さんのテレビに出ない、大きい会場でライブツアーしない、本を出さないという印税や年収に関わる、3つのしないことから、お金を稼ぐことを考える

前川清&クールファイブコンサート2015・昼の部を渋谷公会堂まで観に行って来た。あの歌い方を生で見ました。息子さん登場。嗚呼、カラオケに行きたい

 

 - データの見方(情報・結果) , , , , , ,

  •   
  •    
  • このエントリーをはてなブックマークに追加
  •   

  関連記事

競馬の結果や成績から馬券になるデータ・情報を見つけると、同じ傾向はないか収集してまとめようとして目の前の予想をほっぽり出してしまう…

競馬の結果や成績は日々見ます。競馬の結果や成績から、馬券になるデータ・情報を見つけることもある。すると大変。馬券になる同じ傾向のデータはないか、収集してまとめようとしてしまうのです。細かく競馬の結果や成績を見ていると、意外と馬券になるデータ、傾向は見つかったりするのです。もう、俺の競馬データだものと、収集とまとめ作業です。そして、馬券になる傾向データを収集してまとめることが楽しくなってしまい、競馬の結果や成績ばかり見てしまい、目の前の予想をほっぽり出してしまうのです……。あっ、あれっ? いいのか、これ? 俺の競馬予想。

競馬予想で穴馬券を買えなくする原因は、データ(結果・情報)の見方、組み立て方にあるのでは?精度を上げるには…

競馬予想して穴馬券を買い、的中させたいもの。しかし、競馬予想して穴馬券が買えない。来ない。恐い。そこには、競馬予想して穴馬券を買えなくする原因があると思うのです。競馬のデータ(結果・情報)の見方、組み立て方にあると。競馬のデータ(結果・情報)の見方や、組み立て方の精度を上げるにはどうしたらいいのでしょうか。競馬予想してオッズのつく人気のない穴馬を買ってもいいと思えるようになるには……。競馬予想する人の都合にあわせてくれる、データ(結果・情報)の錯覚とは。

競馬のデータは、的中率・回収率などの確率が高くても事象の集まりにすぎない。どうしてそうなるのか/そうならないのか、意味は答えてくれない

競馬のデータは、競馬予想に欠かせないもの。的中率、回収率、馬券になるかならないか。競馬新聞の馬柱に掲載されている数字も競馬のデータです。しかし、競馬のデータは、的中率・回収率などの確率が高くても事象の集まりにすぎない。どうしてそうなるのか/そうならないのか、意味は答えてくれないのです。どんな的中率、回収率な競馬データを使って競馬予想していくときでも、重要なことは「どうしてそうなるのか、どうしてそうならないのか」について知ってるかどうかはあるでしょう。事象の原因を知っていれば応用が可能になりますから。

競馬予想のデータ、情報・成績・結果にはすぐ確認できる検索可能な要素(着順・タイム・血統・オッズ…)と、不可能なものがある

競馬予想のデータ、情報・成績・結果には様々な切り口があります。情報として、データとして、競馬予想に成績や結果は利用できる。しかし、すぐ確認できる検索可能な要素(着順・タイム・血統・オッズ…)と、不可能なもの(レース映像・パドック・返し馬・調教動画)があるのではないかと思いまして。競馬予想のデータ、情報、結果、成績ですぐに確認できるものは、的中率、回収率をパパッと計算できます。枠が決められているからです。文字を見るだけで確率を知ることが可能です。しかし、検索不可能な競馬予想のデータ、情報、結果、成績は簡単にデータを整えることはできません。

JRA中央競馬・地方競馬の新馬戦予想成績は、使えるファクターに差があるので分けることにした話。馬券の買い方も変える

JRA中央競馬・地方競馬の新馬戦は通常のレースと同様に行われ成績が記録されます。しかし、中央競馬・地方競馬の新馬戦は予想に使えるファクターに差がある。今まで新馬戦の成績も他のレースと一緒の成績としてきたのだけど、自分の予想成績は、新馬戦と新馬戦以外に分けることに。そのほうが正確になるでしょう。新馬戦の馬券の買い方も変えていきます。はやり、馬券を買い続けていく上で再現性をしっかりつかんでるデータかどうかは大切です。新馬戦はどうしても再現性をつかんでいるかどうか微妙なデータで馬券を買うレース。他のレースと一緒の感覚でいるのは違うなと考えまして……。

競馬予想に大数の法則(確率)を応用すると、データが簡単に意味を持つのか。回数増やして成績・結果がわかりやすくなるのか?

競馬予想にデータはつきもの。大数の法則(確率)を使い、競馬予想のデータに有用性を持たせる話がある。はて、大数の法則(確率)を競馬予想に取り入れて応用すると、馬券のデータが簡単に意味を持つのでしょうか。大数の法則と競馬予想のデータの関連性を見ていると、簡単に意味を持つ? どうも疑問が走るのでした。カジノに関する本を読んでて、大数の法則を競馬予想に使い、回数増やして成績・結果がわかりやすくなるのはほんのりまやかしではないかと思ったのです。大数の法則でいわれる、サイコロには……。

卍氏の競馬と追い下げな馬券の買い方推測「馬券裁判男の予想法を解明する本」感想。JRDBファクターシミュレーション。稼げる買い方にするには、工夫が必要?

卍氏の競馬と追い下げな馬券の買い方。ファクター推測、競馬予想本・馬券本。「1億5000万円稼いだ馬券裁判男の予想法を解明する本」の感想・レビュー。様々なファクターを使い競馬予想する。馬券の買い方は追い下げで行くのが一番。競馬で稼ぐならば、馬券の買い方は追い下げと感じた本でした。JRDBファクターを使ってシミュレーションして、稼げる馬券の買い方を見つけた。その馬券の買い方を追い下げで買い続けた馬券裁判男こと、卍氏。競馬で、馬券で稼ぐとき、ファクター、データの組み合わせはとっても大切。JRDBのデータ、ファクターを使ってシミュレーション。卍氏は競馬で馬券で稼げる買い方にした。

馬券が当たらない。競馬予想の知識・情報の見方・データの傾向を知れば知るほど…。どうしてですか?

馬券が当たらない。競馬予想の知識、情報の見方、データの傾向を知れば知るほど、馬券が当たらない。どうしてですか? 競馬本や馬券本、ブログを読んで馬券術を競馬予想のために仕入れてても、馬券は当たらない。どうしてか? 馬券が当たる前提で知ったこと、競馬予想の知識、情報の見方、データの傾向を全て足し算で考えているからではないかと。馬券術やデータ、情報は100%内で割合を変えることが大事です。その中で、自分に相性のいいファクター(要素)を見つけ出すこと。相性のいい競馬予想ファクターの知識、データ傾向、情報の見方については誰よりも知っておく。これが馬券の当たらないことから逃れる道かと思います。

競馬予想で指数を使い馬券を買う意味の違和感は、親父の仕事の教え方からだった。予想の精度を上げるには細かさを先行させ、構築することがなによりも大事

競馬予想で指数を使い馬券を買うのは便利で意味があるように見えます。しかし、その買い方に違和感があったのです。どうしてそう感じるのかをブログに書き探っていったところ、親父の仕事の教え方に謎を解く鍵がありました。競馬予想の精度を良くして、当たる確率、的中率や回収率を上げるには細かさを逃げ・先行させ、構築して差して、追い込んでいくことがなによりも大事です。競馬を見るとき指数を使っていると、どうしても深掘りしようというネタが探れません。そこのところを考えて行きます。指数を使って馬券を買うことに違和感を感じた根本要因を見つけたもので。ひとつ前に書いた、中央競馬(JRA)・地方競馬の予想にスピード指数などを使ったことがない話。作り方や出し方の方程式、理論に興味はあるが自作しようと思ったこともないの続き。

中央競馬(JRA)・地方競馬の予想にスピード指数などを使ったことがない話。作り方や出し方の方程式、理論に興味はあるが自作しようと思ったこともない

中央競馬(JRA)や、地方競馬の予想に、競馬新聞に載ってるスピード指数などを使ったことがないという話。競馬ブックのレイティングやJRDB、日刊コンピ指数……能力、タイム、血統、展開指数。競馬予想における、指数の作り方や出し方の方程式、理論に興味はあるのです。しかし、出されてる数字に興味がない。ゆえに、馬券の当たる確率を高めるために自作しようと思ったこともない。そんな、競走馬の能力を数字に見立てる指数について書いてみたいと思います。中央競馬(JRA)でも、地方競馬でも、なんらかの形で競走馬の力を数字化したもの、指数が競馬新聞に書かれています。アンドリューベイヤーの指数、西田式スピード指数、競馬ブックのスピード指数、日刊コンピ、タイム指数、レイティング……。JRDBの指数……。会費が必要だったり、無料のものだったり。