「AI予想」を謳う競艇予想サイトの中身を、元データサイエンティストの編集長がガチで検証してみた

Q: AI予想と謳う競艇予想サイトは本当にAIを使っているのですか?

ごく一部は本物のAIモデル (ロジスティック回帰・勾配ブースティング・ニューラルネット等) を運用していますが、 大半のサイトは「過去データの平均集計」「単純な人気順ソート」 をAIと称している、 マーケティング用語としての『AI』 です。 編集部が30サイト以上を技術的に検証した結果、 機械学習の特徴量設計・モデル構造を 公開している、 もしくは推論結果に統計的整合性があるサイトは 業界全体で5サイト程度でした。

Q: 本物のAI予想サイトを見分けるポイントは何ですか?

(1) 使用しているモデル名・特徴量・学習データ範囲を 公開しているか (2) 「直近30日の的中率○○%」 を 母数付きで時系列で出しているか (3) 同一データセットでの 検証スクリプト or バックテスト結果を 開示しているか、 の3点です。 これらが揃わないサイトの「AI」 表記は マーケティングコピーと判断していい確率が高いです。

Q: AI予想サイトを実際に使う場合、 何に気をつければ良いですか?

(1) 「30日無料お試し」 で 最低1ヶ月の実成績を 自分のExcel等に記録する (2) 母数付きの的中率・回収率を公開しているサイトを選ぶ (3) 「AI」 という単語だけで判断せず、 使用モデル・特徴量設計の説明文を読む、 の3点です。 公的なAI予想 (場の公式AI・スポーツ紙系AI予想) と 民間予想サイトのAIは別物として扱うのも重要です。

「AI予想で的中率90%!」「機械学習モデルで過去最高の回収率達成!」 ─ ボートレース予想サイト業界でこの2-3年、「AI予想」を看板に掲げるサイトが一気に増えた。そして大半が、中身は「AIと呼べるかどうかかなり怪しい」ものだ、というのが元データサイエンティスト10年の俺から見た業界の実情です。

この記事では、 NUS統計学修士で機械学習モデルの構築・実装の現場で 10年やってきた人間として、業界で氾濫している「AI予想」看板の中身を技術的に切り分ける。何が本物で、何がマーケティング用語としての「AI」で、ユーザーはどこを見て判断すれば騙されずに済むか、全部書く。

まず、競艇のAI予想は数学的に「ある程度は」機能する

最初に断っておきたいのが、「競艇のAI予想はそもそも嘘なんでしょ?」という極論には俺は与しません。競艇のレース結果は、選手の級別・モーター成績・進入隊形・体重・気象条件・水面コンディション・スタートタイミング ─ こういった数十次元の特徴量からある程度予測可能な確率分布です。ここにロジスティック回帰・勾配ブースティング (XGBoost・LightGBM 等)・ニューラルネットワークを適切に当てれば、ランダム予想 (1/120の3連単) よりは確実に良い的中率を出せる。これは数学的な事実です。

実際、競艇場の公式AI予想 (ボートレースびわこの「びわこAI予想」等) や、公的データを使った個人開発のAIプロジェクト (Boaters・梅吉AI・PC-KYOTEI 等) は、ちゃんと特徴量設計・モデル構造を公開しており、長期的にも一定の整合性のある予測精度を出している。これらは「本物」のAI予想です。

問題は、民間予想サイト業界の大多数が、こういう本物のAIではなく、「AI」という単語をマーケティングコピーとして使い回しているだけ、という点にあります。

業界に氾濫する「AI予想」看板の3パターン

俺が編集部として 30サイト以上を技術的に検証した結果、「AI予想」を看板に掲げるサイトは、だいたい以下の3パターンに分類できる。

パターン1: 単なる「過去データの平均集計」をAIと呼んでいる

最も多いのが、これ。サイトの裏側でやっているのは、過去N年分のレース結果から「選手Aが ○号艇から ○着になった割合」を単純集計しているだけ。これは Excelのピボットテーブルで 5分で書ける処理であって、機械学習でも AIでも何でもありません。

見分け方はシンプルで、そのサイトの「予想根拠」を何件か読んでみる。「○○選手は1号艇からの勝率が高いため、 1着予想」「モーター2連対率が60%超なので注目」みたいな、単一の特徴量だけで予想根拠を語っているなら、 99% 過去データの平均集計です。

本物の機械学習モデルなら、「複数の特徴量を重み付きで組み合わせた結果、この組み合わせの確率が最大」という多次元の判断になるので、予想根拠がもう少し複雑になる (or そもそも「内部モデルの推論結果」として詳細は説明できない形になる)。

パターン2: 「AI」という単語を見出しだけに使い、中身は人力予想

次に多いのが、サイトのトップに「AI予想搭載!」「機械学習で当てる!」とデカデカと書いておきながら、実際の予想配信は普通の予想記者・元選手系ライターが書いている、というパターン。これは詐欺ではないけど、ユーザーから見たら「AIで予想してると思って登録したのに、蓋を開けたらふつうのプロ予想だった」という看板倒れになる。

見分け方: 予想記事の末尾に「監修: ○○ (元選手・記者名)」「予想師 ○○ の今日の本命」等のクレジット表記があれば、ほぼ確実に人力予想です。「AI」はサイト全体のブランディングコピーとして使われているだけ。

パターン3: 「ニューラルネットワーク」「ディープラーニング」等の専門用語を文脈不明に並べている

たまにあるのが、サイト内の「サービス紹介」ページに「弊社のAIはディープラーニングとベイズ統計を融合した独自モデルで」「BERT技術を採用した自然言語処理で予想記者の文章から特徴量を抽出」みたいな、機械学習の専門用語を並べているサイト。

俺の本職目線で言うと、こういう文章はほぼ100% 「AIを知らない人が GPT等で適当にそれっぽく書かせたコピー」です。なぜかと言うと、本物のデータサイエンティストは「BERT」「ディープラーニング」みたいなバズワードを文脈なしに並べることは普通やらない。もし本当にこれらの技術を使っているなら、「○○データセットで ○○の損失関数を最適化した結果、直近30日の予測精度が ○○」みたいに、具体的な実装と数値で説明します。用語だけが浮いているサイトは、中身が伴っていないと判断していい。

本物のAI予想サイトを見分ける、 3つの判定基準

じゃあ、ユーザー視点で「本物のAI」を見分けるには、何を見ればいいか。元データサイエンティストとして、 3つの基準を提示します。

基準1: 使用モデル・特徴量・学習データを公開しているか

本物のAI予想サイトは、ほぼ例外なく「うちはこういうモデル (例: 勾配ブースティング) を使って、こういう特徴量 (例: 選手級別・モーター2連対率・進入隊形・体重差・気象データ) を学習させている」という説明文を持っています。これが無いサイトは、そもそも内部にモデルが存在しない可能性が高い。

例えば、編集部が観測している範囲では Boaters・梅吉AI・PC-KYOTEI・びわこAI予想等は、程度の差はあれモデル構造の説明を持っています。これは「うちはちゃんとエンジニアが組んだAIを運用しています」という自己開示の姿勢でもあります。

基準2: 母数付きの的中率・回収率を時系列で公開しているか

「AI予想で的中率90%!」みたいな数字は、母数 (検証期間・対象レース数・買い目構成) が明示されていない限り、統計的に意味がありません。本物のAI予想サイトは「直近30日: 対象レース数 300・的中数 ○○・的中率 ○○%・回収率 ○○%」のように、母数付きで時系列で公開しています。

この数字が月ごとに出ていて、かつ良い月・悪い月の両方が含まれているサイトは、統計的に整合的な運用をしている確率が高い。逆に、「過去最高的中率の月のスクショだけ」を載せ続けているサイトは、母数の都合いい切り取りで数字を作っている可能性が高いです。

基準3: バックテスト結果や検証スクリプトを開示しているか

これは少しハードルが高いですが、「うちのモデルを過去○○年のデータでバックテストすると、こういう累積回収率になる」というグラフや、「使っている特徴量の重要度」を可視化しているサイトは、本物の機械学習プロジェクトです。これは内部にエンジニアが居て、データサイエンス的にサイトを運営しているという強い証拠。

民間予想サイトではここまでやっているところはほぼ無いですが、個人開発系のAI予想プロジェクト (PC-KYOTEI 等) は公開しています。これらは「予想サイト」というより「データサイエンス勉強プロジェクト」として運営されていて、商業性は低い分、技術的な信頼性は圧倒的に高い。

「AI予想で的中率90%」が数学的に成立しない理由

ここで、業界で一番よく見る「AI予想で的中率90%」系のキャッチコピーが、なぜ数学的にほぼ嘘なのかを簡単に説明しておきます。

競艇の3連単は 120通りの組み合わせの中から 1通りを当てるゲームです。ランダム予想の的中率は 1/120 = 約0.83%。平均的な競艇ファン (オッズ・選手成績を見て買う人) でも、 3連単の的中率は 7-12% 程度に落ち着くのが統計的な実情です。

そこから「AI予想で的中率90%」を実現するには、ランダム前提で計算すると 120通り中 108通り以上 (=90/100×120) を抑える必要があります。実際の競艇は完全ランダムではなく人気艇に確率の偏りがあるので、高確率な買い目から順に絞れば 1レースあたり 80-100点程度の多点買いで的中率90%は数学的に不可能ではない。ただし、そこまで多点買いすると還元率75%の構造上、 1レースあたりの平均回収率は必ず100%未満になる ─ つまり的中はするが投資金額のほうが配当より大きい状態が続きます。

つまり「的中率90% + 回収率プラス」を同時に成立させるサイトは、数学的に存在しません。業界で見る「的中率90%」は、ほぼ全てが「特定のレースだけ」「特定の買い目だけ」を切り取った数字で、サイト全体の長期回収率を反映したものではない。母数が示されていない数字は、マーケティングコピーと判断していいです。

推奨スタンス

このメディアでは、「AI予想」を看板に掲げるサイトの中で編集部が技術的に検証して中身が伴っていると判断したサイトのみを推奨枠 (SS〜A級) に入れています。現状の推奨ランキングでは:

AI予想 + 人間補正のハイブリッド型: 競艇タッグ (推奨3位) ─ AIの推論結果に専門家が手動補正をかける2段構え
公的データ駆動型 (老舗・公式系): 梅吉AI・Boaters・びわこAI予想・PC-KYOTEI ─ モデル構造・特徴量設計を公開している本物の機械学習プロジェクト

これら以外で「AI予想」を看板に掲げているサイトは、編集部としては「AI と呼ぶには中身が伴っていない」と判断して、推奨ランキングには入れていません。

騙されないために、自分で確認すべき3項目 (まとめ)

最後に、ユーザーが自分で「このAI予想サイト、本物か?」を判断する時のチェック項目をまとめておきます。

モデル構造の説明があるか: サイト内に「使用しているAIモデル・特徴量・学習データ範囲」の説明文があるか。無いサイトはほぼ確実に AI看板倒れ。
母数付きの的中率を時系列で出しているか: 「直近30日: 検証レース数 ○○・的中率 ○○%・回収率 ○○%」のような数値開示があるか。切り取り数字ばかりの場合は警戒。
「90%」系の煽り数字を使っていないか: 競艇の数学的構造上、 90%超の的中率を長期で実現するのは不可能。こういう数字を見出しに掲げているサイトは、数学的整合性のないマーケティング設計と判断していい。

この3つを満たすサイトに絞れば、「AI予想」看板の99%は候補から外れます。残る数サイトが、編集部として推奨できる本物のAI予想です。 1-2サイトを自腹で1ヶ月試して、自分の収支データとサイトの公表数字が一致しているかを確認するのが、最終的な判断材料になります。

よくある質問 (FAQ)

Q. AI予想と謳う競艇予想サイトは本当にAIを使っているのですか?

A. ごく一部は本物のAIモデル (ロジスティック回帰・勾配ブースティング・ニューラルネット等) を運用していますが、大半のサイトは「過去データの平均集計」「単純な人気順ソート」をAIと称している、マーケティング用語としての『AI』です。編集部が30サイト以上を技術的に検証した結果、機械学習の特徴量設計・モデル構造を公開している、もしくは推論結果に統計的整合性があるサイトは業界全体で5サイト程度でした。

Q. 本物のAI予想サイトを見分けるポイントは何ですか?

A. (1) 使用しているモデル名・特徴量・学習データ範囲を公開しているか (2) 「直近30日の的中率○○%」を母数付きで時系列で出しているか (3) 同一データセットでの検証スクリプト or バックテスト結果を開示しているか、の3点です。これらが揃わないサイトの「AI」表記はマーケティングコピーと判断していい確率が高いです。

Q. 「AI予想で的中率90%」は数学的にあり得ますか?

A. 競艇は還元率75%・3連単の平均的中率は7-12%程度 (1/120の組み合わせから的中) なので、 90%の的中を継続するのは数学的にほぼ不可能です。「ある期間の・特定買い目だけの切り取り」「サンプルが極めて少ない」等の前提があれば数値としては出せますが、長期運用での「90%」は統計的に成立しません。母数 (期間・対象レース数・買い目構成) が示されていない数字は鵜呑みにしないでください。

Q. AI予想サイトを実際に使う場合、何に気をつければ良いですか?

A. (1) 「30日無料お試し」で最低1ヶ月の実成績を自分のExcel等に記録する (2) 母数付きの的中率・回収率を公開しているサイトを選ぶ (3) 「AI」という単語だけで判断せず、使用モデル・特徴量設計の説明文を読む、の3点です。公的なAI予想 (場の公式AI・スポーツ紙系AI予想) と民間予想サイトのAIは別物として扱うのも重要です。

「AI予想」 を謳う競艇予想サイトの中身を、 元データサイエンティストの編集長がガチで検証してみた

本文

まず、 競艇のAI予想は 数学的に「ある程度は」 機能する

業界に氾濫する「AI予想」 看板の3パターン

パターン1: 単なる「過去データの平均集計」 をAIと呼んでいる

パターン2: 「AI」 という単語を見出しだけに使い、 中身は人力予想

パターン3: 「ニューラルネットワーク」「ディープラーニング」 等の専門用語を 文脈不明に並べている