「AI予想で的中率90%!」「機械学習モデルで 過去最高の回収率達成!」 ─ ボートレース予想サイト業界で この2-3年、 「AI予想」 を看板に掲げるサイトが 一気に増えた。 そして 大半が、 中身は「AIと呼べるかどうか かなり怪しい」 ものだ、 というのが 元データサイエンティスト10年の俺から見た 業界の実情です。

この記事では、 NUS統計学修士で 機械学習モデルの構築・実装の現場で 10年やってきた人間として、 業界で氾濫している「AI予想」 看板の中身を 技術的に切り分ける。 何が本物で、 何が マーケティング用語としての「AI」 で、 ユーザーは どこを見て判断すれば 騙されずに済むか、 全部書く。

まず、 競艇のAI予想は 数学的に「ある程度は」 機能する

最初に断っておきたいのが、 「競艇のAI予想は そもそも嘘なんでしょ?」 という極論には 俺は与しません。 競艇のレース結果は、 選手の級別・モーター成績・進入隊形・体重・気象条件・水面コンディション・スタートタイミング ─ こういった 数十次元の特徴量から ある程度 予測可能な確率分布です。 ここに ロジスティック回帰・勾配ブースティング (XGBoost・LightGBM 等)・ニューラルネットワーク を 適切に当てれば、 ランダム予想 (1/120の3連単) よりは 確実に良い的中率を 出せる。 これは 数学的な事実です。

実際、 競艇場の 公式AI予想 (ボートレースびわこの「びわこAI予想」 等) や、 公的データを使った 個人開発のAIプロジェクト (Boaters・梅吉AI・PC-KYOTEI 等) は、 ちゃんと特徴量設計・モデル構造を 公開しており、 長期的にも 一定の整合性のある 予測精度を出している。 これらは「本物」 のAI予想です。

問題は、 民間予想サイト業界の大多数が、 こういう本物のAIではなく、 「AI」 という単語を マーケティングコピーとして 使い回しているだけ、 という点にあります。

業界に氾濫する「AI予想」 看板の3パターン

俺が編集部として 30サイト以上を技術的に検証した結果、 「AI予想」 を 看板に掲げるサイトは、 だいたい以下の3パターンに分類できる。

パターン1: 単なる「過去データの平均集計」 をAIと呼んでいる

最も多いのが、 これ。 サイトの裏側でやっているのは、 過去N年分のレース結果から「選手Aが ○号艇から ○着になった割合」 を 単純集計しているだけ。 これは Excelのピボットテーブルで 5分で書ける処理であって、 機械学習でも AIでも 何でもありません。

見分け方は シンプルで、 そのサイトの「予想根拠」 を 何件か読んでみる。 「○○選手は1号艇からの勝率が高いため、 1着予想」「モーター2連対率が60%超なので 注目」 みたいな、 単一の特徴量だけで予想根拠を語っているなら、 99% 過去データの平均集計です。

本物の機械学習モデルなら、 「複数の特徴量を 重み付きで組み合わせた結果、 この組み合わせの確率が最大」 という 多次元の判断になるので、 予想根拠が もう少し複雑になる (or そもそも「内部モデルの推論結果」 として 詳細は説明できない形になる)。

パターン2: 「AI」 という単語を見出しだけに使い、 中身は人力予想

次に多いのが、 サイトのトップに「AI予想搭載!」「機械学習で当てる!」 と デカデカと書いておきながら、 実際の予想配信は 普通の予想記者・元選手系ライターが書いている、 というパターン。 これは詐欺ではないけど、 ユーザーから見たら「AIで予想してると思って 登録したのに、 蓋を開けたら ふつうのプロ予想だった」 という 看板倒れになる。

見分け方: 予想記事の末尾に「監修: ○○ (元選手・記者名)」「予想師 ○○ の今日の本命」 等の クレジット表記があれば、 ほぼ確実に 人力予想です。 「AI」 は サイト全体のブランディングコピーとして使われているだけ。

パターン3: 「ニューラルネットワーク」「ディープラーニング」 等の専門用語を 文脈不明に並べている

たまにあるのが、 サイト内の「サービス紹介」 ページに 「弊社のAIは ディープラーニングと ベイズ統計を 融合した独自モデルで」「BERT技術を採用した自然言語処理で 予想記者の文章から特徴量を抽出」 みたいな、 機械学習の専門用語を 並べているサイト。

俺の本職目線で言うと、 こういう文章は ほぼ100% 「AIを 知らない人が GPT等で 適当に それっぽく書かせたコピー」 です。 なぜかと言うと、 本物のデータサイエンティストは「BERT」「ディープラーニング」 みたいなバズワードを 文脈なしに並べることは 普通やらない。 もし本当に これらの技術を使っているなら、 「○○データセットで ○○の損失関数を 最適化した結果、 直近30日の予測精度が ○○」 みたいに、 具体的な実装と数値で 説明します。 用語だけが浮いているサイトは、 中身が伴っていないと判断していい。

本物のAI予想サイトを見分ける、 3つの判定基準

じゃあ、 ユーザー視点で「本物のAI」 を見分けるには、 何を見ればいいか。 元データサイエンティストとして、 3つの基準を 提示します。

基準1: 使用モデル・特徴量・学習データを 公開しているか

本物のAI予想サイトは、 ほぼ例外なく「うちは こういうモデル (例: 勾配ブースティング) を使って、 こういう特徴量 (例: 選手級別・モーター2連対率・進入隊形・体重差・気象データ) を 学習させている」 という説明文を 持っています。 これが無いサイトは、 そもそも内部に モデルが存在しない可能性が高い。

例えば、 編集部が観測している範囲では Boaters・梅吉AI・PC-KYOTEI・びわこAI予想 等は、 程度の差はあれ モデル構造の説明を持っています。 これは「うちは ちゃんと エンジニアが組んだAIを 運用しています」 という 自己開示の姿勢でもあります。

基準2: 母数付きの的中率・回収率を 時系列で公開しているか

「AI予想で 的中率90%!」 みたいな数字は、 母数 (検証期間・対象レース数・買い目構成) が 明示されていない限り、 統計的に意味がありません。 本物のAI予想サイトは「直近30日: 対象レース数 300・的中数 ○○・的中率 ○○%・回収率 ○○%」 のように、 母数付きで時系列で 公開しています。

この数字が 月ごとに 出ていて、 かつ 良い月・悪い月の両方が含まれているサイトは、 統計的に 整合的な運用をしている確率が高い。 逆に、 「過去最高的中率の月のスクショだけ」 を 載せ続けているサイトは、 母数の都合いい切り取りで 数字を作っている可能性が高いです。

基準3: バックテスト結果や 検証スクリプトを 開示しているか

これは少しハードルが高いですが、 「うちのモデルを 過去○○年のデータで バックテストすると、 こういう累積回収率になる」 というグラフや、 「使っている特徴量の重要度」 を可視化しているサイトは、 本物の機械学習プロジェクトです。 これは 内部に エンジニアが居て、 データサイエンス的に サイトを運営しているという 強い証拠。

民間予想サイトでは ここまでやっているところは ほぼ無いですが、 個人開発系のAI予想プロジェクト (PC-KYOTEI 等) は 公開しています。 これらは「予想サイト」 というより 「データサイエンス勉強プロジェクト」 として 運営されていて、 商業性は低い分、 技術的な信頼性は 圧倒的に高い。

「AI予想で的中率90%」 が 数学的に成立しない理由

ここで、 業界で 一番よく見る「AI予想で 的中率90%」 系の キャッチコピーが、 なぜ 数学的に ほぼ嘘なのかを 簡単に説明しておきます。

競艇の3連単は 120通りの組み合わせの中から 1通りを当てる ゲームです。 ランダム予想の的中率は 1/120 = 約0.83%。 平均的な競艇ファン (オッズ・選手成績を見て買う人) でも、 3連単の的中率は 7-12% 程度に落ち着くのが 統計的な実情です。

そこから「AI予想で 的中率90%」 を 実現するには、 ランダム前提で計算すると 120通り中 108通り以上 (=90/100×120) を 抑える必要があります。 実際の競艇は 完全ランダムではなく 人気艇に確率の偏りがあるので、 高確率な買い目から順に絞れば 1レースあたり 80-100点程度の多点買いで 的中率90%は 数学的に 不可能ではない。 ただし、 そこまで多点買いすると 還元率75%の構造上、 1レースあたりの 平均回収率は 必ず100%未満になる ─ つまり 的中はするが 投資金額のほうが配当より大きい状態が 続きます。

つまり「的中率90% + 回収率プラス」 を 同時に成立させるサイトは、 数学的に 存在しません。 業界で見る「的中率90%」 は、 ほぼ全てが「特定のレースだけ」「特定の買い目だけ」 を 切り取った数字で、 サイト全体の長期回収率を 反映したものではない。 母数が示されていない数字は、 マーケティングコピーと判断していいです。

推奨スタンス

このメディアでは、 「AI予想」 を 看板に掲げるサイトの中で 編集部が技術的に検証して 中身が伴っていると判断したサイトのみを 推奨枠 (SS〜A級) に 入れています。 現状の推奨ランキングでは:

  • AI予想 + 人間補正の ハイブリッド型: 競艇タッグ (推奨3位) ─ AIの推論結果に 専門家が手動補正を かける2段構え
  • 公的データ駆動型 (老舗・公式系): 梅吉AI・Boaters・びわこAI予想・PC-KYOTEI ─ モデル構造・特徴量設計を 公開している 本物の機械学習プロジェクト

これら以外で「AI予想」 を 看板に掲げているサイトは、 編集部としては 「AI と呼ぶには 中身が伴っていない」 と判断して、 推奨ランキングには 入れていません。

騙されないために、 自分で確認すべき3項目 (まとめ)

最後に、 ユーザーが 自分で「このAI予想サイト、 本物か?」 を 判断する時の チェック項目を まとめておきます。

  1. モデル構造の説明があるか: サイト内に「使用しているAIモデル・特徴量・学習データ範囲」 の説明文があるか。 無いサイトは ほぼ確実に AI看板倒れ。
  2. 母数付きの的中率を 時系列で出しているか: 「直近30日: 検証レース数 ○○・的中率 ○○%・回収率 ○○%」 のような 数値開示があるか。 切り取り数字ばかりの場合は 警戒。
  3. 「90%」 系の煽り数字を使っていないか: 競艇の数学的構造上、 90%超の的中率を 長期で実現するのは 不可能。 こういう数字を 見出しに掲げているサイトは、 数学的整合性のない マーケティング設計と判断していい。

この3つを満たすサイトに 絞れば、 「AI予想」 看板の99%は 候補から外れます。 残る数サイトが、 編集部として 推奨できる 本物のAI予想です。 1-2サイトを 自腹で1ヶ月 試して、 自分の収支データと サイトの公表数字が 一致しているかを 確認するのが、 最終的な判断材料になります。