PHBench
PHBench - Product Huntのローンチ信号からSeries A資金調達を予測するオープンベンチマーク
PHBenchは、67,292件のProduct Huntローンチデータを活用し、Series A資金調達の可能性を予測するオープンベンチマークです。7年間のデータを基に構築され、機械学習モデルやLLMの精度を競います。投資判断の高度化やスタートアップ分析に不可欠なデータを提供します。
2026-05-17
--K
PHBench 製品情報
PHBench:Product HuntのローンチデータからSeries A資金調達を予測する次世代ベンチマーク
スタートアップの世界において、どの企業が次の成長ステージである「Series A」へと進むかを予測することは、投資家やアナリストにとって極めて重要でありながら、困難な課題です。PHBenchは、この課題を科学的に解決するために設計された、オープンで再現性の高いベンチマークプラットフォームです。Product Hunt(PH)での24時間のローンチ信号を利用して、そのスタートアップが将来Series Aの資金調達に成功するかどうかを予測することに特化しています。
What's PHBench?
PHBenchは、Product Hunt上での過去7年間(2019年〜2025年)のローンチデータ、合計67,292件をベースにした予測ベンチマークです。このプラットフォームは、「The Base Rate」による研究成果に基づいており、膨大なローンチ情報の中からSeries Aに到達する可能性のある「干し草の中の針」を見つけ出すためのモデルを訓練・評価するために提供されています。
PHBenchのデータによれば、Product Huntでローンチされたプロジェクトのうち、実際にSeries Aの調達にまで至る割合(Base Rate)はわずか**0.78%**に過ぎません。PHBenchはこの極めて低い確率を、高度な機械学習アルゴリズムや大規模言語モデル(LLM)を用いて、どこまで正確に予測できるかを競うリーダーボードを公開しています。
PHBenchの主な特徴 (Features)
PHBenchは、単なるデータの蓄積ではなく、予測精度を高めるための高度なエンジニアリングと検証プロセスを備えています。
1. 膨大なデータセットと厳格な検証
- 67,292件のローンチデータ: 7年間にわたる膨大な実績データをトレーニング、バリデーション、テストセットに分割して提供。
- 528件のSeries A達成事例: 実際にSeries Aを達成したことが確認された528社のスタートアップを「ウィナー」として定義。
- 18ヶ月の予測ウィンドウ: ローンチから18ヶ月以内にタームシート(投資条件概要)を受け取ったかどうかを基準に判定。
- 手動監査と再現性: 全てのラベルは手動で監査され、提出されたモデルはハッシュ化されたテストセットで再実行されるため、信頼性が担保されています。
2. シグナル(有効な指標)とノイズの分離
PHBenchの研究では、Series Aの成功を予測する上で真に重要な「シグナル」と、一見重要そうに見えて実は効果がない「ノイズ」を明確に区別しています。
- 強力なシグナル:
- ローンチ当日のランク: 最も重要なシグナル。トップ3に入った製品は、Series A調達率がベースレートの3.5倍に跳ね上がります。
- メーカーのフォロワー数: ローンチを行ったメンバーの影響力。
- B2Bトピック・AIトピック: 特定の業界カテゴリやトレンド。
- コメントに対する投票比率: ユーザーエンゲージメントの質。
- ノイズ(影響がほとんどない要素):
- 生のアップボート数(Upvote Count): 単なる得票数は、意外にも予測には役立たない「ノイズ」であることが判明しています。
- キャッチコピーの単語数: 説明文の長さと成功に相関はありません。
- AIというラベル自体の使用: 特定のトレンドは重要ですが、単にラベルを貼るだけでは意味をなしません。
3. 高精度なモデルによるベンチマーク結果
PHBenchの最高精度を誇る「Top-3 Ensemble」モデルは、ランダムに予測した場合と比較して**4.7倍の精度向上(Lift)**を実現しています。リーダーボードには、XGBoost、LightGBM、さらにはGoogleのGeminiシリーズといった最新のLLMモデルまでランクインしており、常に最新の予測技術が評価されています。
PHBenchの活用シーン (Use Case)
PHBenchは、以下のような多様なユーザーや目的での活用が期待されています。
ベンチャーキャピタル (VC) の投資選定
VCはPHBenchの予測モデルを利用することで、毎日何百と公開されるProduct Huntのローンチの中から、将来性の高いスタートアップを効率的に特定できます。特に、Top-3に入った製品が3.5倍の調達率を持つというデータは、ソーシングの強力なエビデンスとなります。
スタートアップによる自己分析
自社のローンチ結果が、過去のSeries A達成企業と比較してどのような立ち位置にあるのかをPHBenchのデータに基づいて客観的に把握できます。どの信号(フォロワー数、ランクなど)を強化すべきかの指針となります。
データサイエンス・AIの研究
PHBenchはarXivに公開された論文(arXiv:2605.02974)としても引用されており、不均衡データ(インバランスデータ)における高度な分類タスクのベンチマークとして、機械学習コミュニティに貢献しています。
FAQ (よくある質問)
Q: PHBenchの「Base Rate(ベースレート)」とは何ですか?
A: Product Huntでローンチされた全プロジェクトのうち、実際にSeries Aの資金調達に成功する割合を指します。PHBenchのデータセットでは**0.78%**となっており、予測が非常に難しい「針を探す」ようなタスクであることを示しています。
Q: Series Aの調達をどのように判定していますか?
A: ローンチから18ヶ月以内に投資のタームシートを受け取った実績があるかどうかで判定され、全てのデータは手動で検証されています。
Q: 単純な「アップボート数」は重要ではないのですか?
A: PHBenchの分析結果によると、生のアップボート数は「ノイズ」に分類されています。それよりも、ローンチ当日の総合ランキング(Daily Rank)の方が予測因子として圧倒的に重要であることが示されています。
Q: どのように予測を提出できますか?
A: PHBenchの公式サイトから「SUBMIT PREDICTIONS」を通じてモデルの結果を提出できます。また、毎週の予測レポートを受け取ることも可能です。
PHBenchは、スタートアップの未来をデータの力で解き明かすための不可欠なツールです。投資の意思決定をデータ主導に変えたい、あるいは最新のAIモデルの性能を実世界のビジネスデータで試したい方は、ぜひPHBenchのデータセットとリーダーボードをチェックしてください。








