PHBench favicon

PHBench

Product Hunt 데이터를 통한 스타트업 시리즈 A 투자 유치 예측 오픈 벤치마크, PHBench

소개:

PHBench는 7년간의 Product Hunt 런칭 데이터 67,292건을 분석하여 스타트업의 시리즈 A 투자 유치 가능성을 예측하는 오픈 벤치마크입니다. 0.78%의 낮은 성공 확률 속에서 데이터 기반의 예측 모델을 구축하고 평가합니다.

추가 날짜:

2026-05-17

월간 방문객:

--K

PHBench - AI Tool Screenshot and Interface Preview

PHBench 제품정보

PHBench: Product Hunt 런칭 신호 기반 시리즈 A 투자 유치 예측 벤치마크

스타트업 생태계에서 시리즈 A(Series A) 투자를 유치하는 것은 마치 '모래사장에서 바늘 찾기'와 같습니다. 수많은 제품이 매일 런칭되지만, 그중 극소수만이 다음 단계의 성장을 위한 자본을 확보합니다. PHBench는 이러한 복잡한 예측 과정을 데이터 과학의 영역으로 가져온 혁신적인 오픈 벤치마크입니다.

PHBench는 세계적인 제품 런칭 플랫폼인 Product Hunt의 24시간 런칭 신호를 활용하여 해당 스타트업이 향후 시리즈 A 투자를 유치할 수 있을지 예측합니다. 본 기사에서는 PHBench의 핵심 데이터, 예측 신호, 그리고 모델 성능에 대해 자세히 살펴보겠습니다.


What's PHBench

PHBench는 Product Hunt 런칭 신호를 바탕으로 스타트업의 시리즈 A 투자 유치를 예측하기 위한 **오픈 벤치마크(Open Benchmark)**입니다. 이 프로젝트는 7년(2019년~2025년) 동안 발생한 67,292개의 런칭 데이터를 학습 및 평가의 근거로 사용합니다.

PHBench의 주요 목표는 런칭 후 24시간 이내에 발생하는 신호만을 사용하여, 해당 스타트업이 런칭 후 **18개월 이내에 시리즈 A 투자 유치(Term Sheet 기준)**에 성공할지 여부를 맞추는 것입니다.

핵심 통계 데이터

  • 총 런칭 수: 67,292건
  • 시리즈 A 성공 기업(Winners): 528건 (검증 완료)
  • 성공률(Base Rate): 단 0.78% (1,000개 제품 중 약 8개 미만)
  • 데이터 기간: 2019년 ~ 2025년 (7년간의 Train/Val/Test 세트 구성)
  • 예측 윈도우: 런칭 후 18개월 이내

PHBench의 최적 모델은 무작위 예측 대비 **4.7배 높은 성과(Lift)**를 달성하며, 이는 단순히 운에 맡기는 것이 아니라 데이터 기반의 정교한 예측이 가능하다는 것을 시사합니다.


Features (주요 특징 및 데이터 신호)

PHBench는 총 61개의 엔지니어링된 특징(Features)을 분석하며, 이 중 시리즈 A 투자 유치와 밀접한 상관관계를 갖는 **12개의 핵심 신호(Signals)**와 상관관계가 낮은 **4개의 노이즈(Noise)**를 구분합니다.

1. 핵심 예측 신호 (Signals)

데이터 분석 결과, 다음과 같은 요소들이 시리즈 A 유치 가능성을 높이는 결정적인 요인으로 밝혀졌습니다.

  • 런칭 당일 순위 (Daily Rank on Launch): 가장 강력한 신호입니다. 런칭 당일 Top 3 안에 드는 제품은 기본 성공률보다 3.5배 높은 시리즈 A 유치 확률을 보입니다. 특히 10위에서 4위로 올라가는 것보다, 4위에서 1위로 올라갈 때 투자 유치 가능성이 비선형적으로 급격히 증가합니다.
  • 메이커 팔로워 수 (Maker Follower Count): 제품을 만든 사람의 영향력이 클수록 긍정적인 신호로 작용합니다.
  • 댓글 대비 투표 비율 (Votes-per-comment Ratio): 단순한 투표 수보다 활발한 소통과 관심의 품질이 중요합니다.
  • B2B 토픽 클러스터: B2B 관련 주제의 제품들이 시리즈 A 유치에 유리한 경향을 보입니다.
  • AI 토픽 x 연도 상호작용: 최신 트렌드인 AI 관련 기술이 연도별로 투자 시장에 미치는 영향이 큽니다.
  • 리뷰 수 및 리뷰 평점: 사용자들의 실제 피드백 데이터가 신뢰성을 뒷받침합니다.

2. 예측에 영향이 적은 요소 (Noise)

일반적인 오해와 달리, 다음 요소들은 시리즈 A 투자 유치 예측에 큰 도움이 되지 않았습니다.

  • 순수 업보트 수 (Raw Upvote Count): 단순히 추천을 많이 받았다고 해서 투자를 잘 받는 것은 아닙니다.
  • 단순 "AI" 토픽 라벨: 단순히 AI 태그를 다는 것만으로는 충분하지 않습니다.
  • 태그라인 단어 수: 제품 설명의 길이는 중요하지 않습니다.
  • 런칭 요일: 특정 요일에 런칭한다고 해서 투자 확률이 드라마틱하게 변하지 않습니다.

PHBench Leaderboard (리더보드 모델 성능)

PHBench는 다양한 머신러닝 모델과 LLM(대형 언어 모델)의 성능을 비교합니다. 현재 리더보드에 등재된 상위 모델들의 성과는 다음과 같습니다.

상위 모델 순위

  1. Top-3 Ensemble (🏆): 여러 모델의 앙상블을 통해 가장 높은 **F0.5 점수(0.284)**와 AUC(0.840)를 기록했습니다.
  2. ENS_avg (🥈): 앙상블 평균 모델로 안정적인 성능을 보여줍니다.
  3. LGBM FS3 + ISO (🥉): LightGBM 알고리즘과 등조정(Isotonic Calibration)을 결합한 모델입니다.
  4. XGB FS4 + ISO: XGBoost 기반 모델로 높은 AUC(0.845)를 기록했습니다.

LLM 모델 성능 비교

Google의 Gemini 모델들도 벤치마크에 참여했으나, 전통적인 머신러닝 앙상블 모델에 비해 낮은 성적을 거두었습니다.

  • Gemini 3 Flash: 6위 (F0.5: 0.129)
  • Gemini 3.1 Pro: 9위 (F0.5: 0.057) 이는 스타트업 투자 유치 예측에 있어 익명화된 신호를 기반으로 한 정밀한 수치 분석이 언어 모델의 추론보다 더 효과적일 수 있음을 보여줍니다.

Use Case (활용 사례)

PHBench는 스타트업 생태계의 다양한 이해관계자들에게 가치 있는 인사이트를 제공합니다.

  • 벤처 캐피털(VC): 매주 쏟아지는 수백 개의 신규 제품 중 어떤 팀이 시리즈 A 단계로 성장할 잠재력이 있는지 필터링하는 도구로 활용할 수 있습니다. (주간 예측 리포트 기능 활용)
  • 스타트업 창업자: 자신의 제품이 Product Hunt에서 얻은 반응이 실제 투자 시장에서 어떻게 해석될지 객관적인 벤치마크 점수를 통해 확인할 수 있습니다.
  • 데이터 과학자 및 연구자: 스타트업의 성공 요인을 분석하고, 새로운 예측 알고리즘을 테스트하기 위한 표준 데이터셋으로 PHBench를 사용할 수 있습니다.

Methodology (연구 방법론)

PHBench는 결과의 투표성과 신뢰성을 위해 엄격한 방법론을 채택합니다.

"우리는 우리가 평가받고 싶은 방식 그대로 PHBench를 구축했습니다."

  • 수동 감사(Manual Audit): 모든 시리즈 A 라벨은 수동으로 검증되었습니다.
  • 문서화된 특징: 모든 데이터 피처는 상세히 문서화되어 투명하게 공개됩니다.
  • 재현성: 제출된 모든 모델은 해시가 고정된 테스트 세트(phbench_public_test.csv)에서 재실행되어 성능을 검증받습니다.
  • VCBench의 확장: 이 프로젝트는 VCBench의 연구 연장선상에 있는 PHBench 컬렉티브에 의해 운영됩니다.

FAQ

Q1: 시리즈 A 투자 유치 여부를 판단하는 기준은 무엇인가요? A: 제품이 Product Hunt에 런칭된 날로부터 18개월 이내에 시리즈 A 투자 유치(Term Sheet 발행 기준)를 성공하고, 이것이 검증된 경우 성공(Winner)으로 간주합니다.

Q2: 어떤 데이터가 예측에 가장 중요한가요? A: 분석 결과, '런칭 당일의 순위(Daily Rank)'가 가장 중요했습니다. 특히 상위 3위권 내에 진입하는 것이 투자 유치 확률을 3.5배 이상 높이는 핵심 신호입니다.

Q3: 벤치마크에 참여하려면 어떻게 해야 하나요? A: PHBench는 오픈 소스 연구를 지향합니다. 공식 프로젝트 페이지를 통해 본인의 예측 모델을 제출(Submit Predictions)하고 리더보드에서 성능을 확인할 수 있습니다.

Q4: 일반적인 Logistic Regression(LR) 모델보다 성능이 좋나요? A: 네, PHBench의 리더보드 상위 모델들은 Baseline인 Logistic Regression 모델(LR FS4)보다 뛰어난 F0.5 스코어와 리프트를 보여주고 있습니다.


본 문서는 PHBench의 연구 내용과 데이터를 바탕으로 작성되었으며, 자세한 내용은 Yagiz Ihlamur 등이 작성한 arXiv 논문(2605.02974)에서 확인할 수 있습니다.

Loading related products...