게임 데이터 분석가가 실제로 하는 일 — 매출 시뮬레이션, 픽률, 그리고 KPI 113% 초과

“게임 데이터 분석가”라고 하면 대시보드 몇 개 띄워놓고 DAU 그래프 쳐다보는 사람을 떠올리기 쉽다. 실제로는 그 반대에 가깝다. 그래프가 꺾이는 순간부터 일이 시작된다. 왜 꺾였는가, 그게 패치 때문인지 밸런스 때문인지 BM 때문인지 시즌성 때문인지를 데이터로 잘라서 증명하는 게 본업이다.

나는 광고홍보학을 전공하고 데이터 쪽으로 넘어온 비전공 12년차 분석가다. 게임 도메인에서는 드래곤네스트(2016~~2018), 킹스레이드(2018~~2021)를 비롯해 게임 3사에서 지표를 만졌다. 이 글은 그 시절 실제로 굴리던 분석 패턴 네 가지를 — 내부 스키마나 민감 수치는 빼고 — 방법론 중심으로 풀어본다. 게임 업계를 노리는 주니어 분석가, 혹은 “데이터 분석가가 도메인 안에서 실제로 뭘 하는지” 궁금한 사람을 위한 글이다.

관통하는 메시지는 하나다. AI 시대일수록 도메인 지식 + 자동화 실행력이 무기다. 모델은 누구나 부른다. “어느 지표를, 왜 봐야 하는지”를 아는 건 도메인 안에 있어 본 사람뿐이다.

게임 데이터 분석가의 하루

아침에 출근하면 전날 배치가 돌린 일일 지표부터 본다. DAU/MAU/NRU(신규)/RAU(복귀)/Retention/PU/ARPPU/ARPU. 숫자가 평소 밴드 안이면 넘어가고, 튀면 멈춘다. 오후엔 사업PM·기획팀과 “이번 패치 어땠냐”를 데이터로 검증하고, 글로벌(북미·동남아) 유관부서엔 그쪽 지표를 정리해 넘긴다. 그 사이사이 SQL을 짜고, 크롤러를 돌리고, 리포트를 자동화한다.

핵심은 분석가가 질문을 데이터로 환원하는 사람이라는 점이다. “신규 영웅 망했냐?”는 질문은 그대로는 답할 수 없다. 픽률·이용률·선호도라는 측정 가능한 지표로 쪼개야 답이 나온다.

사례 1 — 컨텐츠 패치 영향 분석: “신규 컨텐츠가 진짜 먹혔나?”

신규 영웅 + 신규 던전이 나가는 패치가 있었다. 기획팀의 질문은 단순했다. “이거 유저가 쓰긴 쓰냐?”

세 가지 지표로 잘랐다.

픽률(신규 영웅 채용률): 패치 전후로 약 70% 상승. 신규 영웅 자체는 명백히 먹혔다.
컨텐츠 이용률(신규 던전 진입/플레이 비율): 약 20% 상승. 유입은 됐지만 픽률 상승폭에 비하면 약했다.
플레이 형태(솔로 vs 파티): 신규 던전에서 솔플 선호도 약 73%.

여기서 “70% 올랐으니 성공”으로 끝내면 분석가가 아니다. 픽률은 70% 뛰었는데 컨텐츠 이용률은 20%에 그쳤다는 격차가 진짜 신호였다. 영웅은 사고 싶은데 던전은 안 돈다 → 던전 자체에 마찰이 있다. 그리고 솔플 73%라는 숫자가 결정타였다. 파티 매칭을 전제로 설계된 던전인데 유저 대다수가 혼자 돌고 있었다는 뜻 — 즉 파티 난이도·매칭·보상 밸런스에 이슈가 있다는 가설로 좁혀졌다.

분석의 결론은 “성공/실패” 판정이 아니라 밸런스 이슈의 위치를 특정하는 것이었다. 기획팀은 이걸 받아 던전 난이도와 보상 구조를 손봤다. 지표 한 줄이 아니라 지표 간 격차에서 인사이트가 나온다는 게 이 사례의 핵심이다.

사례 2 — 매출 시뮬레이션 모델: 예측이 아니라 원인 규명

게임 매출은 의외로 단순한 곱셈에서 출발한다.

예상매출 = 예상 DAU × PU(%) × ARPPU

DAU: 일일 활성 유저
PU(%): 결제 유저 비율(Paying User rate)
ARPPU: 결제 유저 1인당 평균 결제액

이 모델의 진짜 용도는 미래 매출을 맞히는 점쟁이질이 아니다. (덧붙이자면, 포트폴리오에 들어가는 매출 수치 표는 전부 가데이터다. 특정 매출 금액 자체는 의미가 없다.) 이 모델의 가치는 목표 KPI에 미달했을 때 어디서 빠졌는지 분해하는 것에 있다.

목표를 곱셈 구조로 분해해두면, 실제 결과가 목표에 못 미쳤을 때 세 변수 중 어디가 빠졌는지 즉시 보인다.

DAU는 채웠는데 매출 미달 → 트래픽은 왔지만 결제 전환(PU) 또는 객단가(ARPPU) 문제
PU·ARPPU는 정상인데 매출 미달 → 애초에 유입(DAU) 이 부족 → 마케팅·획득 문제
DAU·PU 정상, ARPPU만 하락 → BM/가격/패키지 구성 문제

여기에 유저를 신규 / 복귀 / 기존 유지 유형으로 나눠 각각 MAU·Retention(M+1)·PU·ARPPU·ARPU를 따로 집계하면, “어느 유저층에서 새는지”까지 좁혀진다. 신규는 잘 들어오는데 M+1 리텐션이 무너지면 온보딩 문제고, 기존 유지층 ARPPU가 빠지면 엔드콘텐츠/BM 노후화 문제다.

분석가에게 이 모델은 예측 도구가 아니라 진단 도구다. KPI 미달이라는 증상에서 원인 장기로 들어가는 청진기에 가깝다.

사례 3 — BM·이벤트 전략으로 동남아 KPI 약 113% 초과

위의 진단 모델을 실전에 붙인 사례다. 동남아 시장 상반기 매출 KPI가 걸려 있었다.

먼저 BM 분석으로 해당 지역 유저의 결제 패턴을 봤다. 어떤 패키지가 팔리고 어디서 결제가 멈추는지, 신규·복귀·유지층별 ARPPU가 어떻게 다른지를 분해했다. 그 위에 지역 특성과 결제 패턴에 맞춘 이벤트 전략을 설계해 유관부서와 함께 실행했다.

결과적으로 상반기 동남아 목표 KPI를 약 113% 초과 달성했다. (구체적 BM 수치·가챠 비중 같은 내부 항목은 공개할 수 없고, 성과 헤드라인만 재직 시 맥락으로 밝힌다.)

여기서 강조하고 싶은 건 분석가의 역할이 리포트 납품에서 끝나지 않는다는 점이다. 데이터로 원인을 규명하고(사례 2의 분해), 그걸 사업PM·기획·글로벌 부서가 실행 가능한 전략으로 번역하고, 실행 후 다시 지표로 검증하는 — 이 루프 전체에 들어가야 KPI 초과 같은 결과가 나온다. 숫자를 보는 사람이 아니라 숫자로 움직이게 만드는 사람.

사례 4 — 현금시세 모니터링 파이프라인 (사이드 프로젝트)

지표 분석과 별개로, 게임 외부 데이터(현금거래 시세)를 자동 수집하는 파이프라인을 사이드로 만들었다. 코드는 github.com/DBhyeong/game-data-analysis에 정리해뒀다.

흐름은 이렇다.

[수집] Selenium + BeautifulSoup 크롤링
   ↓
[적재] pymssql → MS-SQL (한글 인코딩: charset='utf8', codepage='65001')
   ↓
[배포] SMTP 자동 메일 리포트 + Google Drive API 업로드
   ↓
[시각화] Metabase 대시보드 / matplotlib

핵심 디테일 하나. 한글 데이터를 MS-SQL에 넣을 때 인코딩이 깨지는 건 단골 함정이다. pymssql 연결에서 charset과 codepage를 명시적으로 맞춰주는 것만으로 깨짐 대부분을 잡는다.

import pymssql
 
conn = pymssql.connect(
    server=os.environ["DB_SERVER"],
    user=os.environ["DB_USER"],
    password=os.environ["DB_PASSWORD"],   # 비밀번호는 .env로
    database="game_market",
    charset="utf8",        # 한글 인코딩 핵심
)
# 연결 문자열/드라이버 옵션에서 codepage=65001(UTF-8) 정렬을 맞춰주면 깨짐 방지

수집부터 시각화까지 사람이 손대지 않아도 돌아가는 루프를 만드는 것, 그게 분석가의 “자동화 실행력”이다.

기술 스택 정리

게임 도메인에서 실제로 쓴 도구들.

영역	스택
DB (주력)	MS-SQL + Stored Procedure 자동화, MySQL/MariaDB, ODBC
수집	Python: Selenium, BeautifulSoup, requests
적재/처리	pymssql, pandas
리포팅/배포	SMTP 자동 메일, Google Drive API
시각화	Metabase 대시보드, matplotlib
기타	Excel VBA
지표 체계	DAU / MAU / NRU / RAU / Retention / PU / ARPPU / ARPU / 픽률 / 재구매율 / 클리어율

주력은 MS-SQL과 Stored Procedure 기반 집계 자동화였다. 매일 도는 지표 집계를 SP로 묶어두면, 분석가는 쿼리를 매번 다시 짜는 대신 “무엇을 볼지”에 집중할 수 있다. 반복은 DB에, 판단은 사람에게.

마무리

게임 데이터 분석가가 실제로 하는 일은 결국 이 루프다. 지표로 질문을 받고 → 곱셈/유형 분해로 원인을 규명하고 → 실행 부서가 쓸 전략으로 번역하고 → 다시 지표로 검증한다. 픽률 70%와 이용률 20%의 격차에서 밸런스 이슈를 짚어내고, DAU×PU×ARPPU 분해로 KPI 미달의 출처를 찾고, 그 위에 이벤트 전략을 얹어 동남아 KPI를 113%까지 끌어올린 것 — 전부 같은 사고방식의 변주다.

AI가 쿼리도 짜주고 차트도 그려주는 시대다. 그럴수록 “어느 지표를 왜 보는가”라는 도메인 판단과 “수집부터 배포까지 멈추지 않는 루프를 만드는 자동화 실행력”이 분석가의 진짜 해자다.

방법론·합성 스키마 레시피: github.com/DBhyeong/game-data-recipes
현금시세 모니터링 파이프라인: github.com/DBhyeong/game-data-analysis
영상 버전 준비 중입니다.

Hyeong · 데이터·마케팅·개발 제너럴리스트

탐색기