2023 빅콘테스트 - 정형데이터 분석 분야
- 팀명: What’s your EDA?
- 목표: 클래식 공연의 접근성을 높이기 위한 효과적인 가격 모델 개발
- 데이터셋: 예술의전당의 공연 및 고객 데이터
- 분석 기간: 2018-11-18 ~ 2023-06-30
├── 0_2023빅콘테스트_231027/ # 제출 자료
├── files/ # 발표 자료
├── missing 찾기/ # 데이터 행 자체 결측치 처리
├── 가격책정/ # 가격 책정 알고리즘
├── 기타/ # 기타
├── 전처리/ # 전처리
├── 좌석 시각화/ # 좌석 시각화
├── 좌석 찾기/ # 좌석 등급 결측치 처리
├── 좌표 만들기/ # 좌표 파생 변수 생성
├── 클러스터링/ # 고객 및 공연 군집화
└── README.md # README 파일
- 기존의 공연 티켓 가격 책정 방식은 제작비와 목표 수익을 기반으로 하며, 고객의 특성이 반영되지 않음.
- 공연장의 낮은 재정 자립도로 인해 티켓 가격이 상승하고, 접근성이 저하됨.
- 프리미엄 좌석과 일반 좌석 간의 불균형한 수요를 해결할 필요가 있음.
- 결측치 및 이상치 처리
- 데이터 표준화 및 형식 변환
- 웹 크롤링을 통해 추가 공연 정보 확보
- 좌석별 예매율 및 가격 분포 분석
- 고객 유형별 좌석 선호도 파악
- 좌석 위치별 점유율 시각화
- 공연, 고객, 좌석별 주요 특징 변수 생성
- 할인 내역을 활용한 티켓 가격 복구
- 좌석과 무대 간 거리 및 각도 계산
- K-means 클러스터링을 활용한 공연 및 고객 군집 분석
- 고객의 예매 패턴 및 좌석 선호도 파악
- 높은 수요를 보이는 공연은 가격이 높아도 안정적인 예매율 유지
- 특정 마니아층이 주로 관람하는 공연은 맞춤형 가격 정책 필요
- 고객을 예매 속도 및 좌석 선호도에 따라 그룹화 가능
- 30~50대 유료 멤버십 고객의 가격 민감도가 낮음
- 중앙 좌석의 선호도가 가장 높으며, 가장자리 좌석은 선호도가 낮음
- 독주 공연에서는 피아노 배치로 인해 특정 좌석 선호도가 다름
- 공연 및 고객 세분화를 반영한 동적 가격 책정 가능
- 좌석별 최적 가격 설정으로 예매율 극대화
- 고객 군집을 고려한 맞춤형 마케팅 전략 수립
- 공연 주최 측의 실질적인 가격 정책 수립 지원
- 데이터 분석: Python, Pandas, NumPy, Scikit-learn
- 시각화: Matplotlib, Seaborn
- 클러스터링: K-means, 계층적 군집 분석
- 데이터베이스: MariaDB
팀원 연락처:
- 이수진: alwaysna0813@naver.com
- 류수민: rsm011@naver.com
- 문성원: moonjmmm@naver.com
- 이가린: r4135@naver.com
⭐ 프로젝트가 유용하다면 리포지토리에 스타를 남겨주세요! ⭐