Skip to content

UpstageAILab/upstage-ml-regression-01

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

42 Commits
 
 
 
 
 
 

Repository files navigation

Review Assignment Due Date

집값 미래를 내 손에! 예측 전략 대방출

Team

👑
1
2
3
서상혁
김도연
김다운
신동혁
Github Github Github Github

1. Competiton Info

Overview

  • 다양한 부동산 관련 의사결정을 돕고자 하는 부동산 실거래가를 예측하는 모델을 개발하는 것
  • 서울시 한정 아파트 가격 예측
  • 정확하고 일반화된 모델을 개발하여 아파트 시장의 동향을 미리 예측하는 것

Timeline

  • Jan 08 ~ 14, 2024 - Making A Group
  • Jan 15, 2024 - Start Competition
  • Jan 15 ~ 20, 2024 - Data Collection
  • Jan 18 ~ 21, 2024 - Data EDA
  • Jan 21 ~ 25, 2024 - Modeling & Tuning
  • Jan 25 ~ 26, 2024 - Report Writing

Evaluation

  • RMSE 지표를 활용

    image

2. Components

Directory

image

3. Data descrption

Dataset overview

주요 데이터는 .csv 형태로 제공되며, 서울시 아파트의 각 시점에서의 거래금액(만원)을 예측하는 것이 목표입니다.

학습 데이터는 아래와 같이 1,118,822개이며, 예측해야 할 거래금액(target)을 포함한 52개의 아파트의 정보에 대한 변수와 거래시점에 대한 변수가 주어집니다.

image

학습 데이터의 기간은 2007년 1월 1일부터 2023년 6월 30일까지이며, 각 변수 명이 한글로 되어있어 어떤 정보를 나타내는 변수인지 쉽게 확인할 수 있습니다.

예시)

  • 시군구 : “서울특별시 강남구 개포동” 과 같이 주소에 대한 정보입니다.
  • 아파트명 : “개포더샵트리에”와 같이 아파트명에 대한 정보입니다.
  • 전용면적(㎡) : “108.2017”와 같이 매매대상의 전용면적에 대한 정보입니다.
  • 건축년도 : “2021”과 같이 아파트의 건축 연도를 나타내는 정보입니다.

각 변수들은 아래와 같은 결측치 비율을 가지고 있습니다.

image

아파트의 매매가를 결정하는데에 교통적인 요소가 영향을 줄 수 있기에 추가 데이터로 서울시 지하철역, 서울시 버스정류장의 정보가 주어집니다. 

image

추가 데이터는 위도와 경도, 좌표 X와 좌표Y와 같이 거리에 대한 정보가 포함되어 있으며, 이를 활용하여 학습 데이터와 함께 사용할 수 있습니다. 

EDA

(Template)  패스트캠퍼스  Upstage AI Lab 1기_경진대회 발표자료 pptx의 사본 pptx

(Template)  패스트캠퍼스  Upstage AI Lab 1기_경진대회 발표자료 pptx의 사본 pptx (4)

(Template)  패스트캠퍼스  Upstage AI Lab 1기_경진대회 발표자료 pptx의 사본 pptx (3)

(Template)  패스트캠퍼스  Upstage AI Lab 1기_경진대회 발표자료 pptx의 사본 pptx (2)

(Template)  패스트캠퍼스  Upstage AI Lab 1기_경진대회 발표자료 pptx의 사본 pptx (1)

  • Strategy I

(Template)  패스트캠퍼스  Upstage AI Lab 1기_경진대회 발표자료 pptx의 사본 pptx (5)

  • Strategy II

(Template)  패스트캠퍼스  Upstage AI Lab 1기_경진대회 발표자료 pptx의 사본 pptx (6)

Data Preprocessing

  • Strategy I

image

image

  • Strategy II

image

image

image

Feature engineering

  • Strategy I

image

  • Strategy II

image

image

4. Modeling

Model description

  • Strategy I

image

  • Strategy II

image

image

Modeling Process

  • Strategy I

image

  • Strategy II

image

5. Result

Leader Board

image

Presentation

etc

Meeting Log

  • 전체적인 내용은 Notion에서 확인하실 수 있습니다.
  • Jan 21 ~ Jan 26 : Offline Meeting

Reference

About

upstage-ml-regression-01 created by GitHub Classroom

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors