Skip to content

TimeSeriesAnalysisFrameWork/The-Framework-for-Clustering-Time-Series-Data

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

20 Commits
Β 
Β 
Β 
Β 
Β 
Β 

Repository files navigation

μ‹œκ³„μ—΄ 데이터 뢄석 ν”„λ ˆμž„μ›Œν¬


λͺ©ν‘œ

데이터λ₯Ό ν™œμš©ν•œ μ†”λ£¨μ…˜ κ°œλ°œμ€ ν˜„μž₯ 데이터λ₯Ό μˆ˜μ§‘ν•˜κ³ , 데이터 뢄석 μ—”μ§€λ‹ˆμ–΄λ“€μ€ 의뒰 받은 데이터λ₯Ό 뢄석해, κ·Έ κ²°κ³Όλ₯Ό ν† λŒ€λ‘œ μ†”λ£¨μ…˜μ„ μ œμž‘ν•΄ λ°°ν¬ν•˜λŠ” κ³Όμ •μœΌλ‘œ μ§„ν–‰λœλ‹€. 이 λ‹¨κ³„μ—μ„œ 데이터 뢄석 λ‹¨κ³„μ—μ„œ 도움을 μ£ΌλŠ” ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμž‘ν•˜κ³ μž ν•œλ‹€. 뢄석 μ΄ˆκΈ°μ— ν•„μš”ν•œ 일련의 과정듀을 보여주어 λ°μ΄ν„°μ˜ 수치, νŒ¨ν„΄, κ΅°μ§‘κΉŒμ§€ νŒŒμ•…ν•  수 μžˆμ–΄ λ°μ΄ν„°μ˜ 이해도λ₯Ό 높이고 이후 λΆ„μ„μ˜ λ°©ν–₯성을 μ œκ³΅ν•˜λŠ” 것을 λͺ©ν‘œλ‘œ ν•˜μ˜€λ‹€.


Flow

image

λ³Έ ν”„λ ˆμž„μ›Œν¬λŠ” μ‚¬μš©μžμ—κ²Œ 데이터셋을 μž…λ ₯ 받은 ν›„, 데이터 μ „μ²˜λ¦¬, 데이터 μž„λ² λ”©, 데이터 κ΅°μ§‘ν™”λ₯Ό 톡해 뢄석이 μ§„ν–‰λœλ‹€. 데이터 μ „μ²˜λ¦¬ μ•Œκ³ λ¦¬μ¦˜μœΌλ‘œλŠ” Truncation, Padding, 동적 μ‹œκ°„ μ™œκ³‘λ²• 기반의 μ‹œκ³„μ—΄ 길이 λ³€ν™˜ μ•Œκ³ λ¦¬μ¦˜, Sliding windowκ°€ μ œκ³΅λœλ‹€. 데이터 μž„λ² λ”© μ•Œκ³ λ¦¬μ¦˜μœΌλ‘œλŠ” AutoEncoder, PCA, UMAP 이 있으며, 데이터 κ΅°μ§‘ν™” μ•Œκ³ λ¦¬μ¦˜μœΌλ‘œλŠ” K-Means, K-Shape, DBSCAN이 μ œκ³΅λœλ‹€. μ΄λŸ¬ν•œ μ•Œκ³ λ¦¬μ¦˜λ“€μ€ 총 36κ°€μ§€μ˜ 쑰합이 κ°€λŠ₯ν•˜λ©°, μ‚¬μš©μžλŠ” λ‹€μ–‘ν•œ 쑰합을 톡해 데이터λ₯Ό 뢄석할 수 μžˆλ‹€.

λ˜ν•œ, Dashλ₯Ό 톡해 μ‹œκ°μ μœΌλ‘œ 데이터λ₯Ό μ‰½κ²Œ νŒŒμ•…ν•  수 μžˆλ„λ‘ ν•˜μ˜€μœΌλ©°, DBSCAN μ•Œκ³ λ¦¬μ¦˜μ„ 톡해 μΈ‘μ •λœ μ΄μƒμΉ˜ 데이터 λ˜ν•œ 좔적할 수 μžˆλ„λ‘ ν•˜μ˜€λ‹€.


κΈ°λŠ₯

  • μ „μ²˜λ¦¬

image

데이터 μ „μ²˜λ¦¬ νƒ­μ—μ„œλŠ” μ™Όμͺ½ λ°•μŠ€μ—μ„œ β€˜λ°μ΄ν„° λΆˆλŸ¬μ˜€κΈ°β€™, β€˜μ „μ²˜λ¦¬ μ•Œκ³ λ¦¬μ¦˜ 선택’, 였λ₯Έμͺ½ 상단에 제곡된 column λͺ…을 확인해 value column κ³Ό process column 을 μž…λ ₯ν•˜λŠ” β€˜μΈμž κ°’ μž…λ ₯’, β€˜λ°μ΄ν„° 수치 및 길이 정보’, β€˜μ „μ²˜λ¦¬ 데이터 λ‹€μš΄λ‘œλ“œβ€™μ˜ κΈ°λŠ₯을 μ œκ³΅ν•œλ‹€. 였λ₯Έμͺ½ λ°•μŠ€μ—μ„œλŠ” β€˜μ „μ²΄ 데이터 ν‘œβ€™, β€˜μ „μ²΄ 데이터 Plot’을 μ œκ³΅ν•œλ‹€. 이λ₯Ό 톡해 μ‚¬μš©μžλŠ” μ •μ œλ˜μ§€ μ•Šμ€ 데이터에 λŒ€ν•œ 정보λ₯Ό 확인할 수 μžˆλ‹€.

  • μž„λ² λ”©

    image image

    데이터 μž„λ² λ”© νƒ­μ˜ 경우, μ™Όμͺ½ λ°•μŠ€μ—μ„œ β€˜μž„λ² λ”© μ•Œκ³ λ¦¬μ¦˜ 선택’, β€˜μΈμž κ°’ μž…λ ₯’ β€˜μž„λ² λ”© 데이터 λ‹€μš΄λ‘œλ“œβ€™ κΈ°λŠ₯을 μ œκ³΅ν•˜λ©°, 였λ₯Έμͺ½ λ°•μŠ€μ—μ„œλŠ” β€˜μž„λ² λ”©λœ 2차원 데이터 κ·Έλž˜ν”„β€™, β€˜μž„λ² λ”©λœ 3차원 데이터 κ·Έλž˜ν”„β€™, 각 μ£Όμ„±λΆ„μ˜ 영ν–₯도λ₯Ό 확인할 수 μžˆλŠ” β€˜μ£Όμ„±λΆ„ 뢄석 λ§‰λŒ€ κ·Έλž˜ν”„β€™κ°€ μ œκ³΅λœλ‹€. (β€˜μ£Όμ„±λΆ„ 뢄석 λ§‰λŒ€ κ·Έλž˜ν”„β€™ λŠ” PCA μ•Œκ³ λ¦¬μ¦˜μ—μ„œλ§Œ μ œκ³΅ν•˜λ©° β€˜μž„λ² λ”©λœ 3차원 데이터 κ·Έλž˜ν”„β€™ λŠ” PCA 와 UAMP μ—μ„œ 제곡) 이λ₯Ό 톡해 μ‚¬μš©μžλŠ” μž„λ² λ”© κ²°κ³Όλ₯Ό λ‹€μ–‘ν•œ κ·Έλž˜ν”„λ₯Ό 톡해 확인할 수 있으며, λ§Œμ•½ μ›ν•˜μ§€ μ•Šμ€ κ²°κ³Όκ°€ λ‚˜μ™”λ”λΌλ„ ν•΄λ‹Ή νƒ­μ—μ„œ κ²°κ³Ό 값을 ν™•μΈν•˜κ³  λ‹€μ‹œ μž„λ² λ”© ν•  수 μžˆλ„λ‘ ν•˜μ˜€λ‹€.

  • κ΅°μ§‘ν™”

    image image

    데이터 κ΅°μ§‘ν™” νƒ­μ˜ 경우, μ™Όμͺ½ λ°•μŠ€μ—μ„œλŠ” μ•žμ„  단계와 λ™μΌν•˜κ²Œ β€˜κ΅°μ§‘ν™” μ•Œκ³ λ¦¬μ¦˜ 선택’, β€˜μΈμž κ°’ μž…λ ₯’ κΈ°λŠ₯을 μ œκ³΅ν•œλ‹€. 였λ₯Έμͺ½ λ°•μŠ€μ—μ„œλŠ” β€˜κ΅°μ§‘ 쀑심 κ·Έλž˜ν”„β€™, β€˜κ΅°μ§‘ν™”λœ 2차원 κ·Έλž˜ν”„β€™, β€˜hover λ₯Ό 톡해 μ—­μΆ”μ λœ 원본 데이터 Plot’, β€˜μ•„μ›ƒ 라이어 (μ΄μƒμΉ˜) Plotβ€™μ˜ κΈ°λŠ₯이 μ œκ³΅λœλ‹€.

    β€˜κ΅°μ§‘ 쀑심 κ·Έλž˜ν”„β€™λž€, κ΅°μ§‘ν™”λœ 2차원 κ·Έλž˜ν”„μ—μ„œ 쀑심점과 거리가 κ°€μž₯ κ°€κΉŒμš΄ 데이터λ₯Ό μ°Ύμ•„μ„œ 원본 데이터 Plot 을 보여쀀닀. 그리고 β€˜κ΅°μ§‘ν™”λœ 2차원 κ·Έλž˜ν”„β€™ μ—μ„œλŠ” μ‚¬μš©μžκ°€ μ„ νƒν•œ μ•Œκ³ λ¦¬μ¦˜μœΌλ‘œ κ΅°μ§‘ν™”λœ 데이터λ₯Ό 2차원 κ·Έλž˜ν”„λ‘œ 보여쀀닀. λ˜ν•œ, μ‚¬μš©μžκ°€ ν•΄λ‹Ή 2차원 κ·Έλž˜ν”„μ— 마우슀λ₯Ό 올리면, 이에 ν•΄λ‹Ήν•˜λŠ” 원본 데이터λ₯Ό μ—­μΆ”μ ν•˜μ—¬ 였λ₯Έμͺ½μ—μ„œ 좜λ ₯ν•œλ‹€. λ§ˆμ§€λ§‰μœΌλ‘œ, β€˜μ•„μ›ƒ 라이어 Plot’ λŠ” DBSCAN 을 톡해 μΈ‘μ •λœ 아웃 라이어 (μ΄μƒμΉ˜) 의 원본 값을 μ—­μΆ”μ ν•˜μ—¬ 보여쀀닀.

    이λ₯Ό 톡해 μ‚¬μš©μžλŠ” λ‹€μ–‘ν•œ μ•Œκ³ λ¦¬μ¦˜μ„ κ΅°μ§‘ν™”ν•΄λ³Ό 수 있으며, 더 μ •ν™•ν•œ 뢄석을 μœ„ν•΄ ν•΄λ‹Ή κ²°κ³Όλ₯Ό 2μ°¨μ›μ˜ κ·Έλž˜ν”„λ‘œλ§Œ ν™•μΈν•˜λŠ” 것이 μ•„λ‹Œ, 원본 데이터 κ°’ λ˜ν•œ 확인할 수 μžˆλ„λ‘ ν•˜μ˜€λ‹€.


About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •