Skip to content

크롤링 방식 건의 #6

@seonghoo1217

Description

@seonghoo1217

개요

현재 카페 메뉴의 Target Domain인 Starbucks의 경우 영양 성분들을 제공하여 주기에 이를 크롤링하여 DB에 영속화 시키는 전략을 사용하려 헀으나 Tall사이즈를 제외한 Grande, Venti 사이즈에 대한 데이터들을 수집할 수 없는 문제점이 있습니다.

해결방안 제시

현재 해당 사항을 해결하기 위한 방법을 두 가지 정도 구상하였습니다.

  1. Proxy를 이용한 HTTPS 트래픽 가로채기
  • 현재 Starbucks Mobile Application에는 Grande와 Venti의 영양성분을 제시하고 있습니다.
  • 해당 부분을 참고하여 IOS Client가 통신하는 트래픽을 가로채어 Request와 Response를 물리적으로 얻는 방법이 있습니다.
  1. Starbucks App 화면을 캡처 후 OCR 기술을 통한 정보 획득

비고

건의자 : @seonghoo1217
토론 참여자 : @yxxngjxn

Metadata

Metadata

Assignees

No one assigned

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions