Skip to content

2025‐09‐15 공유내용

동욱 edited this page Sep 15, 2025 · 1 revision

이슈 생성하기 Remind!

  • 프로젝트를 사용해보며, 혹은 내가 이 오픈소스를 회사에 적용한다면 어떤 기능이 필요할까라는 고민을 가지며 기여 내용에 대해 이슈를 생성해주세요!
  • 이미 생성된 이슈에 대해 협업 혹은 Comment 또한 기여입니다. 활발하게 참여해주세요!

PR 리뷰

Datahub 사용해보기

  • Datahub 를 실행해두었습니다.
    • 저는 lang2sql --datahub_server http://34.27.166.177:8080 run-streamlit 명령어로 실행하였습니다.
    • 첫날 공유드린것 처럼 현재 Datahub에는 Pseudo-Lab, CasualInferenceLab, apache 에서 수집되는 github event정보에 대한 테이블들이 존재합니다.
    • OPEN_AI_LLM_MODEL=gpt-5-mini 로 설정한 결과입니다.
      Q) ehddnr301유저의 삭제 이벤트
    
      A) 
      SELECT
          event_id,
          ts_kst,
          base_date,
          organization,
          repo_name,
          deleted_ref_type,
          deleted_ref_name,
          is_branch_deletion,
          is_tag_deletion,
          pusher_type,
          COUNT(*) OVER() AS total_delete_events_for_user
      FROM dbt_gh_archive.dl_delete_events
      WHERE user_login = 'ehddnr301'
      ORDER BY ts_kst DESC
    

발전 혹은 기여가능 시나리오

시나리오1

  • 저희는 이 데이터를 바탕으로 Pseudo-Lab, CausualInferenceLab 의 데이터담당자라는 가정하에 Lang2SQL 서비스를 기능적으로 발전시켜 나갑니다.
    • Self-BI가 되지않으면 데이터담당자가 추출...하는 밝지않은 미래가 기다리고있기때문에 Text2SQL을 발전시켜나가야합니다.

시나리오2

  • 성능 추적 및 발전 + 서비스 만족도 추적을 위한 부분을 위해선 LLMOps가 필요합니다.
    • Lang2SQL 오픈소스는 버전업을 계속해나갈테고 버그수정, 신규기능 도입이 계속될텐데 실제 사용을 위해서는 모니터링이 필요합니다.
    • ChatGPT식 만족도 조사 기능 도입 (답변을 제공하고 유저 피드백을 받을수 있게 UI를 수정하여 피드백을 저장, 추후 활용)

시나리오3

  • 채팅형태 도입
    • 단발성 쿼리 생성이 아닌 유저와 Interaction하며 Data Discovery를 돕고 쿼리를 생성하도록 진행
Clone this wiki locally