이 저장소(repository)는 비디오에서 추출된 레이블 데이터를 공유하기 위한 저장소의 예시입니다. 본 저장소와 같은 형태로 저장소를 만들어서 레이블 데이터를 업로드해 주시면, 데이터를 취합해 상황의존적 지식체계 그래프를 생성하는데 사용할 수 있습니다.
상황의존적 지식체계 그래프의 생성에 사용하기 위한 레이블 데이터의 규격은 knowledge-graph-input 저장소에 명시되어 있으며, JSON Lines의 형태를 따릅니다. 해당 저장소에는 JSON Schema 규격으로 레이블 데이터에 포함되는 각 JSON object가 따라야 하는 규격이 정의되어 있으며, 특정 파일이 레이블 데이터의 규격에 맞는지 여부를 검증하기 위한 스크립트가 포함되어 있습니다. 레이블 데이터의 업로드 전에 반드시 해당 스크립트를 사용해서 규격에 맞도록 저장되었는지 확인해 주시기 바랍니다.
저장소에 레이블 데이터 파일을 업로드 하실 때는, 다음과 같이 경로와 파일 이름을 설정해서 업로드 해 주세요.
각 레이블 데이터 파일은 data/{series_title}/{series_title}_s00_e00.jsonl 과 같은 경로와 파일 이름을 갖도록 업로드 해 주시면 됩니다. 가령 Friends의 시즌 1 에피소드 2에 관한 레이블 데이터를 업로드하시는 경우, 저장소의 루트 디렉토리 기준으로 data/friends/friends_s01_e02.jsonl 의 위치에 파일을 업로드 해주세요.
파일이 너무 커서 압축이 필요한 경우, zip으로 압축된 파일을 jsonl 파일 대신 업로드하실 수 있습니다. 이 경우에도 파일 경로와 이름은 똑같이 유지하면서, data/friends/friends_s01_e02.zip 과 같이 파일을 업로드 해주시면 됩니다. 이때, 한 개의 zip파일에는 한 개의 jsonl 파일만이 포함되어야 함을 유의해 주시기 바랍니다.
본 규격에 맞게 레이블 데이터 저장소를 만들어주신 후에는, 따로 공유해드린 Google Form을 통해 저장소 URL을 공유해 주시기 바랍니다.
감사합니다.