Baseline Table Generator는 논문에서 자주 사용하는 **Table 1 (Baseline Characteristics)**을
Python으로 쉽고 정확하게 생성할 수 있도록 도와주는 도구입니다.
이범주, 삼범주를 포함한 그룹 비교, p-value 계산, 통계검정 자동 선택까지 모두 자동화되어 있어
의료·임상 연구자들이 논문 작업에 바로 활용할 수 있습니다.
- 이범주, 삼범주, 다범주 그룹 간 비교 자동 처리
- 변수 타입에 따라 적절한 통계검정 자동 수행
- 이범주: t-test, Welch’s t-test, Mann-Whitney U
- 삼범주 이상: ANOVA, Kruskal-Wallis
- 연속형 변수: 중앙값, 사분위 범위 표시
- 범주형 변수: 빈도수, 비율(%) 자동 정리
- 결과 테이블을 Excel로 내보내기 지원 (.xlsx)
pip install pandas numpy scipy또는 requirements.txt를 통해 설치:
pip install -r requirements.txtfrom baseline_table_generator import bs_count, bs_res_count, export_to_excel
import pandas as pd
df = pd.read_csv("your_data.csv")
df['group'] = df['group'].astype('category')
summary = bs_count(df)
comparison = bs_res_count(df, 'group')
final_table = pd.merge(summary[['Variable', 'Count']], comparison, on='Variable', how='inner')
export_to_excel(final_table, 'Table1_Baseline.xlsx')| Variable | classification_0 | classification_1 | classification_2 | p-value | Test |
|---|---|---|---|---|---|
| age | 64.0 (59.0–70.0) | 65.5 (60.0–71.0) | 67.0 (62.0–74.0) | 0.012 | Kruskal-Wallis |
| sex_1 | 40 (44.0) | 30 (35.0) | 20 (22.0) | 0.047 | Chi-square |
baseline-table-generator/
├── baseline_table_generator.py # 핵심 모듈
├── example_notebook.ipynb # 사용 예시 Jupyter 노트북
├── README.md # 설명서
├── LICENSE # 라이센스 (MIT)
└── .gitignore # Git 무시 파일 설정
이 프로젝트는 MIT 라이센스를 따릅니다.