Hugging Face 모델 카드 작성 가이드 #46
choincnp
started this conversation in
Seminar Materials
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
HuggingFace 모델 카드
Hugging Face 모델 카드(Model Card) 는 머신러닝 모델과 함께 제공되는 문서로, 해당 모델에 대한 다양한 정보를 담은 README 파일이자, 모델에 대한 설명서이자 사용 가이드입니다.
전체적인 내용
Markdown(
.md) 형식으로 구성되어 있으며, 다음과 같은 작성 요소를 가집니다.예시
https://huggingface.co/meta-llama/Llama-3.1-8B-Instruct
모델 카드는 왜 작성해야 할까?
5가지 이유로 알아보는 작성 이유
모델 카드 작성의 장점 (사용자 입장 vs 배포자 입장)
사용자 입장
사용자는 모델 카드 덕분에 해당 모델이 어떤 작업에 적합한지, 어떻게 사용할 수 있는지 바로 알 수 있습니다. 예를 들어 모델 카드에 사용 가능한 언어, 지원되는 라이브러리, 라이선스 등의 메타데이터가 포함되어 있으면, Hugging Face Hub의 모델 검색 페이지에서 필터링을 통해 손쉽게 원하는 모델을 찾을 수 있습니다 .
또한 모델 카드에는 간단한 사용 예제 코드가 제공되는 경우가 많아, 사용자가 빠르게 모델을 실행해볼 수 있습니다. 무엇보다 모델의 한계나 편향 정보가 있다면, 사용자가 부적절한 용도로 모델을 쓰지 않도록 경각심을 갖게 해줍니다.
배포자 입장
잘 정리된 모델 카드는 다른 사람들이 모델을 올바로 이해하고 활용하게 해 주어 모델 영향력 확대로 이어집니다. 또한 모델 카드에 연구 논문이나 참고 문헌 (예: arXiv 논문 링크, BibTeX) 정보를 포함하면, 사용자들이 모델의 배경 연구를 찾아보고 **인용(citation)**할 수 있어 연구자의 공로를 인정받는 통로가 됩니다.
Hugging Face Hub는 모델 카드와 연계하여 Digital Object Identifier (DOI) 발급 기능도 제공하므로, 모델 자체를 학술적으로 인용할 수도 있습니다.
모델 카드 작성하기
모델 카드의 구조
메타데이터
메타데이터는 2가지 방식을 이용해서 기록할 수 있습니다.
YAML방식 (양식)
Hub의 UI

Hugging Face 모델 카드의 구조와 작성 방법
Hugging Face는 모델 카드 작성에 대해 권장되는 템플릿 구조를 제공하고 있습니다 . 2022년 Hugging Face Science 팀은 Model Card Guidebook을 발표하며 기존 연구와 업계 관행을 반영한 업데이트된 모델 카드 템플릿과 Annotated Model Card 예시, 그리고 모델 카드 생성 도구를 소개했습니다 . 아래에서는 Hugging Face 권장 포맷을 중심으로 모델 카드의 주요 섹션과 각 섹션에 포함할 내용을 설명합니다. (물론 모든 모델에 모든 항목이 적용되는 것은 아니며, 필요에 따라 Optional로 표시된 섹션은 생략 가능함을 유의하세요.)
모델 카드 주요 섹션
작성 시 유의사항 및 팁
모델 카드 작성 예시 소개
각기 다른 도메인의 모델 카드를 살펴보면, 도메인별로 강조해야 할 섹션이 다를 수 있음을 알 수 있습니다. 자연어 모델은 사회언어학적 편향과 사용 용도를, 음성 모델은 정확도 한계와 오디오 품질 이슈를, 생성 모델은 윤리적 사용 지침을 특히 강조하는 식입니다. 자신의 모델 특성에 맞춰 중요한 내용을 빠짐없이 담는 것이 좋은 모델 카드의 핵심입니다.
모델 카드 템플릿과 작성 자동화 도구 활용
모델 카드를 처음부터 모든 내용을 손으로 작성하는 것은 벅찰 수 있습니다.
Hugging Face와 커뮤니티에서는 모델 카드 생성을 돕는 템플릿과 도구들을 제공합니다.
HF Hub Template
위 코드는 ModelCardData로 메타데이터 YAML을 쉽게 생성한 뒤, f-string으로 템플릿에 끼워 넣어 ModelCard 객체를 만들고 있습니다. push_to_hub 메소드를 통해 해당 내용을 Hugging Face Hub에 바로 올릴 수도 있으며, create_pr=True 옵션을 주면 곧바로 모델 카드 변경 사항이 Pull Request로 제출되어 공동 작업자들과 검토할 수도 있습니다 . huggingface_hub은 또한 Jinja2 템플릿을 이용한 카드 생성 기능도 제공하여, 반복되는 양식을 보다 간편히 채워 넣을 수 있습니다 . Hugging Face 공식 깃허브에는 모델 카드의 raw 템플릿 (modelcard_template.md)이 공개되어 있으므로 이를 기반으로 커스텀 템플릿을 만들어 활용해도 됩니다 .
Jinja 템플릿
다른 자동화 도구
결론
Hugging Face Model Card는 오늘날 머신러닝 모델 공개의 필수 요소로 자리잡고 있으며, 투명하고 책임있는 AI를 구현하는 데 핵심적인 역할을 합니다. 연구 목적으로 모델을 공유할 때도 모델 카드를 충실히 작성하면 다른 연구자들에게 큰 도움이 되고, 자신의 연구 가치를 극대화할 수 있습니다. 모델 카드에는 모델의 이력과 설명, 사용법, 성능, 한계 등이 망라되어야 하며, Hugging Face의 권장 템플릿을 따르면 이러한 내용을 체계적으로 담을 수 있습니다. 또한 공식 도구와 커뮤니티 툴을 활용하면 모델 카드 작성 과정을 효율화하면서도 높은 품질을 유지할 수 있습니다. 투명성, 재현성, 책임성을 고려한 모델 카드를 작성하여, 더 나은 AI 생태계를 만드는 데 동참해 봅시다 :)
Beta Was this translation helpful? Give feedback.
All reactions