크크루쿠쿠

[데이터 제작] 7. 데이터 구축 가이드라인 작성 기초 본문

DeepLearning/부스트캠프 AI Tech

[데이터 제작] 7. 데이터 구축 가이드라인 작성 기초

JH_KIM 2021. 11. 11. 13:33

문서형 가이드라인 예시

 

튜토리얼 가이드라인 예시

 

가이드라인의 구성 요소

데이터 수집 및 정제 작업 : 데이터 정의, 특성 분석, 정제 방식, 도구, 고려 사항 ->수집을 위한 가이드 라인

데이터 주석 작업 : 특성 분류 체계, 주석 방법 및 절차, 형식과 정의,주석 도구 사용법, 주석 완료 후 관리 방법, 반려 및 통과 기준 -> 주석을 위한 가이드 라인

데이터 검수 및 평가 : 검수 절차 정의, 검수 방식, 평가 지표, 검수 결과 분석법, 검수 결과 반영법 -> 검수를 위한 가이드라인

ex) 서울시 -> location 과 organization 둘다 가능한데 하나로만 정할것인가? 문맥에 따라 할것인가?

 

가이드라인 버전 관리

가이드라인은 구축과 검수 과정을 통해 지속적으로 개정되어야 함.

개정 전과 개정 후 어떤것이 변화하였는지 비교하여 볼 수 있도록 버전 관리가 되는것이 가장 좋음.

버전별로 작성자와 개정일을 기입해두는 것이 관리에 도움이 됨.

 

가이드라인 작성 시 유의 사항

가이드라인의 유형별 특성을 이해하고 그에 알맞는 정보를 작성한다.

작업자의 작업 이해도를 고려하여 작성한다.

작업자에게 공개해야 하는 필수 정보와 부가적인 정보가 무엇인지 사전에 고려한다.

가이드라인 구성 요소의 배치를 어떻게 할 지 고민한다.

작업자의 가독성을 고려한다.

Comments