Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- prompt engineering
- ChatGPT
- Deeplearning
- 머신러닝
- rnn
- BFS
- 일기
- 프로그래머스
- 기계학습
- 파이썬
- LLM
- attention
- deque
- machinelearning
- gradient descent
- GPT
- Linear Model
- NLP
- transformer
- 코딩테스트
- Programmers
- 코테
- 프롬프트
- Linear Regression
- 부스트캠프
- 알고리즘
- dl
- Python
- Django
- LeetCode
Archives
- Today
- Total
크크루쿠쿠
[데이터 제작] 7. 데이터 구축 가이드라인 작성 기초 본문
문서형 가이드라인 예시
튜토리얼 가이드라인 예시
가이드라인의 구성 요소
데이터 수집 및 정제 작업 : 데이터 정의, 특성 분석, 정제 방식, 도구, 고려 사항 ->수집을 위한 가이드 라인
데이터 주석 작업 : 특성 분류 체계, 주석 방법 및 절차, 형식과 정의,주석 도구 사용법, 주석 완료 후 관리 방법, 반려 및 통과 기준 -> 주석을 위한 가이드 라인
데이터 검수 및 평가 : 검수 절차 정의, 검수 방식, 평가 지표, 검수 결과 분석법, 검수 결과 반영법 -> 검수를 위한 가이드라인
ex) 서울시 -> location 과 organization 둘다 가능한데 하나로만 정할것인가? 문맥에 따라 할것인가?
가이드라인 버전 관리
가이드라인은 구축과 검수 과정을 통해 지속적으로 개정되어야 함.
개정 전과 개정 후 어떤것이 변화하였는지 비교하여 볼 수 있도록 버전 관리가 되는것이 가장 좋음.
버전별로 작성자와 개정일을 기입해두는 것이 관리에 도움이 됨.
가이드라인 작성 시 유의 사항
가이드라인의 유형별 특성을 이해하고 그에 알맞는 정보를 작성한다.
작업자의 작업 이해도를 고려하여 작성한다.
작업자에게 공개해야 하는 필수 정보와 부가적인 정보가 무엇인지 사전에 고려한다.
가이드라인 구성 요소의 배치를 어떻게 할 지 고민한다.
작업자의 가독성을 고려한다.
'DeepLearning > 부스트캠프 AI Tech' 카테고리의 다른 글
[모델 최적화] 2. 좋은 모델과 파라미터 찾기:AutoML 이론 (0) | 2021.11.25 |
---|---|
[모델 최적화] 1. 최적화 소개 및 강의 개요 (0) | 2021.11.25 |
[데이터 제작] 6. 데이터 구축 작업 설계 (0) | 2021.11.10 |
[데이터 제작] 5. 원시 데이터의 수집과 가공 (0) | 2021.11.10 |
[데이터 제작] 4. 자연어 처리 데이터 소개 (2) (0) | 2021.11.09 |
Comments