라벨링된 학습 데이터는 기계학습의 발전을 가속화하는 요인이자 때로는 저해 요인이 되기도 한다. 학습 세트 구축을 위해서 비용과 노력이 소요되기 때문이다. 학습 데이터 세트를 구축하여도 데이터의 보안성 때문에 외부로 반출하기 위해서는 대가를 지불해야 하는 경우도 많다. 이러한 문제를 해결하기 위해 최근 소규모의 라벨 데이터를 가공해서 전체 라벨을 확충하거나, 센서나 컴퓨터에서 수집되는 데이터를 프로그램 방식을 통해 전문가의 도움 없이 라벨링하는 기술이 제안되고 있다.
본 고에서는 약지도(weak supervision) 학습과 반지도(semi supervision) 학습 등 비지도 학습 방법에 기반한 데이터 라벨링 동향과 사례에 대해 살펴본다. 약지도 학습을 위한 대표적인 오픈소스인 스노클(Snorkel)을 살펴보고, 향후 비지도 학습기반 데이터 라벨링이 해결해야 할 과제도 언급함으로써 비지도 학습 기반 데이터 라벨링 기술들에 대한 이해를 돕고자 한다.
<목차>
Ⅰ. 서론
Ⅱ. 비지도 학습을 통한 라벨 생성 방법들
Ⅲ. 약지도 학습 기법과 사례
Ⅳ. 반지도 학습 기법과 사례
Ⅴ. 결론
* 출처 : ITFIND 주간기술동향 1986호

'Bigdata Hadoop' 카테고리의 다른 글
| 라즈베리파이 하둡 클러스터 설치 가이드 (1) | 2024.07.02 |
|---|---|
| 빅데이터의 가치를 높이는 기술, 데이터 시각화 (3) | 2024.06.17 |
| 사물인터넷(IoT) 함께하는 빅데이터 교육 과정 (0) | 2023.01.20 |
| 라즈베리파이4 빅 데이터 교육 과정 (0) | 2023.01.12 |
| e-koreatech 인공지능 및 빅데이터 관련 과정 안내 (0) | 2021.05.03 |
| [K-ICT 빅데이터 센터] 파면 팔수록 쉽고 재미있는 딥러닝 (0) | 2021.04.14 |
| 빅데이터플랫폼 통합 데이터지도 서비스 개통 (2) | 2020.04.14 |
| 지식기반 빅데이터 및 공공오픈데이터 기술 및 정책정보 (0) | 2017.09.04 |
취업, 창업의 막막함, 외주 관리, 제품 부재!
당신의 고민은 무엇입니까? 현실과 동떨어진 교육, 실패만 반복하는 외주 계약,
아이디어는 있지만 구현할 기술이 없는 막막함.
우리는 알고 있습니다. 문제의 원인은 '명확한 학습, 실전 경험과 신뢰할 수 있는 기술력의 부재'에서 시작됩니다.
이제 고민을 멈추고, 캐어랩을 만나세요!
코딩(펌웨어), 전자부품과 디지털 회로설계, PCB 설계 제작, 고객(시장/수출) 발굴과 마케팅 전략으로 당신을 지원합니다.
제품 설계의 고수는 성공이 만든 게 아니라 실패가 만듭니다. 아이디어를 양산 가능한 제품으로!
귀사의 제품을 만드세요. 교육과 개발 실적으로 신뢰할 수 있는 파트너를 확보하세요.
캐어랩