반응형
라벨링된 학습 데이터는 기계학습의 발전을 가속화하는 요인이자 때로는 저해 요인이 되기도 한다. 학습 세트 구축을 위해서 비용과 노력이 소요되기 때문이다. 학습 데이터 세트를 구축하여도 데이터의 보안성 때문에 외부로 반출하기 위해서는 대가를 지불해야 하는 경우도 많다. 이러한 문제를 해결하기 위해 최근 소규모의 라벨 데이터를 가공해서 전체 라벨을 확충하거나, 센서나 컴퓨터에서 수집되는 데이터를 프로그램 방식을 통해 전문가의 도움 없이 라벨링하는 기술이 제안되고 있다.
본 고에서는 약지도(weak supervision) 학습과 반지도(semi supervision) 학습 등 비지도 학습 방법에 기반한 데이터 라벨링 동향과 사례에 대해 살펴본다. 약지도 학습을 위한 대표적인 오픈소스인 스노클(Snorkel)을 살펴보고, 향후 비지도 학습기반 데이터 라벨링이 해결해야 할 과제도 언급함으로써 비지도 학습 기반 데이터 라벨링 기술들에 대한 이해를 돕고자 한다.
<목차>
Ⅰ. 서론
Ⅱ. 비지도 학습을 통한 라벨 생성 방법들
Ⅲ. 약지도 학습 기법과 사례
Ⅳ. 반지도 학습 기법과 사례
Ⅴ. 결론
* 출처 : ITFIND 주간기술동향 1986호
반응형
'Bigdata Hadoop' 카테고리의 다른 글
라즈베리파이 하둡 클러스터 설치 가이드 (1) | 2024.07.02 |
---|---|
빅데이터의 가치를 높이는 기술, 데이터 시각화 (3) | 2024.06.17 |
사물인터넷(IoT) 함께하는 빅데이터 교육 과정 (0) | 2023.01.20 |
라즈베리파이4 빅 데이터 교육 과정 (0) | 2023.01.12 |
e-koreatech 인공지능 및 빅데이터 관련 과정 안내 (0) | 2021.05.03 |
[K-ICT 빅데이터 센터] 파면 팔수록 쉽고 재미있는 딥러닝 (0) | 2021.04.14 |
빅데이터플랫폼 통합 데이터지도 서비스 개통 (2) | 2020.04.14 |
지식기반 빅데이터 및 공공오픈데이터 기술 및 정책정보 (0) | 2017.09.04 |
더욱 좋은 정보를 제공하겠습니다.~ ^^