본문 바로가기

Bigdata Hadoop

비지도 학습 기반 빅데이터 라벨링 기술 동향

반응형

 

 

라벨링된 학습 데이터는 기계학습의 발전을 가속화하는 요인이자 때로는 저해 요인이 되기도 한다. 학습 세트 구축을 위해서 비용과 노력이 소요되기 때문이다. 학습 데이터 세트를 구축하여도 데이터의 보안성 때문에 외부로 반출하기 위해서는 대가를 지불해야 하는 경우도 많다. 이러한 문제를 해결하기 위해 최근 소규모의 라벨 데이터를 가공해서 전체 라벨을 확충하거나, 센서나 컴퓨터에서 수집되는 데이터를 프로그램 방식을 통해 전문가의 도움 없이 라벨링하는 기술이 제안되고 있다.

 

본 고에서는 약지도(weak supervision) 학습과 반지도(semi supervision) 학습 등 비지도 학습 방법에 기반한 데이터 라벨링 동향과 사례에 대해 살펴본다. 약지도 학습을 위한 대표적인 오픈소스인 스노클(Snorkel)을 살펴보고, 향후 비지도 학습기반 데이터 라벨링이 해결해야 할 과제도 언급함으로써 비지도 학습 기반 데이터 라벨링 기술들에 대한 이해를 돕고자 한다.

 

<목차>

Ⅰ. 서론

Ⅱ. 비지도 학습을 통한 라벨 생성 방법들

Ⅲ. 약지도 학습 기법과 사례

Ⅳ. 반지도 학습 기법과 사례

Ⅴ. 결론

 

file1161114251077527620-198601.pdf
1.55MB

 

* 출처 : ITFIND 주간기술동향 1986호 

 

 

생활코딩 비지도 학습 https://opentutorials.org/course/4548/28945

 

 

반응형

더욱 좋은 정보를 제공하겠습니다.~ ^^