반응형

분류 전체보기 6191

언어 모델용 합성 데이터에 대한 모범 사례 및 교훈

언어 모델용 합성 데이터에 대한 모범 사례 및 교훈 Best Practices and Lessons Learned on Synthetic Data for Language Models 논문 출처: https://arxiv.org/html/2404.07503v1 요약 AI 모델의 성공 여부는 크고 다양한 고품질 데이터 세트의 가용성에 달려 있는데, 데이터 부족, 개인정보 보호 문제, 높은 비용으로 인해 이를 확보하기가 어려울 수 있습니다. 합성 데이터는 실제 패턴을 모방한 인공 데이터를 생성함으로써 유망한 솔루션으로 떠오르고 있습니다. 이 백서에서는 합성 데이터 연구에 대한 개요를 제공하고, 합성 데이터의 응용, 과제, 향후 방향에 대해 논의합니다. 또한 선행 기술의 경험적 증거를 제시하여 그 효과를 입증하..

다음 인생교훈 16가지를 명심하세요.

다음 인생교훈 16가지를 명심하세요. 사업을 본격적으로 시작한 지 6개월이 되었지만 아직 수입이 없어요. 열정은 바닥을 기고 무얼 이루겠다는 굳은 신념도 자꾸 약해져 갑니다. 지금 저와 같은 마음으로 이 글을 읽고 계신 분들이 많다는 것을 알고 있습니다. 저는 이러한 교훈들을 얻는 것이 얼마나 어려운 일인지, 이러한 교훈들이 실제로 삶을 얼마나 변화시킬 수 있는지 의문을 갖는 것도 잘 알고 있습니다. 어쩌겠어요? 그냥 하는 수밖에는 없습니다. 오늘은 누군가 제게 말해줬으면 하는 제 개인적인 인생 교훈 16가지를 여러분과 공유하고자 합니다. 시작해 보겠습니다. 1. 열심히 일하지 말고 똑똑하게 일하세요. 더 열심히 일한다고 해서 더 나은 결과를 얻을 수 있는 확률이 100% 보장되는 것은 아닙니다. 결과를..

2023 한국의 사회지표 자료 무료 pdf 내려받기

개인은 사회 전체를 보기 참 어렵고 갈등과 오해가 다소 격해지는거 같아서 아래의 자료를 배포합니다. 지난 3월 28일에 배포된 통계청 발간한 2023 한국의 사회지표 자료입니다. (하단에 파일 다운로드 가능) 📍[인구, 가구와 가족] 인구변화 / 가구변화 / 외국이추이 / 혼인현황 / 출산율과 출생아수 📍[건강, 생활환경] 기대수명, 조 사망율, 유병률, 생활습관, 환경상태 📍[교육과 훈련, 노동] 교육기회, 학교생활, 고용과 실업, 근로형태 및 여건 📍[소득과 소비, 자산] 국민계정 및 물가, 가구소득 및 소득분배, 소비생활, 여가활용, 여가충족도 및 만족도 📍[주거, 범죄와 안전] 주택보급, 주거적절성, 주거지출, 범죄현황, 사건 및 사고현황 📍[사회통합, 주관적웰빙] 국가기관 신뢰도, 사회갈등 인식..

WebAnarchist 2024.04.11

데이터 과학 교육은 대규모 언어 모델로 무엇을 해야 할까요?

논문 소개: 데이터 과학 교육은 대규모 언어 모델로 무엇을 해야 할까요? What Should Data Science Education Do with Large Language Models? LLM이 이제 데이터 정리, 모델 개발, 해석, 보고서 작성 등 데이터 분석 파이프라인의 거의 모든 일을 다 할 수 있게 되었기 때문에, 학생들은 AI가 수행하는 분석의 평가 및 관리로 초점을 옮겨야 한다. 전략적 계획, 자원 조정 및 전체 제품 수명 주기를 관리하고, AI가 수행한 분석을 평가하는 제품 관리자로써의 역할을 하는 쪽으로 바뀌고 있다. LLM 조기 교육에서 위험한 점은 학생들이 모델 결과의 정확성과 타당성을 판단할 수 있는 필수 기술을 개발하기 전에 LLM에 지나치게 의존하게 될 수 있다는 것인데 이제..

착하고 친절하면 어떻게 되나요?

당신이 착한 사람이면서 친절한 사람이라면 어떻게 되나요? 우리가 친절할 때, 1. 현관 매트처럼 대접받죠. 당연하다고 생각합니다. 2. 무슨 일이 있어도 실수는 항상 당신의 몫입니다. 3. 당신은 항상 두 번째 선택입니다... 항상! 4. 그들은 더 나은 사람을 찾을 때까지만 당신을 존중합니다. 5. 당신이 친절하게 대하는 사람이 무언가에 대해 화를 내면, 항상 당신의 머리에 폭탄이 떨어집니다. 6. 당신은 다른 사람들의 형편없는 행동의 희생자가 됩니다. 7. 당신은 모든 사람을 이해하지만, 아무도 당신을 이해하지 못합니다. 8. 당신은 너무 많이 신경 쓰지만, 다른 사람은 당신에게 거의 신경 쓰지 않습니다. 9. 당신의 실수는 돌에 새겨진 조각이 되지만, 그들의 실수는 기록조차 되지 않습니다. 10. ..

동기부여 2024.04.11

2024 과천마라톤 하프 코스 신청, 뜨거운 날이다.

모든 우여곡절을 함께 겪는 커뮤니티에 잘 달리는 사람이 몇 있다. 요즈음은 참석률이 낮지만 그래도 실력이 출중해 함께 달리면서 배우는 주자다.  시간이 가면 남자보다 더 잘 달리는 식자 선배도 따라잡고, 동갑이지만 서브 3(풀코스를 3시간 이내 완주)을 달성한 종자도 잡을 수 있을 거라고 생각했다. 여자 중에서 가장 잘 달리는 순자 선배의 기록도 깰 거라고 생각했다. 지금에서야 알게 되었는데 틀린 생각이다. 그들이 너보다 훨씬 빨리 늙지 않는다면 따라잡을 수 없다는 사실이다. 그들보다 더 잘 달리게 되는 순간은 그들을 이기는 것이 아무런 의미나 가치가 없을 때다.  골프, 바둑, 낚시, 당구 등 어떤 것도 수준급 이상으로 잘하는 사람을 안다. 수준급이라는 것은 그 일로 돈벌이를 해도 전혀 나무랄 데가 없..

호모러너스 2024.04.10

애플 UI를 이해하는 AI, Ferret-UI

애플은 UI를 이해하는 MLLM(Multimodal Large Language Model)인 Ferret-UI라는 모델에 대한 논문을 공개했습니다. 이 모델은 모바일 UI 화면을 이해하고, 사용자 지시에 따라 다양한 열린(특정한 작업에 한정되지 않은) 작업을 수행하는 모델입니다. GPT-4V 같은 기존의 이미지를 인식하는 MLLM의 경우, 앱 상의 요소들을 인식하는 능력은 다소 떨어지는데요. 이 성능을 높이기 위한 연구입니다. 아이콘 인식: 화면 상의 아이콘을 식별 텍스트 찾기: 인터페이스의 텍스트 인식 위젯 나열: 화면에서 사용 가능한 위젯 나열 자세한 설명: 보고있는 화면을 설명 인식/상호 작용 대화: 화면에 대한 인식을 바탕으로 대화 형태의 상호작용을 수행 애플의 최근 논문들은 역시 인터페이스, 사..

구글의 스타 윤리 연구원이 구글 비즈니스의 핵심인 대규모 언어 모델의 위험성을 강조

팀닛 게브루를 구글에서 쫓아낸 논문을 읽었습니다. 그 내용은 다음과 같습니다. 구글의 스타 윤리 연구원이 구글 비즈니스의 핵심인 대규모 언어 모델의 위험성을 강조했습니다. By Karen Hao 12월 2일 수요일 저녁, 구글의 윤리적 AI 팀 공동 책임자인 팀닛 게브루는 트위터를 통해 구글이 자신을 강제 퇴사시켰다고 발표했습니다. AI 윤리 연구 분야에서 널리 존경받는 리더인 게브루는 얼굴 인식이 여성과 유색인종을 식별하는 데 정확도가 떨어지며, 이는 결국 이들을 차별할 수 있음을 보여주는 획기적인 논문을 공동 저술한 것으로 유명합니다. 또한 Black in AI 친화성 그룹을 공동 설립하여 기술 업계의 다양성을 옹호하고 있습니다. 그녀가 구글에서 구축하는 데 도움을 준 팀은 AI 분야에서 가장 다양성..

WebAnarchist 2024.04.10

무엇을 해도 뻔한 날들이 온다.

무엇을 해도 뻔한 날들이 온다. 나이가 들 수록 감탄하지 않는다고 한다. 감탄하고 탄성을 자아내는 일이 이제는 뻔한 일이 되어서다. 마음속에서 놀라움을 감추고 애써 태연한 척도 해본다. 삶에서 무어그리 대단한 것도 없는 무상함을 안다. 아침 달리기에서 꽃들을 보고 일부러 감탄해 보지만 진정한 마음이 아니라서 날아갈 듯 좋은 느낌은 없다. 활짝 핀 봄꽃을 바라보면서 만물이 어떻고, 세상이 어떻게 돌아가도 계절은 돌아온다는 수상한 말이나 늘어놓는다. 마라톤 풀코스를 처음으로 완주했던 놀라운 기적의 느낌은 이제 30번쯤 달리고 나면 별 감탄이 나오지 않는다. 다른 사람이 대단하다고 추켜세워도 스스로 겸손한 마음도 없으면서 별 감흥이 없으니 간단히 대답한다. "다 할 수 있는 건데요. 뭐." 모든 일이 뻔하고 ..

우리를 정의하는 건 기억이 아니라 행동이다.

우리를 정의하는 건 기억이 아니라 행동이다. 영화 - 줄리언 반즈 "예감은 틀리지 않는다." 사람은 누구나 이미 지나간 사건에 대한 기억이 자신을 정의한다고 생각하고 기억에 집착하지만, 기억은 현재의 우리를 정의하진 않는다. 아무리 많은 경험에 대한 기억과 사랑, 감정에 대한 기억이 얼마나 거짓이고, 믿을 수 없고, 형편없는 기반을 가진 건물인지 누구나 알고 있다. 그런데도 우리는 기억에 집착한다. 마치 생명이 살아남기 위한 삶의 방식처럼 말이다. 꽃은 기억에 의지해 꽃을 피우지 않는다. 무성한 연두색 잎들이 언제 연두색으로 물들여야 하는지 나무는 기억이 없다. 사람은 언제 열정적으로 살아야 하고, 언제 잠들지, 어느 땐 잊어야 하는지 알지 못한다. 기억으로 우리가 갖는 판단, 선택, 적절한 때는 꽃과 ..

라즈베리파이 5 SD 카드에 OS 굽기

라즈베리파이 운영체제를 다운 받는 사이트로 이동한다.https://www.raspberrypi.com/software/ 아래 이미지에서 빨간 둥근 네모를 선택하여 이동하여 모든 옵션을 보이게 한다. 화면이 바뀌어 아래 여러 옵션중 64-bit를 선택 그럼 아래 이미지가 나오는데 두번째 파일을 다운받는다. 다운 받는데 2-3분 걸린다. 다운 받은 파일의 압축을 풀면 아래 파일이 나온다. 14G Byte 정도 된다. 그러니까 Micro SD 카드는 16G 이상, 안전하게 32G 짜리를 사용하면 좋다. 위 파일을 win32 Disk Imager 파일로 굽는다. Win32 Disk Imager 공식 사이트에 가서 프로그램을 설치한다. https://win32diskimager.org/ Win32 Disk Ima..

불비불명(不飛不鳴)이란 시간을 견디는 일

불비불명(不飛不鳴)은 '날지도 않고 울지도 않는다'는 뜻으로, 큰 목적을 이루기 위해 오랫동안 조용히 때를 기다리고 있음을 뜻한다. 날지도 않고 울지도 않음. 큰일을 위해 때를 기다리는 모습을 사자성어로 불비불명이라고 한다. '큰일을 하기 위해 적절한 때를 기다린다'는 뜻의 불비불명(不飛不鳴)이라는 성어가 유래했다. 기회가 올 때까지 자신이 자신을 컨트롤한다는 것은 쉬운 일 같지만 실상은 제일 어려운 일이다. 자신을 원하는 대로 통제하는 것처럼 어려운 일은 없다. 인간은 자신에겐 한없이 관대하기 때문이다. 하지만 자신을 통제할 줄 아는 사람이 발전 가능성이 많다는 것이다. 자신을 통제하는 능력을 길러야 한다. 이에 노자는 "남을 설복시킬 수 있는 사람은 강한 사람이다. 그러나 자신을 이기는 사람은 더욱 ..

좋은 글 모음 2024.04.08

데이터 과학 교육은 대규모 언어 모델로 무엇을 해야 할까요?

데이터 과학 교육은 대규모 언어 모델로 무엇을 해야 할까요? What Should Data Science Education Do With Large Language Models? by Xinming Tu, James Zou, Weijie Su, and Linjun Zhang Published on Jan 20, 2024 초록 ChatGPT와 같은 대규모 언어 모델(LLM)의 급속한 발전은 데이터 과학과 통계에 혁명을 일으키고 있습니다. 이러한 최첨단 도구는 데이터 정리, 모델 구축, 해석, 보고서 작성과 같은 복잡한 프로세스를 간소화할 수 있습니다. 그 결과 데이터 과학자의 역할이 재편되고 있습니다. 머신러닝은 데이터 과학자의 책임을 변화시키고 있으며, 코딩, 데이터 랭글링, 표준 분석 수행에서 자동화된..

메이커 Maker 2024.04.08

2024 서울 마라톤 풀코스 완주 3시간 58분

유튜브에서 굿네이버스 결식아동 캠페인이나 국경 없는 의사회 활동에 대한 광고를 본다. 10살인 선아는 혼자 반찬도 없이 라면을 끓여 먹는다. 함께 사는 할머니는 파킨슨 병으로 온몸이 굳어간다. 할머니가 입원하는 날이면 선아는 모든 것을 혼자 책임진다. 배고플 때 먹을 것이라곤 집에 있는 라면이 전부다. 배가 고파도, 먹고 싶은 게 있어도 말없이 습관처럼 라면을 끓이는 게 선아가 할 수 있는 일이다. 영상을 보면서 행복이란 희한하게도 감사할 일들이 아무리 많아도 실제 형식적으로는 가능하지만 진실하게 감사하지 않고, 결과로 행복한 마음은 들지 않는다. 마음이 이렇게 형편없이 낮은데 행복을 기대하는 것 자체가 말도 되지 않는다. 우리는 사라지기 직전에 간신히 기록하는 것에 익숙하다. 풀코스를 달리는 그 힘들고..

호모러너스 2024.04.05

세상을 단순화하고 잘 살기위한 50 가지 시대를 초월한 통찰력

세상을 단순화하고 잘 살기 위한 50 가지 시대를 초월한 통찰력! 생활, 경력, 인간 관계, 건강, 돈에 대한 인생에서 반드시 알아야 할 강력한 팁입니다. 인생은 정말 단순하지만 우리는 자꾸만 복잡하게 만들려고 고집합니다. - 공자 이 인용문의 정신은 사실에 부합합니다: 우리 인간은 복잡함을 만들어 내는 경향이 있습니다. 우리는 개인적으로든 직업적으로든 삶에서 진전을 이루면 그 진전을 축하하는 가장 좋은 방법은 새로운 혼란을 가미하는 것으로 생각합니다. 이는 다소 실망스러운(그리고 웃기기도 한) 인간종 전체의 특성입니다: 여유로운 휴가를 예약했지만, 휴가가 끝날 때쯤에는 처음보다 더 피곤해지는 활동으로 매 순간을 채우게 됩니다. 우리는 돈에 대한 스트레스를 줄일 수 있는 프로모션을 받았기 때문에 끊임없이..

반응형