개발자/인공지능과 인간

Autonomous Agents 자율 에이전트 가이드 1

지구빵집 2023. 5. 18. 15:33
반응형

 

 

인공 지능은 콘텐츠 추천, 카피 작성, 질문에 답하기, 심지어 실생활과 구별할 수 없는 사진 생성과 같은 매우 구체적인 작업을 완료하는 데 사용할 수 있습니다.

 

AI에게 하나의 작업을 완료하라고 말하면 AI는 하나의 단순한 작업을 완료합니다.

 

그러나 AI가 수행할 모든 작업을 우리가 하나하나 생각해내지 않아도 되는 경우에는 어떻게 해야 합니까? 단순한 도구가 아닌 팀원을 원한다면? AI가 스스로 생각하게 하려면 어떻게 해야 할까요?

 

정말 AI 자신이 스스로 생각하는 것처럼 .

 

 

Autonomous Agents 자율 에이전트 가이드 4 

Autonomous Agents 자율 에이전트 가이드 3 

Autonomous Agents 자율 에이전트 가이드 2 

Autonomous Agents 자율 에이전트 가이드 1 

 

 

"세계 최고의 아이스크림 만들기"와 같은 모호한 목표를 부여할 수 있는 AI를 만들었다고 상상해 보세요. 목표를 달성할 때까지 이 과정을 계속합니다. 이것이 바로 "자율 에이전트 Autonomous Agents"가 하는 일이며 AI 개발자들 사이에서 가장 빠르게 성장하는 추세이지만 대부분의 사람들은 이에 대해 알지 못합니다.

 

( 이 기사를 작성할 당시에는 자율 에이전트에 대해 작성된 주요 출판물이 없었고 출판 이후에는 소수만이 이를 다루었으므로 이 글을 읽고 있다면... 당신은 매우 이른 것입니다.)

 

자율 에이전트란 ​​무엇입니까? 왜 그렇게 큰 기회입니까? 그들은 어떻게 작동합니까? 미래에 이것은 어떤 모습일까요? 어떻게 구축하거나 사용할 수 있습니까? 자율 에이전트에 관심이 있는 다른 사람들을 어떻게 만날 수 있습니까?

 

이것에 대한 답변을 지금부터 합니다. 

 

"[지능형] Autonomous Agents 자율 에이전트는 일반적으로 자동화의 자연스러운 종착점입니다. 원칙적으로 에이전트는 다른 모든 프로세스를 자동화하는 데 사용될 수 있습니다. 이러한 에이전트가 고도로 정교하고 신뢰할 수 있게 되면 모든 분야와 산업에서 자동화가 기하급수적으로 증가할 것이라는 것은 쉽게 상상할 수 있습니다." Bojan Tunguz, Machine Learning at NVIDIA

 

p.s. 추신: 저는 7년 동안 대화형 AI 제품을 구축해 최근에는 최근에는 브랜드를 개량한 생성형 AI 및 자동화 에이전트 솔루션을 구축하고 있는 Octane AI의 CEO이자 공동 출자자입니다. 2016년에 저는 챗봇 인터페이스가 표준 웹사이트 UI를 복제하기 시작하고 현재 1억 명이 넘는 사람들이 ChatGPT 및 유사한 웹사이트를 계속할 것이라고 예측했습니다. 저는 이제 정식 대리인이 미래에 널리 채택될 것이라고 예측하고 있지만 이 예측은 실현되는 데 7년이 걸리면 즉시 발생하게 될 것입니다. 

 

What Are Autonomous Agents? 자율에이전트란? 

 

자율 에이전트는 목표가 주어지면 스스로 작업을 생성하고, 작업을 완료하고, 새 작업을 생성하고, 작업 목록의 우선순위를 재조정하고, 새로운 상위 작업을 완료하고, 목표에 도달할 때까지 반복할 수 있는 강력한 AI 기반 프로그램입니다. 

 

위의 설명을 다시 한 번 읽어보세요. 간단하지만 매우 어렵기 때문입니다. 

 

"자율 에이전트의 미래는 모든 사람이 관리자가 되는 모습입니다." 요헤이 나카지마, BabyAGI 제작자

 

자율 에이전트는 소셜 미디어 계정 관리, 시장 투자, 최고의 동화책 추천 등 다양한 작업을 수행하도록 설계할 수 있습니다.

 

"인간은 컴퓨터로 할 수 있는 지루하고 수동적인 작업에 지나치게 많은 시간을 낭비하고 있으며, 그 시간을 더 창의적인 일을 하거나 현재 인간만이 할 수 있는 일을 하는 데 할애하고 있습니다. 자율 에이전트를 통해 사람들은 훨씬 더 짧은 시간에 훨씬 더 많은 작업을 수행할 수 있으며, 시간이 지남에 따라 화면 앞에서 보내는 시간이 훨씬 줄어들기를 바랍니다!" - Erica Brescia, Redpoint 전무 이사

 

자율 에이전트를 구동하는 데 필요한 프로그래밍 기술과 AI는 매우 새롭고 실제적인 기술입니다. AutoGPT, BabyAGI, Microsoft의 Jarvis와 같은 많은 오픈 소스 프로젝트가 Github와 AI 커뮤니티 및 부서 내에서 유행하고 있습니다.

 

오픈 소스 자율 에이전트 코드 베이스가 만들어진 지 2주 만에 거의 10만 명의 개발자가 자율 에이전트를 구축하고, 개선하고, 한계까지 밀어붙이고 있으며, 이는 이러한 개념이 발명된 지 불과 몇 주 만에 이루어진 일입니다. 이 기술을 사용하는 개발자의 수는 점점 더 빠른 속도로 증가하고 있습니다. 

 

"AI 에이전트는 어디에나 있을 것입니다. 수십억 달러 규모의 기업들은 AI 에이전트를 배포하는 소규모 팀에서 탄생할 것입니다." Ben Tossell, 벤스 바이트 AI 뉴스레터 창립자

 

자율 에이전트 분야는 라라벨, 비트코인, 장고, 파이토치 등 오랫동안 인기 있는 코드베이스보다 더 큰 규모로 성장했습니다.  

 

 

역사상 그 어떤 코드베이스보다 빠르게 기하급수적으로 증가하는 자동-GPT Github 인기도. 이미지 출처 https://www.mattprd.com/p/the-complete-beginners-guide-to-autonomous-agents

 

 

 

이것은 공상 과학 소설이 아닙니다. 많은 사람들은 이러한 자율 에이전트가 진정한 인공 일반 지능의 시작이라고 생각하며, 일반적으로 "AGI" Artificial General Intelligence라고도 하는데, 이는 지성을 획득하여 "살아 있는" 인공지능을 설명하는 데 사용되는 용어입니다. 

 

"자율 에이전트는 결국 사실 기반 지식의 모든 애플리케이션적을 상품화할 수 있습니다. 사실적 지식에 대한 접근이 보편화되면 창의성, 감성, 전략적 비전과 같은 인간의 자질은 더욱 차별화될 것입니다. 그러나 사실적 지식의 응용이 상품화되는 세상에서 개인과 기업이 경제적 이득을 얻으려 하고 인류의 집단적 지식이 정체되기 시작하면서 지식이 점점 더 독점화될 가능성도 있습니다." Tony Hu, 전 FBI 신흥 기술 책임자 대행, Bondoo AI 공동 설립자

 

HyperWrite에서 방금 출시한 이 자율 에이전트를 확인해보세요. 브라우저에서 살아 움직이며 피자 주문을 도와주는 것을 볼 수 있습니다. "도미노스의 라지 플레인 피자를 원 밴더빌트에 주문해줘"라고 말하기만 하면 바로 주문이 완료됩니다. 

 

 

브라우저를 제어하여 피자를 주문하는 HyperWrite의 자율 에이전트

 

스탠퍼드 대학과 Google이 협력하여 25명의 자율 에이전트로 구성된 가상 마을을 만들고 그 중 한 명에게 발렌타인데이 파티를 계획하도록 한 이 실험이 더 인상적일 수도 있습니다. 시뮬레이션에 참여한 사람들은 서로 대화하고 새로운 추억을 쌓으며 하루를 보냈고, 결국 대부분의 사람들이 발렌타인데이 파티에 대한 소식을 듣고 파티에 참석했습니다. 

 

"좋아요, 미쳤어요... 자율 에이전트가 진짜라고요? 목표가 무엇인지 알려주면 그 이후에는 스스로 알아서 관리한다고요?" 

 

네. 목표 하나만 지정하면 나머지는 자율 에이전트가 알아서 처리합니다. 정말 훌륭한 직원이나 팀원처럼요. 물론 원한다면 특정 주요 의사 결정 순간에 자율 에이전트가 사용자와 함께 체크인하도록 설계하여 일시적으로 업무에 대해 협업할 수도 있습니다. 

 

"이게 진짜라고요? 이런 것들이 지금 존재한다고요?"

 

네, 공상 과학 소설처럼 들리겠지만 실제로 작동하고 있습니다. 코딩만 할 수 있다면 단 몇 분 만에 만들 수 있습니다. 그리고 이것은 시작에 불과합니다. 

 

"원시적인 AGI"입니다. LLM을 루프 안에 넣는 것만으로도 스스로 추론하고, 계획하고, 생각하고, 기억하고, 학습할 수 있는 자율 에이전트를 만들 수 있다는 점이 놀랍습니다. 이는 적절한 구조와 프롬프트로 랩핑할 경우 LLM이 가진 아직 개발되지 않은 힘과 유연성을 보여줍니다. 전체 개념이 완성된 지 한 달도 채 되지 않았기 때문에 점점 더 정교해지는 LLM을 기반으로 구축된 에이전트가 세상에 어떤 영향을 미칠지 기대가 됩니다." Siqi Chen, Runway의 설립자 겸 CEO

 

"하지만 자율 에이전트는 무엇을 할 수 있나요? 자율 에이전트가 작업을 완료한다는 말은 도대체 무슨 뜻인가요?"

 

좋은 질문입니다!

 

자율 에이전트는 목표를 분석하고 작업을 제안하는 것 외에도 다음과 같이 사람이 할 수 있는 모든 디지털 작업을 완료할 수 있는 다양한 능력을 갖출 수 있습니다:

 

  • 인터넷 검색 및 앱 사용 액세스
  • 장기기억 및 단기 기억력
  • 컴퓨터 제어
  • 신용카드 또는 기타 결제 수단 액세스
  • 분석, 요약, 의견 및 답변을 위해 GPT와 같은 대규모 언어 모델(LLM)에 액세스합니다.

 

또한 이러한 자율 에이전트는 다양한 형태와 크기로 제공될 것입니다. 일부는 사용자가 알지 못하는 이면에서 작동하는 반면, 일부는 위의 예에서처럼 사용자가 AI의 '생각'을 따라갈 수 있도록 눈에 보이게 작동할 것입니다. 

 

"자율 에이전트를 사용하면 누구나 국가 원수처럼 살 수 있습니다! 필요한 일이 있으신가요? 요청만 하면 에이전트가 나머지는 알아서 처리합니다. 더 이상 일상적인 업무에 두뇌를 낭비할 필요가 없습니다." - Chris Yeh, 블리츠스케일링의 공동 저자, 리드 호프만과 공동 집필

 

오늘은 여기까지.

다음은 단순한 예를 들어 자율 에이전트가 어떻게 일을 하는지 설명합니다.

 

 

 

반응형