본문 바로가기

개발자/ArduinoUnoQ

Arduino-UnoQ-최적화된 Llama-CLI

반응형

이 저장소는 Arduino Uno Q (Qualcomm QRB2210 + STM32U585) 용 고성능 LLM 추론 엔진과 "듀얼 브레인" 통합 기능을 제공합니다 . 

 

🚀 성능 (SmolLM2-135M)

Adreno 702 GPU 용 NVIDIA DGX Spark (Grace Blackwell) 에 최적화되었습니다 .

  • 신속 처리 속도: 초당 약 60건
  • 토큰 생성량: 초당 약 30개

🧠 듀얼 브레인 아키텍처

이 구현은 Uno Q의 고유한 하이브리드 설계를 활용합니다.

  1. MCU(STM32): 실시간 센서 데이터 및 트리거를 처리합니다.
  2. MPU(퀄컴): 최적화된 방식을 통해 복잡한 AI 추론 작업을 수행합니다 llama-cli.

📂 저장소 구조

  • /mcu : STM32U585용 아두이노 스케치.
  • /mpu : 최적화된 llama-cli바이너리 및 Python 오케스트레이터.
  • /models : 양자화된 .gguf가중치를 위한 디렉토리입니다.

📥 모델 받기

최적화된 가중치 파일은 Hugging Face에서 다운로드할 수 있습니다: 👉 SmolLM2-135M-Instruct-ArduinoUnoQ-GGUF 다운로드

🛠️ 빠른 시작

  1. 스케치를 /mcuUno Q에 플래시하세요.
  2. /mpu해당 폴더를 보드의 Linux 영역으로 옮기세요 .
  3. .gguf모델을 다음 위치에 다운로드하세요 /mpu/models.
  4. 오케스트레이터를 실행하세요: bash python3 mpu/bridge_orchestrator.py  또는 간단히 실행하세요 ./llama-cli -m ~/models/unoq_optimized.gguf

 

 

 

 

반응형

캐어랩 고객 지원

취업, 창업의 막막함, 외주 관리, 제품 부재!

당신의 고민은 무엇입니까? 현실과 동떨어진 교육, 실패만 반복하는 외주 계약, 아이디어는 있지만 구현할 기술이 없는 막막함.

우리는 알고 있습니다. 문제의 원인은 '명확한 학습, 실전 경험과 신뢰할 수 있는 기술력의 부재'에서 시작됩니다.

이제 고민을 멈추고, 캐어랩을 만나세요!

코딩(펌웨어), 전자부품과 디지털 회로설계, PCB 설계 제작, 고객(시장/수출) 발굴과 마케팅 전략으로 당신을 지원합니다.

제품 설계의 고수는 성공이 만든 게 아니라 실패가 만듭니다. 아이디어를 양산 가능한 제품으로!

귀사의 제품을 만드세요. 교육과 개발 실적으로 신뢰할 수 있는 파트너를 확보하세요.

지난 30년 여정, 캐어랩이 얻은 모든 것을 함께 나누고 싶습니다.

카카오 채널 추가하기

카톡 채팅방에서 무엇이든 물어보세요

당신의 성공을 위해 캐어랩과 함께 하세요.

캐어랩 온라인 채널 바로가기

캐어랩