AI 컴퓨팅 기술 분야의 선두주자인 엔비디아(www.nvidia.co.kr)가 RTX AI PC와 워크스테이션에서 에이전트 워크플로우를 간소화하는 엔비디아 NIM 마이크로서비스(NVIDIA NIM microservices)를 출시했다.
생성형 AI는 게임 어시스턴트, 향상된 콘텐츠 제작과 생산성 도구 등 PC와 워크스테이션을 위한 새로운 기능을 선보이고 있다.

현재 사용 가능한 엔비디아 NIM 마이크로서비스와 출시를 앞둔 AI 블루프린트(AI Blueprint)는 AI 개발을 가속화하고 접근성을 개선한다. 지난 1월 CES에서 발표된 엔비디아 NIM은 엔비디아 RTX 플랫폼에 최적화된 최첨단 AI 모델을 사전 패키지로 제공한다. 엔비디아 RTX 플랫폼에는 엔비디아 지포스(GeForce) RTX 50 시리즈와 새로운 엔비디아 블랙웰(Blackwell) RTX PRO GPU가 포함된다. 마이크로서비스는 쉽게 다운로드하고 실행할 수 있다. 이는 PC 개발을 위한 최고의 양식을 포괄하며, 최고의 생태계 애플리케이션과 도구와 호환된다.
이와 함께 프로젝트 G-어시스트(Project G-Assist)의 실험적인 시스템 어시스턴트 기능도 공개됐다. 프로젝트 G-어시스트는 AI 어시스턴트가 앱과 게임을 어떻게 향상시킬 수 있는지 보여준다. 시스템 어시스턴트를 통해 사용자는 간단한 음성 또는 텍스트 명령을 통해 실시간 진단을 실행하고, 성능 최적화에 대한 조언을 받거나, 시스템 소프트웨어와 주변기기를 제어할 수 있다. 개발자와 애호가는 간단한 플러그인 아키텍처와 새로운 플러그인 빌더를 통해 기능을 확장할 수 있다.
지금은 획기적인 AI 모델과 글로벌 개발자 커뮤니티가 AI 기반 도구와 워크플로우의 폭발적인 증가를 주도하고 있는 컴퓨팅의 결정적인 순간이다. 여기서 NIM 마이크로서비스, AI 블루프린트, G-어시스트는 PC에 주요 혁신을 가져오는 데 도움을 주고 있다. RTX AI 개러지(RTX AI Garage) 블로그 시리즈는 RTX AI PC와 워크스테이션에서 차세대 AI를 구축하는 데 도움이 되는 업데이트, 인사이트, 리소스를 지속적으로 제공해 개발자와 마니아들을 지원할 예정이다.
AI의 혁신 속도는 놀랍지만, PC 개발자 커뮤니티에서 이 기술을 시작하기는 여전히 어려울 수 있다.
연구용 AI 모델을 PC로 가져오려면 모델 변형의 큐레이션, 모든 입력과 출력 데이터를 관리하기 위한 적응, 리소스 사용을 최적화하기 위한 정량화가 필요하다. 또한 최적화된 추론 백엔드 소프트웨어에서 작동하도록 모델을 변환하고 새로운 AI 애플리케이션 프로그래밍 인터페이스(API)에 연결해야 한다. 이 작업에는 상당한 노력이 필요하므로 AI 도입이 늦어질 수 있다.
엔비디아 NIM 마이크로서비스는 업계 표준 API에 연결되는 사전 패키지화되고 최적화된, 쉽게 다운로드할 수 있는 AI 모델을 제공해 AI 도입을 지원한다. NIM 마이크로서비스는 RTX AI PC와 워크스테이션의 성능에 최적화돼 있으며, 엔비디아에서 개발한 모델뿐만 아니라 커뮤니티의 인기 AI 모델도 포함된다.
NIM 마이크로서비스는 거대 언어 모델(large language model, LLM), 비전 언어 모델(vision language models), 이미지 생성, 음성 처리, 검색 증강 생성(retrieval-augumented generation, RAG) 기반 검색, PDF 추출, 컴퓨터 비전 등 다양한 AI 애플리케이션을 지원한다. 언어와 이미지 생성, 컴퓨터 비전, 음성 AI 등을 포함한 다양한 애플리케이션을 지원하는 10개의 RTX용 NIM 마이크로서비스가 제공된다. 이러한 NIM 마이크로서비스는 지금 바로 시작할 수 있다:
- 언어와 추론: 딥시크-R1-증류-라마(Deepseek-R1-distill-llama-8B), 미스트랄-네모-12B-지시(Mistral-nemo-12B-instruct), 라마3.1-8B-지시(Llama3.1-8B-instruct)
- 이미지 생성: 플럭스.dev(Flux.dev)
- 오디오: 리바 페러킷-ctc-06B-asr(Riva Parakeet-ctc-06B-asr), 맥신 스튜디오 보이스(Maxine Studio Voice)
- RAG: 라마-3.2-NV-임베드QA-1B-v2(Llama-3.2-NV-EmbedQA-1B-v2)
- 컴퓨터 비전과 이해: NV-클립(NV-CLIP), 패들OCR(PaddleOCR), 욜로-X-v1(Yolo-X-v1)
NIM 마이크로서비스는 인기 AI 에코시스템 도구와 프레임워크를 통해서도 이용할 수 있다.
애니띵LLM(AnythingLLM)과 챗RTX(ChatRTX)는 NIM을 지원함으로써 AI 애호가가 인터페이스를 통해 LLM과 AI 에이전트와 간편하게 채팅할 수 있게 한다. 이러한 도구를 통해 사용자는 개인화된 AI 어시스턴트를 만들고 자신의 문서와 데이터를 통합해 작업을 자동화하고 생산성을 향상시킬 수 있다.
이제 플로와이즈AI(FlowiseAI)와 랭플로우(Langflow)도 NIM을 통해 애플리케이션에 AI를 구축, 테스트, 통합하고자 하는 개발자를 지원한다. 이를 통해 최소한의 코딩 전문 지식으로 AI 워크플로우를 설계할 수 있는 시각적 인터페이스가 포함된 로우-코드와 노-코드 솔루션을 제공한다. 컴피UI(ComfyUI)에 대한 지원도 곧 제공될 예정이다. 개발자는 이러한 도구를 사용해 챗봇, 이미지 생성기, 데이터 분석 시스템과 같은 복잡한 AI 애플리케이션을 쉽게 만들 수 있다.
또한 이제부터 마이크로소프트 VS Code AI 툴킷(Microsoft VS Code AI Toolkit), 크루AI(CrewAI), 랭체인(Langchain)도 NIM을 지원한다. 이들은 마이크로서비스를 애플리케이션 코드에 통합하기 위한 고급 기능을 제공해 원활한 통합과 최적화를 보장한다.
엔비디아 기술 블로그와 build.nvidia.com에서 자세한 내용을 확인할 수 있다.
엔비디아 AI 블루프린트는 AI 개발자가 엔비디아 NIM 마이크로서비스로 생성형 AI 워크플로우를 구축하는 데 있어 유리한 출발점을 제공한다.
블루프린트는 소스 코드, 샘플 데이터, 문서, 데모 앱 등 필요한 모든 것을 번들로 제공하며, 즉시 사용 가능하고 확장 가능한 참조 샘플이다. 이는 로컬에서 실행되는 고급 AI 워크플로우를 생성하고 개인화하기 위해 사용된다. 개발자는 AI 블루프린트를 수정하고 확장해, 동작을 조정하거나 다른 모델을 사용하거나 완전히 새로운 기능을 구현할 수 있다.

PDF를 팟캐스트로 변환하는 AI 블루프린트는 문서를 오디오 콘텐츠로 변환해 사용자가 이동 중에도 학습할 수 있게 한다. 이 워크플로우는 PDF에서 텍스트, 이미지, 표를 추출하며, AI를 사용해 유익한 팟캐스트를 생성한다. 주제에 대해 더 자세히 알아보고자 하는 경우, 사용자는 AI 기반 팟캐스트 호스트와 대화형 토론을 할 수 있다.
3D 가이드 생성형 AI를 위한 AI 블루프린트는 아티스트가 이미지 생성을 더 세밀하게 제어할 수 있도록 해준다. AI는 간단한 텍스트 프롬프트에서 놀라운 이미지를 생성할 수 있지만, 단어만으로 이미지 구성을 제어하는 것은 어려울 수 있다. 이 블루프린트를 사용하면 제작자는 블렌더(Blender)와 같은 3D 렌더러에 배치된 간단한 3D 개체를 사용해 AI 이미지 생성을 유도할 수 있다. 아티스트는 수작업으로 3D 에셋을 만들거나 AI를 사용해 생성하고, 장면에 배치하며 3D 뷰포트 카메라를 설정할 수 있다. 이어서 플럭스 NIM 마이크로서비스로 구동되는 사전 패키지화된 워크플로우가 현재 구성을 사용해 3D 장면에 맞는 고품질 이미지를 생성한다.
NIM 마이크로서비스를 PC에서 실행할 수 있도록 하는 핵심 기술 중 하나는 리눅스용 윈도우 하위 시스템(Windows Subsystem for Linux, WSL)이다.
마이크로소프트와 엔비디아가 WSL에 쿠다(CUDA)와 RTX 가속을 도입하도록 협력해 윈도우에서 최적화되고 컨테이너화된 마이크로서비스를 실행할 수 있게 됐다. 이를 통해 PC, 워크스테이션부터 데이터센터, 클라우드에 이르기까지 어디서나 동일한 NIM 마이크로서비스를 실행할 수 있다.
build.nvidia.com에서 RTX AI PC용 엔비디아 NIM을 시작할 수 있다.
프로젝트 G-어시스트의 일환으로, 지포스 RTX 데스크톱 사용자를 위한 시스템 어시스턴트 기능의 실험용 버전이 현재 엔비디아 앱을 통해 제공되며, 곧 노트북에도 지원된다.
G-어시스트는 사용자가 기본적인 음성 또는 텍스트 명령을 통해 광범위한 PC 설정을 제어할 수 있도록 도와준다. 여기에는 게임과 시스템 설정 최적화, 프레임 속도 등 주요 성능 통계 차트 작성, 조명과 같은 일부 주변기기 설정 제어가 포함된다.
G-어시스트는 게임 개발자가 비플레이어 캐릭터에 생명력을 불어넣는 데 사용하는 것과 동일한 AI 기술 제품군인 엔비디아 에이스(ACE)를 기반으로 한다. 온라인 액세스와 유료 구독이 필요한 대규모 클라우드 호스팅 AI 모델을 사용하는 AI 툴과 달리, G-어시스트는 지포스 RTX GPU에서 로컬로 실행된다. 즉, 반응이 빠르고 무료이며 인터넷 연결 없이도 실행할 수 있다. 제조업체와 소프트웨어 제공업체는 이미 에이스를 사용해 G-어시스트와 같은 맞춤형 AI 어시스턴트를 제작하고 있다. 여기에는 MSI의 AI 로봇(AI Robot) 엔진, 스트림랩스 인텔리전트 AI 어시스턴트(Streamlabs Intelligent AI Assistant), 그리고 곧 출시될 HP의 오멘 게이밍 허브(Omen Gaming Hub)가 포함된다.
G-어시스트는 커뮤니티 주도의 확장을 위해 만들어졌다. 엔비디아 깃허브(GitHub) 리포지토리에서 새로운 기능을 추가하는 플러그인을 만들기 위한 샘플과 지침을 확인할 수 있다. 간단한 JSON 형식으로 기능을 정의하고 구성 파일을 지정된 디렉토리에 드롭해 G-어시스트가 자동으로 로드하고 해석하도록 할 수 있다. 개발자는 플러그인을 엔비디아에 제출해 검토 받고 포함될 가능성을 확인할 수 있다.
현재 사용 가능한 샘플 플러그인에는 핸즈프리 음악과 볼륨 제어를 지원하는 스포티파이(Spotify)와 구글 제미나이(Google Gemini)가 있다. 따라서 무료 구글 AI 스튜디오(AI Studio) API 키를 사용해 더 복잡한 대화, 브레인스토밍 세션, 그리고 웹 검색을 위해 훨씬 더 큰 클라우드 기반 AI를 호출할 수 있다.
관련 영상에서 G-어시스트가 제미나이에게 에이펙스 레전드(Apex Legends) 솔로 대전에서 어떤 전설을 선택해야 하는지, 디아블로 4(Diablo IV)에서 25레벨에 악몽 모드로 바꿔 드는 것이 현명한지에 대해 질문하는 장면을 볼 수 있다.
더 많은 커스터마이징을 원한다면 깃허브 리포지토리의 지침에 따라 챗GPT(ChatGPT) 기반 "플로그인 빌더(Plug-in Builder)"를 사용해 G-어시스트 플러그인을 생성할 수 있다. 이 도구를 사용하면 사용자가 코드를 작성하고 내보낸 다음, G-어시스트에 통합해 텍스트와 음성 명령에 응답하는 AI 지원 기능을 빠르게 구현할 수 있다.
관련 영상에서 한 개발자가 플러그인 빌더를 사용해 스트리머가 생방송 중인지 확인하는 G-어시스트용 트위치(Twitch) 플러그인을 만든 방법을 살펴볼 수 있다.
플로그인을 구축, 공유, 로드하는 방법에 대한 자세한 내용은 엔비디아 깃허브 리포지토리에서 확인할 수 있다.
한편, 시스템 요구 사항과 추가 정보는 G-어시스트 문서에서 확인할 수 있다.
RTX용 엔비디아 NIM 마이크로서비스는 build.nvidia.com에서 이용할 수 있다. 이는 개발자와 AI 애호가에게 AI 애플리케이션을 구축하기 위한 강력하고 바로 사용할 수 있는 도구를 제공한다.
엔비디아 앱 '홈(Home)' 탭의 디스커버리(Discovery) 섹션에서 프로젝트 G-어시스트를 다운로드할 수 있다. G-어시스트는 현재 영어로 된 다양한 음성과 텍스트 명령뿐만 아니라 지포스 RTX 데스크톱 GPU를 지원한다. 향후 업데이트를 통해 지포스 RTX 노트북 GPU에 대한 지원, 새롭고 향상된 G-어시스트 기능, 추가 언어 지원이 추가될 예정이다. 설치 후 Alt+G를 눌러 G-어시스트를 활성화할 수 있다.
매주 RTX AI 개러지에서는 커뮤니티가 주도하는 AI 혁신과 콘텐츠를 통해 NIM 마이크로서비스와 AI 블루프린트에 대해 자세히 알아볼 수 있다. 또한 AI PC와 워크스테이션에서 AI 에이전트, 창의적 워크플로우, 디지털 휴먼, 생산성 앱 등을 구축하고자 하는 사람들을 위한 정보를 제공한다.