본문으로 이동

NVMe SSD 가상화의 표준화: PCIe Exported NVM Subsystem Migration의 도입

  • 메일

AI 중심 워크로드와 데이터센터 아키텍처가 빠르게 변화하면서, 스토리지 가상화 구조에도 새로운 접근이 요구되고 있다. 특히 시스템 자원을 보다 유연하게 구성하고 확장하려는 요구가 증가하면서, 기존과 같이 소프트웨어 중심으로 구현되던 가상화 방식은 점차 한계를 드러내고 있다.

이러한 흐름 속에서 NVMe®는 ‘TP4193: PCIe® Exported NVM Subsystem Migration’을 통해 스토리지 계층에서의 가상화 방식을 표준화했다. 이는 가상 스토리지의 생성, 관리, 이동 방식을 SSD 내부 동작 수준에서 재정의하려는 시도다.

삼성전자는 Google과 같은 주요 업계 관계자들과 협력하여 NVMe 협회의 표준 제정 과정에서 핵심적인 역할을 수행했으며, 소프트웨어 기반 가상화의 한계를 효과적으로 보완할 수 있는 기반 마련에 기여했다.

 

기존 가상화 방식의 구조적 한계

현재 대부분의 스토리지 가상화는 SSD 외부, 즉 하이퍼바이저(가상화 관리 소프트웨어)나 호스트 소프트웨어 계층에서 구현된다. 이 방식은 기능적으로는 유연하지만, 시스템 전반의 구조적 부담을 증가시킨다.

네임스페이스(Namespace) 매핑, 격리, 마이그레이션 처리 등을 하이퍼바이저가 직접 수행하면서 시스템 복잡도가 크게 증가한다. 또한 가상머신(Virtual machine, VM) 간 스토리지 리소스의 이동 및 재할당은 여러 계층 간 조율이 필요해 구현 난이도가 높고, 특정 공급사의 전용 도구에 의존하는 경우도 많다. 여기에 I/O 경로가 길어지면서 지연시간 증가도 불가피하다.

특히 GPU 기반 AI 워크로드처럼 데이터 이동이 빈번한 동적인 환경에서는 이러한 비효율이 더욱 두드러진다. 결과적으로 스토리지는 보다 유연하게 이동 가능하고, 소프트웨어 개입을 최소화할 수 있는 구조가 요구된다.

 

TP4193 이전의 가상화 방식

기존 SSD 가상화는 주로 PCIe 기반의 직접 할당 방식으로 구현된다. 대표적으로 SR-IOV를 통해 하나의 SSD를 여러 개의 가상 기능(Virtual function, VF)으로 분할하고, 이를 VM에 직접 매핑하는 구조다.

이 방식은 VM이 물리 장치에 가까운 성능으로 접근할 수 있다는 장점이 있지만, 동시에 SSD의 실제 속성과 식별 정보가 그대로 노출되는 한계가 있다. 이를 보완하기 위해 하이퍼바이저는 일부 정보를 재구성하거나, 명령 처리 과정에 개입해 동작을 조정하는 방식(명령 가로채기, trap-and-emulate)을 사용한다.

그러나 이러한 개입은 시스템 오버헤드를 증가시키며, 특히 I/O 경로 내 명령 처리까지 관여할 경우 성능 저하로 이어질 수 있다. 결과적으로 직접 할당 방식이 가진 저지연 특성이 제한되는 구조적 한계를 갖는다.

 

TP4193이 제시하는 가상화 모델

TP4193은 이러한 접근 방식을 근본적으로 바꾼다. 가상화를 호스트 소프트웨어가 아닌 SSD 내부에서 직접 처리하도록 설계한 것이다.

이 구조에서는 SSD가 자체적으로 가상화 스토리지 객체를 생성하고, 해당 객체의 동작 방식과 속성을 정의한다. 이에 따라 호스트는 가상화를 구현하는 주체가 아니라, 이를 조율하는 역할을 수행하게 된다.

표준 기반으로 정의된 이 메커니즘은 하이퍼바이저의 복잡도를 줄이고, 특정 공급사에 대한 의존도를 낮추며, SSD 간 스토리지 마이그레이션이 VM 관점에서 변화가 감지되지 않는 형태로 이루어질 수 있다. 또한 SSD가 자체적으로 리소스를 관리함으로써 지연시간을 줄이고, 다중 워크로드 환경에서도 워크로드 간 안정적인 격리를 제공할 수 있다.

 

NVMe 기술의 확장

최근 NVMe 기술은 단순한 스토리지 인터페이스를 넘어, 스토리지 리소스가 유연하게 이동 가능하고 확장 가능한 인프라를 구성하기 위한 핵심 요소로 자리잡고 있다.

TP4193과 같은 표준화 작업은 스토리지를 고정된 자원이 아닌 유연하게 재구성 가능한 요소로 전환시키고, 가상화 소프트웨어의 부담을 줄이며, 데이터 이동을 보다 일상적인 운영 범위로 확장한다.

이는 GPU 기반 AI 시스템과 멀티 테넌트 데이터센터 환경에서 요구되는 유연성과 안정성을 동시에 충족하기 위한 변화이며, 스토리지 아키텍처 전반의 설계 방식에도 영향을 미치는 흐름이다.

이러한 표준화 흐름은 NVMe 협회를 중심으로 참여 기업 간 협업을 통해 구체화되고 있으며, 삼성전자는 이 과정에서 스토리지 가상화 구조 전환을 포함한 주요 표준화 논의에 지속적으로 기여하고 있다.

 

더 알아보기

표준의 구체적인 아키텍처와 동작 방식은 NVM Express 공식 블로그의 아래 아티클[1]에서 확인할 수 있다.

 


 
References
 
[1] Standardizing SSD Virtualization: NVMe® Technology Building Blocks
 

* 본 페이지(또는 블로그)에 포함된 모든 내용은 정보 제공을 목적으로 작성되었습니다. 삼성전자 및 그 계열사와 각 임직원, 자문인, 대리인 등(이하 “삼성”)은 본 페이지에 포함된 정보, 진술, 의견 또는 기타 사항의 정확성, 합리성, 완전성에 대해 명시적 또는 묵시적으로 어떠한 보증이나 진술도 하지 않으며, 해당 내용은 “있는 그대로(AS-IS)” 제공됩니다.
* 삼성은 본 페이지의 내용 사용 또는 이와 관련하여 발생하는 어떠한 손해에 대해서도 책임을 지지 않습니다. 또한 본 페이지에 포함된 정보, 자료 또는 콘텐츠와 관련하여 어떠한 지식재산권 또는 라이선스도 부여되지 않습니다.
* 본 페이지(또는 블로그)에는 향후 전망에 관한 진술(forward-looking statements)이 포함될 수 있습니다. 이러한 진술은 미래 성과를 보장하지 않으며, 실제 삼성의 사업, 시장 또는 산업 환경의 전개는 본 페이지에 포함된 전망과 실질적으로 다를 수 있습니다.
* NVM Express® 및 NVMe®는 NVM Express, Inc. 의 상표입니다.
* PCI Express® 및 PCIe®는 PCI SIG의 등록 상표입니다.