本文へ移動

[Memory Tech Day 2023]強化されたSSDを構築する

  • 共有
SSDメモリの容量と速度に対する要件の急増により、データストレージの効率を向上させつつガベージコレクションを減らし、エラーをより効率的に処理する必要性が高まっている。 例えば、SSDデータが直面する問題を、貯蔵庫から倉庫への穀物輸送に例えてみよう。配送する穀物袋をSSDに保存する大容量データと想定してNVMe SSD技術を利用すると、配送業者(データセンターのホスト)は次のことが指定できる。
    • 複数の穀物配送業者が穀物袋にタグを付けて、単一の輸送チャネルで混同することなくすべてを輸送できるようにする方法(SR-IOV、ZNS)
    • 倉庫から各穀物袋を他の同様の穀物と一緒に保管できる最適な場所(FDP:Flexible Data Placement)を見つけて、再配置する袋の数を最小限に抑える方法(GC:ガベージコレクション)
    • 優先順位の高い配送と優先順位の低い配送に適用されるリソース数(パフォーマンス管理)
次に、穀物管理において有害動物や害虫の問題を考えてみよう。かつては最高のネズミ捕り(トラップ)を作った人に管理を任せていた。SSDの世界では、これらの作業はエラー管理に似ている。
    • ネズミをできるだけ多く捕獲できるようにトラップ機構を改善(CECC/UECC)
    • トラップをモニタリングして捕獲されたネズミの数、トラップがいっぱいになっているかどうか、他のトラップに比べてうまく機能していないトラップはないかを確認(SMART/Health)
    • できるだけ多くのネズミの活動を追跡して報告
    • 活動データを使用して害虫の侵入を発生前に予測
また、次のような領域間の問題も考えられる。
    • 既存の貯蔵空間がいっぱいになった場合、穀物袋を新しい貯蔵空間に回収(データ復旧及び新規ドライブへの移行)
サムスンはSSDエンジニアリング技術分野をリードしており、より良いトラップソリューションを作っている。 毎年開催されているサムスンのMemory Tech Dayイベントでは、最新のストレージ技術を紹介する複数の分科セッションが行われた。下記は、コンピューティングメモリソリューション分科の主な内容である。 ソリューション製品エンジニアリングチーム副社長のチョン・スンジンがSSDテレメトリについて説明した。 まず、テレメトリの歴史について簡単に見てみると、運用データを収集してから遠隔地に伝送して解釈するテレメトリの概念は、1世紀以上も使われてきた。現代のハードドライブ技術の初期段階から、様々な形のエラーロギングと検索が行われてきた。基本的なSSD専用テレメトリコマンドと伝送形式はNVMe 1.3から標準となっている。 最近では、サムスンがSSD技術のリーダーとしての地位を活用し、精巧で不可欠なテレメトリ機能を仕様に追加している。サムスンの最先端研究のメリットは明らかである。例えば、顧客企業がデバイスをリモートで分析・管理できるようにするための最先端ツールであるサムスンテレメトリサービスを考えてみよう。同ツールは、データの安定性を確保し、データセンターのオペレータが将来のドライブの障害を防ぎ、ドライブ交換を管理し、データを移行できるようにする。 「モニタリングを通じて、マルチアドレス(multi-address)CECCが、システムに障害を引き起こすUECCになる可能性があることがわかった。」 テレメトリプレゼンテーションでは、テレメトリの背景、サムスンが仕様に追加するために進めている最新の改善事項、ドライブの障害を検知する上でテレメトリがどのような役割を果たすかに対する事例にフォーカスが当てられた。主な関心事は、サムスンの最先端機械学習ベースの異常兆候予測研究である。
ソフトウェア開発チーム長のチャン・シルワン(常務)がWAF(Write Amplification Factor、書き込みデータ量の比率係数)を大幅に削減できるFDP(Flexible Data Placement)とその実装の容易さについて説明を行った。同議論では、ZNSを含む様々なデータ配置技術を比較分析し、サムスンのFDP技術の活用事例について紹介した。 NANDの基本的な限界は、NANDセルのデータを上書きできないため、データを書き込む前にNANDブロックを削除しなければならないことである。データ配置技術は、このような限界を乗り越えられる技術として、理想的なデータ配置を通じ、追加のH/Wコストを要せずに最新のSSDのパフォーマンスと耐久性を向上させられる。 ホストはSSDが処理する回収ユニット(RU)を通じてデータを配置し、この基本SSDストレージユニットの最も効率的なサイズと境界が分かれば、同様のライフサイクルのデータをグループ化し、SSDガベージコレクションの非効率性を抑制または削除できる。 「FDP SSDの最大のメリットは、システムソフトウェアを少し変更するだけで改善できるということです。」
続いて、MetaのRoss StenfortがハイパースケールFDPの観点について発表を行い、WAFを減らすための改善の進捗状況について紹介した。
    • オーバープロビジョニング:ガベージコレクションに使用する追加ブロックを割り当てる
    • ホストのトリム/割り当て解除コマンド:SSDに安全に削除できる項目を知らせる
    • FDP:今後のガベージコレクションを最小限に抑えるためにデータをグループ化する方法をSSDに知らせる
同プレゼンテーションでは、FDPの有無による効果的なワークロードの例を示し、「アプリケーションが必ずしもFDPを活用してこそ効果的になるわけではない」と説明した。   次のセッションでは、副社長のSilwang WindがSR-IOVを活用したサムスンSSDの仮想化技術の現状と未来について議論を行った。 データセンターの処理容量を増やすためには、効率性が欠かせない。データセンターにおけるCPUコア数が100を超えることが普通のことになるにつれ、単一のSSDを使用するテナント(個々のインスタンス/アプリケーション)の数が急増している。 仮想化は、各テナントにSSDストレージスペースに対する独自のウィンドウを提供する。PCIe SR-IOV仕様は、仮想化環境を設定するためのベースを提供している。サムスンは、初期研究を通じて、SR-IOVに対する約10年間の経験を有しており、根本的なセキュリティ及びパフォーマンスの問題を把握してソリューションを開発した。
    • データ分離:論理的な共有から物理的に分離されたパーティション化に進化し、一定のテナントのデータを別のテナントからのアクセスから安全に保護
    • パフォーマンスの分離:一定のテナントの活動が別のテナントのパフォーマンスに悪影響を与えることを防止
    • セキュリティの強化:仮想機能レベルからリンクレベルに強化された暗号化機能を提供
    • ライブマイグレーション:データセンターのホストに対する両方のアクティブサービスを維持しながら、一定のSSDから別のSSDにデータを移動
「単一のSSDで完全に分離されたストレージスペースを実装するためには、NANDチップとコントローラリソースに至るまで、名前空間専用の物理パーティションに進化する必要がある。」
ソリューション開発チーム副社長のチョン・ソンフンは、急速に進化するPCIeインターフェース速度と、高容量製品のトレンドに対応するためにサムスンが継続的に開発に取り組んでいる新しいソリューションについて説明した。 ここで重要なのは、低い有効電力でも速い速度を実現することであるが、この2つの要素は相反する傾向がある。 サムスンは、大きく2つの方法で有効電力を抑えることを目指している。
    • 電圧レギュレータの効率を高めるため、パワーレールを追加して省電力部品を設計する方法
    • ファームウェアを修正し、DRAMよりも省電力であるSRAMの活用を増やすなど、コンポーネント間の相互作用を最適化する省電力機能を導入する方法
速度を上げるためには温度が高くなるが、サムスンはこの問題を解決するため、次のような方法を活用している。
    • 25Wから40Wに増加した電力要件を満たすため、フォームファクタを変換してより多くの熱を放出
    • より効果的で新しいケース構成材料及び設計技術を採用
    • 強力な実験的成果を収めた浸水冷却を活用する熱管理ソリューション
「サムスンの目標は、時代の変化に対応し、今後、浸水冷却システムに最適化された完璧なSSDを作るために努力を続けることである。」
簡単に言えば、同プレゼンテーション分科では、顧客の成功のためのサムスンSSDの戦略を示している。
    • サムスンの最先端FDP技術を通じてWAFを画期的に抑える
    • サムスンのパフォーマンス調整と空間パーティショニング技術を通じてマルチコアデータセンターCPUの各コアに対する処理容量を最大化することで、仮想化の効率性を大幅に高める
    • サムスンの新しい設計及びパッケージング技術を通じて省電力を図り、熱放出を増加させると同時にさらなる高速動作を実現する。
    • 革新的なサムスンテレメトリサービスを通じてデバイスをリモートで分析かつ管理し、データの損失とそれによる深刻なダウンタイムを事実上排除する。
サムスンの最先端研究ロードマップに追従する顧客は、今後10年間、「限界を超える」パフォーマンスの向上とコスト削減効果を享受できるに違いない。