进入正文

[2023存储技术日]构建高性能SSD 新范式

  • 邮件
当前,SSD存储容量和运行速度的要求与日俱增,进而增加了对提高数据存储效率、减少垃圾收集和更主动处理错误的要求。 试想将SSD数据直面的问题与将粮食从筒仓运输到仓库的问题进行宏观类比,把谷物袋比作存储在SSD硬盘上的批量数据。那么,托运者( 数据中心主机 )应用NVMe SSD技术可以指定:
    • 让多个谷物托运者分别给他们的袋子贴上标签,以便在单一运输通道运送所有谷物时不发生混淆(SR-IOV、ZNS)。
    • 在仓库中,确定同时存储同类谷物时的最佳位置(FDP-灵活数据放置),籍以最大限度减少需要重新放置的袋子数量(GC-垃圾收集)。
    • 应用于高优先级发货与低优先级发货的资源数量(控制性能)。
接下来,让我们考虑一下害虫防范的相关问题。过去,世界为那些制造更好捕鼠器的人开辟了道路,而该任务类似于SSD领域的错误管理。
    • 改进诱捕机制,尽可能捕获更多老鼠(CECC/UECC)。
    • 监视诱捕器,检查捕获的老鼠数量、诱捕器是否已满,以及该诱捕器的效果是否理想(SMART/Health)。
    • 跟踪并报告与老鼠最相关的活动(遥测)。
    • 使用动态数据预测重大害虫侵扰(失败预测)。 此外,还有跨职能问题,例如:
    • 当原存储区域超负载时,将谷物袋回收到新的存储区域(数据恢复和新驱动器迁移)。
三星正在通过SSD工程技术领域先进技术,打造更卓越的“捕鼠器”。 三星年度存储技术日活动举办了多个分组讨论会介绍了最新存储技术。下面是关于计算机存储解决方案的关键要点。 解决方案产品工程团队副总裁Jung Seungjin介绍了SSD遥测相关情况。 回顾一下遥测的历史:收集操作数据然后将其传输到远端进行解释分析的遥测概念已经存在了一个多世纪。 从现代硬盘驱动器技术开始,就包含了各种形式的错误记录和检索。 从 NVMe 1.3 开始,特定于 SSD 的基本遥测命令和传输格式成为标准。 最近,三星利用其在 SSD 技术领域的领导者地位来推动复杂却必要的遥测功能增加到规范当中。三星尖端研究的优势显而易见。例如,三星遥测服务是一种先进的工具,可帮助企业客户远程分析和管理其设备。 它保证了数据的稳定性——使数据中心运营商能够防止未来的驱动器故障、管理驱动器更换和迁移数据。 “通过监测,我们意识到多重地址CECC可能会发展为UECC,从而在未来引发系统的问题。” 遥测演示重点介绍了遥测技术的背景、三星正在推动添加到规范中的最新改进,以及实现驱动器故障检测的意义的示例。其中,三星基于机器学习的先进异常预测研究备受关注。
软件开发团队副总裁Silwan Chang介绍了灵活数据放置(FDP)及其实现的便捷性,以显着降低写入放大系数(WAF)。 内容涵盖比较分析ZNS等各种数据放置技术,展示了三星FDP技术的用例。 NAND的根本局限在于NAND单元中的数据无法被覆盖。因此,在写入数据之前必须擦除NAND块。 数据放置技术克服了这一限制,因为理想的数据放置无需额外的硬件成本,即可提高新型SSD的性能和耐用性。 主机通过 SSD处理的回收单元(RU)影响数据放置,而了解基本SSD存储单元的最有效大小和边界,可以对相似生命周期的数据进行分组,以减少或消除SSD垃圾收集效率低下。 “FDP SSD的最大优势在于,只需对系统软件进行极小的改动就可以实现这一点。”
接下来,Meta的Ross Stenfort介绍了超大规模FDP观点,并展示了减少WAF的改进进展:
    • 预留空间(OP)——扩充额外数据块用于垃圾收集。
    • 修剪(TRIM)/释放游标主机命令——告知SSD可以安全删除的内容。
    • FDP —— 告知SSD如何进行数据分组,以尽量减少未来的垃圾收集。
该演讲呈现了一个典型的工作负载示例(带或不带FDP),并指出:“应用程序并非必需使用FDP,方可提升效率。” 紧接着,Silwan Chang继续介绍了使用SR-IOV的三星SSD虚拟化技术的现状和未来。 效率已成为提高数据中心处理能力的核心关注点。 由于数据中心CPU内核数量通常超过100个,使用单SSD的租户(单实例/应用程序)数量激增。 虚拟化为每个租户提供了进入SSD存储空间的独立窗口。PCIe SR-IOV规范提供了设置虚拟化环境的基础。三星半导体在SR-IOV领域的研究起步较早, 现已拥有近十年的经验,根据潜在安全和性能问题开发了针对性解决方案:
    • 数据隔离——确保租户的数据不被其他租户访问,从逻辑共享发展到物理隔离分区。
    • 性能隔离——防止一个租户的活动对其他租户的性能产生不利影响。
    • 强化安全——提供从虚拟功能级别升级至链路级别的加密功能。
    • 动态迁移——将数据从一个SSD移动到另一个SSD,同时保持两者都为数据中心主机提供有效服务。
“我们需要发展从NAND芯片至控制器资源都能用专属命名空间的物理分区,才能实现在单SSD中实现完全隔离的存储空间。”
解决方案开发团队副总裁 Sunghoon Chun 介绍了三星正在开发的全新解决方案,旨在迎接快速发展的PCIe接口速度和大容量产品趋势带来的挑战。 关键在于以较低的有效功率实现更高的速度,但二者却存在相悖倾向。 三星主要通过两种方式降低有效功率:
    • 通过增加电源轨来设计低能耗组件,以提高稳压器的效率。
    • 引入节能功能来优化组件之间的交互,例如通过修改固件以支持比DRAM更低功耗的SRAM的利用率。
更高的速度目标会带来更高的温度,三星通过以下方式解决了这个问题:
    • 外形尺寸转换可适应更高的散热,满足25W至40W的功率需求。
    • 使用更有效、新颖的案例构建材料和设计技术。
    • 使用浸入式冷却热管理解决方案,产生强大实验成果。
“我们的目标是在未来几年内,继续努力创造一种完美的SSD,并紧跟时代趋势,优化浸入式冷却系统的应用。”
综上所述,本次演讲阐述了三星SSD助力客户成功的战略。
    • 三星半导体先进的灵活数据放置技术大幅减少WAF。
    • 三星半导体的性能调节和空间分区技术大幅提高虚拟化效率,最大限度提高多核数据中心CPU每个核心的处理能力。
    • 应用三星半导体的新颖设计和封装技术,能够降低能耗、提高散热效率,大幅提高运行速度。
    • 创新的三星遥测服务远程分析和管理设备,消除数据丢失及严重的停机时间问题。
紧跟三星先进研究路线图,客户将在未来十年内获得“超乎想象”的降本增效成果。 免责声明: 除非经特殊说明,本文中所涉及的数据均为三星内部测试结果,涉及的对比均为与三星产品相比较。