进入正文

AI 创新推动处理器开发新场景

  • 邮件
how-the-new-world-of-ai-is-driving-a-new-world-of-processor-development_1
how-the-new-world-of-ai-is-driving-a-new-world-of-processor-development_1
本文由以下作者联合采写:Samsung Foundry 边缘和端点业务营销总监 Tim DryBlaize 平台工程副总裁 Santiago Fernandez GomezVeriSilicon 北美平台解决方案销售副总裁 Mahadev Kolluru
Blaize 面向边缘人工智能 (AI) 的新型流式处理器,是中小企业利用半导体行业资源追求自身目标的新机遇的真实案例。
直到现在,AI 应用所采用的处理器芯片大多仍是 GPU 等器件的改装,而这些器件最初的开发用途并不在此。这既是因为这些现有器件确实非常实用,也是因为大多数公司都认为开发 AI 专用处理器的成本高昂、程序复杂且/或风险极大,因此望而却步。 但随着 AI 市场开始急速扩张,位于边缘和端点的各种新应用将会需要更贴近具体任务和场景定制的半导体,不再需要在云端进行 AI 处理。我们开始注意观察半导体行业如何不断演进以满足这些需求,以及这对于 AI 市场以及期望进入该市场的企业有何影响。 边缘 AI 初创公司 Blaize 就是一个非常实用的案例,该公司以工业、智慧城市、汽车传感器融合、最后一公里配送和零售等应用领域的客户为目标,最近推出了 Pathfinder 和 Xplorer 等模块化系统平台及随附的软件工具。 该公司指出,现有边缘解决方案对于这些行业而言,“不是太小而难以承担计算负载,就是太贵且难以实现生产。” Blaize 携手 Samsung Foundry 和设计/IP 公司 VeriSilicon 开发了新型图形流式传感器 (GSP),助力实现多传感器处理能力、紧凑尺寸、低耗电量和易于编程等优势,立志弥补上述不足。
为什么选择流式处理器?
流式处理器在实时分析多种来源的连续图形数据方面具有多重优势,例如工厂车间或零售门店的摄像头或传感器的协作组合产生的数据。与传统批处理式处理器不同,流式处理器不需要临时存储数据进行处理,也不需要重新聚合不同批次的数据。这在总体上降低了存储要求并减少了延迟,同时还提高了边缘 AI 环境下通常所需任务的处理效率。 例如,Blaize 实现的 GSP 让 Pathfinder 模组可以提供五个独立的神经网络,可按照 10 帧/秒(总计 50 fps)的帧率和不足 100 毫秒的延迟传输视频流,同时还支持在不同媒体流之间同步处理多个工作负载。从而让平台具有完全的可编程性,实现传感器融合、对象检测、图像降噪、视频及激光雷达/雷达数据融合,以及取决于特定用例的其他功能。特别是,GSP 尽管能够提供 16 万亿次运算/秒 (TOPS) 的处理能力,其功率仅为 7 瓦。 从战略角度来看,这些能力很有吸引力,但是采用可靠经济的硅将其推向市场则是一项艰巨的任务,直到最近,仍然很少有公司愿意或能够解决这一问题。这项工作远远超出了常见定制芯片的范畴,需要广泛的先进设计和制造能力、多种电路 IP 的集成,以及大范围的跨领域开发团队协作,而这些在传统上属于大型专业企业的领域,并非初创公司所能力及。 而且除了基础的开发障碍(时间、物理布局、存储器管理等)之外,考虑到业务和技术因素,还必须达成迅速而可靠的上市时间。这种项目通常只有一次成功的机会,因而放大了风险回报考量。
确保开发成功的战略选择
因此,在 Blaize 初次与 Samsung Foundry 接触并介绍项目目标和要求时,晶圆代工团队建议邀请 VeriSilicon 加入,因为后者是能够提供定制硅解决方案和半导体 IP 的一站式供货源,拥有丰富的业绩履历,其中包括与 AI 相关的其他项目。作为 Samsung Advanced Foundry Ecosystem (SAFE™) 合作计划的成员,VeriSilicon 自己的许多设计项目也是借助三星的制程实现的,同时在战略规划和开发策略方面积累了经验。 首先要作出的一项重要决策就是选择制程节点。在考虑了所有可用选项之后,Samsung Foundry 的 14 纳米 FinFET 制程击败几种后续节点胜出。
how-the-new-world-of-ai-is-driving-a-new-world-of-processor-development_2
how-the-new-world-of-ai-is-driving-a-new-world-of-processor-development_2
考虑到初始芯片的目标应用领域以及当时较为先进的节点尚且不能使用 14 纳米 IP 的情况,就会发现成熟节点的作用举足轻重。成本也是一个问题。鉴于 VeriSilicon 多年来与三星合作生产 14 纳米产品,积累了丰富的经验和专业知识,因而坚信这是实现一次完成硅晶设计的上策。 而且,合作公司还能够完善并优化 Blaize 的原型 GSP 概念,以实现边缘 AI 产品平台的所有重要目标。在项目初期的几个月里,Samsung Foundry 团队和 VeriSilicon 携手合作,充分探索各种可能的设计方法,以实现 Blaize 需要的性能和耗电量特征。Samsung Foundry 成功实现了超出标准流程要求的解决方案,让 Blaize 能够全面实现其功耗/性能/面积目标。 VeriSilicon 还可提供从硅晶规格到量产的一站式服务,同时统筹重要的供应链,在配合三星之外,还联合封装、组装和测试承包商,留足产能。
how-the-new-world-of-ai-is-driving-a-new-world-of-processor-development_3
how-the-new-world-of-ai-is-driving-a-new-world-of-processor-development_3

按时交付及市场影响
整个过程需要中国、印度、英国和美国的多个团队紧密协作,即使新冠疫情迫使全球各地办事处在器件还有两周即可流片时停业,也并未影响该项目的顺利进展。 同时为首件硅晶选择低风险路径的先期决定,也在初始样品下线时凸显了它的可观回报。通常,从第一枚硅晶到客户样品阶段需要六到九个月的时间,而实现全面投产则需要 12 到 18 个月。Blaize 却能在两个月之内收到客户样品。而且由于硅晶品质上乘,六个月之后就投入真正的量产。 Blaize 的方案不一定适合所有新兴的 AI 初创公司。每一家公司都需要综合考虑市场机遇、技术、资金、组织能力以及合格的合作伙伴等因素。GSP 项目的成功证明,如今只要选对时机,现有的半导体资源(例如,Samsung Foundry 及其 SAFE™ 生态系统,以及 VeriSilicon 的广泛能力)就能够提供非常便利的开发路径,支持开发面向 AI 的专用处理器。 这在几年之前还无法想象,而在未来,这些项目可能会变得更加便利和经济。因此,会有越来越多面向 AI 的新机构不再需要因硅晶改装而限制自己,并将获得更大的自由和空间,为客户提供切实有效的解决方案。