章节目录 第464章 架构演进路线讨论(1 / 2)
作品:《重回1990:我的科技强国路》[全本小说]:qbxs. N e t 一秒记住!
宋瑾在走廊上收到的那张便签,在周五下午被方敏贴在了合城人力资源中心的文化墙上。便签旁边是方敏从可验证墙科研伦理展区列印出来的一张照片——半块砖头搁在研发治理委员会会议桌上,旁边散落着草案文件的列印稿。两张纸并排贴在一起,中间隔着一拳的距离,像一个问题和一个回答在互相对望。
便签上那句「什么样的小物件应该被自己记住,什么样的小物件应该被制度记住」还没有答案。但方敏不急着找答案。她在两张纸中间贴了一张空白的便签纸,纸上只写了一个日期——下周的日期,以及一行小字:「这个问题应该由不止一个人来回答。」
而在合城中央研究院的深度计算实验室里,章宸正在面对一个比便签上的问题更硬丶更冷丶更需要被回答的问题。这个问题已经在他的工作日志里盘踞了将近四个月,从赵静揭示天权6号预调度模型在低温端准确率降至百分之八十六点三的非线性偏移那天开始,它就像一颗被压进弹簧里的钢珠,随着每一个技术参数的确认而越压越紧。
问题是:天权7号的3D堆叠架构,到底该走哪条路。
章宸在周四晚上把这个问题从工作日志里搬到了实验室的白板上。他用黑色马克笔画了三根柱子,每根柱子代表一套他过去四个月里反覆推演过的堆叠方案。第一根柱子标注着「同构堆叠」——两颗完全相同的天权6号计算晶粒通过矽通孔垂直互连,逻辑上构成一个统一的计算资源池,调度器在上层将任务拆解后分配到两颗晶粒上并行执行。第二根柱子标注着「异构堆叠」——一颗天权6号计算晶粒与一颗专用于特定负载的加速晶粒堆叠,加速晶粒上集成了羲和GPU架构的下一代变体和张京京设计的物理时钟偏斜补偿电路。第三根柱子标注着一个让陈醒在第一次听到时都愣了一下笔锋的名字——「逻辑-物理分离堆叠」。
这个名字是章宸自己起的。它描述的不是一种架构,是一种架构哲学。在这套方案里,上下两层晶粒不是按计算任务分工,而是按「逻辑功能」和「物理资源」分离——上层晶粒承担全部的指令调度丶缓存一致性和虚存映射等逻辑功能,下层晶粒是一整块被剔除了所有控制逻辑的「裸算力」——密密麻麻的浮点单元丶向量单元和张量加速器,排列成一个纯计算阵列,通过超高密度的矽通孔矩阵与上层逻辑晶粒直连。
「同构堆叠最稳。」章宸用红笔在第一根柱子上画了一个圈,「稳到几乎不需要新的架构验证。两颗天权6号的晶粒,良率已稳定在九十四点二,矽通孔间距压到了六微米,工艺参数在恒芯试产线上跑了三轮验证。把两颗往上一堆,软体调度的复杂度在作业系统层面可控,生态兼容性不需要任何改动。十二个月内能流片,十五个月内能进量产。」
他把红笔放下,拿起蓝色马克笔。「也稳到了几乎没有任何突破。两颗天权6号堆在一起,功耗翻倍,面积翻倍,但单线程性能不增加。多线程性能靠调度器优化最多提升百分之六十到八十——因为内存带宽的瓶颈卡在封装基板上,不是卡在矽通孔密度上。这颗晶片做出来,在未来科技内部会被评价为『稳健的工程交付』。但火龙联盟的下一代架构不会等我们。北洲那家公司的3D堆叠验证晶片已经在顶会上发了论文——异构堆叠,计算晶粒加专用加速晶粒,能效比比同构高百分之四十。」
蓝色马克笔在第二根柱子上画了一圈。「异构堆叠是我们目前内部呼声最高的方案。羲和GPU架构从风险清单变成了护城河,张京京的时钟偏斜方案可以在低温端把预调度模型的准确率从百分之八十六点三拉回九十三以上。赵静的三子模型架构在功耗控制上已经证明了它的价值。把这三样东西集成进一颗专用加速晶粒,和天权6号堆在一起,能效比会有质的提升。但代价是——软体栈需要重写。不是修改,是重写。任务调度器需要知道哪种负载适合主晶粒丶哪种负载适合加速晶粒,这个判断不能靠开发者手动标注——那会重蹈挪鸡鸭应用商店碎片化的覆辙。必须靠编译器自动识别丶自动分配丶自动负载均衡。一套能做好这件事的编译器,开发周期至少两年。我们从现在开始写,能在天权7号流片前完工吗?」
实验室里安静了几秒。深度计算实验室的散热风扇阵列在背景中发出低沉的丶均匀的嗡鸣声——那声音和追光四期洁净间的风机声不同,更低沉,更像是某种沉默的巨型动物在匀速呼吸。
章宸拿起黑色马克笔,走到第三根柱子前。他没有立刻画圈。他先在那根柱子旁边写了两个字——「赌注」。
「逻辑-物理分离堆叠。」章宸的声音没有因为这个词的重量而拔高,反而更低了,「这套方案在学术界的顶会上被讨论过,在工业界没有被任何一家公司实现过。不是因为大家不想——是因为这套架构对矽通孔密度的要求是现有工艺极限的三倍,对热管理的挑战是现有方案的至少两倍,对作业系统的内存模型是一个从零开始的定义。同构堆叠用现有的矽通孔间距六微米就够。异构堆叠需要把矽通孔间距压到四微米,恒芯试产线已经在向五点五微米推进,乐观估计十二个月内能碰到四点五。逻辑-物理分离堆叠需要矽通孔间距在两点五微米以下——不是微凸点,是混合键合。混合键合技术目前在全球范围内只有一家北洲公司和一家霓虹研究所在实验线上跑通过,良率不到百分之三十。」
他把马克笔搁在白板下方的笔槽里,从实验台上拿起一块天权6号的工程样片。样片被封装在一层透明的环氧树脂里,晶片表面的金属层在实验室的白光下反射出细密的虹彩。
「但如果这条路走通了,结果是什么?」章宸把样片举到白板前,放在第三根柱子旁边,「结果是一颗晶片,它的逻辑层可以独立叠代——当你需要升级指令集架构或者改进调度算法时,只换上层逻辑晶粒就够了,下层的算力阵列原封不动。结果是一颗晶片,它的算力密度可以线性扩展——因为下层没有控制逻辑,全部是计算单元,矽通孔的带宽可以全部用来搬运数据而不是搬运控制信号。结果是一颗晶片,它的能效比不是比上一代提升百分之几十——是提升几倍。」
「这不是一个产品,是一个架构平台。如果逻辑-物理分离堆叠走通了,天权7号就不只是天权6号的下一代——它是未来十年所有天权晶片的架构地基。天权8号可能只是换一颗逻辑晶粒,天权9号可能只是把算力阵列从七纳米叠代到五纳米。所有的软体生态不需要重新适配,因为逻辑层的指令集架构是向前兼容的。」
陈醒的声音从实验室门口传来。他站在那里不知道多久了,手里端着一杯已经不冒热气的茶。他走进来,在白板前的摺叠椅上坐下,看了一眼那三根柱子和章宸手里的工程样片。
「你刚才说同构堆叠能在十二个月内流片。」陈醒说,「异构堆叠需要编译器团队至少两年的开发周期。第三套方案——那个分离堆叠——需要多久?」
章宸转过身,在白板第三根柱子旁边写了一行数字。「矽通孔两点五微米以下的混合键合——恒芯现在做不到,追光先进封装线还没建,焊料合金国产替代配方中试验证还在等合工热工的下一轮工艺窗口。作业系统内存模型重写——至少十八个月。编译器适配——和异构方案一样,两年。如果按最乐观估计,混合键合在十四个月内突破到良率百分之四十以上,其他模块并行推进,逻辑-物理分离堆叠的首颗验证晶片能在三十六个月内流片。」
「三十六个月。」陈醒重复了一遍这个数字,「火龙联盟的全面制裁时间窗口,在最近一次战术推演中被评估为十二到十八个月。实体清单一旦落地,先进封装设备和材料的进口通道可能会在六个月内被切断。我们在三十六个月后才能流片的架构——在最坏情况下,可能根本找不到代工厂愿意接单。」
「所以同构堆叠是唯一在制裁时间窗口内存活的方案。」章宸说。他用红笔在白板边缘画了一条水平线,线下方写着「制裁窗口内的可行域」,上方写着「制裁窗口外的探索域」。同构堆叠完全在线下方。异构堆叠的流片时间线跨在线上——一部分在窗口内,一部分在窗口外。逻辑-物理分离堆叠整根柱子在线的上方,远到连跨线的资格都没有。
「但我画这条线的时候,假设的是追光产线被限制在现有工艺节点上。」章宸在水平线旁边加了一个星号,「如果我们自己的制造能力在三十六个月内把先进封装突破了——不是依赖进口设备,是全国产替代线跑通了混合键合——那这条线的位置就会移动。补天计划的目标是十二个月内EDA国产化率从百分之四十迈向百分之七十。如果补天能做到,那追光的国产替代为什么不能在三十六个月内把矽通孔间距压到两点五微米?」
林薇在第二天上午被章宸从追光四期的洁净间里请到了深度计算实验室。她一进实验室的门就看到了白板上那三根柱子,看到章宸一夜之间在每根柱子旁边补充的技术参数矩阵——矽通孔间距需求丶热设计功耗上限丶内存带宽需求丶编译器开发周期丶作业系统改动量丶生态兼容性影响丶以及最关键的一列:制造端可行性评估。
林薇把白大褂脱下来搭在椅背上,站在白板前看了将近十分钟。她没有先说话——她在脑子里把章宸写的每一个数字和她自己在追光四期洁净间里摸到的工艺极限逐条做了比对。比对完成之后,她拿起一支绿色马克笔,在第三根柱子旁边的「矽通孔间距需求:≤2.5μm」那行字下方画了一条新的线。
「六微米到五点五微米,恒芯试产线已经做到了。五点五到四点五,十二个月内有希望,但需要焊料合金国产替代配方完成中试验证——合工热工的下一轮工艺窗口排在下个月。四点五到三点五,需要全面切换混合键合工艺路径,追光先进封装线目前连桩基都还没打。」林薇在三点五微米的位置画了一个红圈,「三点五到两点五,这是一个不连续的跳跃。不是在现有工艺路径上优化参数——是换一条完全不同的物理路径。混合键合的核心设备目前全球只有一家北洲公司和一家霓虹研究所的定制设备能跑通,这两家的设备都在出口管制清单上。国产替代设备——顾教授和合工热工联合改造方案的目标是十四纳米光刻配套,不是混合键合。如果我们现在启动混合键合国产设备的预研,按照天枢OS产线管理系统的项目周期模型推算,从方案论证到首台原型机交付,最乐观的时间是——三十个月。」
实验室里安静下来。三十个月加上设备调试和工艺磨合,总周期很可能超过四十个月。而章宸标注的逻辑-物理分离堆叠流片时间线——三十六个月——是建立在混合键合在十四个月内突破的前提上的。如果混合键合设备本身需要三十个月才能到位,那三十六个月的流片节点就不成立。
𝙌 🅑 𝑋 S . n e t