
全系列文章共分为五个篇章,今天为该系列文章的第一篇。
- 计算单元重构:通过配置参数定义运算器功能(如算子和精度切换)
- 互连网络重构:动态调整计算单元间的连接拓扑
- 存储系统重构:根据数据访问模式优化缓存分配策略
可重构芯片的内部结构主要有以下几部分组成:
- 计算阵列:由处理单元(PE)阵列构成,每个PE具有多种算术逻辑运算能力,通过可编程互连网络形成复杂的数据路径。
- 可重构控制器:发射“配置信息”,动态调整计算阵列的连接方式和运算模式。这种分离设计(数据流与控制流独立)使得芯片能够像CPU一样灵活可编程,同时保持接近ASIC的能效。
- 存储器:分为配置存储器和数据存储器。配置存储器存储计算阵列“配置信息”;数据存储器存储计算阵列所需的原始数据、中间数据和结果数据。

图1.可重构芯片基本架构[1]
自1991年“新机器范式”提出可重构计算架构以来,该领域逐步从理论研究走向产业实践:
1997年加州大学伯克利分校启动GARP项目,对可重构计算架构进行概念验证;
2003年麻省理工学院启动MORPHEUS项目,探索可重构计算在专用领域的应用。
2006年清华大学成立可重构计算实验室,研究可重构计算理论和架构实现。
2015年清华大学在可重构芯片方面的研究成果荣获国家技术发明二等奖。
同年,国际半导体技术路线图(ITRS)将可重构芯片列为“未来最具前景芯片架构技术”。
2016年,美国电子复兴计划(ERI)明确将可重构计算(软件定义硬件)列为未来计算芯片的核心架构技术。
2017年,国务院在《新一代人工智能发展规划》中将可重构计算列入“新一代人工智能关键共性技术体系”,重点支持其发展。
2017年清华大学团队突破动态重构、多粒度融合等关键技术,研制出“Thinker”系列可重构 AI 芯片,实测表明,该芯片运行典型人工智能任务时,能效比显著高于同类 GPU。Thinker芯片被《麻省理工科技评论》专题报道。
2019年初,清微智能公司的首款可重构芯片,也是全球第一颗可重构商用芯片大规模量产。
同年,赛灵思推出包含粗粒度可重构阵列(CGRA)架构的Versal系列产品,面向数据中心和高端智能驾驶,算力达到128TOPS。
2020年美国SambaNova公司发布基于可重构芯片的DataScale平台,并在多个美国多个算力中心、国家实验室和研究机构规模部署。
2021年Mobileye公司在L4自动驾驶芯片中嵌入粗粒度可重构阵列。
2022年谷歌TPU v4借助可重构互连技术实现算力跃升(同等芯片数量时,处理速度达A100的1.67倍)
2023年日本采用可重构芯片建造了“富岳(Fugaku)”超级计算机,名列全球超算排行榜(TOP500)第二名,处理AI任务的性能达到A100集群的6倍。
从这一发展脉络不难洞察,可重构芯片的价值正逐步获得广泛认知,并开始在实践中得以深度应用。
架构革新:动态异构与资源复用
- 多层次重构能力:通过动态层次化重构技术(数据级/张量级/任务级)与混合粒度架构设计(如粗粒度可编程单元与细粒度加速器协同),实现计算资源在时空维度的弹性调度与高效复用,突破非规则计算负载的资源适配瓶颈。
- 并行化扩展:支持从SIMD到数据流驱动的多样化并行模式,结合非冯架构的存算一体化设计,显著提升算法映射效率,尤其适用于稀疏计算、图计算等复杂场景。
软硬协同:敏捷开发与智能编译
- SDH(软件定义硬件)范式深化:基于配置轻量化管理、运行时自适应优化及AI驱动的智能编译框架,构建从算法到硬件的敏捷开发链路,降低开发门槛并提升硬件资源利用率。
- 多模态计算融合:集成存内计算、近似计算、模拟计算等新型计算单元,结合3D集成与光互连技术,实现能效数量级提升,满足AI大模型训练推理、边缘端实时决策等场景的差异化需求。
场景驱动:垂直优化与生态构建
- 领域专用化演进:针对自动驾驶、工业物联网、生物计算等垂直领域,形成可配置模板库与敏捷开发套件,加速算法-芯片协同优化。
- 开放生态延伸:通过多层次编程模型拓展(如RISC-V扩展、Triton框架)建立软硬件解耦生态,推动跨平台工具链与开源社区建设,释放长尾应用创新潜力。
可重构芯片究竟藏有什么“神秘魔法”?为何它是最有前景的AI计算架构?下一篇文章,我们将从多维度深度剖析其中奥秘。
