《一种提高胚胎型仿生自修复可重构硬件可靠性的细胞阵列结构及其布局方法.pdf》由会员分享,可在线阅读,更多相关《一种提高胚胎型仿生自修复可重构硬件可靠性的细胞阵列结构及其布局方法.pdf(17页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 (43)申请公布日 (21)申请号 201410762746.6 (22)申请日 2014.12.11 G06F 19/12(2011.01) (71)申请人 南京航空航天大学 地址 210016 江苏省南京市秦淮区御道街 29 号 (72)发明人 张砦 王友仁 (74)专利代理机构 南京瑞弘专利商标事务所 ( 普通合伙 ) 32249 代理人 杨晓玲 (54) 发明名称 一种提高胚胎型仿生自修复可重构硬件可靠 性的细胞阵列结构及其布局方法 (57) 摘要 本发明公开了一种提高胚胎型仿生自修复可 重构硬件可靠性的细胞阵列结构及其布局方法, 本发明内容包含一个采用先分块后分层。
2、的新逻辑 结构和细胞布局方法。新结构由相互独立的块子 阵列组成, 每个块子阵列包含若干层电子细胞, 每一层布局的空闲资源相同, 自修复过程中每一 层都按照细胞移除策略进行修复, 上一层不能修 复再引入下一层空闲细胞, 块内所有层都无法修 复则表明块子阵列出现故障, 此时整个阵列处于 故障状态。本发明还针对新细胞阵列结构, 给出 了可靠性建模和分析方法, 能够实现以可靠性最 大化为目标的最优布局。本发明的可靠性可提高 88。 (51)Int.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书10页 附图4页 (10)申请公布号 CN 104392149 A。
3、 (43)申请公布日 2015.03.04 CN 104392149 A 1/2 页 2 1. 一种提高胚胎型仿生自修复可重构硬件可靠性的细胞阵列结构布局方法, 其特征在 于 : 分析电子细胞内部电路变化规律, 建立可靠性模型, 并经过可靠性分析, 确定新结构下 细胞的最大可靠性布局结构。 2. 根据权利要求 1 所述的提高胚胎型仿生自修复可重构硬件可靠性的细胞阵列结构 布局方法, 其特征在于 : 所述可靠性模型包括行可靠度模型、 阵列的可靠度模型以及阵列可 靠性模型 ; 所述可靠性模型的建立包括以下步骤 : 步骤一、 根据细胞内增加的辅助电路面积与原细胞面积之比, 得到辅助电路面积增加 率 。
4、; 步骤二、 以 r 表示行内空闲细胞数 ; 设 0 时细胞面积为 S, 则 0 时细胞面积 Sg为 : Sg S(1+r) ; 细胞失效率 g为 : g S(1+r), 为理想状态下细胞 失效率, 单位为 10-6/h ; 步骤三、 设理想状态 0 时总细胞数为 NM, N,M 分别表示阵列总细胞的行数和列 数 ; 由于辅助电路面积随细胞布局结构变化, 因此单个细胞面积是变值, 则此时的总阵列细 胞行数 Ng; 列数 Mg分别为 :表示取不大于该数的 最大整数 ; 步骤四、 工作细胞数 c 为 : c nm, n,m 分别表示阵列中工作细胞的行数和列数, 工作 细胞布局结构可变, 即 n 和。
5、 m 为变值, 但 c 不变 ; 步骤五、 根据工作细胞数列数 m, 阵列总细胞列数 Mg, 细胞失效率 g, 建立行可靠度模 型 : 行可靠度 Rh(t) :其中 t 为时间 ; 根据工作细胞数行数 n, 阵列总细胞行数 Ng, 行可靠度 Rh(t), 建立阵列的可靠度模型 : 阵列的可靠度 R(t) : 根据阵列的可靠度 R(t), 建立阵列的可靠度模型 : 阵列可靠性 MTTF : 3. 根据权利要求 2 所述的提高胚胎型仿生自修复可重构硬件可靠性的细胞阵列结构 布局方法, 其特征在于 : 电子细胞采用阵列形式布局, 采用先分块、 后分层结构, 每个块子阵 列包含若干层电子细胞, 每一层。
6、布局的空闲资源相同 ; 所有分块中工作细胞采用左下角连 续布局方式, 空闲细胞布局在阵列的右边和上边, 自修复过程中每一层都按照细胞移除策 略进行修复, 上一层不能修复再引入下一层空闲细胞, 块内所有层都无法修复则表明块子 阵列出现故障, 此时整个阵列处于故障状态。 权 利 要 求 书 CN 104392149 A 2 2/2 页 3 4. 根据权利要求 3 所述的提高胚胎型仿生自修复可重构硬件可靠性的细胞阵列结构 布局方法, 其特征在于 : 所述细胞移除策略包括以下步骤 : 确定故障细胞的个数和故障细 胞所在的行和列, 根据故障细胞所在的行, 确定其修复功能的空闲细胞所在的层, 以及在该 层。
7、下的空闲细胞的个数, 修复时, 若故障细胞的个数小于等于该层的空闲细胞的个数, 则将 故障细胞的功能向同行的空闲细胞移动 ; 若故障细胞的个数大于空闲细胞的个数, 则将故 障细胞所在行的细胞整体删除, 同时选择在该层数下其他具有大于等于故障细胞个数的空 闲细胞所在的行, 将整行删除的细胞的功能向该行的空闲细胞移动 ; 当该层数的空闲细胞 的个数小于故障细胞的个数时, 启用下一层的空闲细胞, 重复上述过程。 5. 一种提高胚胎型仿生自修复可重构硬件可靠性的细胞阵列结构, 其特征在于 : 包括 一个以上的相互独立的块子阵列, 相邻的块子阵列之间相互连接在一起 ; 每个块子阵列包 括一个以上的电子细。
8、胞, 每个电子细胞均与相邻电子细胞直接连接 ; 所述电子细胞分为工 作细胞和空闲细胞, 所述工作细胞是配置了逻辑功能的细胞, 而空闲细胞是其他未配置逻 辑功能用于修复的细胞 ; 每个块子阵列中的工作细胞采用左下角连续布局方式, 空闲细胞 布局在阵列的右边和上边, 且所述空闲细胞从工作细胞一侧向外依次分为一层以上的空闲 细胞, 层与层之间采用固定通道连接方式, 且每一层空闲细胞布局的空闲资源相同 ; 块子阵 列在自修复过程中每一层都按照细胞移除策略进行修复, 上一层不能修复再引入下一层空 闲细胞, 块内所有层都无法修复则表明块子阵列出现故障, 此时整个阵列处于故障状态。 6. 根据权利要求 5 。
9、所述的提高胚胎型仿生自修复可重构硬件可靠性的细胞阵列结构, 其特征在于 : 在块子阵列中, 根据空闲细胞资源的可靠性提高率来选择空闲细胞层数。 7. 根据权利要 6 所述的提高胚胎型仿生自修复可重构硬件可靠性的细胞阵列结构, 其 特征在于 : 所述电子细胞包括功能模块、 控制模块、 配置存储器、 坐标模块、 输入输出布线器 和辅助自修复模块 ; 功能模块用于实现逻辑功能 ; 控制模块用于负责细胞工作、 时序和修 复的控制 ; 配置存储器用于保存所有能实现的功能的配置信息 ; 坐标模块用于决定细胞具 体功能 ; 输入输出布线器用于连接细胞并传送数据, 辅助自修复模块是特别为自修复而增 加的模块,。
10、 用于实现对各模块进行自测试和辅助自修复过程的重布线。 权 利 要 求 书 CN 104392149 A 3 1/10 页 4 一种提高胚胎型仿生自修复可重构硬件可靠性的细胞阵列 结构及其布局方法 技术领域 0001 本发明涉及一种胚胎型仿生自修复可重构硬件细胞阵列的布局结构及其布局方 法, 属于胚胎自修复硬件技术领域。 背景技术 0002 胚胎自修复硬件研究来源于仿生电子硬件 (Bio-inspired Hardware for Electronics)。模仿生物体多细胞组织和基于细胞死亡、 激活、 替代等机体自愈机制, 采用 二维阵列结构, 构造电子细胞电路 : 所有细胞结构相同 ( 类似。
11、干细胞 ), 当工作细胞发生故 障时, 其功能由冗余的空闲细胞替代, 整个过程的细胞自诊断和自修复都在容错策略下由 芯片自主控制。 由于硬件冗余发生在芯片内的电子细胞层, 硬件容错代价大大减小, 与传统 板级外部控制下的芯片重构相比, 不仅实现了自主控制, 可靠性也得到大幅提高。 0003 胚胎自修复硬件采用细胞移除自修复策略时, 工作细胞布局在阵列的左下角, 这 种设计中, 随着硬件资源量的增加, 特别是冗余的空闲资源增多, 每个细胞内用于辅助实 现自修复的电路资源面积急剧增加, 使得相同硬件冗余情况能获得的可靠性提高率大大降 低, 需要通过新布局结构调整来解决此问题。 0004 一次自修复。
12、硬件设计任务, 设计者一般是在特定芯片上去实现特定功能。设计任 务不同, 设计人员不同, 设计能力也不同, 提高系统可靠性的新结构应该充分考虑这几个方 面的因素, 因此, 新结构的提出需要结合具体设计问题进行研究, 才能得出特定设计下的布 局方式, 这需要建立相应的可靠性模型, 精确表达胚胎自修复硬件结构和细胞资源消耗的 可靠性模型是目前这方面研究缺乏的。 0005 传统的可靠性模型将细胞以面积不变的固定节点进行抽象, 未考虑自愈过程细胞 内部电路模块的变化。 实际设计中, 工作细胞和空闲细胞布局结构不同, 细胞内部模块组成 和资源消耗会随之变化, 因此传统模型并不准确, 无法对新型结构提出指。
13、导。 设计任务往往 是在固定硬件上实现特定功能, 则可认为一项设计的前提是总资源和工作细胞资源保持不 变, 采用不同的细胞布局结构, 无论空闲细胞如何布局, 因空闲细胞行数、 列数乘积不变, 所 以配置存储器的资源消耗不变 ; 而辅助布线模块资源消耗会受到行内空闲细胞数的影响, 但与空闲细胞行数无关。不同的细胞布局结构对辅助布线模块资源消耗影响大, 这是传统 可靠性模型未能体现的。 0006 鉴于上述原因, 本发明在传统模型基础上, 针对自修复过程中的资源消耗特点, 建 立新的可靠性模型, 通过新模型分析阵列规模变化对阵列可靠性的影响规律, 进而提出新 的细胞阵列结构及其布局方法。 发明内容 。
14、0007 发明目的 : 为了克服现有技术中存在的不足, 本发明提供一种提高胚胎型仿生自 修复可重构硬件可靠性的细胞阵列结构及其布局方法, 本发明通过深入分析胚胎自修复硬 说 明 书 CN 104392149 A 4 2/10 页 5 件修复过程的细胞内硬件资源变化规律, 建立准确的可靠性分析模型, 围绕此模型以可靠 性优化为目标, 分析当前细胞阵列结构下, 系统可靠性随结构、 细胞布局变化的趋势, 从中 找出导致可靠性降低的阵列结构因素, 进而提出新的结构形式。进一步通过新结构的可靠 性分析来验证改进的有效性。 0008 为实现上述目的, 本发明采用的技术方案为 : 一种提高胚胎型仿生自修复可。
15、重构 硬件可靠性的细胞阵列结构布局方法, 分析电子细胞内部电路变化规律, 建立可靠性模型, 并经过可靠性分析, 确定新结构下细胞的最大可靠性布局结构。 0009 所述可靠性模型包括行可靠度模型、 阵列的可靠度模型以及阵列可靠性模型 ; 所 述可靠性模型的建立包括以下步骤 : 0010 步骤一、 根据细胞内增加的辅助电路面积与原细胞面积之比, 得到辅助电路面积 增加率 ; 0011 步骤二、 以 r 表示行内空闲细胞数 ; 设 0 时细胞面积为 S, 则 0 时细胞 面积 Sg为 : Sg S(1+r) ; 细胞失效率 g为 : g S(1+r), 为理想状态下 细胞失效率, 单位为 10-6/。
16、h ; 0012 步骤三、 设理想状态 0 时总细胞数为 NM, N,M 分别表示阵列总细胞的行数 和列数 ; 由于辅助电路面积随细胞布局结构变化, 因此单个细胞面积是变值, 则此时的总阵 列细胞行数 Ng; 列数 Mg分别为表示取不大于 该数的最大整数 ; 0013 步骤四、 工作细胞数 c 为 : c nm, n,m 分别表示阵列中工作细胞的行数和列数, 工作细胞布局结构可变, 即 n 和 m 为变值, 但 c 不变 ; 0014 步骤五、 根据工作细胞数列数 m, 阵列总细胞列数 Mg, 细胞失效率 g, 建立行可靠 度模型 : 0015 行可靠度 Rh(t) :其中 t 为时间 ; 0。
17、016 根据工作细胞数行数 n, 阵列总细胞行数 Ng, 行可靠度 Rh(t), 建立阵列的可靠度模 型 : 0017 阵列的可靠度 R(t) : 0018 根据阵列的可靠度 R(t), 建立阵列的可靠度模型 : 0019 阵列可靠性 MTTF : 0020 优选的 : 电子细胞采用阵列形式布局, 采用先分块、 后分层结构, 每个块子阵列包 含若干层电子细胞, 每一层布局的空闲资源相同 ; 所有分块中工作细胞采用左下角连续布 说 明 书 CN 104392149 A 5 3/10 页 6 局方式, 空闲细胞布局在阵列的右边和上边, 自修复过程中每一层都按照细胞移除策略进 行修复, 上一层不能修。
18、复再引入下一层空闲细胞, 块内所有层都无法修复则表明块子阵列 出现故障, 此时整个阵列处于故障状态。 0021 优选的 : 所述细胞移除策略包括以下步骤 : 确定故障细胞的个数和故障细胞所在 的行和列, 根据故障细胞所在的行, 确定其修复功能的空闲细胞所在的层, 以及在该层下的 空闲细胞的个数, 修复时, 若故障细胞的个数小于等于该层的空闲细胞的个数, 则将故障细 胞的功能向同行的空闲细胞移动 ; 若故障细胞的个数大于空闲细胞的个数, 则将故障细胞 所在行的细胞整体删除, 同时选择在该层数下其他具有大于等于故障细胞个数的空闲细胞 所在的行, 将整行删除的细胞的功能向该行的空闲细胞移动 ; 当该。
19、层数的空闲细胞的个数 小于故障细胞的个数时, 启用下一层的空闲细胞, 重复上述过程。 0022 一种提高胚胎型仿生自修复可重构硬件可靠性的细胞阵列结构, 包括一个以上的 相互独立的块子阵列, 相邻的块子阵列之间相互连接在一起 ; 每个块子阵列包括一个以上 的电子细胞, 每个电子细胞均与相邻电子细胞直接连接 ; 所述电子细胞分为工作细胞和空 闲细胞, 所述工作细胞是配置了逻辑功能的细胞, 而空闲细胞是其他未配置逻辑功能用于 修复的细胞 ; 每个块子阵列中的工作细胞采用左下角连续布局方式, 空闲细胞布局在阵列 的右边和上边, 且所述空闲细胞从工作细胞一侧向外依次分为一层以上的空闲细胞, 层与 层之。
20、间采用固定通道连接方式, 且每一层空闲细胞布局的空闲资源相同 ; 块子阵列在自修 复过程中每一层都按照细胞移除策略进行修复, 上一层不能修复再引入下一层空闲细胞, 块内所有层都无法修复则表明块子阵列出现故障, 此时整个阵列处于故障状态。 0023 优选的 : 在块子阵列中, 根据空闲细胞资源的可靠性提高率来选择空闲细胞层数。 0024 优选的 : 所述电子细胞包括功能模块、 控制模块、 配置存储器、 坐标模块、 输入输出 布线器和辅助自修复模块 ; 功能模块用于实现逻辑功能 ; 控制模块用于负责细胞工作、 时 序和修复的控制 ; 配置存储器用于保存所有能实现的功能的配置信息 ; 坐标模块用于决。
21、定 细胞具体功能 ; 输入输出布线器用于连接细胞并传送数据, 辅助自修复模块是特别为自修 复而增加的模块, 用于实现对各模块进行自测试和辅助自修复过程的重布线。 0025 本发明提供的一种提高胚胎型仿生自修复可重构硬件可靠性的细胞阵列结构及 其布局方法, 相比现有技术, 具有以下有益效果 : 0026 可针对任意特定设计, 采用本发明所提的结构形式, 根据设计者设计能力情况, 能 够通过本发明所提可靠性模型的数值分析, 得到最佳布局, 实现硬件资源消耗不变前提下 的系统可靠性提高。本发明实施方式中采用的实例, 可靠性提高可达 88。 附图说明 0027 图 1 是胚胎自修复硬件基本阵列结构和内。
22、部模块组成 ; 0028 图 2 是细胞移除策略下输入输出布线器连接示意图 ; 0029 图 3 是分块布局结构示意图 ; 0030 图 4 是不同辅助面积增加率情况下可靠性随分块数变化曲线 ; 0031 图 5 是不同辅助面积增加率情况下空闲资源可靠性提高率曲线 ; 0032 图 6 是块内分层结构示意图 ; 0033 图 7 是块内分层结构下细胞移除策略工作原理 ; 说 明 书 CN 104392149 A 6 4/10 页 7 具体实施方式 0034 下面结合附图对本发明作更进一步的说明。 0035 一种提高胚胎型仿生自修复可重构硬件可靠性的细胞阵列结构布局方法, 分析电 子细胞内部电路。
23、变化规律, 建立可靠性模型, 并经过可靠性分析, 确定新结构下细胞的最大 可靠性布局结构。 0036 所述可靠性模型包括行可靠度模型、 阵列的可靠度模型以及阵列可靠性模型 ; 所 述可靠性模型的建立包括以下步骤 : 0037 步骤一、 根据细胞内增加的辅助电路面积与原细胞面积之比, 得到辅助电路面积 增加率 ; 0038 步骤二、 以 r 表示行内空闲细胞数 ; 设 0 时细胞面积为 S, 则 0 时细胞 面积 Sg为 : Sg S(1+r) ; 细胞失效率 g为 : g S(1+r), 为理想状态下 细胞失效率, 单位为 10-6/h ; 0039 步骤三、 设理想状态 0 时总细胞数为 N。
24、M, N,M 分别表示阵列总细胞的行数 和列数 ; 由于辅助电路面积随细胞布局结构变化, 因此单个细胞面积是变值, 则此时的总阵 列细胞行数Ng; 列数Mg分别为 :表示取不大于 该数的最大整数 ; 0040 步骤四、 工作细胞数 c 为 : c nm, n,m 分别表示阵列中工作细胞的行数和列数, 工作细胞布局结构可变, 即 n 和 m 为变值, 但 c 不变 ; 0041 步骤五、 根据工作细胞数列数 m, 阵列总细胞列数 Mg, 细胞失效率 g, 建立行可靠 度模型 : 0042 行可靠度 Rh(t) :其中 t 为时间 ; 0043 根据工作细胞数行数 n, 阵列总细胞行数 Ng, 行。
25、可靠度 Rh(t), 建立阵列的可靠度模 型 : 0044 阵列的可靠度 R(t) : 0045 根据阵列的可靠度 R(t), 建立阵列的可靠度模型 : 0046 阵列可靠性 MTTF : 0047 如图 2、 图 3、 图 6 所示, 电子细胞采用阵列形式布局, 采用先分块、 后分层结构, 每 个块子阵列包含若干层电子细胞, 每一层布局的空闲资源相同 ; 所有分块中工作细胞采用 左下角连续布局方式, 空闲细胞布局在阵列的右边和上边, 自修复过程中每一层都按照细 胞移除策略进行修复, 上一层不能修复再引入下一层空闲细胞, 块内所有层都无法修复则 说 明 书 CN 104392149 A 7 5。
26、/10 页 8 表明块子阵列出现故障, 此时整个阵列处于故障状态。 0048 如图 7 所示, 所述细胞移除策略包括以下步骤 : 确定故障细胞的个数和故障细胞 所在的行和列, 根据故障细胞所在的行, 确定其修复功能的空闲细胞所在的层, 以及在该层 下的空闲细胞的个数, 修复时, 若故障细胞的个数小于等于该层的空闲细胞的个数, 则将故 障细胞的功能向同行的空闲细胞移动 ; 若故障细胞的个数大于空闲细胞的个数, 则将故障 细胞所在行的细胞整体删除, 同时选择在该层数下其他具有大于等于故障细胞个数的空闲 细胞所在的行, 将整行删除的细胞的功能向该行的空闲细胞移动 ; 当该层数的空闲细胞的 个数小于故。
27、障细胞的个数时, 启用下一层的空闲细胞, 重复上述过程。 0049 一种提高胚胎型仿生自修复可重构硬件可靠性的细胞阵列结构, 如图 1 所示, 包 括一个以上的相互独立的块子阵列, 如图 6 所示, 相邻的块子阵列之间相互连接在一起 ; 每 个块子阵列包括一个以上的电子细胞, 如图 2 所示, 每个电子细胞均与相邻电子细胞直接 连接 ; 所述电子细胞分为工作细胞和空闲细胞, 所述工作细胞是配置了逻辑功能的细胞, 而 空闲细胞是其他未配置逻辑功能用于修复的细胞 ; 每个块子阵列中的工作细胞采用左下角 连续布局方式, 空闲细胞布局在阵列的右边和上边, 且所述空闲细胞从工作细胞一侧向外 依次分为一层。
28、以上的空闲细胞, 层与层之间采用固定通道连接方式, 且每一层空闲细胞布 局的空闲资源相同 ; 如图 7 所示, 块子阵列在自修复过程中每一层都按照细胞移除策略进 行修复, 上一层不能修复再引入下一层空闲细胞, 块内所有层都无法修复则表明块子阵列 出现故障, 此时整个阵列处于故障状态。 0050 在块子阵列中, 根据空闲细胞资源的可靠性提高率来选择空闲细胞层数。 0051 如图 1 所示, 所述电子细胞包括功能模块、 控制模块、 配置存储器、 坐标模块、 输 入输出布线器和辅助自修复模块 ; 功能模块用于实现逻辑功能 ; 控制模块用于负责细胞工 作、 时序和修复的控制 ; 配置存储器用于保存所有。
29、能实现的功能的配置信息 ; 坐标模块用 于决定细胞具体功能 ; 输入输出布线器用于连接细胞并传送数据, 辅助自修复模块是特别 为自修复而增加的模块, 用于实现对各模块进行自测试和辅助自修复过程的重布线。 0052 为了更好的说明本发明, 现给出其一个实例进行说明。 0053 胚胎自修复硬件细胞阵列结构的自修复过程, 为了实现完全分布式的自主容错, 细胞内有用于辅助的电路以实现故障自检测、 自修复触发和重布线, 鉴于这种因素的存在, 通过可靠性建模与分析来寻找具体规律, 进而分析其影响程度 : 根据细胞移除容错策略, 一 个二维细胞阵列中, 随着行内空闲细胞数的增加, 所需的辅助连线通道随之增加。
30、, 单个细胞 在完成相同逻辑功能时所需的辅助资源面积随之增加, 因此, 冗余资源越多将导致硬件资 源的可靠性提高率下降 ; 同时, 单个阵列中随着冗余资源总量增加, 获得可靠性提高的比例 也不相同, 即单位面积冗余资源带来的可靠性提高量不呈线性关系。 0054 建立的可靠性模型如下 : 0055 (1) 以 表示行内每增加一个空闲细胞, 细胞内增加的辅助电路面积与原细胞面 积的比, 称为辅助电路面积增加率, 由细胞结构和辅助布线电路设计方法决定 ( 由实际 设计情况总结得到, 与细胞粒度、 辅助电路设计能力有关, 但在固定芯片上实现特定任务, 且设计者一定时, 芯片规模、 设计方法、 实现能力。
31、都已确定, 则为定值)。 细胞阵列布局结 构不同, 行内空闲细胞数不同, 受影响, 细胞中辅助电路面积也不同(与行内空闲细胞数 成正比 )。传统模型将细胞整体抽象为节点, 不随阵列结构变化, 即 0, 是理想状态, 不 说 明 书 CN 104392149 A 8 6/10 页 9 符合实际。 0056 (2) 以 r 表示行内空闲细胞数, r 不同, 表明布局结构不同。设 0 时细胞面积 为 S, 则 0 时为 Sg S(1+r), 细胞失效率与面积成正比 : g S(1+r), 为理想状态下细胞失效率, 单位为 10-6/h。 0057 (3) 设 理 想 状 态 ( 0 时 ) 下 总 。
32、细 胞 数 为 NM, N、 M 分 别 表 示 阵 列 总 细胞的行数和列数。每个细胞由基本电路和辅助电路组成, 基本电路面积不变, 辅 助电路面积随细胞布局结构变化, 则单个细胞面积是变值, 总阵列细胞行列数为 : 表示取不大于该数的最大整数, 与 和 r 均有 关, r 越大, 每个细胞内辅助电路面积越大, 总细胞数将减少, 而工作细胞数不变, 则总的空 闲细胞数会减少。 0058 (4) 工作细胞数为 c nm, n、 m 分别表示阵列中工作细胞的行数和列数, 工作细 胞布局结构可变, 即 n 和 m 为变值, 但 c 不变。 0059 (5) 计算公式为 : 0060 行可靠度 : 。
33、0061 阵列的可靠度 R(t) : 0062 阵列可靠性 MTTF : 0063 通过新可靠性模型的可靠性数值分析规律, 可以发现, 随着行内空闲细胞数增加, 一方面行内修复次数增多可提高可靠性, 但同时因为行内细胞数增多, 修复过程中, 行内每 个细胞所需的辅助电路也线性增加, 导致硬件总资源不变情况下, 实际有效的行内空闲细 胞数减少, 从而降低可靠性, 两者的此消彼长是阵列规模大小对可靠性影响的关键因素, 通 过分析其变化规律, 能够根据设计能力确定可靠性最大化情况下的细胞阵列规模, 鉴于上 述原因, 提出胚胎自修复硬件细胞阵列分块结构, 将固定规模硬件进行分块布局, 分割成多 个二维。
34、阵列形式, 这种布局能够降低每个阵列中行内空闲细胞数, 从而减少细胞内的辅助 资源消耗量, 可提高阵列可靠性, 另一方面, 多个块子阵列之间采用串联可靠性关系, 一个 分块故障则整个系统故障会降低系统可靠性, 因此, 阵列规模不大时分块的可靠性可能更 低, 具体分块数根据可靠性分析结果确定。 0064 根据可靠性模型分析, 阵列中含有不同比例的空闲资源时, 空闲资源的可靠性提 高率并不是恒定值, 即可靠性提高与空闲资源增加并不呈线性比例关系。可靠性提高率呈 先增后减趋势, 因此, 让每一次布局在修复阵列中的空闲资源比例都出现在最大可靠性提 高率时, 则整体可靠性能够得到提高, 基于此特点, 采。
35、用将空闲资源进行分层布局, 使每个 说 明 书 CN 104392149 A 9 7/10 页 10 层中的空闲资源比例为最大可靠性提高率时的值。 若空闲资源无法达到最大可靠性提高率 值时, 则不分层, 即只有一层。 0065 本发明包含围绕该新结构开展的基于可靠性优化分析的可靠性模型建立、 分析方 法。所有细胞采用阵列形式布局, 采用先分块、 后分层结构, 所有分块中工作细胞采用左下 角连续布局方式, 空闲细胞布局在阵列的右边和上边, 针对目前采用的细胞移除自修复策 略, 分析细胞内部电路变化规律, 提出可靠性模型, 并经过可靠性分析, 确定新结构下细胞 的最大可靠性布局结构。 0066 细。
36、胞电路内部模块包含用于实现电路逻辑功能的基本资源和用于实现自修复的 辅助电路资源两个大部分。 0067 采用细胞移除策略的胚胎自修复硬件设计过程, 辅助资源会随着行内空闲细胞数 的增加, 细胞面积增加, 通过减少空闲细胞数以降低辅助资源增加量的方法将细胞阵列布 局成多个细胞阵列块, 降低单个细胞内的冗余资源, 实现空闲细胞数增加。 0068 所述的可靠性模型采用 k-out-of-m 模型, 细胞单元相互独立, 结构中行列都满足 k-out-of-m 模型, 块与块之间呈串联可靠性关系, 若一个分块内故障无法修复, 则整体阵列 无法修复。 0069 考虑修复过程细胞内硬件资源变化规律以建立精确。
37、的可靠性模型, 选用细胞辅助 资源增加率 ( 修复过程中, 每行多一个空闲细胞, 为实现该空闲细胞用于替代该行故障细 胞所增加的细胞内辅助资源与原细胞资源的比 ) 这一实际设计过程的变化因素进行建模。 0070 分块数的确定与设计者设计能力有关, 在确定分块结构中分块数时, 须分别计算 不同设计能力下的最大可靠性随分块数变化曲线, 设计任务和设计能力不同、 工作细胞资 源与空闲细胞资源不同, 曲线都不相同, 每一次设计都必须进行计算, 求得曲线取最大值时 的分块数为最优分块数。 0071 分块之间采用固定连线连接的方法, 当一个块子阵列的故障无法修复, 则整个阵 列也无法修复。 0072 每个。
38、分块内的分层中, 先在一层内按照细胞移除策略进行修复, 当该层无法再进 行修复时 ( 该层空闲细胞不足 ), 再引入下一层的空闲细胞, 此时上一层即使还有空闲细胞 也不能用于修复。 0073 在确定分层结构中分层数和每层内空闲细胞数时, 分析块内所有空闲细胞资源的 可靠性提高率 ( 在特定的自修复策略下, 可靠性的提高并不与空闲资源的增加呈线性比例 关系, 而是一条有最大值的曲线 ), 根据可靠性提高率最大化选择空闲细胞层数。 0074 层与层之间采用固定通道连接方式, 修复过程中, 相邻两层的上层为工作细胞层, 下层为空闲细胞层。 0075 所建立的可靠性模型中, 单个细胞的失效率与细胞面积。
39、大小成正比, 其大小只影 响整个阵列的可靠性, 不会影响整个阵列布局结构对可靠性大小影响的趋势。 0076 用户采用特定芯片设计特定电路任务, 根据采用的设计方法, 只需设计一个细胞, 依据单个细胞的资源消耗情况, 根据单个细胞中辅助资源消耗情况, 即可确定最佳布局方 式。 鉴于上述方案, 本发明提出一种先分块后分层的新型细胞阵列结构, 围绕提高可靠性的 目标, 根据可靠性模型的分析, 确定特定设计任务情况下获取最大可靠性的布局方式。 0077 如图 1 所示, 典型的胚胎自修复硬件细胞阵列布局结构和内部组成, 所有电子细 说 明 书 CN 104392149 A 10 8/10 页 11 胞。
40、结构相同, 功能可配置, 每个细胞与四个方向的相邻细胞有直接连线。 系统功能由工作细 胞 ( 配置了逻辑功能的细胞 ) 实现, 其他细胞称为空闲细胞 ( 用于修复 ), 自修复是在片内 分布式自主控制下用故障细胞配置数据配置空闲细胞并由其替代完成功能的过程。 细胞内 部组成包括功能模块、 控制模块、 配置存储器、 坐标模块、 输入输出布线器和辅助自修复模 块六大部分, 功能模块实现逻辑功能, 控制模块负责细胞工作、 时序和修复的控制, 配置存 储器保存所有能实现的功能的配置信息 ( 类似生物 DNA), 坐标模块决定细胞具体功能 ( 坐 标是配置信息的选择地址 ), 输入输出布线器用于连接细胞。
41、并传送数据, 辅助自修复模块是 特别为自修复而增加的模块, 实现对各模块进行自测试和辅助自修复过程的重布线, 因此, 该模块主要包括自测试逻辑和辅助布线逻辑。胚胎自修复硬件的细胞内部组成模块按功 能不同, 可分为实现系统逻辑功能的电路, 称为基本电路 ( 不进行修复, 基本电路即可完成 系统功能 ) ; 实现自愈设计增加的电路, 主要是坐标模块和辅助自修复模块等, 称为辅助电 路。 设计任务一定, 基本电路资源消耗仅与要实现的逻辑功能(设计任务)有关, 是不变的, 而辅助电路会受到阵列布局结构影响。 0078 如图 2 所示, 细胞移除策略下, 每个细胞内输入输出布线器的连接示意图, 修复过 。
42、程行内细胞功能右移, 该行故障细胞右方所有细胞与其相邻的上下行之间的连线均发生变 化, 须增加辅助布线电路, 行内空闲细胞数越多, 辅助布线电路资源消耗越大, 而整行移除 时不需要辅助布线电路 ( 直接穿过 ), 因此, 输入输出布线模块资源消耗的主要影响因素是 行内空闲细胞数, 电路面积增大与行内空闲细胞数成正比。图中行内 2 个空闲细胞, 则每个 细胞的辅助布线模块需要增加 2 条重布线辅助通道。因此, 辅助资源会随着行内空闲细胞 数的增加而增多。输入输出布线器电路是影响细胞面积的重要因素, 也是辅助资源随布局 结构变化的主要原因。 0079 如图 3 所示, 将一个完整阵列采用分块结构布。
43、局, 由于各分块之间采用串联可靠 性关系, 需尽量保持各分块可靠性相近, 所以将硬件资源平均分配, 所有分块中工作细胞与 空闲细胞比例相同, 系统功能分布到各阵列块中的工作细胞中, 分出的阵列块独立进行自 修复, 分块结构能够带来两个方面的优化 : 一是块内小阵列中行内空闲细胞数少, 则细胞面 积相应减小 ( 辅助电路少 ), 失效率降低 ; 另一方面, 由于修复过程发生在更小规模的阵列 中, 修复时重布线过程的延时缩短, 虽然不会影响可靠性, 但有利于提高修复速度。分块布 局结构中, 块之间为固定连线, 某一块失效则总阵列也失效, 这种结构无需附加硬件, 阵列 可靠度与块可靠度的关系为 R总。
44、(t) Rb(t)。虽然串联关系使得总阵列可靠性比阵列块 的可靠性低, 但单个阵列块面积消耗大大减少, 其可靠性是远高于未分块阵列可靠性的, 因 此, 分块布局结构仍然可能获得比未分块阵列更高的可靠性。 0080 如图 4 所示, 为了找到不同设计任务和设计能力下采用何种分块策略获取最大的 可靠性的一般规律, 需要分析多种不同辅助面积增加率 下可靠性的变化规律, 图中列举 了几个不同 取值时的可靠性随分块数变化的情况, 得到的规律是 : 0 时, 不分块可 靠性最大, 随着 增大, 获得最大可靠性时的分块数越多, 说明通过多分块能够在不增加 硬件情况下获得更高的可靠性, 但实际设计无法做到0,。
45、 始终0, 所以通过分块的方 式能够获得可靠性提高。具体某一设计任务选取的分块数通过图 4 所示的分析得到。 0081 如图 5 所示, 不同 值下, 单位空闲资源的可靠性提高率随空闲资源面积与工作 资源面积比升高, 呈先增后减趋势, 阵列中空闲资源与工作资源面积比例为 40 50 说 明 书 CN 104392149 A 11 9/10 页 12 时, 空闲资源的可靠性提高率最高, 此时单位空闲资源能够获取更高可靠性, 这个结论说 明 : 一个阵列中, 空闲资源与工作资源在一定比例时, 单位空闲资源带来的可靠性提高率最 高, 即效率最高。基于上述结论, 可将空闲资源分开布局, 使得每个阵列中。
46、空闲资源比例保 持在最高可靠性提高率情况。 0082 如图 6 所示, 基于图 5 的结论, 本发明将空闲资源进行分层布局, 每层中的空闲资 源与工作细胞资源比例尽量靠近最大可靠性提高率。图中给出了一定细胞数的细胞阵列 的布局方式, 分成四个块, 每个块中包含两层。分层数的确定方法是 : 根据某设计任务的 值, 计算图 5 所示曲线, 得到此时获得最大可靠性提高率情况的空闲资源面积比例, 该比例 不一定等于最大可靠性提高率情况时比例的整数倍, 因此, 确定分层数时采用可靠性提高 率最大化原则, 即选择最大可靠性提高率附近的空闲资源面积比例值, 使空闲资源总面积 正好是每一层空闲资源面积的整数倍。
47、 ( 这样处理的原理是分层硬件自修复结构的一般适 用性 )。 0083 如图7所示, 本发明中各分块阵列块内分层布局结构下的容错策略原理。 按图6所 示的布局结构布局细胞, 以左下角的阵列块为例, 每层空闲资源相同, 自修复过程中, 第一 层首先按照细胞移除策略进行修复, 直到不能进行修复时, 再将第二层的空闲细胞引入, 第 一层仍工作的细胞作为第二层修复时的工作细胞。层与层之间采用固定电路连接的方式。 图 7(a) 中细胞 11 发生故障, 其功能由原来坐标为 12 的细胞替代 ; 图 7(b) 中第二行出现两 个故障细胞时, 表明图 7(a) 中原坐标为 12( 替代了细胞 11 的功能 。
48、) 的细胞也发生故障, 则 第一层无法行内替换, 虽然第二层有细胞 13( 也处于第二行 ), 但不进行跨层行内替换, 而 是先进行第一层内的行移除, 图 7(b) 是行移除后细胞工作状态图, 原来坐标分别为 20、 21 和 22 的细胞替代了故障行 10、 11 和 12 的功能, 而其本身空闲状态则移位到了细胞 30、 31 和32中 ; 图7(c)中给出了修复后的行内再次发生两个细胞故障的情况, 此时第一层无法容 错, 启用第二层的冗余细胞第二层的细胞 13 替代了细胞 11 的功能 ; 图 7(d) 中第二层冗余 细胞启用后, 与第一层的工作细胞构成的行内出现了 3 个故障细胞, 则触发第二层细胞的 行移除。 0084 如表 1 所示, 依据本发明方法, 以理想状态下细胞阵列规模为 N M 150, c 10000情况, 给出不同设计能力(不同)下, 采用分块分层布局结构时可靠性的提高情况, 可以发现随着设计能力变化, 越大, 分块可靠性提高率越高, 而分层可靠性提高率下降, 但总的可靠性提高率呈上升趋势。虽然表 1 结果依据某个特定设计任务进行, 但从可靠性 计算公式容易推导, 不同阵列规模时上述结论具有一般适用性。 0085 上述实施例不以任何形式限制本发明, 凡采取等同替换或等效变换的。