《用于尖峰神经网络中的自然多尖峰序列的神经学习的方法和装置.pdf》由会员分享,可在线阅读,更多相关《用于尖峰神经网络中的自然多尖峰序列的神经学习的方法和装置.pdf(31页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103890787 A (43)申请公布日 2014.06.25 CN 103890787 A (21)申请号 201280051748.3 (22)申请日 2012.10.19 13/276,812 2011.10.19 US G06N 3/08(2006.01) G06N 3/04(2006.01) (71)申请人 高通股份有限公司 地址 美国加利福尼亚州 (72)发明人 JF亨泽格 (74)专利代理机构 上海专利商标事务所有限公 司 31100 代理人 唐杰敏 (54) 发明名称 用于尖峰神经网络中的自然多尖峰序列的神 经学习的方法和装置 (57) 摘要 本公开。
2、的某些方面支持用于尖峰神经网络中 的自然多尖峰序列的神经学习的技术。可取决于 与突触相关联的资源来适配突触权重, 该资源可 以因权重变化而被消耗并且可以随时间推移而恢 复。 在本公开的一个方面, 权重适配可以取决于自 从上一次显著的权重变化以来的时间。 (30)优先权数据 (85)PCT国际申请进入国家阶段日 2014.04.21 (86)PCT国际申请的申请数据 PCT/US2012/061167 2012.10.19 (87)PCT国际申请的公布数据 WO2013/059703 EN 2013.04.25 (51)Int.Cl. 权利要求书 7 页 说明书 14 页 附图 9 页 (19)。
3、中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书7页 说明书14页 附图9页 (10)申请公布号 CN 103890787 A CN 103890787 A 1/7 页 2 1. 一种神经学习的方法, 包括 : 通过将突触前神经元与突触后神经元相连接的突触的权重来调制从所述突触前神经 元至所述突触后神经元的输入 ; 以及 基于与所述突触相关联的资源、 自从所述权重的上一次改变以来的时间、 或者所述突 触前神经元与所述突触后神经元的尖峰定时中的至少一者来适配突触的权重。 2. 如权利要求 1 所述的方法, 其特征在于, 进一步包括 : 与适配突触的权重相关地来修改所述资源 ; 以及。
4、 随时间推移朝所述资源在所述修改之前的值恢复所述资源。 3. 如权利要求 2 所述的方法, 其特征在于, 修改所述资源包括减少所述资源。 4. 如权利要求 3 所述的方法, 其特征在于, 所述资源被减少与突触的权重在所述适配 期间的变化的绝对值成比例的量。 5. 如权利要求 3 所述的方法, 其特征在于, 如果突触的权重在所述适配期间的变化的 绝对值高于阈值, 则所述资源被减少到 0。 6. 如权利要求 2 所述的方法, 其特征在于, 随时间推移恢复所述资源包括 : 在一时间延迟之后将所述资源恢复到所述修改之前的值。 7. 如权利要求 2 所述的方法, 其特征在于, 修改所述资源发生在对适配所。
5、述权重的交 付履行之时。 8. 如权利要求 2 所述的方法, 其特征在于 : 修改所述资源发生在确定适配所述权重的一方面时 ; 以及 适配所述权重发生在此后的时间。 9. 如权利要求 8 所述的方法, 其特征在于, 适配所述权重的所述方面包括以下各项中 的至少一项 : 所述权重的变化量、 或者所述权重的变化方向。 10. 如权利要求 1 所述的方法, 其特征在于, 如果所述资源低于一阈值, 则突触的权重 在所述适配期间的变化不被应用。 11. 如权利要求 1 所述的方法, 其特征在于, 如果自从所述上一次改变以来的时间低于 一阈值, 则突触的权重在所述适配期间的变化不被应用。 12. 如权利要。
6、求 1 所述的方法, 其特征在于, 适配突触的权重进一步包括 : 在所述突触后神经元或所述突触前神经元的尖峰发放的时间更新突触的权重为生 效 ; 在所述权重更新的时间将更新所述权重的时间存储为所述资源上一次被使用的时 间 ; 在更新所述权重的另一时间根据所述另一时间和所述资源上一次被使用的时间来计 算所述资源 ; 以及 根据计算出的资源来获得突触的权重的变化。 13. 如权利要求 12 所述的方法, 其特征在于, 如果突触的权重的所述变化的幅值低于 一阈值, 则所述资源上一次被使用的时间的值不被覆写。 14. 如权利要求 12 所述的方法, 其特征在于, 如果所述另一时间减去所述资源上一次 被。
7、使用的时间的值小于一阈值, 则所述权重的变化为 0。 15. 一种用于神经学习的装置, 包括 : 权 利 要 求 书 CN 103890787 A 2 2/7 页 3 第一电路, 配置成通过将突触前神经元与突触后神经元相连接的突触的权重来调制从 所述突触前神经元至所述突触后神经元的输入 ; 以及 第二电路, 配置成基于与所述突触相关联的资源、 自从所述权重的上一次改变以来的 时间、 或者所述突触前神经元与所述突触后神经元的尖峰定时中的至少一者来适配突触的 权重。 16. 如权利要求 15 所述的装置, 其特征在于, 进一步包括 : 第三电路, 配置成与适配突触的权重相关地来修改所述资源 ; 以。
8、及 第四电路, 配置成随时间推移朝所述资源在所述修改之前的值恢复所述资源。 17. 如权利要求 16 所述的装置, 其特征在于, 修改所述资源包括减少所述资源。 18. 如权利要求 17 所述的装置, 其特征在于, 所述资源被减少与突触的权重在所述适 配期间的变化的绝对值成比例的量。 19. 如权利要求 17 所述的装置, 其特征在于, 如果突触的权重在所述适配期间的变化 的绝对值高于一阈值, 则所述资源被减少到 0。 20. 如权利要求 16 所述的装置, 其特征在于, 所述第四电路还被配置成 : 在一时间延迟之后将所述资源恢复到所述修改之前的值。 21. 如权利要求 16 所述的装置, 其。
9、特征在于, 修改所述资源发生在对适配所述权重的 交付履行之时。 22. 如权利要求 16 所述的装置, 其特征在于 : 修改所述资源发生在确定适配所述权重的一方面时 ; 以及 适配所述权重发生在此后的时间。 23. 如权利要求 22 所述的装置, 其特征在于, 适配所述权重的所述方面包括以下各项 中的至少一项 : 所述权重的变化量、 或者所述权重的变化方向。 24. 如权利要求 15 所述的装置, 其特征在于, 如果所述资源低于一阈值, 则突触的权重 在所述适配期间的变化不被应用。 25. 如权利要求 15 所述的装置, 其特征在于, 如果自从所述上一次改变以来的所述时 间低于一阈值, 则突触。
10、的权重在所述适配期间的变化不被应用。 26. 如权利要求 15 所述的装置, 其特征在于, 所述第二电路还被配置成 : 在所述突触后神经元或所述突触前神经元的尖峰发放的时间更新突触的权重为生 效 ; 在所述权重更新的时间将更新所述权重的时间存储为所述资源上一次被使用的时 间 ; 在更新所述权重的另一时间根据所述另一时间和所述资源上一次被使用的时间来计 算所述资源 ; 以及 根据计算出的资源来获得突触的权重的变化。 27. 如权利要求 26 所述的装置, 其特征在于, 如果突触的权重的所述变化的幅值低于 一阈值, 则所述资源上一次被使用的时间的值不被覆写。 28. 如权利要求 26 所述的装置,。
11、 其特征在于, 如果所述另一时间减去所述资源上一次 被使用的时间的值小于一阈值, 则所述权重的变化为 0。 29. 一种用于神经学习的设备, 包括 : 权 利 要 求 书 CN 103890787 A 3 3/7 页 4 用于通过将突触前神经元与突触后神经元相连接的突触的权重来调制从所述突触前 神经元至所述突触后神经元的输入的装置 ; 以及 用于基于与所述突触相关联的资源、 自从所述权重的上一次改变以来的时间、 或者所 述突触前神经元与所述突触后神经元的尖峰定时中的至少一者来适配突触的权重的装置。 30. 如权利要求 29 所述的设备, 其特征在于, 进一步包括 : 用于与适配突触的权重相关地。
12、来修改所述资源的装置 ; 以及 用于随时间推移朝所述资源在所述修改之前的值恢复所述资源的装置。 31. 如权利要求 30 所述的设备, 其特征在于, 所述用于修改资源的装置包括用于减少 所述资源的装置。 32. 如权利要求 31 所述的设备, 其特征在于, 所述资源被减少与突触的权重在所述适 配期间的变化的绝对值成比例的量。 33. 如权利要求 31 所述的设备, 其特征在于, 如果突触的权重在所述适配期间的变化 的绝对值高于一阈值, 则所述资源被减少到 0。 34. 如权利要求 30 所述的设备, 其特征在于, 所述用于随时间推移恢复资源的装置包 括 : 用于在一时间延迟之后将所述资源恢复到。
13、所述修改之前的值的装置。 35. 如权利要求 30 所述的设备, 其特征在于, 修改所述资源发生在对适配所述权重的 交付履行之时。 36. 如权利要求 30 所述的设备, 其特征在于 : 修改所述资源发生在确定适配所述权重的一方面时 ; 以及 适配所述权重发生在此后的时间。 37. 如权利要求 36 所述的设备, 其特征在于, 适配所述权重的所述方面包括以下各项 中的至少一项 : 所述权重的变化量、 或者所述权重的变化方向。 38. 如权利要求 29 所述的设备, 其特征在于, 如果所述资源低于一阈值, 则所述突触的 权重在所述适配期间的变化不被应用。 39. 如权利要求 29 所述的设备, 。
14、其特征在于, 如果自从所述上一次改变以来的时间低 于一阈值, 则所述突触的权重在所述适配期间的变化不被应用。 40. 如权利要求 29 所述的设备, 其特征在于, 所述用于适配突触的权重的装置包括 : 用于在所述突触后神经元或所述突触前神经元的尖峰发放的时间更新所述突触的权 重为生效的装置 ; 用于在所述权重更新的时间将更新所述权重的时间存储为所述资源上一次被使用的 时间的装置 ; 用于在更新所述权重的另一时间根据所述另一时间和所述资源上一次被使用的时间 来计算所述资源的装置 ; 以及 用于根据计算出的资源来获得突触的权重的变化的装置。 41. 如权利要求 40 所述的设备, 其特征在于, 如。
15、果突触的权重的所述变化的幅值低于 一阈值, 则所述资源上一次被使用的时间的值不被覆写。 42. 如权利要求 40 所述的设备, 其特征在于, 如果所述另一时间减去所述资源上一次 被使用的时间的值小于一阈值, 则所述权重的变化为 0。 权 利 要 求 书 CN 103890787 A 4 4/7 页 5 43. 一种用于神经学习的计算机程序产品, 所述计算机程序产品包括计算机可读介质, 所述计算机可读介质包括用于以下动作的代码 : 通过将突触前神经元与突触后神经元相连接的突触的权重来调制从所述突触前神经 元至所述突触后神经元的输入 ; 以及 基于与所述突触相关联的资源、 自从所述权重的上一次改变。
16、以来的时间、 或者所述突 触前神经元与所述突触后神经元的尖峰定时中的至少一者来适配突触的权重。 44. 如权利要求 43 所述的计算机程序产品, 其特征在于, 所述计算机可读介质还包括 用于执行以下动作的代码 : 与适配突触的权重相关地来修改所述资源 ; 以及 随时间推移朝所述资源在所述修改之前的值恢复所述资源。 45. 如权利要求 44 所述的计算机程序产品, 其特征在于, 修改所述资源包括减少所述 资源。 46. 如权利要求 45 所述的计算机程序产品, 其特征在于, 所述资源被减少与突触的权 重在所述适配期间的变化的绝对值成比例的量。 47. 如权利要求 45 所述的计算机程序产品, 其。
17、特征在于, 如果突触的权重在所述适配 期间的变化的绝对值高于一阈值, 则所述资源被减少到 0。 48. 如权利要求 44 所述的计算机程序产品, 其特征在于, 所述计算机可读介质还包括 用于执行以下动作的代码 : 在一时间延迟之后将所述资源恢复到所述修改之前的值。 49. 如权利要求 44 所述的计算机程序产品, 其特征在于, 修改所述资源发生在对适配 所述权重的交付履行之时。 50. 如权利要求 44 所述的计算机程序产品, 其特征在于, 修改所述资源发生在确定适配所述权重的一方面时 ; 以及 适配所述权重发生在此后的时间。 51. 如权利要求 50 所述的计算机程序产品, 其特征在于, 适。
18、配所述权重的所述方面包 括以下各项中的至少一项 : 所述权重的变化量、 或者所述权重的变化方向。 52. 如权利要求 43 所述的计算机程序产品, 其特征在于, 如果所述资源低于一阈值, 则 突触的权重在所述适配期间的变化不被应用。 53. 如权利要求 43 所述的计算机程序产品, 其特征在于, 如果自从所述上一次改变以 来的时间低于一阈值, 则突触的权重在所述适配期间的变化不被应用。 54. 如权利要求 43 所述的计算机程序产品, 其特征在于, 所述计算机可读介质还包括 用于执行以下动作的代码 : 在所述突触后神经元或所述突触前神经元的尖峰发放的时间更新所述突触的权重为 生效 ; 在所述权。
19、重更新的时间将更新所述权重的时间存储为所述资源上一次被使用的时 间 ; 在更新所述权重的另一时间根据所述另一时间和所述资源上一次被使用的时间来计 算所述资源 ; 以及 根据计算出的资源来获得突触的权重的变化。 权 利 要 求 书 CN 103890787 A 5 5/7 页 6 55. 如权利要求 54 所述的计算机程序产品, 其特征在于, 如果突触的权重的所述变化 的幅值低于一阈值, 则所述资源上一次被使用的时间的值不被覆写。 56. 如权利要求 54 所述的计算机程序产品, 其特征在于, 如果所述另一时间减去所述 资源上一次被使用的时间的值小于一阈值, 则所述权重的变化为 0。 57. 一。
20、种神经学习的方法, 包括 : 通过将突触前神经元与突触后神经元相连接的突触的权重来调制从所述突触前神经 元至所述突触后神经元的输入 ; 基于与所述突触相关联的资源考虑以及所述突触前神经元和所述突触后神经元的尖 峰定时来适配突触的权重 ; 以及 基于所述突触前神经元和所述突触后神经元的先前尖峰之间的一个或多个定时关系 来确定所述资源考虑。 58. 如权利要求 57 所述的方法, 其特征在于, 所述一个或多个定时关系包括关于所述 突触前神经元和所述突触后神经元的一对先前尖峰之间的时间差的信息。 59. 如权利要求 57 所述的方法, 其特征在于, 所述一个或多个定时关系包括关于一对 先前尖峰与另一。
21、对先前尖峰之间的时间差的信息。 60. 如权利要求 57 所述的方法, 其特征在于, 所述一个或多个定时关系包括关于自从 一对先前尖峰发生以来的时间的信息。 61. 一种用于神经学习的装置, 包括 : 第一电路, 配置成通过将突触前神经元与突触后神经元相连接的突触的权重来调制从 所述突触前神经元至所述突触后神经元的输入 ; 第二电路, 配置成基于与所述突触相关联的资源考虑以及所述突触前神经元和所述突 触后神经元的尖峰定时来适配突触的权重 ; 以及 第三电路, 配置成基于所述突触前神经元和所述突触后神经元的先前尖峰之间的一个 或多个定时关系来确定所述资源考虑。 62. 如权利要求 61 所述的装。
22、置, 其特征在于, 所述一个或多个定时关系包括关于所述 突触前神经元和所述突触后神经元的一对先前尖峰之间的时间差的信息。 63. 如权利要求 61 所述的装置, 其特征在于, 所述一个或多个定时关系包括关于一对 先前尖峰与另一对先前尖峰之间的时间差的信息。 64. 如权利要求 61 所述的装置, 其特征在于, 所述一个或多个定时关系包括关于自从 一对先前尖峰发生以来的时间的信息。 65. 一种用于神经学习的设备, 包括 : 用于通过将突触前神经元与突触后神经元相连接的突触的权重来调制从所述突触前 神经元至所述突触后神经元的输入的装置 ; 用于基于与所述突触相关联的资源考虑以及所述突触前神经元和。
23、所述突触后神经元 的尖峰定时来适配突触的权重的装置 ; 以及 用于基于所述突触前神经元和所述突触后神经元的先前尖峰之间的一个或多个定时 关系来确定所述资源考虑的装置。 66. 如权利要求 65 所述的设备, 其特征在于, 所述一个或多个定时关系包括关于所述 突触前神经元和所述突触后神经元的一对先前尖峰之间的时间差的信息。 权 利 要 求 书 CN 103890787 A 6 6/7 页 7 67. 如权利要求 65 所述的设备, 其特征在于, 所述一个或多个定时关系包括关于一对 先前尖峰与另一对先前尖峰之间的时间差的信息。 68. 如权利要求 65 所述的设备, 其特征在于, 所述一个或多个定。
24、时关系包括关于自从 一对先前尖峰发生以来的时间的信息。 69. 一种用于神经学习的计算机程序产品, 所述计算机程序产品包括计算机可读介质, 所述计算机可读介质包括用于以下动作的代码 : 通过将突触前神经元与突触后神经元相连接的突触的权重来调制从所述突触前神经 元至所述突触后神经元的输入 ; 基于与所述突触相关联的资源考虑以及所述突触前神经元和所述突触后神经元的尖 峰定时来适配所述突触的权重 ; 以及 基于所述突触前神经元和所述突触后神经元的先前尖峰之间的一个或多个定时关系 来确定所述资源考虑。 70. 如权利要求 69 所述的计算机程序产品, 其特征在于, 所述一个或多个定时关系包 括关于所述。
25、突触前神经元和所述突触后神经元的一对先前尖峰之间的时间差的信息。 71. 如权利要求 69 所述的计算机程序产品, 其特征在于, 所述一个或多个定时关系包 括关于一对先前尖峰与另一对先前尖峰之间的时间差的信息。 72. 如权利要求 69 所述的计算机程序产品, 其特征在于, 所述一个或多个定时关系包 括关于自从一对先前尖峰发生以来的时间的信息。 73. 一种神经学习的方法, 包括 : 通过将突触前神经元与突触后神经元相连接的突触的权重来调制从所述突触前神经 元至所述突触后神经元的输入 ; 基于与所述突触相关联的资源考虑以及所述突触前神经元和所述突触后神经元的尖 峰定时来适配突触的权重 ; 以及。
26、 基于自从对所述权重的改变的先前交付履行以来的时间量来确定所述资源考虑。 74. 如权利要求 73 所述的方法, 其特征在于, 权重的改变是在对所述权重的改变的交 付履行之后的时间发生的。 75. 一种用于神经学习的装置, 包括 : 第一电路, 配置成通过将突触前神经元与突触后神经元相连接的突触的权重来调制从 所述突触前神经元至所述突触后神经元的输入 ; 第二电路, 配置成基于与所述突触相关联的资源考虑以及所述突触前神经元和所述突 触后神经元的尖峰定时来适配突触的权重 ; 以及 第三电路, 配置成基于自从对所述权重的改变的先前交付履行以来的时间量来确定所 述资源考虑。 76. 如权利要求 75。
27、 所述的装置, 其特征在于, 所述权重的改变是在对所述权重的改变 的交付履行之后的时间发生的。 77. 一种用于神经学习的设备, 包括 : 用于通过将突触前神经元与突触后神经元相连接的突触的权重来调制从所述突触前 神经元至所述突触后神经元的输入的装置 ; 用于基于与所述突触相关联的资源考虑以及所述突触前神经元和所述突触后神经元 权 利 要 求 书 CN 103890787 A 7 7/7 页 8 的尖峰定时来适配突触的权重的装置 ; 以及 用于基于自从对所述权重的改变的先前交付履行以来的时间量来确定所述资源考虑 的装置。 78. 如权利要求 77 所述的设备, 其特征在于, 所述权重的改变是在。
28、对所述权重的改变 的交付履行之后的时间发生的。 79. 一种用于神经学习的计算机程序产品, 所述计算机程序产品包括计算机可读介质, 所述计算机可读介质包括用于以下动作的代码 : 通过将突触前神经元与突触后神经元相连接的突触的权重来调制从所述突触前神经 元至所述突触后神经元的输入 ; 基于与所述突触相关联的资源考虑以及所述突触前神经元和所述突触后神经元的尖 峰定时来适配所述突触的权重 ; 以及 基于自从对所述权重的改变的先前交付履行以来的时间量来确定所述资源考虑。 80. 如权利要求 79 所述的计算机程序产品, 其特征在于, 所述权重的改变是在对所述 权重的改变的交付履行之后的时间发生的。 权。
29、 利 要 求 书 CN 103890787 A 8 1/14 页 9 用于尖峰神经网络中的自然多尖峰序列的神经学习的方法 和装置 背景技术 0001 领域 0002 本公开的某些方面一般涉及神经系统工程, 更具体地涉及用于尖峰神经网络中的 自然多尖峰序列的神经学习的方法和装置。 0003 背景 0004 典型的取决于尖峰定时的可塑性 (STDP) 学习规则基于单对尖峰前 (输入) 与尖峰 后 (输出) 之间的定时来适配突触权重。然而, 自然尖峰序列 (例如, 在生物学中) 和尖峰神 经网络中的尖峰序列一般不具有清晰分开的尖峰对。因此, 多个输入和输出尖峰表示一般 情形。然而, 基于 STDP 。
30、的学习可能因权重增大和减小的振荡而不能收敛。不仅如此, 基本 STDP 学习规则可能未能计及多尖峰上下文中生物学上观察到的学习。 0005 已在文献中基于理论提议了两种主要模型。一种方法需要基于所有组合对 (突触 前和突触后) 的计算。然而, 这种办法往往在计算上是昂贵的。另一种方法解释基于速率的 效应, 而非与时间编码有关的时间效应。 此外, 这种办法可以取决于神经元动态模型并且可 能需要多个时标上的复杂滤波。 0006 因此, 希望有在计算上实用的、 为在时间编码上下文中操作的尖峰网络提供稳定 性和快速学习的、 且还能够是生物学上似真的方法。 0007 概述 0008 本公开的某些方面提供。
31、一种神经学习的方法。该方法一般包括 : 通过将突触前神 经元与突触后神经元相连接的突触的权重来调制从突触前神经元至突触后神经元的输入 ; 以及基于与突触相关联的资源、 自从该权重的上一次改变以来的时间、 或者突触前神经元 与突触后神经元的尖峰定时中的至少一者来适配突触的权重。 0009 本公开的某些方面提供了一种用于神经学习的装置。 该装置一般包括 : 第一电路, 配置成通过将突触前神经元与突触后神经元相连接的突触的权重来调制从突触前神经元 至突触后神经元的输入 ; 以及第二电路, 配置成基于与突触相关联的资源、 自从该权重的上 一次改变以来的时间、 或者突触前神经元与突触后神经元的尖峰定时中。
32、的至少一者来适配 突触的权重。 0010 本公开的某些方面提供了一种用于神经学习的设备。该设备一般包括 : 用于通过 将突触前神经元与突触后神经元相连接的突触的权重来调制从突触前神经元至突触后神 经元的输入的装置 ; 以及用于基于与突触相关联的资源、 自从该权重的上一次改变以来的 时间、 或者突触前神经元与突触后神经元的尖峰定时中的至少一者来适配突触的权重的装 置。 0011 本公开的某些方面提供了一种用于神经学习的计算机程序产品。 该计算机程序产 品一般包括计算机可读介质, 该计算机可读介质包括用于执行以下操作的代码 : 通过将突 触前神经元与突触后神经元相连接的突触的权重来调制从突触前神经。
33、元至突触后神经元 的输入, 以及基于与突触相关联的资源、 自从该权重的上一次改变以来的时间、 或者突触前 说 明 书 CN 103890787 A 9 2/14 页 10 神经元与突触后神经元的尖峰定时中的至少一者来适配突触的权重。 0012 本公开的某些方面提供一种神经学习的方法。该方法一般包括 : 通过将突触前神 经元与突触后神经元相连接的突触的权重来调制从突触前神经元至突触后神经元的输入 ; 基于与突触相关联的资源考虑和突触前神经元与突触后神经元的尖峰定时来适配突触的 权重 ; 以及基于突触前神经元和突触后神经元的先前尖峰之间的一个或多个定时关系来确 定该资源考虑。 0013 本公开的某。
34、些方面提供了一种用于神经学习的装置。 该装置一般包括 : 第一电路, 配置成通过将突触前神经元与突触后神经元相连接的突触的权重来调制从突触前神经元 至突触后神经元的输入 ; 第二电路, 配置成基于与突触相关联的资源考虑和突触前神经元 与突触后神经元的尖峰定时来适配突触的权重 ; 以及第三电路, 配置成基于突触前神经元 和突触后神经元的先前尖峰之间的一个或多个定时关系来确定该资源考虑。 0014 本公开的某些方面提供了一种用于神经学习的设备。该设备一般包括 : 用于通过 将突触前神经元与突触后神经元相连接的突触的权重来调制从突触前神经元至突触后神 经元的输入的装置 ; 用于基于与突触相关联的资源。
35、考虑和突触前神经元与突触后神经元的 尖峰定时来适配突触的权重的装置 ; 以及用于基于突触前神经元和突触后神经元的先前尖 峰之间的一个或多个定时关系来确定该资源考虑的装置。 0015 本公开的某些方面提供了一种用于神经学习的计算机程序产品。 该计算机程序产 品一般包括计算机可读介质, 该计算机可读介质包括用于执行以下操作的代码 : 通过将突 触前神经元与突触后神经元相连接的突触的权重来调制从突触前神经元至突触后神经元 的输入 ; 基于与突触相关联的资源考虑和突触前神经元与突触后神经元的尖峰定时来适配 突触的权重 ; 以及基于突触前神经元和突触后神经元的先前尖峰之间的一个或多个定时关 系来确定该资。
36、源考虑。 0016 本公开的某些方面提供一种神经学习的方法。该方法一般包括 : 通过将突触前神 经元与突触后神经元相连接的突触的权重来调制从突触前神经元至突触后神经元的输入 ; 基于与突触相关联的资源考虑和突触前神经元与突触后神经元的尖峰定时来适配突触的 权重 ; 以及基于自从对该权重的改变的先前交付履行以来的时间量来确定该资源考虑。 0017 本公开的某些方面提供了一种用于神经学习的装置。 该装置一般包括 : 第一电路, 配置成通过将突触前神经元与突触后神经元相连接的突触的权重来调制从突触前神经元 至突触后神经元的输入 ; 第二电路, 配置成基于与突触相关联的资源考虑和突触前神经元 与突触后。
37、神经元的尖峰定时来适配突触的权重 ; 以及第三电路, 配置成基于自从对该权重 的改变的先前交付履行以来的时间量来确定该资源考虑。 0018 本公开的某些方面提供了一种用于神经学习的设备。该设备一般包括 : 用于通过 将突触前神经元与突触后神经元相连接的突触的权重来调制从突触前神经元至突触后神 经元的输入的装置 ; 用于基于与突触相关联的资源考虑和突触前神经元与突触后神经元的 尖峰定时来适配突触的权重的装置 ; 以及用于基于自从对该权重的改变的先前交付履行以 来的时间量来确定该资源考虑的装置。 0019 本公开的某些方面提供了一种用于神经学习的计算机程序产品。 该计算机程序产 品一般包括计算机可。
38、读介质, 该计算机可读介质包括用于以下操作的代码 : 通过将突触前 神经元与突触后神经元相连接的突触的权重来调制从突触前神经元至突触后神经元的输 说 明 书 CN 103890787 A 10 3/14 页 11 入 ; 基于与突触相关联的资源考虑和突触前神经元与突触后神经元的尖峰定时来适配突触 的权重 ; 以及基于自从对该权重的改变的先前交付履行以来的时间量来确定该资源考虑。 0020 附图简述 0021 为了能详细理解本公开的以上陈述的特征所用的方式, 可参照各方面来对以上简 要概述的内容进行更具体的描述, 其中一些方面在附图中解说。 然而应该注意, 附图仅解说 了本公开的某些典型方面, 。
39、故不应被认为限定其范围, 因为本描述可允许有其他等同有效 的方面。 0022 图 1 解说根据本公开的某些方面的神经元的示例网络。 0023 图 2 解说了根据本公开的某些方面的突触前和突触后神经元尖峰和突触权重适 配的示例。 0024 图 3 解说了根据本公开的某些方面的突触前和突触后神经元尖峰发放和突触权 重适配的另一示例。 0025 图 4 解说了根据本公开的某些方面的突触前和突触后神经元尖峰发放和突触权 重适配的另一示例。 0026 图 5 解说了根据本公开的某些方面的突触前和突触后神经元尖峰发放和突触权 重适配的另一示例。 0027 图 6 解说了根据本公开的某些方面的神经学习的示例。
40、操作。 0028 图 6A 解说了能够执行图 6 中解说的操作的示例组件。 0029 图 7 解说了根据本公开的某些方面的神经学习的其他示例操作。 0030 图 7A 解说了能够执行图 7 中解说的操作的示例组件。 0031 图 8 解说了根据本公开的某些方面的神经学习的其他示例操作。 0032 图 8A 解说了能够执行图 8 中解说的操作的示例组件。 0033 图 9 解说了根据本公开的某些方面的使用通用处理器进行神经学习的示例软件 实现。 0034 图 10 解说了根据本公开的某些方面的神经学习的示例实现, 其中存储器可与个 体分布式处理单元对接。 0035 图 11 解说了根据本公开的某。
41、些方面的基于分布式存储器和分布式处理单元的 0036 神经学习的示例实现。 0037 详细描述 0038 以下参照附图更全面地描述本公开的各个方面。然而, 本公开可用许多不同形式 来实施并且不应解释为被限定于本公开通篇给出的任何具体结构或功能。相反, 提供这些 方面是为了使得本公开将是透彻和完整的, 并且其将向本领域技术人员完全传达本公开的 范围。基于本文中的教导, 本领域技术人员应领会, 本公开的范围旨在覆盖本文中所披露 的本公开的任何方面, 不论其是与本公开的任何其他方面相独立地还是组合地实现的。例 如, 可以使用本文所阐述的任何数目的方面来实现装置或实践方法。 另外, 本公开的范围旨 在。
42、覆盖使用作为本文中所阐述的本公开的各种方面的补充或者与之不同的其他结构、 功能 性、 或者结构及功能性来实践的此类装置或方法。 应当理解, 本文中所披露的本公开的任何 方面可由权利要求的一个或多个元素来实施。 0039 措辞 “示例性” 在本文中用于表示 “用作示例、 实例或解说” 。本文中描述为 “示例 说 明 书 CN 103890787 A 11 4/14 页 12 性” 的任何方面不必被解释为优于或胜过其他方面。 0040 尽管本文中描述了特定方面, 但这些方面的众多变体和置换落在本公开的范围之 内。 虽然提到了优选方面的一些益处和优点, 但本公开的范围并非旨在被限定于特定益处、 用途。
43、或目标。相反, 本公开的各方面旨在能宽泛地应用于不同的技术、 系统配置、 网络和协 议, 其中一些作为示例在附图以及以下对优选方面的详细描述中解说。详细描述和附图仅 仅解说本公开而非限定本公开, 本公开的范围由所附权利要求及其等效技术方案来定义。 0041 示例神经系统 0042 图 1 解说根据本公开的某些方面的具有多级神经元的示例神经系统 100。神经系 统 100 可包括神经元级 102, 该神经元级 102 通过突触连接网络 104 连接到另一神经元级 106。为简单起见, 图 1 中仅解说了两个神经元级, 但在典型的神经系统中可存在更少或更 多个神经元级。 0043 如图 1 中所解。
44、说的, 级 102 中的每个神经元可接收输入信号 108, 输入信号 108 可 以是由前一级 (图 1 中未示出) 的多个神经元所生成的。信号 108 可表示级 102 的神经元的 输入电流。该电流可在神经元膜上累积以对膜电位进行充电。当膜电位达到其阈值时, 该 神经元可激发并生成输出尖峰, 该输出尖峰将被传递到下一神经元级 (例如, 级 106) 。 0044 尖峰从一个神经元级向另一个神经元级的传递可通过突触连接 (或简称 “突触” ) 网络104来达成, 如图1中所解说的。 突触104可以从级102的神经元 (相对于突触104而言 的突触前神经元) 接收输出信号 (即, 尖峰) , 并。
45、且根据可调节突触权重 (其中, P 是级 102 和级 106 的神经元之间的突触连接总数) 来缩放那些信号。此外, 经缩放 信号可被组合以作为级 106 中每个神经元 (相对于突触 104 而言的突触后神经元) 的输入信 号。级 106 中的每个神经元可基于对应的经组合输入信号来生成输出尖峰 110。随后可使 用另一突触连接网络 (图 1 中未示出) 将这些输出尖峰 110 传递给另一神经元级。 0045 神经系统 100 可以通过电路来仿真并且可以在大范围的应用中利用, 诸如图像和 模式识别、 机器学习、 电机控制及类似应用等。神经系统 100 中的每个神经元可被实现为神 经元电路。 被充。
46、电至发起输出尖峰的阈值的神经元膜可被实现为例如对流经其的电流进行 积分的电容器。 0046 在一方面, 电容器作为神经元电路的电流积分器件可被除去, 并且可使用较小的 忆阻器元件来替代它。这种办法可应用于神经元电路中, 以及其中大容量电容器被用作电 流积分器的各种其他应用中。另外, 每个突触 104 可基于忆阻器元件来实现, 其中突触权重 改变可与忆阻器电阻的变化有关。使用纳米特征尺寸的忆阻器, 可显著地减小神经元电路 和突触的面积, 这可使得实现超大规模神经系统硬件实现变得可行。 0047 尖峰神经网络 (诸如来自图 1 的神经网络 100) 中的学习通常可以采用基于生物学 上观察到的数据的。
47、取决于尖峰定时的可塑性 (STDP) 规则。此类典型学习可以基于突触前 神经元输入尖峰与突触后神经元尖峰之间的时间差来适配突触的权重 (例如, 来自图 1 的 突触 104 的权重) 。然而, 较自然的尖峰序列 (例如, 在生物学或工程网络中发生) 可包括多 个尖峰 (突触前和突触后两者) 。当如在自然尖峰序列中那样有多个突触前和突触后尖峰 时, 根据 STDP 规则的学习可能是不稳定的并且不能收敛, 这是因为权重调整可能由于是长 期增强 (LTP) 还是长期抑压 (LTD) 取决于精确的时间可占主导地位的敏感性而被平均掉或 说 明 书 CN 103890787 A 12 5/14 页 13 。
48、者振荡。可能出现的另一问题是神经元的过激发或欠激发。无论是将成对 STDP 规则应用 于尖峰对的所有组合还是应用于毗邻尖峰对的序列, 这都可能是个问题。 0048 本公开的某些方面支持基于资源概念的工程解决方案以使多尖峰学习稳定和加 速。近来, 已找到与典型 STDP 规则相反的新生物学证据。已提议某些理论和模型来解释多 尖峰或尖峰速率现象。然而, 这些模型较复杂, 其需要维护先前尖峰时间的历史, 计算多个 滤波器, 并且有较大数目的性能敏感参数。 另外, 这些模型在计算上不独立于工程设计出的 尖峰神经网络的其他方面。本公开中所提议的基于资源的方法在计算上较简单、 很大程度 上可分开、 并且性。
49、能胜过其他方法。 0049 基于取决于尖峰定时的可塑性规则的多尖峰序列的学习 0050 STDP学习规则可根据突触前神经元A的尖峰时间tpre与突触后神经元B的尖峰时 间 tpost之间的时间差 (即, t=tpost-tpre) 来有效地适配将神经元 A 连接到神经元 B 的突触 的突触权重。 STDP的典型公式是若该时间差为正 (突触前神经元在突触后神经元之前激发) 则增大突触权重 (即, 增强该突触) , 以及若该时间差为负 (突触后神经元在突触前神经元之 前激发) 则减小突触权重 (即, 抑压该突触) 。突触权重的变化可通常使用指数衰退来达成, 如由下式给出的 : 0051 0052 其中 sign(t)是时间常数并且 Asign(t)是缩放幅值, 其中 sign(t)和 Asign(t)两者 通常都可取决于时间差为正还是为负。 0053 如果有一个突触前尖峰和一个突触后尖峰, 则 STDP 学习规则是清楚的。另一方 面, 如果有多个尖峰, 则 STDP 学习规则是不清楚的, 这是因为不清楚应当使用哪个时间。一 种简单的工程解决方案可以是使用最后 。