一种计算机事务存储方法 【技术领域】
本发明涉及一种计算机事务存储(transactional memory)方法,属于计算机系统结构技术领域。
背景技术
根据摩尔定律,计算机处理器的性能每18至24个月增加一倍,然而,内存的访问速度仅以每年7%-10%的速度增长,远远落后于处理器的增长速度。相对于处理器来说,内存访问延迟以每十年5倍的速度增长,处理器与存储器的差距不断增加,造成了系统结构的失衡,形成了阻碍性能提升的“存储墙”,从而使得内存访问成为整个计算机系统的性能瓶颈。
为了缓解“存储墙”对计算机系统性能的影响,需要对内存访问进行优化。降低内存的访问次数是访存优化的一种方法。Lepak等人通过研究,观察到由于许多写指令写入内存的值都与内存中原有的值相同,因此这些写指令都没有产生实际效果。基于这一观察,Lepak等人提出了沉默存储(silent store)结构。在这种结构中,一个写操作被转换为三个操作,即读操作、比较操作和实际的写操作(如果这个写操作不是沉默的),这样系统就可能减少内存的写操作,但是这种结构同时可能会增加读操作的次数。
事务存储编程模型由布朗大学的Herlihy教授于1993年提出,它的提出受到了数据库系统中事务处理的影响,使用事务的概念代替原来的临界区。事务是只能被一个线程执行的一段内存读写指令序列,这个序列中的读写操作只有两种结果:全部生效或者不起作用。事务存储就是支持多个事务并行执行的一种编程模型。事务存储具有容易编程、安全性好、可扩展性好及高性能的优点,从而得到了广泛的关注。在最近十几年里,许多大学和科研单位参加到事务存储的研究之中,同时微软、英特尔等一批公司也在积极地进行相关研究。
实现事务存储中的版本管理(version management)是指系统必须同时提供空间用于存放数据的新值(当提交事务时会使用这些新值)和旧值(当放弃事务时会使用这些旧值)。威斯康星大学麦迪逊分校的Moore等人提出的基于日志的事务存储(log-based transactionalmemory,简称LogTM)采用积极的版本管理方式,将数据的新值直接存放在目标位置,而将数据的旧值存放于可缓存的日志中,在事务放弃时用来对数据进行恢复。当事务提交或放弃后,事务的日志都被丢弃,但实际上被丢弃的日志还存在于缓存中而且在缓存中的状态为“被修改过”,在日志所在缓存行被其它行替换时,就可能造成不必要的写回,从而增加了内存写操作的次数,造成了性能的下降。
【发明内容】
本发明的目的是提出一种计算机事务存储方法,以克服已有的事务存储实现方法中对日志进行无意义的内存写操作的缺点。本发明提出的事务存储方法减少了对日志的写内存操作的次数,缓解了处理器和内存之间的速度差距,提高了事务存储系统的性能。
本发明提出的计算机数据的事务存储方法,包括以下步骤:
(1-1)定义:从对计算机内存地址的写操作至对该内存地址的下一次写操作之前的对该地址的最后一次读指令为数据存活区间,从对计算机内存地址的最后一次读操作到对该内侧地址的下一次写操作为数据消亡区间;
(1-2)计算机地一个缓存行中的数据被修改过,若在该缓存行被替换时,修改的数据所在的内存地址处于上述数据存活区间中,则将修改的数据写回内存中,若在缓存行被替换时,修改的数据所在的内存地址处于上述数据消亡区间中,则修改的数据保持在缓存中;
(1-3)在数据存活区间结束和数据消亡区间开始的位置,插入一条最后一次读操作指令M,在数据消亡区间中读操作指令已经进行后插入一条该数据的存活区间结束消亡区间从此开始的标识指令N;
(1-4)当处理器执行读指令M或标识指令N时,对计算机缓存行的状态进行修改;
(1-5)处理器在进行事务的提交操作时,丢弃内存中该事务所有的日志,对日志所在的所有内存地址,执行数据的存活区间结束消亡区间从此开始的标识指令N;
(1-6)处理器在进行事务的放弃操作时,通过读取该事务的日志,恢复内存中被该事务修改过的所有数据的原值,对日志所在的所有内存地址,执行数据的存活区间结束消亡区间从此开始的标识指令N。
上述事务存储方法中,步骤(1-2)计算机的一个缓存行中的数据被修改过,若在该缓存行被替换时,修改的数据所在的内存地址处于上述数据存活区间中,则将修改的数据写回内存中,若在缓存行被替换时,修改的数据所在的内存地址处于上述数据消亡区间中,则修改的数据保持在缓存中,其过程如下:
(2-1)计算机的缓存为一级,若缓存行被替换时被修改的数据所在的内存地址处于所述的数据存活区间中,则将被修改的数据写回内存中,若在缓存行被替换时被修改的数据所在的内存地址处于所述的数据消亡区间中,则被修改的数据保持在缓存中;
(2-2)计算机的缓存为两级,其中一级为写直达方式,二级为写回方式,且二级缓存的缓存行中的数据被修改过,若二级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的数据存活区间中,则将被修改的数据写回内存中,若二级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的消亡区间中,则被修改的数据保持在缓存中;
(2-3)计算机的缓存有两级,其中一级和二级同时为写回方式,若一级缓存的缓存行中的数据被修改过,则当该一级缓存行被替换时,若一级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的数据存活区间中,则将被修改的数据写回内存中,若一级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的消亡区间中,则被修改的数据保持在缓存中;若二级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的数据存活区间中,则将被修改的数据写回内存中,若二级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的消亡区间中,则被修改的数据保持在缓存中。
上述事务存储方法中,步骤(1-4)当处理器执行读指令M或标识指令N时,对计算机缓存行的状态进行修改的方法,包括以下步骤:
(3-1)计算机的缓存为一级,计算机处理器执行最后一次读操作指令M或数据的存活区间结束消亡区间从此开始的标识指令N时,若与指令的内存地址相对应的缓存行的状态为“缓存行中的数据被修改过”,则将该缓存行状态修改为“缓存行中的数据未修改过”,若与指令的内存地址相对应的缓存行的状态为“缓存行中的数据未被修改过”,则不作修改;
(3-2)计算机的缓存未两级,其中一级为写直达方式,二级为写回方式,计算机处理器执行最后一次读操作指令M或数据的存活区间结束消亡区间从此开始的标识指令N时,若与指令的内存地址相对应的二级缓存行的状态为“缓存行中的数据被修改过”,则将该缓存行状态修改为“缓存行中的数据未修改过”,若与指令的内存地址相对应的二级缓存行的状态为“缓存行中的数据未被修改过”,则不作修改;
(3-3)计算机的缓存为两级,其中一级和二级同时为写回方式,计算机处理器执行最后一次读操作指令M或数据的存活区间结束消亡区间从此开始的标识指令N时,若与指令的内存地址相对应的一级缓存行的状态为“缓存行中的数据被修改过”,则将该缓存行状态修改为“缓存行中的数据未修改过”,若与指令的内存地址相对应的一级缓存行的状态为“缓存行中的数据未被修改过”,则不作修改;若与指令的内存地址相对应的二级缓存行的状态为“缓存行中的数据被修改过”,则将该缓存行状态修改为“缓存行中的数据未修改过”,若与指令的内存地址相对应的二级缓存行的状态为“缓存行中的数据未被修改过”,则不作修改。
本发明提出的计算机事务存储方法,其优点是:减少了对日志的写内存操作的次数,缓解了处理器与内存之间的速度差距,提高了事务存储系统的性能。
【附图说明】
图1本发明方法中定义的数据存活区间和消亡区间的定义示意图。
【具体实施方式】
本发明提出的计算机数据的事务存储方法,包括以下步骤:
(1-1)定义:从对计算机内存地址的写操作至对该内存地址的下一次写操作之前的对该地址的最后一次读指令为数据存活区间,从对计算机内存地址的最后一次读操作到对该内侧地址的下一次写操作为数据消亡区间,如图1所示;
(1-2)计算机的一个缓存行中的数据被修改过,若在该缓存行被替换时,修改的数据所在的内存地址处于上述数据存活区间中,则将修改的数据写回内存中,若在缓存行被替换时,修改的数据所在的内存地址处于上述数据消亡区间中,则修改的数据保持在缓存中;
(1-3)在数据存活区间结束和数据消亡区间开始的位置,插入一条最后一次读操作指令M,在数据消亡区间中读操作指令已经进行后插入一条该数据的存活区间结束消亡区间从此开始的标识指令N;
(1-4)当处理器执行读指令M或标识指令N时,对计算机缓存行的状态进行修改;
(1-5)处理器在进行事务的提交操作时,丢弃内存中该事务所有的日志,对日志所在的所有内存地址,执行数据的存活区间结束消亡区间从此开始的标识指令N;
(1-6)处理器在进行事务的放弃操作时,通过读取该事务的日志,恢复内存中被该事务修改过的所有数据的原值,对日志所在的所有内存地址,执行数据的存活区间结束消亡区间从此开始的标识指令N。
上述事务存储方法中,步骤(1-2)计算机的一个缓存行中的数据被修改过,若在该缓存行被替换时,修改的数据所在的内存地址处于上述数据存活区间中,则将修改的数据写回内存中,若在缓存行被替换时,修改的数据所在的内存地址处于上述数据消亡区间中,则修改的数据保持在缓存中,其过程如下:
(2-1)计算机的缓存为一级,若缓存行被替换时被修改的数据所在的内存地址处于所述的数据存活区间中,则将被修改的数据写回内存中,若在缓存行被替换时被修改的数据所在的内存地址处于所述的数据消亡区间中,则被修改的数据保持在缓存中;
(2-2)计算机的缓存为两级,其中一级为写直达方式,二级为写回方式,且二级缓存的缓存行中的数据被修改过,若二级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的数据存活区间中,则将被修改的数据写回内存中,若二级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的消亡区间中,则被修改的数据保持在缓存中;
(2-3)计算机的缓存有两级,其中一级和二级同时为写回方式,若一级缓存的缓存行中的数据被修改过,则当该一级缓存行被替换时,若一级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的数据存活区间中,则将被修改的数据写回内存中,若一级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的消亡区间中,则被修改的数据保持在缓存中;若二级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的数据存活区间中,则将被修改的数据写回内存中,若二级缓存行被替换时缓存行中被修改的数据所在的内存地址处于所述的消亡区间中,则被修改的数据保持在缓存中。
上述事务存储方法中,步骤(1-4)当处理器执行读指令M或标识指令N时,对计算机缓存行的状态进行修改的方法,包括以下步骤:
(3-1)计算机的缓存为一级,计算机处理器执行最后一次读操作指令M或数据的存活区间结束消亡区间从此开始的标识指令N时,若与指令的内存地址相对应的缓存行的状态为“缓存行中的数据被修改过”,则将该缓存行状态修改为“缓存行中的数据未修改过”,若与指令的内存地址相对应的缓存行的状态为“缓存行中的数据未被修改过”,则不作修改;
(3-2)计算机的缓存未两级,其中一级为写直达方式,二级为写回方式,计算机处理器执行最后一次读操作指令M或数据的存活区间结束消亡区间从此开始的标识指令N时,若与指令的内存地址相对应的二级缓存行的状态为“缓存行中的数据被修改过”,则将该缓存行状态修改为“缓存行中的数据未修改过”,若与指令的内存地址相对应的二级缓存行的状态为“缓存行中的数据未被修改过”,则不作修改;
(3-3)计算机的缓存为两级,其中一级和二级同时为写回方式,计算机处理器执行最后一次读操作指令M或数据的存活区间结束消亡区间从此开始的标识指令N时,若与指令的内存地址相对应的一级缓存行的状态为“缓存行中的数据被修改过”,则将该缓存行状态修改为“缓存行中的数据未修改过”,若与指令的内存地址相对应的一级缓存行的状态为“缓存行中的数据未被修改过”,则不作修改;若与指令的内存地址相对应的二级缓存行的状态为“缓存行中的数据被修改过”,则将该缓存行状态修改为“缓存行中的数据未修改过”,若与指令的内存地址相对应的二级缓存行的状态为“缓存行中的数据未被修改过”,则不作修改。