一种需求项与工作产品间跟踪关系维护方法.pdf

上传人:b*** 文档编号:973950 上传时间:2018-03-22 格式:PDF 页数:9 大小:550.65KB
返回 下载 相关 举报
摘要
申请专利号:

CN201010137834.9

申请日:

2010.03.30

公开号:

CN101847097A

公开日:

2010.09.29

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 9/44申请日:20100330|||公开

IPC分类号:

G06F9/44; G06F17/30

主分类号:

G06F9/44

申请人:

中国科学院软件研究所

发明人:

王青; 孔令军; 李引; 杨达; 李娟

地址:

100190 北京市海淀区中关村南四街4号

优先权:

专利代理机构:

北京君尚知识产权代理事务所(普通合伙) 11200

代理人:

余功勋

PDF下载: PDF下载
内容摘要

本发明公开了一种需求项与工作产品间跟踪关系维护方法,属于计算机软件工程领域。本方法为:1)输入需求规约、变更前的跟踪关系TRold以及工作产品的变更信息;2)对于增加工作产品,找出与新增工作产品项相似度大于设定阈值h的原工作产品集合WpSetold;3)对需求规约中每一需求项r,根据TRold找出WpSetold中与该r有关系的工作产品,记为集合WPr∪n;4)将r与WPr∪n作为相关反馈算法的输入,得到一需求项查询r′;5)将r′与新增工作产品间相似度大于设定阈值H的关联关系作为候选跟踪关系;6)对于修改工作产品,将修改后的工作产品项作为新增工作产品项,重复步骤2)~5);7)对于删除工作产品,删除与变更工作产品项相关联的跟踪关系。本发明大大提高了跟踪维护的自动化程度和效率。

权利要求书

1.  一种需求项与工作产品间跟踪关系维护方法,其步骤为:
1)输入需求规约、工作产品的变更信息以及变更前的需求跟踪关系,其中工作产品的变更信息包括:增加工作产品、修改工作产品、删除工作产品;
2)对于变更信息为增加工作产品,则计算新增工作产品项与所有变更前工作产品项间的相似度,并找出相似度大于设定阈值h的变更前工作产品集合WpSetold
3)遍历输入的需求规约中的所有需求项,对于每一个需求项r,根据变更前需求跟踪关系TRold找出WpSetold中所有与该需求项r有关系的工作产品,记为集合WPr∪n
4)将需求项r与WPr∪n作为相关反馈算法的输入,计算得到一需求项查询r′;如果WpSetold或WPr∪n为空,则将需求项r作为一需求项查询r′;
5)计算需求项查询r′与新增工作产品间的相似度,如果相似度大于设定的阈值H,则将两者间的关联关系作为候选跟踪关系;
6)对于变更信息为修改工作产品,则将修改后的工作产品项作为新增工作产品项,重复步骤2)~5);
7)对于变更信息为删除工作产品,则删除与变更工作产品项相关联的跟踪关系。

2.
  如权利要求1所述的方法,其特征在于所述集合WPr∪n中包括与r存在跟踪关系的工作产品项、与r不存在跟踪关系的工作产品项;所述与r存在跟踪关系的工作产品项以及r为相关反馈算法的正反馈,所述与r不存在跟踪关系的工作产品项以及r为相关反馈算法的负反馈。

3.
  如权利要求1或2所述的方法,其特征在于所述相关反馈算法为向量空间模型中的Standard Rochio算法。

4.
  如权利要求1所述的方法,其特征在于所述工作产品集合WpSetold的计算方法为:
1)将新增工作产品项wpnew的文本表示成向量
2)计算中标引词的权重;
3)对每个变更前工作产品项wpold,计算其向量表示以及该中标引词的权重;
4)计算该和所述间的相似度;如果相似度大于设定阈值h,则将相应wpold放入所述集合WpSetold中。

5.
  如权利要求4所述的方法,其特征在于采用Tf-idf算法计算中标引词的权重。

6.
  如权利要求4所述的方法,其特征在于采用向量空间模型中的向量夹角余弦相似度计算方法计算间的相似度,如果余弦值大于设定阈值h,则将相应wpold放入所述集合WpSetold中。

7.
  如权利要求1所述的方法,其特征在于采用向量空间模型中的向量夹角余弦相似度计算方法计算所述需求项查询r′与新增工作产品间的相似度。

说明书

一种需求项与工作产品间跟踪关系维护方法
技术领域
本发明属于计算机软件工程领域,具体涉及一种需求项与工作产品间跟踪关系维护方法,实现了工作产品发生变更时需求跟踪关系的自动化更新和维护。
背景技术
需求跟踪是一种描述和跟踪整个需求生命周期的能力,需求跟踪关系则是指需求和软件工作产品间的关联关系,目前很多组织采用需求跟踪矩阵来描述需求跟踪关系,建立需求跟踪矩阵作为需求工程中一个指导性的标准过程,其不但是CMM/CMMI 2级里面的一个核心活动,也是软件开发和维护标准ISO9001中条款4.8的一个必要活动。软件需求跟踪辅助软件开发生命周期中很多活动的执行,并且能够为决策分析和权衡提供依据。比如,需求跟踪可以作为需求变更影响分析的依据,为接受或拒绝需求变更提供支持。一个全面的需求跟踪可以为最后开发的产品质量提供保证,对软件开发和维护提供有力支持,并且可以降低系统开发生命周期中的成本。实践表明,软件开发生命周期中,“忽略了需求跟踪,或者是不充分和非结构化的需求跟踪关系将会导致系统质量的下降和反复的修改,从而增加系统开发的时间和成本。由于缺乏有效的需求跟踪,以致人员的流动会引起的项目知识的缺失,从而导致做出错误的决策”。
尽管需求跟踪如此重要,在实际开发过程中,却面临着成本过高、维护困难、容易出错等问题。这些问题使得需求跟踪关系在实际软件开发过程中没有很好地被开发人员建立和维护,从而其作用也就没有得到完全发挥。为了解决这些问题,动态需求跟踪采用自动化技术,包括信息检索技术、自然语言处理、运行时分析技术、事件发布/订阅等,取得了较好的效果。基于信息检索技术的需求跟踪关系建立方法是目前比较流行的一种方法,该方法利用信息检索模型计算需求文本和工作产品文本之间的相似度,按照相似度的大小进行排列,通过设定一定的阈值,就可以筛选得到需求所跟踪的工作产品。需求和工作产品之间的相似度越大,那么它们之间就越可能存在跟踪关系。需求和工作产品间的相似度一般通过两者的标引词间的匹配来计算。这里的需求和工作产品是统称,需求可以分为很多具体的需求项,工作产品同样可以按照某种粒度继续划分。比如,源代码作为一种工作产品,可以按照包或者类进行更细粒度的划分,我们暂称为工作产品项。实际建立的跟踪关系中,多是需求项和工作产品项的跟踪关系。该方法的一般过程如下:1)对需求和工作产品进行查询表示和文本表示,即将需求文档和工作产品文档(可能需要搜集和提取)表达成信息检索模型所需要的表示形式,比如一段文字可以表达成一个向量,其中每一个维度是一个标引词及其权重大小。2)使用信息检索模型中的相似度计算方法计算文本间的相似度,并筛选出相似度大于设定阈值的关联关系呈现给用户。3)用户对给定的关联关系进行修改、确认和完善。
跟踪关系建立完毕后,并非一劳永逸,在软件开发中,需求和工作产品都在不断地演化,由此也会引发跟踪关系的不断变化,所以跟踪关系的维护是一项必不可少而又非常重要的工作。目前跟踪关系的维护还大多采用手工维护,手工维护的繁琐、容易出错等问题是显而易见的。能够自动化或半自动化地辅助开发人员维护需求跟踪关系将会大大减少维护的人力、时间成本和复杂程度,促进需求跟踪关系在实际开发中的应用。
信息检索(IR)技术是一种应用十分广泛的技术,它是指用户为处理解决各种问题而查找、识别、获取相关的事实、数据、文献的活动及过程(参考:申请号:200810117633.5,发明名称“一种自动识别需求依赖关系的方法”的技术文件)。简单地,信息检索可以被理解为对给定的用户查询返回相关的文档的过程和方法。基于标引词(keyword-based)的信息获取是信息检索技术最常用的方法。用户查询和被检索文档都被认为是具有不同重要程度标引词的组合,两者间的相关性程度是通过比较它们之间的标引词来确定(参考:申请号:200810046936、发明名称:基于自然语言的全文检索系统,的中国专利申请)。目前有多种不同的信息检索模型,不同的信息检索模型中,查询、文本表示和相关性(或相似度)计算方法各有不同。其中,向量空间模型是众多信息检索模型中的时间较早、简单而有效的一个模型。
向量空间模型将文献集合中所包含的标引词看成向量,代表空间中的一个维度,那么这些标引词集合就构成了一个空间。文献集合中的任何一个文献都可以用空间中的一个向量来进行表示,利用查询和文献的向量积就可以计算它们之间的相似度。假设集合中有n个不同的标引词,则文献Di可以表示为:其中dij表示标引词j在文献i中的权重(weight);查询q可以表示为:其中qj表示标引词j在查询中的权重。运用向量积运算可以得到文献向量与查询向量之间的相似度:同一个标引词在不同的查询和文献中具有不同的权重,权重值越大的就认为该标引词越能代表这篇文献,权重值越小的就认为该标引词越不能代表这篇文献。Tf-idf是向量模型(Vector Space IR Model)中比较常用的标引词权重的计算方式,综合考虑了标引词的词频和逆文献频率两个因素,比较全面的反映了标引词在整个文献空间中的重要性。词频用tf表示,是标引词i在文献中出现的频率,其计算方式为m表示文献中包含的标引词的个数,freq(ti,d)表示在文献d中标引词i出现的次数;文献频率df是包含该标引词的文献数与所有文献数的比值,逆文献频率idf的一种计算方式是n表示文献的个数。因此一个标引词i的权重表示为
相关反馈技术是信息检索领域中很早就被提出的一种提高检索性能的方法。相关反馈本质上是一种查询优化技术,它首先收集用户的反馈信息,然后利用反馈信息修改原查询,最后利用新的查询重新进行检索,通常能得到更好的检索结果。这个过程可以循环直到用户对检索结果满意或者性能不再有提高。在信息检索领域,有很多具体的相关反馈方法来处理用户的反馈信息。其中,向量空间模型中Standard Rochio方法和语言模型中的MixtureModel方法是两个有代表性的反馈方法。下面是两种方法的简单介绍:Standard Rochio方法指的是:其中q′和q分别表示新查询和原查询;Dr和Dn分别表示与查询相关的文档(正反馈信息)和不相关的文档(负反馈信息)集合;α,β,γ是三个常量权重系数,分别表示原查询、相关文档集和不相关文档集在形成新查询时的权重,可以根据具体情况进行调整,通常三者的值分别是1,0.75,0.25时被认为有较好的效果。Mixture Model方法将反馈看作是按照某个概率模型生成的,并借助最大似然估计方法求出该概率模型。Mixture Model方法的公式是:q′=αq+β·θr,和其中q′和q分别表示原查询和新查询;θr分别表示生成相关文档的概率模型,可以通过Mixture Model方法求出,可以看到Mixture Model方法一般没有考虑负反馈信息。
发明内容
本发明的目的是提供一种需求项与工作产品间跟踪关系维护方法,该方法实现了工作产品发生变更时需求跟踪关系的自动化更新和维护。
需求规约由需求项组成。简单地,可以认为一个需求项就是一条文字描述的需求。工作产品是由工作产品项组成。比如,源代码作为一种工作产品,可以把类(class)看做工作产品项,一个类就是一个工作产品项。本发明中的需求跟踪关系具体指需求项和工作产品项间的关联关系。
跟踪关系的维护和更新是由变化引起的,变化主要来自两个方面:一是需求变更,另一个是工作产品的变更。本发明只讨论后者,工作产品的变更具体指工作产品项的变化,分为三种情况:增加、删除、修改。本发明根据不同的变更采用不同的方法对跟踪关系进行维护和更新。
本发明的技术方案为:
一种需求项与工作产品间跟踪关系维护方法,其步骤为:
1)输入需求规约、工作产品的变更信息以及变更前的需求跟踪关系,其中工作产品的变更信息包括:增加工作产品、修改工作产品、删除工作产品;
2)对于变更信息为增加工作产品,则计算新增工作产品项与所有变更前工作产品项间的相似度,并找出相似度大于设定阈值h的变更前工作产品集合WpSetold
3)遍历输入的需求规约中的所有需求项,对于每一个需求项r,根据变更前需求跟踪关系TRold找出WpSetold中所有与该需求项r有关系的工作产品,记为集合WPr∪n
4)将需求项r与WPr∪n作为相关反馈算法的输入,计算得到一需求项查询r′;如果WpSetold或WPr∪n为空,则将需求项r作为一需求项查询r′;
5)计算需求项查询r′与新增工作产品间的相似度,如果相似度大于设定的阈值H,则将两者间的关联关系作为候选跟踪关系;
6)对于变更信息为修改工作产品,则将修改后的工作产品项作为新增工作产品项,重复步骤2)~5);
7)对于变更信息为删除工作产品,则删除与变更工作产品项相关联的跟踪关系。
进一步的,所述集合WPr∪n中包括与r存在跟踪关系的工作产品项、与r不存在跟踪关系的工作产品项;所述与r存在跟踪关系的工作产品项以及r为相关反馈算法的正反馈,所述与r不存在跟踪关系的工作产品项以及r为相关反馈算法的负反馈。
进一步的,所述相关反馈算法为向量空间模型中的Standard Rochio算法。
进一步的,所述工作产品集合WpSetold的计算方法为:
1)将新增工作产品项wpnew的文本表示成向量
2)计算中标引词的权重;
3)对每个变更前工作产品项wpold,计算其向量表示以及该中标引词的权重;
4)计算该和所述间的相似度;如果相似度大于设定阈值h,则将相应wpold放入所述集合WpSetold中。
进一步的,采用Tf-idf算法计算中标引词的权重。
进一步的,采用向量空间模型中的向量夹角余弦相似度计算方法计算间的相似度,如果余弦值大于设定阈值h,则将相应wpold放入所述集合WpSetold中。
进一步的,采用向量空间模型中的向量夹角余弦相似度计算方法计算所述需求项查询r′与新增工作产品间的相似度。
本发明的输入包含两部分:一是维护前的需求跟踪关系(使用信息检索技术建立),记为TRold。二是工作产品的变更情况,即已经识别出的增删改的变化。输出是维护后的需求跟踪关系。下面按照不同的变更类型,详述本方法的内容:
1、增加工作产品项
对每一个新增工作产品项,基本过程分为三步:
1)获得相关反馈的输入信息
此步主要用于判断是否应该使用相关反馈来维护需求跟踪关系,具体方法是:
计算新增工作产品项wpnew与所有原有(变更前)工作产品项wpold间的相似度,并找出相似度大于设定阈值的原有工作产品,记为WpSetold。具体的相似度计算方法,比如可以采用向量空间模型中的余弦相似度计算方法:
其中为wpnew在向量空间模型中对应的向量表示,是wpold的向量表示。
2)利用相关反馈算法扩展、修订需求项
具体地,遍历需求规约中的所有需求项r,对于每一个需求项r,根据TRold查看r与WpSetold中工作产品间是否存在跟踪关系。将与r存在关系(包括存在或不存在跟踪关系)的工作产品项和r作为相关反馈的输入,计算得到一需求项查询r′。如果WpSetold为空或者r和WpSetold中工作产品不存在任何关系,直接将r作为一需求项查询r′。具体的相关反馈算法,比如可以采用向量空间模型中的Standard Rochio算法:其中,WPr分别表示存在跟踪关系的工作产品集合和不存在跟踪关系的工作产品集合。
3)计算修订后需求项查询r′和新增工作产品的相似度对每一个修订后的需求项查询r′,计算r′和新增工作产品间的相似度,如果相似度大于设定的阈值,则将两者间的关联关系作为候选跟踪关系。相似度计算方法采用和1)中相同的余弦相似度计算。
2、删除工作产品项
遍历被删除工作产品集合,对每一个被删除工作产品,直接删除和其相关联的跟踪关系。
3、修改工作产品项
将修改后的工作产品当作新增的工作产品,按照1)中的方法处理。
对工作产品的变更,按照上面的三种分类分别进行处理。最后将更新后的跟踪关系呈现给用户,等待用户的确认。
本发明的优点和积极效果如下:
1)本发明从分析跟踪关系的变化原因入手,提出了工作产品可能发生的增、删、改三种变化类型,并针对不同的变化提出了相应的更新方法,最后形成了一个需求跟踪关系的自动维护方法。
2)本发明通过相关反馈技术利用已有的跟踪关系对需求查询进行了修改,使得检索精度会更高,从而提高跟踪维护的自动化程度和效率。
附图说明
图1.基于相关反馈的跟踪关系维护方法总体流程图;
图2.使用相关反馈维护跟踪关系详细流程图。
具体实施方式
下面结合附图,对基于相关反馈的需求跟踪关系的维护过程作进一步的说明,但不构成对本发明的限制,方法的基本过程如图1所示。
从图1中可以看到,方法的输入是维护前的需求跟踪关系(基于信息检索技术建立,记为TRold)、需求规约和工作产品及其变更信息(即已经识别的增删改的变化),输出是维护后的跟踪关系。基于信息检索技术建立的需求跟踪关系包含如下含义:
1)已知变更前的需求项和工作产品项间的跟踪关系。
2)已经对需求和工作产品建立了相应的信息检索模型。例如向量空间模型下,需求项和工作产品项的文本已经有了相应的向量表示。
如图1所示,方法的基本流程是:对于输入的不同类型的变更,分别执行不同的维护策略,然后将维护后的跟踪关系呈现给用户,等待确认。具体地,对增加和修改工作产品,使用相关反馈维护跟踪关系;对于删除,则直接将和被删除工作产品相关联的跟踪关系删除。整个方法基于信息检索处理平台,主要使用了相关反馈算法和相似度计算方法。在方法中,除了用户确认需要用户的参与之外,方法的其余部分都是自动完成的。
下面结合图2详细介绍使用相关反馈技术处理工作产品增加和修改时的跟踪关系维护过程。如图2所示,对于每一个增加(或修改)工作产品项,方法分为三个步骤。
步骤1:获得相关反馈的输入信息
计算新增工作产品项wpnew与所有原有(变更前)工作产品项WPold间的相似度,并找出相似度大于设定阈值的原有工作产品,记为WpSetold。具体的分为两步,如下:
1)首先将wpnew的文本表示成向量以进行后面的相似度计算。本实例使用Tf-idf计算中标引词的权重,具体的公式是其中,n为变更后所有工作产品项的个数。
2)然后对每个原有工作产品项wpold,采用和1)中类似的方法计算其向量表示并计算间的相似度,本施例采用向量空间模型中的向量夹角余弦相似度计算方法,具体计算公式为:如果余弦值大于设定阈值,则将wpold放入WpSeold
步骤2:利用相关反馈算法扩展、修订需求项
遍历需求规约中的所有需求项r,对于每一个需求项r,做如下处理:
1)根据TRold找出WpSetold中所有与r有关系的工作产品,记为WPr∪n。这里的关系指与r存在或不存在跟踪关系,存在跟踪关系可以用作正反馈,不存在跟踪关系可以用作负反馈。
2)将r和WPr∪n作为相关反馈的输入,计算得到一需求项查询r′。如果WpSetold或者WPr∪n为空,直接将r作为一需求项查询r′。对于具体的相关反馈算法,本施例采用向量空间模型中的Standard Rochio算法,其计算公式为:
其中,WPrWPr表示存在跟踪关系的工作产品集合(即正反馈集合),WPn不存在跟踪关系的工作产品集合(即负反馈集合)。
步骤3:计算修订后需求项查询和新增工作产品间的相似度
遍历所有需求,对每一个修订后的需求项查询r′,计算r′和新增工作产品间的相似度,如果相似度大于设定的阈值,则将两者间的关联关系作为候选跟踪关系。。具体的相似度计算采用和步骤1中相同的余弦相似度计算方法。
上述实施例中既包含了对本发明方法的描述,本领域的技术人员应能理解,也包含了本发明方法的处理过程,依照本实施例,本领域的技术人员可以很容易地实现工作产品变更时的需求跟踪关系维护方法。

一种需求项与工作产品间跟踪关系维护方法.pdf_第1页
第1页 / 共9页
一种需求项与工作产品间跟踪关系维护方法.pdf_第2页
第2页 / 共9页
一种需求项与工作产品间跟踪关系维护方法.pdf_第3页
第3页 / 共9页
点击查看更多>>
资源描述

《一种需求项与工作产品间跟踪关系维护方法.pdf》由会员分享,可在线阅读,更多相关《一种需求项与工作产品间跟踪关系维护方法.pdf(9页珍藏版)》请在专利查询网上搜索。

本发明公开了一种需求项与工作产品间跟踪关系维护方法,属于计算机软件工程领域。本方法为:1)输入需求规约、变更前的跟踪关系TRold以及工作产品的变更信息;2)对于增加工作产品,找出与新增工作产品项相似度大于设定阈值h的原工作产品集合WpSetold;3)对需求规约中每一需求项r,根据TRold找出WpSetold中与该r有关系的工作产品,记为集合WPrn;4)将r与WPrn作为相关反馈算法的输入,。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1