一种基于分类的自适应网站无障碍检测任务分配方法技术领域
本发明涉及面向众包网站无障碍的任务分配方法的技术领域,特别是基于分类的
自适应众包网站无障碍检测任务分配方法。
技术背景
根据中国残疾人联合会最新统计的数据显示,截止于2010年末我国各类残疾人总
数已达8500万。随着信息化技术在全球内的迅猛发展以及网络技术的普及应用,互联网在
我们日常生活中的重要性持续上升。然而在日常生活中,残疾人由于自身缺陷在获取和利
用互联网信息等方面存在较大的困难,而且大部分网站对于残疾人而言是有障碍的。
为了让残疾人在使用互联网的过程中减少障碍、拥有更好的体验,我们需要建立
一种机制来对一个网站的无障碍程度进行评估,并根据网站的无障碍程度给出改进建议供
网站建设者参考。到目前为止,网站无障碍检测还无法完全实现机器自动检测,在实际检测
中存在相当一部分检测工作仍需要人工的干预。
群体智慧在网站无障碍检测中可以更好地被利用,让人数众多的检测人员来完成
网站检测的任务。然而,由于检测人员具备不同的专业技能知识和生活文化背景,检测质量
无法得到保证,而且在不同规则下不同检测人员的检测质量也会不相同。如果只是随机地
把检测任务分配给检测人员,对于同一检测任务会存在较多检测结果冲突以至需要引入更
多检测人员从而导致效率低下,影响整个网站无障碍检测系统的实用性。
正因为如此,为了更好地提升无障碍检测系统的检测质量与准确率,我们需要使
用一种更高效的任务分配方法来对网站无障碍检测的任务进行分配。
发明内容
为了克服现有技术的上述问题,提升无障碍检测系统的检测质量,本发明提出了
一种基于分类的自适应众包网站无障碍检测任务分配方法。
本发明是基于这样的一个认识:相同的检测规则下的检测任务考察的检测内容是
相同的,相似的检测规则下的检测任务考察的检测内容也是相近的。如果一个检测人员对
某一条检测规则的检测任务具有较高的准确率,就认为该检测人员对该检测规则下的或者
与该检测规则高度相似的检测任务也有较高的准确率,那就优先将这类检测任务分配给检
测人员。
本发明所述的一种基于分类的自适应众包网站无障碍检测任务分配方法,当检测
人员需要申请新的检测任务时,按以下的操作选取检测任务进行分配:
1)根据检测任务对应的检测规则为检测任务分类,并计算每一检测类别与其它检
测类别相似度;
2)基于检测类别,利用检测人员已完成任务的数据统计检测人员在每一类别下的
准确率,以此来预测该检测人员在不同类别下未完成任务的准确率。当检测人员提交检测
结果时,预测的准确率会发生变化;
3)基于不同检测类别下预测的准确率和不同检测类别之间的相似度对检测任务
进行自适应分配。
进一步,步骤1)中所述的为检测任务分类和计算检测类别之间的相似度,具体步
骤如下:
11)、对于每一条检测任务,提取出它的检测规则,并按检测规则的不同将该任务
划分为不同的类别;
12)、对于上面得到的每一条检测类别,计算该检测类别与其它类别之间的相似
度,从而得到每一个检测类别的相似度向量[s0,s1,s2,s3,...,sn],向量中的每一项表示
当前检测类别与其它类别的相似度。对于任意两个检测任务类别,可能是完全不相关的。
步骤2)中所述的准确率预测,具体步骤如下:
21)、利用检测人员已完成任务的数据统计检测人员在每一类别下的准确率,从而
得到该检测人员的历史准确率向量[p0,p1,p2,p3,...,pn],其中pi表示该检测人员在检测类
别i下的准确率;
22)、为了避免只给检测人员分配其擅长的检测任务,对上一步骤得到的历史准确
率向量中的每一个分量加上一个随机噪音,然后再对该向量按准确率由大到小排序;
23)、利用检测类别之间的相似度构建相似度图G。每一个检测类别对应于图中的
一个顶点,两个类别之间的相似度作为其对应结点之间边的权重。
步骤3)中所述的自适应任务分配,具体步骤如下:
31)、获取未完成的任务集合,即获取分配次数没有达到指定次数的所有任务列
表。在网站无障碍检测中,为保证检测的准确性,一条任务会分配给多个人检测。按检测规
则对未完成的任务集合进行分类,分类方法和前面提到的一致;
32)、根据该检测人员历史准确率向量[p0,p1,p2,p3,...,pn]和检测类别相似度图
G,按以下步骤进行任务分配:
a、顺序取出历史准确率向量中的某一项pi,其对应的检测类别为ci。查看检测类别
ci下有没有未完成的检测任务。如果存在未完成的检测任务,直接分配给该检测人员。否则
进行步骤b;
b、相似度图G中找到ci顶点,进而找到与ci相似的检测任务类别列表l0,l1,l2,
l3,...,ld。如果该列表为空,则进行步骤a继续取该检测人员历史准确率向量中的下一项,
否则进行步骤c;
c、遍历与ci相似的检测任务类别列表l0,l1,l2,l3,...,ld。对于其中的每一项,查
看该类别下有没有未完成的检测任务,如果存在未完成的检测任务,直接分配给该检测人
员;
d、重复步骤a、步骤b和步骤c,直到找到一条未完成的检测任务为止。
该发明的优点在于:自适应的任务分配方法考虑到了众包网站无障碍检测系统中
同一检测规则检测内容的一致性和相似检测规则检测内容的相似性,并根据检测任务的类
别使用检测人员在某一类别下已完成的任务的准确率来预测该类别下未完成任务的准确
率,再根据预测的准确率给检测人员分配其所擅长的任务,从而提高了无障碍检测系统的
检测质量和准确程度。
附图说明
图1是本发明的方法流程图。
具体实施方式
参照附图,进一步说明本发明:
一种基于分类的自适应众包网站无障碍检测任务分配方法,当检测人员需要申请
新的检测任务时,按以下的操作选取检测任务进行分配:
1)根据检测任务对应的检测规则为检测任务分类,并计算每一检测类别与其它检
测类别相似度;
2)基于检测类别,利用检测人员已完成任务的数据统计检测人员在每一类别下的
准确率,以此来预测该检测人员在不同类别下未完成任务的准确率。当检测人员提交检测
结果时,预测的准确率会发生变化;
3)基于不同检测类别下预测的准确率和不同检测类别之间的相似度对检测任务
进行自适应分配。
步骤1)中所述的为检测任务分类和计算检测类别之间的相似度,具体步骤如下:
11)、对于每一条检测任务,提取出它的检测规则,并按检测规则的不同将该任务
划分为不同的类别;
12)、对于上面得到的每一条检测类别,计算该检测类别与其它类别之间的相似
度,从而得到每一个检测类别的相似度向量[s0,s1,s2,s3,...,sn],向量中的每一项表示当
前检测类别与其它类别的相似度。对于任意两个检测任务类别,可能是完全不相关的。
步骤2)中所述的准确率预测,具体步骤如下:
21)、利用检测人员已完成任务的数据统计检测人员在每一类别下的准确率,从而
得到该检测人员的历史准确率向量[p0,p1,p2,p3,...,pn],其中pi表示该检测人员在检测类
别i下的准确率;
22)、为了避免只给检测人员分配其擅长的检测任务,对上一步骤得到的历史准确
率向量中的每一个分量加上一个随机噪音,然后再对该向量按准确率由大到小排序;
23)、利用检测类别之间的相似度构建相似度图G。每一个检测类别对应于图中的
一个顶点,两个类别之间的相似度作为其对应结点之间边的权重。
步骤3)中所述的自适应任务分配,具体步骤如下:
31)、获取未完成的任务集合,即获取分配次数没有达到指定次数的所有任务列
表。在网站无障碍检测中,为保证检测的准确性,一条任务会分配给多个人检测。按检测规
则对未完成的任务集合进行分类,分类方法和前面提到的一致;
32)、根据该检测人员历史准确率向量[p0,p1,p2,p3,...,pn]和检测类别相似度图
G,按以下步骤进行任务分配:
a、顺序取出历史准确率向量中的某一项pi,其对应的检测类别为ci。查看检测类别
ci下有没有未完成的检测任务。如果存在未完成的检测任务,直接分配给该检测人员。否则
进行步骤b;
b、相似度图G中找到ci顶点,进而找到与ci相似的检测任务类别列表l0,l1,l2,
l3,...,ld。如果该列表为空,则进行步骤a继续取该检测人员历史准确率向量中的下一项,
否则进行步骤c;
c、遍历与ci相似的检测任务类别列表l0,l1,l2,l3,...,ld。对于其中的每一项,查
看该类别下有没有未完成的检测任务,如果存在未完成的检测任务,直接分配给该检测人
员;
d、重复步骤a、步骤b和步骤c,直到找到一条未完成的检测任务为止。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护
范围的不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技
术人员根据本发明构思所能够想到的等同技术手段。