优化译员的检索方法.pdf

上传人:54 文档编号:4758475 上传时间:2018-11-07 格式:PDF 页数:15 大小:1,000.19KB
返回 下载 相关 举报
摘要
申请专利号:

CN201210594784.6

申请日:

2012.12.31

公开号:

CN103064970A

公开日:

2013.04.24

当前法律状态:

授权

有效性:

有权

法律详情:

专利权人的姓名或者名称、地址的变更IPC(主分类):G06F 17/30变更事项:专利权人变更前:武汉传神信息技术有限公司变更后:语联网(武汉)信息技术有限公司变更事项:地址变更前:430073 湖北省武汉市东湖开发区光谷软件园一期以西、南湖南路以南、光谷软件园六期2幢5层205号变更后:430070 湖北省武汉市东湖开发区光谷软件园一期以西、南湖南路以南、光谷软件园六期2幢5层205号|||著录事项变更IPC(主分类):G06F 17/30变更事项:发明人变更前:江潮变更后:江潮 张芃 王杰|||授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20121231|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

武汉传神信息技术有限公司

发明人:

江潮

地址:

430073 湖北省武汉市东湖开发区光谷软件园一期以西南湖南路以南光谷软件园六期2幢5层205号

优先权:

专利代理机构:

代理人:

PDF下载: PDF下载
内容摘要

本发明提供了一种优化译员的检索方法,拆分待译稿件,对拆分的后的每个稿件碎片分类;根据每个所述稿件碎片的属性,从符合相应分类的译员库中选择相应的译员。通过对译稿进行碎片化,将碎片后的片段的属性,找到相匹配的译员,提高了译员的查找效率,减少了主观性。由于译员基因属性包含了语种、行业、学科、领域等的翻译能力,以及信用度、完成任务及时度、质量波动情况、对某类(个)客户的熟悉度等其他因素,而稿件碎片的基因属性则包括语种、行业、学科、难度、翻译要求等,将这些基因带入到基因匹配模型中匹配,得出哪些译员适合翻译并有适合度的排序。对于解决翻译效率、质量等问题具有非常现实的作用,对翻译行业的大规模产业化生产也具有重要意义。

权利要求书

权利要求书一种优化译员的检索方法,其特征在于,包括:
拆分待译稿件,对拆分的后的每个稿件碎片分类;
根据每个所述稿件碎片的属性,从符合相应分类的译员库中选择相应的译员。
根据权利要求1所述的方法,其特征在于,包括:所述拆分、所述分类的过程包括:
提取译稿每段的各个关键词,建立每个段落与其包含的各个关键词的对应关系;
将所述译稿的各个关键词逐个在术语语料库中匹配,将每个关键词匹配的术语的行业类别属性,作为该关键词所对应的每个段所归属的行业类别属性;
根据所述对应关系,确定每个段包含相同的最多的行业类别属性;
将最多的行业类别属性对该段分类。
根据权利要求2所述的方法,其特征在于,判断所述译稿内的每段的词数;
如果所述词数小于阈值,则与相邻的下一段合并作为新的一段;
直到所述新的一段的词数大于阈值。
根据权利要求1所述的方法,其特征在于,为所述分类后的碎片选择译员的过程包括:
读取分类后碎片的稿件的各个属性,筛选出满足全部属性要求的译员;
读取所述筛选出的译员ID,对每个译员的译后稿件与标准译稿进行相似性分析,确定每个译员的翻译能力的量化值;
确定为每个译员设定的合适度值;
将每个译员的量化值、合适度值的和进行排序,选择出分值最高的译员。
根据权利要求4所述的方法,其特征在于,所述待译稿件的各个属性至少包括之一:
翻译价格、退稿率、翻译需求、专项稿件。
所述筛选的过程包括:
确定该译员的状态为接案状态后,读取该译员的与所述待译稿件相同的属性;
至少执行以下之一的属性筛选:
如果所述译员的翻译价格属性的值在所述待译稿件的翻译价格属性的上下限阀值之间,则认为符合属性要求;
如果所述译员的退稿率属性的值小于所述待译稿件的退稿率属性的值,则认为符合属性要求;
如果所述译员的翻译需求属性的内容包含所述待译稿件的翻译需求属性的内容,则认为符合属性要求;
如果所述译员的专项稿件的能力属性符合所述待译稿件的专项稿件属性的内容,则认为符合属性要求。
根据权利要求4所述的方法,其特征在于,所述合适度的计算项至少包括以下之一:
退稿率、及时交稿率、稿件可用率、翻译性价比、合作次数、低级失误;其中,每一项对应一个介于0~100之间的数值。
所述确定合适度值的过程包括:
设定多个合适度计算项的权重;
将每个合适度计算项与其对应的权重相乘,将所述多个合适度计算项的乘积的和作为所述和适度值;
将每个译员的量化值、合适度值的和进行排序,选择出分值最高的译员。
根据权利要求4所述的方法,其特征在于,所述相似性分析的过程包括:
提取每篇译后稿件和与其对应的测试文档库中的标准译稿集合的关键词;该关键词的集合为C={k1,k2,…,km};
计算C中每个关键词k在稿件中出现的概率,即出现关键词k的稿件数和稿件总数之比,记为p(k);
将C中关键词按p(k)进行降序排序,并将每一个关键词作为一个集合,这样得到初始的m个待合并集合,记为{k1},{k2},…,{km};
在这m个关键词中,计算在关键词ki出现的稿件中关键词kj出现的概率,记为p(kj|ki),共计个条件概率,(1≤i,j≤m;i≠j);p(kj|ki)=p(kjki)/p(ki),p(kjki)为kj和ki同时出现在同一篇稿件中的概率;
合并待合并集合,生成以关键词集合C为根节点的关键词概念树。
根据权利要求7所述的方法,其特征在于,所述合并过程包括:
对于待合并的两个关键词集合C1和C2,合并条件为:存在ki属于C1,kj属于C2,且p(ki)>阀值P1,p(kj|ki)>阀值P2,当p(ki)和p(kj|ki)大于所述设定阀值时,关键词ki和kj表达相同概念,满足其所在的集合的合并条件之一;
在合并后的集合中任给一个关键词ki,其与集合中一半以上关键词都满足条件p(kj|ki)>阀值P2。
根据权利要求8所述的方法,定义H为生成的概念树的高度,定义depth(k)为节点k在树中的深度,即为从根节点到该节点所经历的边数;
定义com(ki,kj)为离节点ki和kj最近的共同父节点;
任两个关键词的积的计算公式:ki×kj=depth(com(ki,kj))/H;
设向量A={a1,a2,…,an},B={b1,b2,…,bn},定义向量计算:<mrow><MI>A</MI><MO>*</MO><MI>B</MI><MO>=</MO></MROW><MROW><MUNDEROVER><MI>Σ</MI><MROW><MI>i</MI><MO>=</MO><MN>1</MN></MROW><MI>n</MI></MUNDEROVER><MUNDEROVER><MI>Σ</MI><MROW><MI>j</MI><MO>=</MO><MN>1</MN></MROW><MI>n</MI></MUNDEROVER><MROW><MO>(</MO><MSUB><MI>a</MI><MI>i</MI></MSUB><MO>×</MO><MSUB><MI>b</MI><MI>j</MI></MSUB><MO>)</MO></MROW><MO>;</MO></MROW>]]&gt;</MATH></MATHS>所述A和B中的一个为待译译稿,另一个为相应的标准译稿;<BR>相似度计算公式为:<MATHS id=cmaths0002 num="0002"><MATH><![CDATA[<mrow><MROW><MO>(</MO><MI>A</MI><MO>,</MO><MI>B</MI><MO>)</MO></MROW><MO>=</MO><MFRAC><MROW><MI>A</MI><MO>*</MO><MI>B</MI></MROW><MROW><MSQRT><MI>A</MI><MO>*</MO><MI>B</MI></MSQRT><MSQRT><MI>A</MI><MO>*</MO><MI>B</MI></MSQRT></MROW></MFRAC><MO>.</MO></MROW>]]&gt;</MATH></MATHS><BR>根据权利要求9所述的方法,其特征在于,确定所述量化值的过程包括:<BR>根据每篇测试稿件的专业术语的数量,确定该每篇测试稿件的权重基值;其中,所述测试稿件经过翻译后得到所述译后稿件;<BR>通过所述权重基值、所述测试稿件的翻译难度系数、和译员的翻译速度系数确定出每件测试稿件所占的权重;<BR>将上述所得的权重值结合译后稿件与标准译稿的相似度值得到一个0~100之间的数值,将该数值作为所述量化值。</p></div> </div> </div> <div class="zlzy"> <div class="zltitle">说明书</div> <div class="gdyy"> <div class="gdyy_show"><p>说明书优化译员的检索方法 <BR>技术领域 <BR>本发明涉及计算机领域,具体而言,涉及一种优化译员的检索方法。 <BR>背景技术 <BR>信息时代和网络化使翻译工作方式发生了很大的变化。利用翻译流程管理平台,根据不同对象储存人才资料。有翻译任务时,可以根据翻译项目的语种、文章类型、专业领域以及客户对翻译质量和时限的要求,调用最合适的翻译和审校人员,组成项目组进行翻译,从而提高翻译效率、节省翻译费用、确保译文质量、优化项目管理。 <BR>目前的辅助翻译及管理平台对译员和译稿的匹配,一般还是通过人工或半人工的方式来完成,往往需通过更高级别的译员(比如审校)来判别译员的翻译能力和对译稿的合适度。这样不但主观性强,且采用人工选择译员,效率低下。 <BR>发明内容 <BR>本发明旨在提供一种优化译员的检索方法,以解决上述采用人工选择译员,效率低下的问题。 <BR>在本发明的实施例中,提供了一种优化译员的检索方法,包括: <BR>拆分待译稿件,对拆分的后的每个稿件碎片分类; <BR>根据每个所述稿件碎片的属性,从符合相应分类的译员库中选择相应的译员。 <BR>实施例的步骤,通过对译稿进行碎片化,将碎片后的片段的属性,找到相匹配的译员,提高了译员的查找效率,减少了主观性。 <BR>附图说明 <BR>此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中: <BR>图1示出了实施例的流程图; <BR>图2示出了实施例的方法采用的系统框架结构图; <BR>图3示出了实施例中进行相似度分析的模块架构; <BR>图4示出了实施例中关键词的树形结构图。 <BR>具体实施方式 <BR>下面将参考附图并结合实施例,来详细说明本发明。实施例的步骤包括: <BR>S1:拆分待译稿件,对拆分的后的每个稿件碎片分类; <BR>S2:根据每个所述稿件碎片的属性,从符合相应分类的译员库中选择相应的译员。 <BR>实施例的步骤,通过对译稿进行碎片化,将碎片后的片段的属性,找到相匹配的译员,提高了译员的查找效率,减少了主观性。 <BR>上述步骤S1,通过以下子步骤实现,包括: <BR>S11:提取译稿每段的各个关键词,建立每个段落与其包含的各个关键词的对应关系; <BR>S12:将所述译稿的各个关键词逐个在术语语料库中匹配,将每个关键词匹配的术语的行业类别属性,作为该关键词在其对应的每个段所归属的行业类别属性; <BR>S13:根据所述对应关系,确定每个段包含相同的最多的行业类别属性; <BR>S14:将最多的行业类别属性对该段分类。 <BR>由于待译文稿的词语数要远小于术语语料库的词语数,经过分词处理后的词语数量还要大为减少;而且术语语料库具备按字母顺序查找的功能,在其中进行关键词匹配不需要采用模式匹配算法,可以极大的减少查询时间。缩短对译稿分类的时间,提高分类效率。 <BR>优选地,参见图2,由系统中的分词处理模块提取关键词,包括: <BR>对译稿进行分词处理,去除停用词和不表示具体概念的词语,得到分词后的关键词集合。 <BR>优选地,在实施例中,计算每个词语在文稿中的出现次数即词频,记录每个词语的段落属性,即其所属的段落号; <BR>建立待译文档的关键词列表,列表项包括:词语、词频、词语在段落属性、列表如表1所示: <BR>表1 <BR></TABLES> <BR>优选地,记录的词频,可用于在确定每个段落的包含相同的最多的行业类别属性的过程中,通过该段落的关键词的词频做乘积运算即可,例如,A段落的关键词B所匹配的术语属于C行业;关键词B在A段落中的词频是5,则A段落包括的C行业类别属性为5个。 <BR>参见图2,采用关键词匹配模块,以关键词列表中的词语作为匹配项在术语语料库中进行查询,若匹配则该词语为待译文稿的术语,记录该术语在术语语料库中对应的行业和学科领域信息,所有词语匹配完成后,得到该文稿中的术语列表,如表2所示: <BR>表2 <BR></TABLES> <BR>优选地,译稿内的有些段的词数较少,可将多个段作为一段,具体步骤如下: <BR>S21:判断所述译稿内的每段的词数; <BR>S22:如果所述词数小于阈值,则与相邻的下一段合并作为新的一段; <BR>S23:直到所述新的一段的词数大于阈值。 <BR>阈值可根据实际情况设置,例如,设置为100词或200词等。通过上述步骤,可将少于阈值的多个段归类为一段。这样,由于段数缩减,可减少对段的操作,提高分类效率。 <BR>优选地,为便于后续对每个段进行处理,可为每个段落建立ID;同时建立属于同一个行业类别属性的多个段落的ID的集合,得到多个集合。 <BR>经过上述过程,将稿件实现了碎片化,分成各个段落,每个段落对应一个行业类别的属性,根据该属性可找到相应行业类别属性的译员的集合,通过译稿的整体属性,可在译员库中找到合适的译员,图1中的S2的步骤如下: <BR>S31:读取待译稿件的各个属性,筛选出满足全部属性要求的译员; <BR>S32:读取所述筛选出的译员ID,对每个译员的译后稿件与标准译稿进行相似性分析,确定每个译员的翻译能力的量化值; <BR>S33:确定每个译员设定的合适度值; <BR>S34:将每个译员的量化值、合适度值的和进行排序,选择出分值最高的译员。 <BR>优选地,实施例中,每个译员对应该译员基因属性,包含了语种、行业、学科、领域等的翻译能力,以及信用度、完成任务及时度、质量波动情况、对某种稿件类型的熟悉度、对某类(个)客户的熟悉度等其他因素;而待译稿件的稿件碎片的基因属性则包括语种、行业、学科、难度、翻译要求等。通过将这些基因属性量化并带入到一个合适的匹配模型中进行匹配,从而得出某个稿件碎片适合哪些译员翻译并且给出适合度的排序。 <BR>可按照三层匹配模型找到译员,第一层为过滤项,该层首先确定一些基本的开关项,不符合这些项的译员被滤掉,符合的译员进入下一层匹配; <BR>第二层为翻译能力项,该层通过译稿的基因属性来计算译员相应语种、行业、学科、领域的翻译能力,其值为一个0~100的数值; <BR>第三层合适度计算项,系统根据译员的基因属性及属性的权重计算出译员翻译该译稿的合适度。 <BR>第一层的匹配过程包括:读取待译稿件的各个属性,筛选出满足全部属性要求的译员; <BR>确定该译员的状态为接案状态后,读取该译员的与所述待译稿件相同的属性;属性至少包括之一:包括翻译价格、是否接任务、退稿率、是否翻译需求方、专项稿件能力。 <BR>至少执行以下之一的属性筛选: <BR>如果所述译员的翻译价格属性的值在所述待译稿件的翻译价格属性的上下限阀值之间,则认为符合属性要求; <BR>如果所述译员的退稿率属性的值小于所述待译稿件的退稿率属性的值,则认为符合属性要求; <BR>如果所述译员的翻译需求属性的内容包含所述待译稿件的翻译需求属性的内容,则认为符合属性要求; <BR>如果所述译员的专项稿件属性能力符合所述待译稿件的专项稿件属性的内容,则认为符合属性要求。 <BR>例如:判别该译员翻译价格是否超过给定译稿的翻译价格阀值,不超过为1,否则为0该译员被过滤掉。 <BR>是否接任务:判断若该译员是否处于暂不接任务状态,接任务为1,不接任务为0该译员被过滤掉。 <BR>退稿率:若译员退稿率不大于50%,按其值的大小归入到合适度项目计算,否则其值为0直接过滤掉。 <BR>是否翻译需求方:若翻译甲方有指定的翻译要求,按其要求判断译员是否符合要求,符合为1,否则为0该译员被过滤掉。 <BR>专项稿件能力:若待译稿件为某类专门稿件,如简历、公证书、法律文书或其他有专门格式和体裁文书,则要求译员具备相关的文书翻译能力,具备为1,否则为0该译员被过滤掉。 <BR>在第一层匹配之后,通过第二层的译稿的基因属性来计算译员相应语种、行业、学科、领域的翻译能力,其值为一个0~100的数值。按照图3所示的模块结构量化,该方法的流程过程如下: <BR>提取测试稿件 <BR>一篇中到英的有关汽车发动机制造的测试稿件,其语种信息、行业信息和学科领域信息为: <BR>语种信息:中→英 <BR>行业信息:37交通运输设备制造业 <BR>372汽车制造 <BR>3721汽车整车制造 <BR>学科领域信息:470动力与电气工程 <BR>470.30动力机械工程 <BR>470.3020内燃机工程(包括汽油机、柴油机、气体燃料发动机等) <BR>对译员能力进行判断,如果已经经过判定,则进入译员能力选择/比较模块,如果没有经过判定,则进行翻译能力测试系统登陆模块。 <BR>译员登录平台申请领取测试稿件。系统读取测试稿件的语种、行业、学科、领域等属性信息,若译员具备该属性能力,则进入译员能力比较/选择模块;否则分配测试许可号给该译员进行该专业属性能力的翻译测试; <BR>申领译员凭测试许可号登录翻译能力测试系统,进行该语种、行业、学科、领域的翻译能力测试; <BR>系统根据测试许可号,从标准测试文档库中提取7篇相关测试文档给待测译员,包括语种类文档1篇,行业类文档3篇(37、372、3721),学科领域类文档3篇(470、470.30、470.3020),其难度系数分别为:9、6、8、8、7、8、7,排列顺序为语种、行业‑交通运输设备制造业(37)、行业‑交通运输设备制造业‑汽车制造(372)、行业‑交通运输设备制造业‑汽车制造‑汽车整车制造(3721)、学科领域信息‑动力与电气工程(470)、学科领域信息‑动力与电气工程‑动力机械工程(470.30)、学科领域信息‑动力与电气工程‑动力机械工程‑内燃机工程(470.3020),后面的数字顺序与此相同; <BR>译员翻译完成后,根据翻译时间得到7篇译文的翻译速度档位值分别为:6、8、7、6、6、7、7,然后调用相似性比较模块计算译员的译文和标准译文的相似度,得到7篇译文和标准译文的相似度值,分别为:0.6、0.65、0.79、0.83、0.77、0.82、0.85; <BR>优选地,稿件相似性比较模块进行分析的过程包括: <BR>S41:提取每篇译后稿件和与其对应的标准译稿所归属的属于一个专业的多篇标准译稿的全部关键词,得到关键词集合C={k1,k2,…,km}; <BR>S42:计算C中每个关键词k在稿件集合中出现的概率,即出现关键词k的稿件数和稿件总数之比,记为p(k)。 <BR>将关键词按p(k)进行降序排序,并将每一个关键词作为一个集合,这样得到初始的m个待合并集合,记为{k1},{k2},…,{km}; <BR>在这m个关键词中,计算在关键词ki出现的稿件中,关键词kj也出现的概率,记为p(kj|ki),共计个条件概率,(1≤i,j≤m;i≠j); <BR>p(kj|ki)的计算方法:p(kj|ki)=p(kjki)/p(ki),p(kjki)为kj、ki同时出现在同一篇稿件中的概率。 <BR>S43:合并集合,当集合I和J同时满足以下两个条件时合并: <BR>(ki∈I,kj∈J,ki≠kj)满足p(ki)&gt;P1,p(kj|ki)&gt;P2; <BR>(ki∈I∪J)满足|{ki∈I∪J|p(kj|ki)&gt;P2}|&gt;(|I|+|J|)/2。(|X|表示集合X中元素的个数) <BR>当任两个集合都不符合这两个条件的时合并结束,同时得到第一层聚类关键词集合C={C1,C2,…,Cq}。 <BR>对C={C1,C2,…,Cq},取阈值P3&lt;P2,用上述方法再次进行聚类,生成上一层概念集合。重复此过程,直到聚类集合无法再聚类为止,这些无法再聚类的概念集合为根节点C的子节点,这样就生成如图4所示的关键词的概念树。 <BR>S44:根据概率形成的树形结构,计算两篇文档的相似度。 <BR>相似度<MATHS num="0001"><MATH><![CDATA[ <mrow> <MI>Sim</MI> <MROW><MO>(</MO> <MI>A</MI> <MO>,</MO> <MI>B</MI> <MO>)</MO> </MROW><MO>=</MO> <MFRAC><MROW><MI>A</MI> <MO>*</MO> <MI>B</MI> </MROW><MROW><MSQRT><MI>A</MI> <MO>*</MO> <MI>B</MI> </MSQRT><MSQRT><MI>A</MI> <MO>*</MO> <MI>B</MI> </MSQRT></MROW></MFRAC><MO>.</MO> </MROW>]]&gt;</MATH></MATHS> <BR>A={a1,a2,…,an},B={b1,b2,…,bn},A、B分别为每个稿件内对应的关键词的集合,a1为A稿件的第一个关键词,b1为B稿件的第一个关键词。 <BR>根据概念树中,每个关键词的概率在概念树的节点位置,确定译后稿件和标准译稿的任意两个关键词的乘积的总和C;其中 <BR><MATHS num="0002"><MATH><![CDATA[ <mrow><MI>C</MI> <MO>=</MO> <MI>A</MI> <MO>*</MO> <MI>B</MI> <MO>=</MO> <MUNDEROVER><MI>Σ</MI> <MROW><MI>i</MI> <MO>=</MO> <MN>1</MN> </MROW><MI>n</MI> </MUNDEROVER><MUNDEROVER><MI>Σ</MI> <MROW><MI>j</MI> <MO>=</MO> <MN>1</MN> </MROW><MI>n</MI> </MUNDEROVER><MROW><MO>(</MO> <MSUB><MI>a</MI> <MI>i</MI> </MSUB><MO>×</MO> <MSUB><MI>b</MI> <MI>j</MI> </MSUB><MO>)</MO> </MROW><MO>;</MO> </MROW>]]&gt;</MATH></MATHS> <BR>ai×bj为两个关键词的乘积,该关键词的乘积为:根据任意两个叶子节点与其距离最近的父节点的路径长度,与树的深度路径长度的比值,作为这两个叶子节点的乘积;ai×bj=depth(com(ai,bj))/H,其中,H为树的路径深度。 <BR>得到相似度的值之后,提取每篇测试稿件内的关键词,与术语语料库进行匹配,确定每篇稿件的术语数量,作为计算稿件权重的基值; <BR>通过所述基值、所述测试稿件的翻译难度系数、和译员的翻译速度系数确定出每件测试稿件所占的权重; <BR>将上述所得的权重值结合译后稿件与标准译稿的相似度值得到一个0~100之间的数值,将该数值作为该译员在该专业的翻译能力分值。为该译员的翻译能力量化值。 <BR>例如: <BR>7篇译文的权重计算:根据术语语料库计算6篇行业类和学科领域类文档的相关专业术语的数量,得到6篇文档的专业术语的数量分别为7、23、28、20、33、31,将这6个数值作为计算权重的基值,因为语种类文档基本没有专业术语,可以取这6个数的算术平均值23.7作为语种类的权重基值,这样得到计算7篇译文权重的基值集合{23.7,7,23,28,20,33,31}; <BR>将该权重集合的值对应乘以这7篇文档的难度系数{9,6,8,8,7,8,7}和翻译速度档位值{6,8,7,6,6,7,7},得到集合{1279.7,336,1288,1344,840,1848,1519},对该集合做归一化处理即得到这7篇文章的权重值集合{0.15136,0.03974,0.15234,0.15896,0.09935,0.21858,0.17966}。 <BR>译员专业翻译能力分值计算:以相似度值集合{0.6,0.65,0.79,0.83,0.77,0.82,0.85}与权重集合{0.15136,0.03974,0.15234,0.15896,0.09935,0.21858,0.17966}对应相乘,得到集合{0.09082,0.02583,0.12035,0.13194,0.0765,0.17924,0.15271},将该集合的值相加再乘以100就得到译员在该语种、行业、学科、领域属性的翻译能力分值77.739分。 <BR>通过第三层合适度计算项,系统根据译员的基因属性及属性的权重计算出译员翻译该译稿的合适度的值。 <BR>合适度计算项包括:退稿率、及时交稿率、稿件可用率、翻译性价比、合作次数、低级错误、是否签约。 <BR>其中每个项都一个介于0~100之间的数值,具体计算方法见一下的详述,其中各项所占权重如下表: <BR>表3 <BR><TGROUP cols="2"><COLSPEC colwidth="49%" colname="c001" /><COLSPEC colwidth="51%" colname="c002" /><ROW><ENTRY morerows="1">合适度计算项</ENTRY><ENTRY morerows="1">权重</ENTRY></ROW><ROW><ENTRY morerows="1">退稿率</ENTRY><ENTRY morerows="1">0.15</ENTRY></ROW><ROW><ENTRY morerows="1">及时交稿率</ENTRY><ENTRY morerows="1">0.15</ENTRY></ROW><ROW><ENTRY morerows="1">稿件可用率</ENTRY><ENTRY morerows="1">0.30</ENTRY></ROW><ROW><ENTRY morerows="1">翻译性价比</ENTRY><ENTRY morerows="1">0.10</ENTRY></ROW><ROW><ENTRY morerows="1">合作次数</ENTRY><ENTRY morerows="1">0.15</ENTRY></ROW><ROW><ENTRY morerows="1">低级失误</ENTRY><ENTRY morerows="1">0.15</ENTRY></ROW><ROW><ENTRY morerows="1">是否签约</ENTRY><ENTRY morerows="1"></ENTRY></ROW></TGROUP></TABLES><BR>退稿率:当退稿率不大于50%时,进入合适度计算项,(1‑退稿率)×100作为其计算分值。 <BR>及时交稿率:及时交稿率×100作为其计算分值。 <BR>稿件可用率:稿件可用率×100作为其计算分值。 <BR>翻译性价比:该译稿的标准翻译价格/译员的翻译价格,根据其值的大小转换成0~100之间的数值作为其计算分值,转换表如下: <BR>表4 <BR><TGROUP cols="4"><COLSPEC colwidth="14%" colname="c001" /><COLSPEC colwidth="16%" colname="c002" /><COLSPEC colwidth="49%" colname="c003" /><COLSPEC colwidth="21%" colname="c004" /><ROW><ENTRY morerows="1">性价比</ENTRY><ENTRY morerows="1">不大于0.5</ENTRY><ENTRY morerows="1">0.5~2</ENTRY><ENTRY morerows="1">不小于2</ENTRY></ROW><ROW><ENTRY morerows="1">档位分值</ENTRY><ENTRY morerows="1">0</ENTRY><ENTRY morerows="1">0.5~2之间每隔0.015,档位值加1</ENTRY><ENTRY morerows="1">100</ENTRY></ROW></TGROUP></TABLES><BR>合作次数:按译员和公司的成功合作次数计算档位分值表如下: <BR>表5 <BR><TGROUP cols="6"><COLSPEC colwidth="18%" colname="c001" /><COLSPEC colwidth="12%" colname="c002" /><COLSPEC colwidth="19%" colname="c003" /><COLSPEC colwidth="18%" colname="c004" /><COLSPEC colwidth="13%" colname="c005" /><COLSPEC colwidth="20%" colname="c006" /><ROW><ENTRY morerows="1">合作次数</ENTRY><ENTRY morerows="1">0次</ENTRY><ENTRY morerows="1">1~3次</ENTRY><ENTRY morerows="1">4~10次</ENTRY><ENTRY morerows="1">11~20</ENTRY><ENTRY morerows="1">大于20</ENTRY></ROW><ROW><ENTRY morerows="1">档位分值</ENTRY><ENTRY morerows="1">30</ENTRY><ENTRY morerows="1">60</ENTRY><ENTRY morerows="1">80</ENTRY><ENTRY morerows="1">90</ENTRY><ENTRY morerows="1">100</ENTRY></ROW></TGROUP></TABLES><BR>低级错误:低级错误在一定程度上反映了译员翻译的责任心和翻译态度,根据译员的低级错误次数设定相应的档位分值表如下: <BR>表6 <BR><TGROUP cols="7"><COLSPEC colwidth="21%" colname="c001" /><COLSPEC colwidth="7%" colname="c002" /><COLSPEC colwidth="12%" colname="c003" /><COLSPEC colwidth="16%" colname="c004" /><COLSPEC colwidth="11%" colname="c005" /><COLSPEC colwidth="12%" colname="c006" /><COLSPEC colwidth="21%" colname="c007" /><ROW><ENTRY morerows="1">低级错误次数</ENTRY><ENTRY morerows="1">0次</ENTRY><ENTRY morerows="1">1~5次</ENTRY><ENTRY morerows="1">5~10次</ENTRY><ENTRY morerows="1">11~20</ENTRY><ENTRY morerows="1">20~40</ENTRY><ENTRY morerows="1">大于40次</ENTRY></ROW><ROW><ENTRY morerows="1">档位分值</ENTRY><ENTRY morerows="1">100</ENTRY><ENTRY morerows="1">80</ENTRY><ENTRY morerows="1">60</ENTRY><ENTRY morerows="1">40</ENTRY><ENTRY morerows="1">20</ENTRY><ENTRY morerows="1">0</ENTRY></ROW></TGROUP></TABLES><BR>是否签约:签约译员合适度分值加10分。 <BR>将每个合适度计算项与其对应的权重相乘,将所述多个合适度计算项的乘积的和作为所述和适度值。 <BR>最后,将每个译员的量化值、合适度值的和进行排序,选择出分值最高的译员。 <BR>下面通过具体的一篇待译文稿详细说明。 <BR>该待译文稿的属性信息如下:翻译价格为标准翻译价格、翻译需求无特殊要求、非专项稿件。其语种属性为中到英,所属行业为汽车行业,学科领域信息为机械——发动机。各个译员的属性信息与译稿的属性信息匹配程度如表7所示: <BR>表7 <BR></TABLES> <BR></TABLES> <BR>经过滤项过滤和计算译员的翻译能力分值后得到下表8所示: <BR>表8 <BR></TABLES> <BR>计算后:TR001、TR002、TR003、TR006的合适度得分分别为以下表9所示:84.3,87.3,85.8,76.8。 <BR>表9 <BR><TGROUP cols="4"><COLSPEC colwidth="24%" colname="c001" /><COLSPEC colwidth="24%" colname="c002" /><COLSPEC colwidth="24%" colname="c003" /><COLSPEC colwidth="28%" colname="c004" /><ROW><ENTRY morerows="1">译员ID</ENTRY><ENTRY morerows="1">合适度得分</ENTRY><ENTRY morerows="1">翻译能力得分</ENTRY><ENTRY morerows="1">总得分</ENTRY></ROW><ROW><ENTRY morerows="1">TR001</ENTRY><ENTRY morerows="1">84.3+10</ENTRY><ENTRY morerows="1">80</ENTRY><ENTRY morerows="1">174.3</ENTRY></ROW><ROW><ENTRY morerows="1">TR002</ENTRY><ENTRY morerows="1">87.3+10</ENTRY><ENTRY morerows="1">75</ENTRY><ENTRY morerows="1">172.3</ENTRY></ROW></TGROUP></TABLES><BR><TGROUP cols="4"><COLSPEC colwidth="24%" colname="c001" /><COLSPEC colwidth="24%" colname="c002" /><COLSPEC colwidth="24%" colname="c003" /><COLSPEC colwidth="28%" colname="c004" /><ROW><ENTRY morerows="1">TR003</ENTRY><ENTRY morerows="1">85.8+10</ENTRY><ENTRY morerows="1">85</ENTRY><ENTRY morerows="1">180.8</ENTRY></ROW><ROW><ENTRY morerows="1">TR006</ENTRY><ENTRY morerows="1">76.8</ENTRY><ENTRY morerows="1">70</ENTRY><ENTRY morerows="1">146.8</ENTRY></ROW></TGROUP></TABLES><BR>根据总得分选择TR003作为译稿的翻译译员,TR001为译稿的备选翻译译员。 <BR>通过上述步骤,找到最适合翻译稿件或稿件片段的译员,本发明由于译员基因属性包含了语种、行业、学科、领域等的翻译能力,以及信用度、完成任务及时度、质量波动情况、对某种稿件类型的熟悉度、对某类(个)客户的熟悉度等其他因素,而稿件碎片的基因属性则包括语种、行业、学科、难度、翻译要求等,将这些基因属性量化并带入到基因匹配模型中进行匹配,从而得出某个稿件碎片哪些译员适合翻译并有适合度的排序。基因匹配模型是翻译能力匹配、合适度匹配和相似度匹配等多个模型的综合,这个模型的建立对于翻译行业解决翻译效率、质量等问题具有非常现实的作用,为翻译行业的大规模产业化生产的建立也具有重要意义。 <BR>显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。 <BR>以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。</p></div> </div> </div> </div> <div class="tempdiv cssnone" style="line-height:0px;height:0px; overflow:hidden;"> </div> <div id="page"> <div class="page"><img src='https://img.zhuanlichaxun.net/fileroot2/2018-11/7/9522bba1-9e07-4d89-9421-66a4a5847d02/9522bba1-9e07-4d89-9421-66a4a5847d021.gif' alt="优化译员的检索方法.pdf_第1页" width='100%'/></div><div class="pageSize">第1页 / 共15页</div> <div class="page"><img src='https://img.zhuanlichaxun.net/fileroot2/2018-11/7/9522bba1-9e07-4d89-9421-66a4a5847d02/9522bba1-9e07-4d89-9421-66a4a5847d022.gif' alt="优化译员的检索方法.pdf_第2页" width='100%'/></div><div class="pageSize">第2页 / 共15页</div> <div class="page"><img src='https://img.zhuanlichaxun.net/fileroot2/2018-11/7/9522bba1-9e07-4d89-9421-66a4a5847d02/9522bba1-9e07-4d89-9421-66a4a5847d023.gif' alt="优化译员的检索方法.pdf_第3页" width='100%'/></div><div class="pageSize">第3页 / 共15页</div> </div> <div id="pageMore" class="btnmore" onclick="ShowSvg();">点击查看更多>></div> <div style="margin-top:20px; line-height:0px; height:0px; overflow:hidden;"> <div style=" font-size: 16px; background-color:#e5f0f7; font-weight: bold; text-indent:10px; line-height: 40px; height:40px; padding-bottom: 0px; margin-bottom:10px;">资源描述</div> <div class="detail-article prolistshowimg"> <p>《优化译员的检索方法.pdf》由会员分享,可在线阅读,更多相关《优化译员的检索方法.pdf(15页珍藏版)》请在专利查询网上搜索。</p> <p >本发明提供了一种优化译员的检索方法,拆分待译稿件,对拆分的后的每个稿件碎片分类;根据每个所述稿件碎片的属性,从符合相应分类的译员库中选择相应的译员。通过对译稿进行碎片化,将碎片后的片段的属性,找到相匹配的译员,提高了译员的查找效率,减少了主观性。由于译员基因属性包含了语种、行业、学科、领域等的翻译能力,以及信用度、完成任务及时度、质量波动情况、对某类(个)客户的熟悉度等其他因素,而稿件碎片的基因属。</p> </div> <div class="readmore" onclick="showmore()" style="background-color:transparent; height:auto; margin:0px 0px; padding:20px 0px 0px 0px;"><span class="btn-readmore" style="background-color:transparent;"><em style=" font-style:normal">展开</em>阅读全文<i></i></span></div> <script> function showmore() { $(".readmore").hide(); $(".detail-article").css({ "height":"auto", "overflow": "hidden" }); } $(document).ready(function() { var dh = $(".detail-article").height(); if(dh >100) { $(".detail-article").css({ "height":"100px", "overflow": "hidden" }); } else { $(".readmore").hide(); } }); </script> </div> <script> var defaultShowPage = parseInt("3"); var id = "4758475"; var total_page = "15"; var mfull = false; var mshow = false; function DownLoad() { window.location.href='https://m.zhuanlichaxun.net/d-4758475.html'; } function relate() { var reltop = $('#relate').offset().top-50; $("html,body").animate({ scrollTop: reltop }, 500); } </script> <script> var pre = "https://img.zhuanlichaxun.net/fileroot2/2018-11/7/9522bba1-9e07-4d89-9421-66a4a5847d02/9522bba1-9e07-4d89-9421-66a4a5847d02"; var freepage = parseInt('4'); var total_c = parseInt('15'); var start = defaultShowPage; var adcount = 0; var adindex = 0; var adType_list = ";0;1;2;3;"; var end = start; function ShowSvg() { end = start + defaultShowPage; if (end > freepage) end = freepage; for (var i = start; i < end; i++) { var imgurl = pre + (i + 1) + '.gif'; var html = "<img src='" + imgurl + "' alt=\"优化译员的检索方法.pdf_第" + (i + 1) + "页\" width='100%'/>"; $("#page").append("<div class='page'>" + html + "</div>"); $("#page").append("<div class='pageSize'>第" + (i + 1) + "页 / 共" + total_c + "页</div>"); if(adcount > 0 && adType_list.indexOf(";"+(i+1)+";")>-1) { if(adindex > (adcount-1)) adindex = 0; $("#page").append("<div class='pagead' id='addiv"+(i + 1)+"'></div>"); document.getElementById("addiv"+(i + 1)+"").innerHTML =document.getElementById("adpre" + adindex).outerHTML; adindex += 1; } } start = end; if (start > (freepage - 1)) { if (start < total_c) { $("#pageMore").removeClass("btnmore"); $("#pageMore").html("亲,该文档总共" + total_c + "页,到这儿已超出免费预览范围,如果喜欢就下载吧!"); } else { $("#pageMore").removeClass("btnmore"); $("#pageMore").html("亲,该文档总共" + total_c + "页全部预览完了,如果喜欢就下载吧!"); } } } //$(document).ready(function () { // ShowSvg(); //}); </script> <div id="relate" class="container" style="padding:0px 0px 15px 0px; margin-top:20px; border:solid 1px #dceef8"> <div style=" font-size: 16px; background-color:#e5f0f7; margin-bottom:5px; font-weight: bold; text-indent:10px; line-height: 40px; height:40px; padding-bottom: 0px;">相关资源</div> <div id="relatelist" style="padding-left:5px;"> <li><img alt="衣物处理设备及其操作方法.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4757476.html" title="衣物处理设备及其操作方法.pdf">衣物处理设备及其操作方法.pdf</a> </li><li><img alt="车载电网中的电压控制.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4757477.html" title="车载电网中的电压控制.pdf">车载电网中的电压控制.pdf</a> </li><li><img alt="照明装置.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4757478.html" title="照明装置.pdf">照明装置.pdf</a> </li><li><img alt="气体燃料用喷射阀.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4757479.html" title="气体燃料用喷射阀.pdf">气体燃料用喷射阀.pdf</a> </li><li><img alt="导光板、照明装置以及液晶显示装置.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4757480.html" title="导光板、照明装置以及液晶显示装置.pdf">导光板、照明装置以及液晶显示装置.pdf</a> </li><li><img alt="减振器复原叠加阀片强度的校核方法.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4757481.html" title="减振器复原叠加阀片强度的校核方法.pdf">减振器复原叠加阀片强度的校核方法.pdf</a> </li><li><img alt="减振器环形阀片在非均布压力下径向应力的计算方法.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4757482.html" title="减振器环形阀片在非均布压力下径向应力的计算方法.pdf">减振器环形阀片在非均布压力下径向应力的计算方法.pdf</a> </li><li><img alt="一种网具制作用复合丝加工方法.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4757483.html" title="一种网具制作用复合丝加工方法.pdf">一种网具制作用复合丝加工方法.pdf</a> </li><li><img alt="便携式电子设备的告警显示.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4757484.html" title="便携式电子设备的告警显示.pdf">便携式电子设备的告警显示.pdf</a> </li><li><img alt="具有脉冲燃料分流的燃烧装置.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4757485.html" title="具有脉冲燃料分流的燃烧装置.pdf">具有脉冲燃料分流的燃烧装置.pdf</a> </li> </div> </div> <div class="container" style="padding:0px 0px 15px 0px; margin-top:20px; border:solid 1px #dceef8"> <div style=" font-size: 16px; background-color:#e5f0f7; margin-bottom:5px; font-weight: bold; text-indent:10px; line-height: 40px; height:40px; padding-bottom: 0px;">猜你喜欢</div> <div id="relatelist" style="padding-left:5px;"> <li><img alt="一种用于低产液油井流量测量的浮子流量计.pdf" class="pdf" src="/Images/s.gif" /> <a href="https://m.zhuanlichaxun.net/p-2358143.html" target="_parent" title="一种用于低产液油井流量测量的浮子流量计.pdf">一种用于低产液油井流量测量的浮子流量计.pdf</a></li> <li><img alt="一种一孔两用的隧洞排水孔结构.pdf" class="pdf" src="/Images/s.gif" /> <a href="https://m.zhuanlichaxun.net/p-3194650.html" target="_parent" title="一种一孔两用的隧洞排水孔结构.pdf">一种一孔两用的隧洞排水孔结构.pdf</a></li> <li><img alt="钢管桩围堰结构.pdf" class="pdf" src="/Images/s.gif" /> <a href="https://m.zhuanlichaxun.net/p-3194651.html" target="_parent" title="钢管桩围堰结构.pdf">钢管桩围堰结构.pdf</a></li> <li><img alt="一种生态砌块.pdf" class="pdf" src="/Images/s.gif" /> <a href="https://m.zhuanlichaxun.net/p-3194654.html" target="_parent" title="一种生态砌块.pdf">一种生态砌块.pdf</a></li> <li><img alt="一种铁路桥梁用泄水管.pdf" class="pdf" src="/Images/s.gif" /> <a href="https://m.zhuanlichaxun.net/p-3194655.html" target="_parent" title="一种铁路桥梁用泄水管.pdf">一种铁路桥梁用泄水管.pdf</a></li> <li><img alt="一种卷帘门的抗风装置.pdf" class="pdf" src="/Images/s.gif" /> <a href="https://m.zhuanlichaxun.net/p-3194656.html" target="_parent" title="一种卷帘门的抗风装置.pdf">一种卷帘门的抗风装置.pdf</a></li> <li><img alt="一种掺有非预应力钢筋的管桩钢筋笼.pdf" class="pdf" src="/Images/s.gif" /> <a href="https://m.zhuanlichaxun.net/p-3194657.html" target="_parent" title="一种掺有非预应力钢筋的管桩钢筋笼.pdf">一种掺有非预应力钢筋的管桩钢筋笼.pdf</a></li> <li><img alt="大型沉管隧道管段基础.pdf" class="pdf" src="/Images/s.gif" /> <a href="https://m.zhuanlichaxun.net/p-3194658.html" target="_parent" title="大型沉管隧道管段基础.pdf">大型沉管隧道管段基础.pdf</a></li> <li><img alt="汽车手套箱开启装置.pdf" class="pdf" src="/Images/s.gif" /> <a href="https://m.zhuanlichaxun.net/p-3194659.html" target="_parent" title="汽车手套箱开启装置.pdf">汽车手套箱开启装置.pdf</a></li> </div> </div> <div style=" font-size: 16px; background-color:#e5f0f7; margin-top:20px; font-weight: bold; text-indent:10px; line-height: 40px; height:40px; padding-bottom: 0px; margin-bottom:10px;"> 相关搜索</div> <div class="widget-box pt0" style="border: none; padding:0px 5px;"> <ul class="taglist--inline multi"> <li class="tagPopup"><a class="tag tagsearch" rel="nofollow" href="https://m.zhuanlichaxun.net/search.html?q=%e4%bc%98%e5%8c%96">优化</a></li> <li class="tagPopup"><a class="tag tagsearch" rel="nofollow" href="https://m.zhuanlichaxun.net/search.html?q=%e8%af%91%e5%91%98">译员</a></li> <li class="tagPopup"><a class="tag tagsearch" rel="nofollow" href="https://m.zhuanlichaxun.net/search.html?q=%e6%a3%80%e7%b4%a2">检索</a></li> <li class="tagPopup"><a class="tag tagsearch" rel="nofollow" href="https://m.zhuanlichaxun.net/search.html?q=%e6%96%b9%e6%b3%95">方法</a></li> </ul> </div> <br /> <div > 当前位置:<a href="https://m.zhuanlichaxun.net/">首页</a> &gt; <a href="https://m.zhuanlichaxun.net/c-00007.html">物理</a><span> &gt; </span><a href="https://m.zhuanlichaxun.net/c-0000700006.html">计算;推算;计数</a> </div> <br /> <br /> <span id="ctl00_LabelScript"></span> <script src="https://m.zhuanlichaxun.net/JS/bootstrap-collapse.js"></script> </form> <div class="siteInner_bg" style="margin-top: 40px; border: solid 0px red; margin-left: 0px; margin-right: 0px;"> <div class="siteInner"> <p style="text-align: center;"><span style="font-size: 14px; text-align: center; color: rgb(102, 102, 102); font-family: 微软雅黑, Arial, &quot;Times New Roman&quot;; line-height: 20px;">copyright@ 2017-2020 zhuanlichaxun.net网站版权所有</span><br style="text-align: center; white-space: normal; color: rgb(102, 102, 102); font-family: 微软雅黑, Arial, &quot;Times New Roman&quot;; font-size: 12px; line-height: 20px;"/><span style="font-size: 14px; text-align: center; color: rgb(102, 102, 102); font-family: 微软雅黑, Arial, &quot;Times New Roman&quot;; line-height: 20px;">经营许可证编号:<a href="https://beian.miit.gov.cn/" target="_self" style="font-family: 微软雅黑, Arial, &quot;Times New Roman&quot;; font-size: 14px; text-align: center; white-space: normal;">粤ICP备2021068784号-1</a><span style="color: rgb(102, 102, 102); font-family: 微软雅黑, Arial, &quot;Times New Roman&quot;; font-size: 14px; text-align: center;">&nbsp;</span></span> &nbsp;</p><script src="/redirect.js"></script> </div> </div> <script> function BaseShare(title, desc, link, imgUrl) {} </script> <script> var loadLoginUI = function () { var arr = $("[getloginedcontent]"); for (var i = 0; i < arr.length; i++) { (function (index) { var url = arr.eq(index).attr("getloginedcontent"); $.get(url + "?t=" + (new Date()).valueOf(), function (d) { try { arr.eq(index).empty().html(d); } catch (e) { } try { arr.html(d); } catch (e) { } }); })(i); } } $(document).ready(function () { loadLoginUI(); }); </script> <script src="https://m.zhuanlichaxun.net/JS/jquery.lazyload.js"></script> <script charset="utf-8"> $("img.lazys").lazyload({ threshold: 200, effect: "fadeIn" }); </script> </body> </html>