《目标用户对象的确定方法.pdf》由会员分享,可在线阅读,更多相关《目标用户对象的确定方法.pdf(11页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103744929 A (43)申请公布日 2014.04.23 CN 103744929 A (21)申请号 201310745330.9 (22)申请日 2013.12.30 G06F 17/30(2006.01) (71)申请人 传神联合 (北京) 信息技术有限公司 地址 100022 北京市朝阳区东三环中路 39 号建外 SOHO18 号楼 17 层 (72)发明人 江潮 (74)专利代理机构 北京康盛知识产权代理有限 公司 11331 代理人 张良 (54) 发明名称 目标用户对象的确定方法 (57) 摘要 一种目标用户对象的确定方法, 包括接收待 匹配的数。
2、据对象 ; 提取所述待匹配的数据对象的 文本属性参数 ; 将所述文本属性参数在预置的数 据库中进行匹配, 所述预置的数据库中包括多个 用户对象及每个用户对象相关联的文本属性参数 系数 ; 确定所述数据库中与所述待匹配的数据对 象的文本属性参数匹配度高于预设阈值的用户对 象, 为目标用户对象。 采用上述方法确定了待匹配 的数据对象的最合适的用户对象, 使得所述待匹 配的数据对象可以实现精准推送。 (51)Int.Cl. 权利要求书 2 页 说明书 6 页 附图 2 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书6页 附图2页 (10)申请公布号 CN 10。
3、3744929 A CN 103744929 A 1/2 页 2 1. 一种目标用户对象的确定方法, 其特征在于, 包括 : 接收待匹配的数据对象 ; 提取所述待匹配的数据对象的文本属性参数 ; 将所述文本属性参数在预置的数据库中进行匹配, 所述预置的数据库中包括 : 多个用 户对象及每个用户对象相关联的文本属性参数系数 ; 确定所述数据库中与所述待匹配的数据对象的文本属性参数匹配度高于预设阈值的 用户对象, 为目标用户对象。 2. 如权利要求 1 所述的方法, 其特征在于, 所述提取待匹配的数据对象的文本属性参 数集合为 X =X 1,X2,Xn ; 其中, n 为文本属性参数的数量 ; 所。
4、述预置的数据库中的每个用户对象相关联的文本属性参数系数包括数据集合系数 K=K1,K2,Kn ; 所述文本属性参数集合 X 与所述数据集合系数 K 的各项一一对应。 3. 如权利要求 2 所述的方法, 其特征在于, 所述匹配的过程包括 : 将所述提取的文本属 性参数逐个与每个用户对象的文本属性参数系数运算, 得到与每个用户对象的匹配度。 4. 如权利要求 3 所述的方法, 其特征在于, 所述运算匹配度的过程是利用数学公式 : Y =K1X 1+K2X2+Kn Xn 得到文本属性参数匹配度, 记为 Y 。 5. 如权利要求 2 所述的方法, 其特征在于, 所述数据集合系数 K 通过以下过程得到,。
5、 包 括 : 提取每个用户对象的 m 篇包含文本属性参数的数据对象 ; 从上述 m 篇数据对象中的每 篇数据对象提取 n 个文本属性参数作为一组, 形成 m 组文本参数集合 X ; 其中, 每组对应以 下其中的一行 ; X1=X11,X12,X1n X2=X21,X22,X2n . . . Xm=Xm1,Xm2,Xmn 所述每组中的每一项参数与文本属性参数 X 中的位置相对的参数的属性相同 ; 建立描述综合特征的数据组, 记为 Y, Y=Y1,Y2,Ym, 其中每篇数据对象对应 Y 中的 一项数据 ; 根据以下匹配模型, 获得文本属性参数集合系数 K : 权 利 要 求 书 CN 103744。
6、929 A 2 2/2 页 3 其中,X为 X 的转置矩阵。 6. 如权利要求 1 所述的方法, 其特征在于, 所述高于预设阈值的用户对象的数量的个 数为多个, 所述目标对象为多个中的随机的一个 ; 或, 在多个高于预设阈值的用户对象中, 确定每个用户对象的负载系数, 选择负载系数 最小的用户对象。 7. 如权利要求 5 所述的方法, 其特征在于, 所述待匹配的数据对象是待译稿件, 每个用 户对象的 m 篇包含文本属性参数的数据对象为该用户的 m 篇译后稿件。 权 利 要 求 书 CN 103744929 A 3 1/6 页 4 目标用户对象的确定方法 技术领域 0001 本发明属于信息检索领。
7、域, 尤其涉及一种目标用户对象的确定方法。 背景技术 0002 在全球化、 国际化的今天, 同时随着互联网的兴起, 越来越多的产业选择通过适应 发展形势的系统化、 产业化、 标准化的云服务平台来承接各种任务。 目前大部分的方式是基 于任务的种类或要求等信息, 根据主观判断和简单的测试系统来确定合适的承接任务的公 司、 部门或个人, 这对应管理着散布于全球的海量资源的云服务平台来说, 接受的任务信息 与承接的对象选择难以做到准确的匹配, 从而无法实现任务的自动推送流程。所以必须要 有一种简单、 高效、 可以在计算机系统上实现的目标用户对象的确定方法, 这是建立大规模 任务并行分布式处理流程的一项。
8、基础性的工作, 也是建立云服务平台的一项基础性工作。 发明内容 0003 有鉴于此, 为解决现有技术中, 存在接受的任务信息与承接的对象选择难以做到 准确的匹配的问题, 本发明的一个目的是提出一种目标用户对象的确定方法。为了对披露 的实施例的一些方面有一个基本的理解, 下面给出了简单的概括。该概括部分不是泛泛评 述, 也不是要确定关键重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简 单的形式呈现一些概念, 以此作为后面的详细说明的序言。 0004 在一些可选的实施例中, 所述方法包括 : 0005 接收待匹配的数据对象 ; 0006 提取所述待匹配的数据对象的文本属性参数 ; 0007。
9、 将所述文本属性参数在预置的数据库中进行匹配, 所述预置的数据库中包括 : 多 个用户对象及每个用户对象相关联的文本属性参数系数 ; 0008 确定所述数据库中与所述待匹配的数据对象的文本属性参数匹配度高于预设阈 值的用户对象, 为目标用户对象。 0009 在一些可选的实施例中, 所述提取待匹配的数据对象的文本属性参数集合为 X =X 1,X2,Xn ; 其中, n 为文本属性参数的数量 ; 0010 所述预置的数据库中的每个用户对象相关联的文本属性参数系数包括数据集合 系数 K=K1,K2,Kn; 0011 所述文本属性参数集合 X 与所述数据集合系数 K 的各项一一对应。 0012 在一些。
10、可选的实施例中, 所述运算匹配的过程是利用数学公式 : 0013 Y =K1X 1+K2X2+Kn Xn 0014 得到文本属性参数匹配度, 记为 Y 。 0015 在一些可选的实施例中, 所述数据集合系数 K 通过以下过程得到, 包括 : 0016 提取每个用户对象的 m 篇包含文本属性参数的数据对象 ; 从上述 m 篇数据对象中 的每篇数据对象提取 n 个文本属性参数作为一组, 形成 m 组文本参数集合 X ; 其中, 每组对 说 明 书 CN 103744929 A 4 2/6 页 5 应以下其中的一行 ; 0017 X1=X11,X12,X1n 0018 X2=X21,X22,X2n 。
11、0019 . 0020 . 0021 . 0022 Xm=Xm1,Xm2,Xmn 0023 所述每组中的每一项参数与文本属性参数 X 中的位置相对的参数的属性相同 ; 0024 建立描述综合特征的数据组, 记为 Y, Y=Y1,Y2,Ym, 其中每篇数据对象对应 Y 中的一项数据 ; 0025 根据以下匹配模型, 获得文本属性参数集合系数 K : 0026 0027 其中,X为 X 的转置矩阵。 0028 在一些可选的实施例中, 所述高于预设阈值的用户对象的数量的个数为多个, 所 述目标对象为多个中的随机的一个 ; 0029 或, 在多个高于预设阈值的用户对象中, 确定每个用户对象的负载系数,。
12、 选择负载 系数最小的用户对象。 0030 在一些可选的实施例中, 所述待匹配的数据对象是待译稿件, 每个用户对象的 m 篇包含文本属性参数的数据对象为该用户的 m 篇译后稿件。 0031 采用上述实施例, 能达到以下技术效果 : 0032 上述方法让最合适的用户对象能够匹配到待完成的任务, 使得所述任务在云平台 上可以实现精准推送, 有效的促进了任务的分工, 提高了单位产能。 同时这种相对客观的用 户对象的确定方法, 极大的减轻选择用户对象过程中巨大的人工工作量。 0033 为了上述以及相关的目的, 一个或多个实施例包括后面将详细说明并在权利要求 中特别指出的特征。下面的说明以及附图详细说明。
13、某些示例性方面, 并且其指示的仅仅是 各个实施例的原则可以利用的各种方式中的一些方式。 其它的益处和新颖性特征将随着下 面的详细说明结合附图考虑而变得明显, 所公开的实施例是要包括所有这些方面以及它们 的等同。 0034 此处所说明的附图用来提供对本发明的进一步理解, 构成本申请的一 部分, 本发 明的示意性实施例及其说明用于解释本发明, 并不构成对本发明的不当限定。在附图中 : 附图说明 0035 图 1 是本发明实施例的流程示意图 ; 说 明 书 CN 103744929 A 5 3/6 页 6 0036 图 2 是本发明实施例的流程示意图。 具体实施方式 0037 以下描述和附图充分地示。
14、出本发明的具体实施方案, 以使本领域的技术人员能够 实践它们。其他实施方案可以包括结构的、 逻辑的、 电气的、 过程的以及其他的改变。实施 例仅代表可能的变化。 除非明确要求, 否则单独的部件和功能是可选的, 并且操作的顺序可 以变化。一些实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本 发明的实施方案的范围包括权利要求书的整个范围, 以及权利要求书的所有可获得的等同 物。在本文中, 本发明的这些实施方案可以被单独地或总地用术语 “发明” 来表示, 这仅仅 是为了方便, 并且如果事实上公开了超过一个的发明, 不是要自动地限制该应用的范围为 任何单个发明或发明构思。 0038 。
15、图 1 是本发明实施例的流程示意图, 实施例包括如下步骤 : 0039 S1 : 接收待匹配的数据对象, 例如待译稿件 ; 0040 S2 : 提取所述待匹配的数据对象的文本属性参数, 所述提取待匹配的数据对象的 文本属性参数集合为 X =X 1,X2,Xn, 其中, n 为文本属性参数的数量 ; 0041 所述待译稿件中包含完成该稿件的最低要求, 所述最低要求是一系列参数的集合 X , 集合 X 包含 5 个参数, 分别是 : 中途放弃任务次数 X 1、 不按时完成和提交任务次数 X2、 低级错误次数 X 3、 谎报能力指标次数 X4、 接到通知不响应次数 X5、 能够申请任务的时间 分别情。
16、况 X 6; 0042 S3 : 将所述文本属性参数在预置的数据库中进行匹配, 所述预置的数据库中包括 : 多个用户对象及每个用户对象相关联的文本属性参数系数 ; 0043 集合 X 的所有参数在数据库中进行匹配, 确定多个数据库中包含集合 X 中所有 参数的译员, 并从每个译员的个人翻译文档库中获得与集合 X 中各项参数相匹配的数据集 合系数 ; 0044 例如基于集合 X , 从某译员的个人翻译文档库获取所述 K, K=K1,K2,K3,K4,K5, 其 中集合中每一项数据系数与 X 中的每一项参数一一对应 ; 0045 所述匹配过程是, 将待译稿件的文本属性参数集合 X 的各项与译员的数。
17、据集合系 数 K 中相对位置的各项数据系数相乘, 然后再将得到的乘积相加获得所述匹配度, 记为 Y , 即译员完成待译稿件的匹配度, 这个值是系统通过匹配公式计算的一个预测值, 具体计算 过程如下 : 0046 Y =K1X 1+K2X2+K3X3+K4X4+K5X5; 0047 其中 Y 是一个译员完成待译稿件的匹配度, 设共有 L 个译员, 每个译员有对应的 L 个集合 K, 同理根据上述步骤能获得 L 个译员的匹配度, 记为 Y 1、 Y2, YL; 0048 S4 : 确定所述数据库中与所述待匹配的数据对象的文本属性参数匹配度高于预设 阈值的用户对象, 为目标用户对象 ; 0049 优。
18、选地, 设所述待译稿件中对最低匹配度进行了限定, 即预设阈值 A, 将所述 L 个 译员的匹配度 Y 1、 Y2, YL分别与所述预设阈值 A 进行比较, 获得 S 个匹配度高于预 设阈值 A 的译员, 则所述目标对象为 S 个译员中随机的一个 ; 0050 进一步地, 将所述 S 个译员的匹配度进行比较, 选择匹配度最高的译员为目标对 象 ; 说 明 书 CN 103744929 A 6 4/6 页 7 0051 进一步地, 确定所述 S 个译员的负载系数, 所述负载系数能反映每个译员当前跟 进稿件的数量和进展情况, 选择负载系数最小的译员为目标对象, 即选择任务量最少的译 员作为目标译员。。
19、实施例的步骤, 通过对待匹配数据对象的文本属性参数进行提取, 并找 到匹配的用户对象和每个用户对象的相关文本属性参数的系数, 提高了用户对象的查找效 率, 减少了主观性。再进一步的, 将每个用户对象的文本属性参数的系数与待匹配数据 对 象的文本属性参数进行匹配, 获得了客观、 精准的该用户对象完成待匹配数据对象的预测 的匹配度, 根据匹配度是否高于预设的完成待匹配数据对象的最低阈值, 确定该用户对象 是否有能力完成所述待匹配数据对象。 0052 如图 2 所示, 步骤 S3 通过以下子步骤实现, 包括 : 0053 S31 : 提取每个用户对象 (即译员) 的 m 篇包含文本属性参数的数据对象。
20、 (即译后稿 件) ; 从上述 m 篇译后稿件中的每篇译后稿件提取 5 个与上述待译稿件的集合 X 中的 5 个参 数属性相同的参数作为一组, 形成 m 组文本参数集合 X ; 其中, 每组对应以下其中的一行 ; 0054 X11,X12,X13,X14,X15 0055 X21,X22,X23,X24,X25 0056 . 0057 . 0058 . 0059 Xm1,Xm2,Xm3,Xm4,Xm5 0060 所述每组中的每一项参数与文本属性参数 X 中的位置相对的参数的属性相同 ; 0061 S32 : 建立描述综合特征的, 即翻译可信度的数据组, 记为Y, Y=Y1,Y2,Ym, 其中 。
21、每篇数据对象对应Y中的一项数据, 优选便于计算的数据, 一般为110。 由于采用的样本 数据的数量很大, 人为的因素影响可以忽略不计 ; 0062 S33 : 根据以下匹配模型, 获得一个译员的文本属性参数集合系数 K : 0063 0064 其中,X为 X 的转置矩阵。 0065 上述步骤是获得一个译员的文本集合系数K的过程, 在实施例中, 共 有L个译员, 通过上述步骤, 可以获得 L 个译员的文本属性集合系数 K, 得到的文本属性系数通过大量样 本数据进行计算, 得到的可忽略人为因素的客观数据, 得到的文本属性系数之间同时具有 关联性。 0066 在一些实施例中, 在所述步骤 S2 前,。
22、 还包括判断用户对象是否可以接收待匹配的 数据对象的步骤, 如果用户对象可以接收待匹配的数据对象则再进行匹配并计算匹配度, 如果用户对象不接收待匹配的数据对象则切换其他用户, 再执行步骤 S3。 说 明 书 CN 103744929 A 7 5/6 页 8 0067 在一些实施例中, 所述用户对象可以以人为单位的对象, 例如 : 个人、 小组、 部门、 公司等, 或者是某种系统、 软件、 硬件、 技术、 项目等其他形式的对象。 0068 在一些实施例中, 所述待匹配的数据对象可以是各种数据类型, 例如 : 文字、 音频、 视频、 包含文字和 / 或音频和 / 或视频的多媒体流、 图片信息、 具。
23、有多个指标要求的工作任 务, 或者包含多种数据类型的数据集合等。 0069 在一些实施例中, 所述待匹配的数据对象可以是一个或者多个具有共同特征的数 据对象。 0070 在一些实施例中, 所述用户对象的确定方法可以用于网络的云服务平台上或者封 闭的系统中。 0071 在一些实施例中, 所述待匹配的数据对象是待译稿件, 所述用户对象是译员, 每个 译员都具有其个人翻译文档库, 所述个人翻译文档库包括 m 篇包含文本属性参数的数据对 象为该用户的 m 篇译后稿件 ; 将所述待译稿件的文本属性参数与译员个人翻译文档库中的 数据进行匹配, 确定符合所述待译稿件要求的信息。 0072 优选地, 所述预置。
24、的数据库中的描述综合特征的数据是根据译员完成每篇译后稿 件情况的评估值。 0073 优选地, 所述待译稿件的文本属性参数包括申请领取翻译任务的种类、 任务特征、 完成翻译任务的速度和质量情况、 完成翻译任务的速度和质量的波动情况、 能够申请任务 的时间分布情况等各方面与译员的翻译效率相 关的参数。所述描述综合特征的数据组中 的每一项是译员完成每篇译后稿件的翻译效率评估值。 所述预设阈值是待译稿件对译员翻 译效率的最低要求。 0074 优选地, 所述待译稿件的文本属性参数包括中途放弃任务的次数、 不按时完成和 提交任务的次数、 低级错误发生的次数、 谎报能力指标的次数、 接到通知不响应等各方面与。
25、 译员的信用相关的参数。 所述描述综合特征的数据组中的每一项是译员完成每篇译后稿件 的翻译可信度的评估值。所述预设阈值是待译稿件对译员翻译可信度的最低要求。 0075 优选地, 所述待译稿件的文本属性参数包括语种、 难度、 行业、 学科、 领域等参数。 所述描述综合特征的数据组中的每一项是译员完成每篇译后稿件的相似度评估值。 所述预 设阈值是对译员完成待译稿件的相似度的最低要求。 0076 采用上述实施例, 能达到以下技术效果 : 0077 提高了用户对象的查找效率, 减少了主观性, 找到待匹配的数据对象的目标匹配 用户对象。 0078 获得了客观、 精准的用户对象完成待匹配数据对象的匹配度,。
26、 根据预测的匹配度 确定用户对象是否有能力完成所述待匹配数据对象。 0079 实现了在待匹配数据对象在大量信息资源, 例如云服务平台, 的精准推送, 有效的 促进了任务的分工, 提高了单位产能。 同时这种相对客观的用户对象的确定方法, 极大的减 轻选择用户对象过程中巨大的人工工作量。 0080 本领域技术人员还应当理解, 结合本文的实施例描述的各种说明性的逻辑框、 模 块、 电路和算法步骤均可以实现成电子硬件、 计算机软件或其组合。 为了清楚地说明硬件和 软件之间的可交换性, 上面对各种说明性的部件、 框、 模块、 电路和步骤均围绕其功能进行 了一般地描述。至于这种功能是实现成硬件还是实现成软。
27、件, 取决于特定的应用和对整个 说 明 书 CN 103744929 A 8 6/6 页 9 系统所施加的设计约束条件。熟练的技术人员可以针对每个特定应用, 以变通的方式实现 所描述的功能, 但是, 这种实现决策不应解释为背离本公开的保护 范围。 0081 以上所述仅为本发明的优选实施例而已, 并不用于限制本发明, 对于本领域的技 术人员来说, 本发明可以有各种更改和变化。 凡在本发明的精神和原则之内, 所作的任何修 改、 等同替换、 改进等, 均应包含在本发明的保护范围之内。 说 明 书 CN 103744929 A 9 1/2 页 10 图 1 说 明 书 附 图 CN 103744929 A 10 2/2 页 11 图 2 说 明 书 附 图 CN 103744929 A 11 。