《基于信息熵的对象名称编辑距离计算方法及匹配方法.pdf》由会员分享,可在线阅读,更多相关《基于信息熵的对象名称编辑距离计算方法及匹配方法.pdf(8页珍藏版)》请在专利查询网上搜索。
本发明涉及一种基于信息熵的对象名称编辑距离计算方法及匹配方法。该编辑距离计算方法包括:步骤10、统计每个字符出现的次数freq以及对象名称的总数totalNum,如果字符在一对象名称中出现多次按一次计算;步骤20、根据对象名称的总数totalNum及字符出现的次数freq之间的比值计算字符的信息熵,得到字符的编辑代价;步骤30、计算对象名称的编辑距离时,插入或删除一个字符的编辑代价等于该字符的编辑。