《一种快速分词的实现方法.pdf》由会员分享,可在线阅读,更多相关《一种快速分词的实现方法.pdf(15页珍藏版)》请在专利查询网上搜索。
本发明公开了一种基于词条查找树的快速分词方法,词条查找树由一级索引表和HASH多叉树构成。一级索引表是数组,通过下标直接访问,可快速缩小搜索范围,时间复杂度为常数。HASH多叉树是基于HASH的多叉树,即每个节点的子节点列表通过HASH散列,查找的时候平均时间复杂度为常数。通过本发明的词条查找树能利用相对较少的内存资源,获得近乎常数时间复杂度的分词功能,可支持大型词典,满足海量文本信息的分析需求。。