专利名称:基于分布熵的局部敏感哈希高维索引方法专利类型:发明专利
发明人:张伟,高科,张勇东,李锦涛申请号:CN201110443604.X申请日:20111227公开号:CN102609441A公开日:20120725
摘要:本发明提供了基于分布熵的局部敏感哈希高维索引方法。该方法首先生成局部敏感哈希函数候选集合。接着,根据训练数据集,计算局部敏感哈希函数候选集合中每个哈希函数的分布熵值,并从中选取分布熵值最高的L个哈希函数作为局部敏感哈希函数集合。然后,基于该局部敏感哈希函数集合,将待索引数据集存储到哈希表中。还可以采用基于三角不等式过滤和欧氏距离排序的查询算法查询上述哈希表,得到与查询数据相似的结果集。该方法通过选择分布熵值高的哈希函数,更好地适应了数据的分布,从而优化了哈希表索引结构,减小了索引的内存消耗,同时使得查询更加准确和高效。
申请人:中国科学院计算技术研究所
地址:100190 北京市海淀区中关村科学院南路6号
国籍:CN
代理机构:北京泛华伟业知识产权代理有限公司
代理人:王勇
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容