此文是一篇信息检索论文范文,关于信息检索相关论文范文资料,与机器学习的查询扩展在博客检索中的应用相关毕业论文格式模板。适合不知如何写信息检索及计算机应用及方法方面的论文摘要专业大学硕士和本科毕业论文以及信息检索类开题报告范文和职称论文的作为写作参考文献资料下载。
摘 要 :该文介绍一种新的查询扩展方法,该方法结合了查询扩展技术和机器学习理论.通过机器学习的方法挑选出查询扩展词,以此提高检索结果的性能.对于输入的查询项,首先通过伪反馈技术生成候选扩展词集合,然后使用支持向量机对输入的候选词评分,挑选得分较高的候选词和原始查询项组成一个新的查询项.由于训练这个支持向量机的训练数据较难获得,我们利用评测会议的检索结果和检索工具自动地生成训练数据.这套查询扩展方法的优点在于通过对训练语料的学习,能够对候选扩展词作出更合理的选择.在TREC评测会议组织的观点检索任务中,相对于不采用任何扩展技术的基准系统,该方法提高了MAP指标33.1%.
关 键 词 :计算机应用;中文信息处理;信息检索;查询扩展;机器学习
中图分类号:TP391 文献标识码:A