本文是一篇数据论文范文,关于数据相关毕业论文提纲,关于基于R树的非结构数据索引相关毕业论文模板范文。适合数据及计算机工程及信息管理方面的的大学硕士和本科毕业论文以及数据相关开题报告范文和职称论文写作参考文献资料下载。
摘 要 :随着信息技术的巨大进步,特别是互联网技术的迅速发展,人们所接触的信息已不再局限于传统的非结构数据.而传统的文本检索或者图像检索等技术只能专门处理某一种类型的非结构数据.如何采用统一的方法表示和访问非结构数据已经成为一个研究热点.该文在R树索引的基础上实现了不同类型非结构数据的混合索引,并且取得了不错的效果.
关 键 词 :R树;非结构数据;索引
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2012)29-6869-03
1.概述
在信息爆炸的今天,大量结构化和非结构数据急剧增加.如果采用人工处理的方式,由于非结构数据的结构化过程受限于人工处理速度,导致非结构数据的增长远远超过结构化数据.如何有效的管理每天出现大量的文本、图像和视频等非结构数据成为一个巨大的挑战.
王建民等研究了基于特征非结构数据管理建模框架[1].李青等研究了基于相似度矩阵的非结构化数据分类算法[2].文龙等研究了如何将XML应用于非结构数据的管理[3].杨岳等研究了非结构化数据统一访问平台及索引技术[4].邹波等研究了海量非结构化数据的文件组织格式等问题[5].
本文进行了基于R树的非结构数据的索引的研究,并且在搜狗语料数据集和SceneClass13数据集上取得了不错的效果.本文第二节是非结构数据在R树上的查找,插入和删除的实现.第三节是在搜狗语料数据集和SceneClass13数据集上进行实验的情况.最后是全文总结和对未来工作的展望.
4.结束语
非结构数据检索是信息管理的重要组成部分.本文实现了基于R树的非结构数据的查找,插入和删除,并在搜狗语料库数据集和SceneClass13数据集中得出了不错的效果.下一步我们一方面会进一步优化现有的索引算法,一方面将会借助于Hadoop实现非结构数据检索的并行化.