本文是一篇概率统计论文范文,关于概率统计类毕业论文参考文献格式,关于基于本体和词汇语义相似度的Web服务相关开题报告范文。适合概率统计及互联网及计算机方面的的大学硕士和本科毕业论文以及概率统计相关开题报告范文和职称论文写作参考文献资料下载。
【摘 要】针对于当前Web服务器存在的技术不足的情况,引入了本体论和词汇语义相似度的技术,并根据此技术通过实例的方式来验证基于本体论和词汇语义相似度的Web服务发现方法的可行性.
【关 键 词]Web服务;本体;词汇语义相似度
中图分类号:TP39文献标识码:A文章编号:1006-0278(2013)01-092-01
一、引言
Web服务应用模式的广泛使用,加快了商业数据交互的速度,实现了当前数据代码的重用性与关联性,但是随着互联网时代的快速发展,用户使用搜索的词汇的频率将会越来越高,而用户如何正确、高效地从庞大的Web服务群中找到自己所需的服务成为当今Web服务研究的热点问题之一.因此,进行提高web服务发现的能力的研究具有重要意义.
二、相关研究
本体出自一个哲学术语,表示客观现实的抽象本质.Ne-ches最早将本体引入到人工智能中.1993年,Gruber认为本体是词汇模型的明确的规范性说明;之后,Borst提出本体是共享词汇模型的形式化规范说明;Studer等人对上述2个定义进行了深入的研究,认为本体是共享词汇模型的明确的形式化规范说明,该定义包括4层含义:词汇模型,明确的,形式化和共享性.
三、词汇相似度的算法
文章通过基于词汇相似度的算法,结合本体论的方法来进行Web服务的推理与计算.
四、实验及结果
基于上述的相似度计算方法,文章选取了两个描述计算机方面的本体(其中一个本体包含12个子结点,32个叶结点;另一个本体包含15个子结点,37个叶子结点),采用Ja语言实现相似度计算模块.
文章算法考虑到了关联度较小的词汇对之间的相似度;可以发现,考虑X、Y系数,比不考虑这2个系数的相似度结果低,但是变化程度不一样,表明文章算法考虑了词汇的层次、结构,层次、结构越近,词汇间相似度越高;比较第3列、第5列数据,可以发现,考虑了X、Y两个系数之后,比不考虑这两个系数的相似度有所降低,其中大部分比采用概率统计的计算结果要高,但小部分要低,表明文章算法区分度高,能更准确地反映词汇间相似度.综上所述,文章算法有效.
五、结束语
在整个数据检索的过程当中,词汇之间的语义相似度的计算起到了重要的分辨作用,由于文章从本体论出发,对于词汇间的语义相似度的计算方法进行了相对的改进,并从该方法中选择了2个任意本体进行实验,从实验的结果上看,文章的词汇相似度算法是有效的.