我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:2019跑狗图高清彩图 > 语义分析 >

潜在语义分析

归档日期:08-18       文本归类:语义分析      文章编辑:爱尚语录

  声明:百科词条人人可编辑,词条创建和修改均免费,绝不存在官方及代理商付费代编,请勿上当受骗。详情

  潜在语义分析(Latent Semantic Analysis)或者潜在语义索引(Latent Semantic Index),是1988年S.T. Dumais等人提出的一种新的信息检索代数模型,是用于知识获取和展示的计算理论和方法,它使用统计计算的方法对大量的文本集进行分析,从而提取出词与词之间潜在的语义结构,并用这种潜在的语义结构来表示词和文本,达到消除词之间的相关性和简化文本向量实现降维的目的。

  潜在语义分析的基本观点是:把高维的向量空间模型(VSM)表示中的文档映射到低维的潜在语义空间中。这个映射是通过对项/文档矩阵的奇异值分解(SVD)来实现的。

  LSA 的应用:信息滤波、文档索引、视频检索、文本分类与聚类、图像检索、信息抽取等。

  百度蜘蛛算法一直在模仿用户的习惯,这也是为什么网站建设时要更注重用户体验才能更好的优化网站。而蜘蛛算法虽然一直在模仿,可算法与人同样存在着很不一样的地方,因为人可以直接理解某个关键词的意义、文章的意思。如人看到“果汁”这两个字就知道指的是有果味的好喝的液体饮料,而蜘蛛算法却不能从感性的去理解果汁是什么。

  但是蜘蛛算法确实可以掌握词与词之间的关系,因而我们便可从关键词相关性看潜在语义索引

  如博客与blog两个词在我们撰写文章可能会被经常混合使用,那么这两个词就在大量文档和网页上同时出现,那么对于蜘蛛而言,它就会认为这两个词是即为语义相关,当然,实际上也确实是同义词,只不过语言不一罢了。 而这潜在语义索引,并不依赖或者说限制在语言之上,也正如此,蜘蛛把博客与blog这两个词紧紧地联系在一起,于是乎,惠州SEO博客并未对“seo blog”任何优化,且密度为零的情况下,却神奇的出现了排名。不过对于这个潜在语义索引其实并未得到搜索引擎的承认,当然为进行否认,因此这也仅能说是惠州SEO叶剑辉的个人猜测。

  在我们撰写文章之时,其实并不需要死盯着目标关键词,不妨多包涵与目标关键词语义相关、相近的词汇,以支持目标关键词,如此或许会起到意想不到的效果哦,同样的也能让优化更趋向自然,而避免过度优化某个关键词而导致被。

  就如“SEO”这词,若是想要加强相关性,其实并非仅仅更多的重复“SEO”就可以了,还需要通过出现“搜索引擎优化”等语义相关的词汇。由于语义分析的缘故,让蜘蛛认为如此更为相关,因此在我们撰写文章时,就需要更多的将与目标关键词语义相关的词汇逻辑的、通顺的进行融入。

本文链接:http://furymagazine.com/yuyifenxi/264.html

上一篇:义素分析

下一篇:head