如何设置SEO关键词当然重要,但SEO优化技术如果只是机械式的说该做什麽不做什麽,而涉及的步骤又非常死板,例如:将焦点关键词设定放在标题一,关键词在首段重覆出现三次等等,会是何等枯燥乏味。
SEO关键词–基本概念
多了解一些关键词设定基本概念和基础理论会令SEO优化变得更有趣味。例如:SEO关键词的出现密度的基础理论是TF-IDF。搜索引擎希望从页面出现的关键词密度决定该SEO关键词和内容的相关性Relevance有多大。用浅白语言排除数学其实不难理解:
关键词在网页出现的频率就是TF(TermFrequency)。如果关键词K在网页出现4次,TF值看似应该是4。
问题是如果A页的内容长度是B页的两倍,某关键词K在A页的出现次数是B页两倍时就不能断言关键词K与A页更相关。所以TF被修正为出现次数/长度。例如,出现4次文件章度为100个字:
TF值=4/100=0.04
问题是例如一编介绍“网上生意”文章的描述中,有些字像“客户”,”网上”的TF就显然要比“网上生意”的TF为高。但说该文章跟“网上”或“生意”的相关性较“网上生意”为高,明显违反常识。当文章是谈论“网上生意”,”云端运算”,”网上缴费”,”网上教学”等等时“网上”都很可能被提及。结论是“网上”一词是一般文章中更普及出现。单纯利用TF计算相关性会出现以上的偏差。
解决的方法是对愈普及的关键词给出愈低的权重Weight,倒如在10,000文章中关键词“网上”出现100次,权重变成倒数(所以叫IDF或InverseDocumentFrequency)10,000/100=100,如关键词“网上推广”在10,000文章中出现一次,权重变成10,000/1=10,000.为了令这权重值变化不要不急,所以以logbase10计算。
“网上”IDF值=log(10,000/100)=2
“网上推广”IDF值=log(10,000/1)=5
将TF乘以IDF就是相关性的评分。当然今天的搜索引擎采用的TF-IDF更复杂,但原理是一样。今天搜索引擎已经进化到非常复杂,除了Google内部从事SEO研究的资深工程师外,外面从事SEO优化的人只能根据一些如专利申请和Google人员不同埸合的阐述等符尝试理解其中的精萃。Google搜索引擎计算关键词相关性的算法是以TF-IDF为基础,但已经进化到更为先进。
长尾关键词
长尾关键词Longtailkeyword指基于通用关键词在前或在后或同时在前后加入更多字眼作更精准标示所要找的产品、服务或信息,长尾关键词IDF值高。例如:“大码衣服婚礼用”,“防敏感化妆品”等等。长尾关键词特色是搜索量小,但同时提供和该关键词相关的产品、服务或信息的网站亦小,所以该长尾关键词的搜索排名竞争亦小,更容易获得高搜索排名。
焦点关键词
焦点关键词FocusKeyword指网页内容是以该关键词为争取排名目标,焦点关键词IDF值低。所以在页内重要的元素中会加入该焦点关键词以便通知搜索引擎网页内容和焦点关键词的相关性。SEO优化工具如YoastSEO,SEOpressor的排名优化建议都需要先设定焦点关键词。一般网页内容只应瞄准一两个焦点关键词,否则可能造成文理不通,降低可读性。
单页相关还是多页相关
某些网站接受游客发帖GuestPosting,单独一个页面和某关键词有高相关性不及和好几页面展现高相关性来得重要。利用ITF可以侦测到整个网站(或者更正确是整个网站中被搜索引擎索引的页面)和某关键词的相关性。例如“韩国时装”在一般网站的ITF是0.0003,即是在一万页中只有3页提及,而某网站是0.05,即一百页中有五页提及,就表示该网站以“韩国时装”为主题的可能性极高。也就是该网站对“韩国时装”的权威性高,亦即是GoogleRaterGuideline所阐述优质内容E.A.T里内的A,代表Authority。搜索引擎是偏好来自权威性高的内容。
直接相关还是间接相关
关键词有同义词Synonyms。例如:教员,教师,老师代表非常接近甚至完全相同的概念或事物。当网页或网站和关键词A的相关性高,而关键词B是关键词A的同义词时,就间接引证该网页或网站和关键词B的相关性亦高。但由于是间接相关,所以网页对搜索输入关键词B的排名评分会略低于对直接相关的关键词A。
应该是直接相关还是间接相关取决于地理位置文化差异。有些同义词是由于文化地理差异引起,例如“moggie”是英国人对混种家猫的称呼,亦就是一般我们都叫“cat”.随着手机普及可以更准确判断用户的地理位置,英国用户输入“moggie”可以判断为猫(搜索引擎很可能判断与“cat”为直接相关),但中国用户输入“moggie”就不一定(搜索引擎很可能判断与“cat”为间接相关)。
关键词的繁简转换亦可以看成间接相关,所以你会看到输入繁体关键词时亦有时会出现简体排名结果。但亦是由于间接相关,所以排名计分稍为不利。
潜在词义的相关性
随着手机愈趋普及,语音搜索VoiceSearch使用量会大幅增加。当用户慢慢发现原来搜索引擎对自然语音输入的理解原来不差时,搜索用户行为亦会改变,放弃以词组式关键词输入而改为更自然的句子。RankBrain的出现就是为了处理更复杂的词意含义,通过利用人工智能AI理解潜在含意而将用户的搜索输入和隐含的关键词搭出关系。例如用户查询:PDF有什麽弊端,通过RankBrain潜在词义分析转化为“PDF保安”。
LSI和Proximity
单一词语代表的意义有时非常含糊。例如“苹果”代表水果亦广泛指美国一家上市公司。所以确切的相关性判断需要看上文下理,例如如果网页是关于水果苹果,很可能同时在内文中找都关于食品的关键词,例如“健康”,“味道”。如果是关于苹果公司,就可以找到关键词如“公司”,流行産品如“iPhone”等等。又例如“心理辅导”的资料,多数会提及“情绪”这个词。英文Lincoln可以是人名,可以代表汽车,可以代表美国总统。潜在语义索引LatentSemanticIndexing(LSI)是指搜索引擎根据上文下理所出现的其他相关词汇判断关键词的相关性。而这些相关的关键词应该出现在主关键词不太远的地方,相隔愈远代表两者关系愈弱。
SEO关键词密度
从以上的理论介绍中你看到为多几个的关键词出现次数对搜索引擎判断相关性没有大帮助,反而一些长尾的关键词可能更有利IDF权重计分。
由于关键词密度已经被滥用。今时今日,关键词出现在网页的密度已经变得不重要。代之已起的是更看重LSI暗视式的相关性出现频率。理解SEO关键词基本概念后下一步就是如何选关键词。
关键词位置
关键词位置KeywordPosition指关键词在不同元素中出现位置对搜索排名的影响,特别是当元素出现在有长度限制的地方,例如标题。一般出现位置是愈前愈好,但有时将关键词放在前面可能造成文理不通,又会降低搜索用户点击意欲。
本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/70653.html
如有侵犯您的合法权益请发邮件951076433@qq.com联系删除