基于搜索引擎优化技术与模板引擎技术的网站优化策略,本文主要内容关键词为:技术论文,搜索引擎优化论文,模板论文,策略论文,引擎论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中国互联网络信息中心(CNNIC)2009年发布的《第23次中国互联网络发展状况统计报告》中显示,截至2008年底,中国的网站数目已经达到287.8万个。Netcraft 2009年公布的最新月度互联网调查报告中指出,全球网站数量已经接近2.25亿个。除了一些知名的门户网站外,绝大部分网站都不为网民所知。因此,如何能让网站的信息被用户发现,或者能够将网站的信息快捷准确地推送到广大的互联网用户群体中,是各网站经营者普遍关注的问题,也是各网站成败的关键。尤其对于一些建立时间不长或者影响力比较小的网站,从信息采集和信息推广上都存在很大不足,虽然很多单位将一些具有价值的情报信息发布到其门户网站上,但由于推广做得不够,这些信息很有可能被互联网用户遗漏。这些网站除了进行传统的宣传和推广以外,进行搜索引擎优化(Search Engine Optimization,SEO)是一种最为直接的手段。通过总结各类搜索引擎抓取网页的规律,以及对网页进行索引和排名等技术,可以对网站页面进行合理优化,提高网站在各搜索引擎中的排名,从而提高网站的知名度。
1 SEO概述
SEO主要就是通过对网站的结构、标签、排版等各方面进行优化,使各搜索引擎更容易搜索到网站的内容,并且让网页在Google等搜索引擎中获得较高的评分和较好的排名。因为一般情况下,搜索结果在10页以后的信息经常都会被淹没在浩瀚的信息中。在国外,搜索引擎优化已经成为一个行业,中国的SEO行业从2003年才正式起步,但发展迅速[1]。
SEO相比传统的营销推广而言,具有成本低、周期短、目标客户群体定位更加准确等特点。SEO技术分为白帽(Whitehat)和黑帽(Blackhot)两种[2]。顾名思义,黑帽技术指专门用作弊手段取得排名的SEO方法。常见的黑帽技术有[3]:跳转页面、门页,垃圾链接,隐藏网页,桥页,关键词,等等,最典型的黑帽搜索引擎优化是,开发网络抓取软件,直接从互联网上抓取网页搭建网站,然后在这些网页上放上Google Adsense。黑帽所用的技术是搜索引擎明确禁止的,一旦使用过黑帽技术的网站被搜索引擎发现,排名将会大幅度降低甚至删除域名,因此网站使用黑帽技术提高排名,无异于是饮鸩止渴。白帽技术是指那些使用正规方法优化网页,并使其容易让搜索引擎发现的技术。使用白帽技术是正规网站的必经之路,虽然不能短期快速增长流量,但是,如果长期坚持,一旦网站有了稳定流量,网站就会逐渐走向成熟,并且会对搜索引擎的依靠度降低。本文就是基于白帽技术提出的网站优化方案。
2 基于SEO的网站优化方案设计
SEO贯穿网站开发和维护的全过程,涉及网络策划人员、软件开发工程师、界面设计师、内容管理员、网站维护人员等多种角色的配合工作。本文提出一套基于策划层次、基于开发层次、基于界面设计层次、基于内容维护层次的整套网站SEO解决方案,贯穿网站生命周期的各个环节。
2.1 基于策划层次的SEO
1)选择合适的域名。拥有自己独立的域名,能够树立网站的信誉。在选取域名的过程中,最好能够选择便于用户记忆的关键词,同时,域名不要过长,否则难于记忆。
2)虚拟主机策略。与其他网站共享一台虚拟主机,如果共享同一IP地址的某一网站被搜索引擎惩罚,将连累其他网站也无法登录到搜索引擎。因此选择虚拟主机服务的时候,需要对该主机的使用情况进行了解和选择,经济条件允许的情况下,尽量使用独立的主机。
3)栏目设计。栏目设置是否合理是网站成功的一大关键因素。从搜索引擎的角度看,单一的目录结构为最佳。因此,对于规模比较小的网站来说,最好不要超过一级子目录,而对规模大一些的站点来说,不要超过三层子目录。
2.2 基于开发层次的SEO
目前,网站数据大都由网站后台上传,审核后发布供互联网用户浏览。发布方式有两种,一种是通过动态页面浏览,采用ASP,PHP,JSP,.NET等程序动态生成,它们的大部分内容来自于与网站相连的数据库,其访问URL中通常出现“?”,“=”,“%”等符号。另外一种方式是,通过网站后台发布系统,直接通过模板引擎技术生成静态页面,即在后台增加一条数据,审核发布成为静态页面,互联网用户访问的是模板引擎发布的静态页面,而不需要动态访问数据库内容。
由于大多数搜索引擎的抓取程序都无法解读符号“?”后的字符,这就意味着动态网页很难被搜索引擎检索到,因而被互联网用户搜索到的机会也大为降低。因此应尽量将网站发布的内容静态化,或者采用URL重写技术。
2.3 基于界面设计层次的SEO
1)网站布局设计。网站结构是SEO的关键,应该迎合搜索引擎的抓取习惯,即从左到右、由上及下的抓取习惯,因此在这些地方出现关键词是有利的。网站结构比较差的是首页Flash开屏、图片导航、整站图片等。
2)优化网页元素。首先,网页代码中的标题、关键词和网页描述对搜索引擎来说非常重要,其在HTML语言中形式如下:
〈title〉标题〈/title〉
〈meta name=“keywords”content=“关键词”〉
〈meta name=“description”content=“网页描述”〉
这些需要界面设计人员通过标签的方式预留在模板中,内容维护人员上传内容的时候提供关键词,从而自动插入到页面相应位置。
其次,对于界面设计人员来说,由于使用一些界面设计工具,经常会误操作产生一些空链接,过多的空链接会给搜索引擎优化带来不利影响。因为搜索引擎的爬行器漫游到站点并沿链接前进,遇到无效链接时,它就会停止前进。因此,必须确保HTML结构良好,所有链接都按照预期工作。
再次,网页上一般都会出现图片,对于网站上重要的图片需要加上ALT属性。对于那些用于排版的图片,可使用空ALT属性(alt=“ ”)。对于链接图片的ALT文字,其关键词应为被链接网页的关键词,而非本页的关键词。
3)CSS+div技术的使用。利用Table对网页进行分割,是目前大多数中小型网站采用的方式。近两年来,一些大型商业网站纷纷采用了CSS+div技术对网站进行了改版,采用CSS技术,能够使得网页制作不需要使用大量的Table表格嵌套,减少冗余代码,提升网页加载速度,符合W3C标准[4],并且由于样式放在CSS里面,这样搜索引擎在抓取时就不会管CSS,只需要采集静态页面里的内容就可以了,提高了抓取效率,对搜索引擎的爬行器友好度高[5]。
2.4 基于内容维护层次的SEO
1)为页面确定关键词。合适的关键词,能够让用户快速定位到网站,这是进行网页优化的基础。除了给首页增加关键词以外,网站内容维护人员在上传内容的时候,需要为更新的每一篇内容选择合适的关键词,以便直接通过搜索引擎找到该内容,而不仅仅是通过首页导航点击进去。
研究表明,关键词密度在2%~8%时有益于网站的排名[6-7],因此,内容维护人员确定好关键词以后,应该尽量提高关键词密度。比如关键词为“青年教育”的网页,网页的内容中尽量不要出现“青少年教育”等字眼,而应该把这些词汇都统一为“青年教育”,关键词分布应遵循“无所不在,有所侧重”的原则[8]。需要注意的是,过度使用关键词则会造成关键词堆砌,很可能被搜索引擎归入恶意行为,从而遭到惩罚[9]。
2)友情链接。Google的PR技术就是建立在外链的基础上的,外链指标是数量和质量,质量好的外链是SEO外部因素中最为重要的。
3)向搜索引擎提交网址。向各大主要搜索引擎提交网址,不要使用软件或自动提交服务。
3 基于模板引擎技术的网站优化方案
3.1 模板引擎技术介绍
尽管采用URL重写技术也能够解决动态页面难以被搜索引擎收录的问题,但是出于访问效率等因素综合考虑,动态数据静态化发布为越来越多的内容管理系统采用。而通过模板引擎技术实现动态数据静态化,是目前网站开发的趋势。各种开发语言都有基于自己的模板引擎,基于Java的模板引擎有[10]:Velocity,FreeMarker,Jamon,等等。这些模板引擎技术各有千秋,本文采用了应用非常广泛的FreeMarker来实现网站内容的静态发布。
FreeMarker是一个免费的模板引擎组件[11],它使用纯Java编写,是一个Jar包。通常由Java程序准备要显示的数据,由FreeMarker根据模板描述生成包含这些数据的页面。FreeMarker将设计者和程序员视为具有不同专业技能的不同个体,即界面设计人员和程序员是分工劳动的,界面设计人员只需要在HTML中加入一些特定指令,这些包含FreeMarker指令的文件就称为模板,FreeMarker会在页面输出时,用程序员开发的Java对象中对应的数据模型替代这些代码。数据模型由程序员编程创建,向模板提供变化的信息,这些信息来自于数据库、文件,甚至在程序中直接生成,模板设计者不用关心数据从哪儿来,只需使用已经建立的数据模型。
3.2 模板引擎技术在SEO中的应用
以实现增加新闻为例,其中新闻由标题、关键词和内容描述几个属性组成,来说明利用模板引擎技术实现SEO的方法以及动态数据静态化的方法。
首先,界面设计人员在模板中相应位置加入FreeMarker指令,编辑新闻页面的模板content.ftl:
内容维护人员在发布某条新闻的时候,输入标题、关键词、内容等数据,并被存储到数据库中,审核后将会触发静态化数据的Java对象。该Java对象根据这条新闻的唯一标识,从数据库中获得该新闻的所有信息,并将这些信息封装到对象ArticlePo中。接下来,需要将该对象和模板结合起来,发布成静态页面,如以下代码所示,其中aInfo是对象ArticlePo的一个实例,包含一条新闻的信息:
模板中的标签将会被aInfo对应的数据替换,生成静态页面,访问该新闻的时候,则不需要再进行数据库的访问操作,直接访问生成的静态页面即可。
4 SEO实例
笔者负责开发的北京市科学技术出版社网站(www.bjkpress.com.cn),又名“贝壳阅读网”,经SEO策划和改造后于2009年8月初上线,新网站改版运行以来,发现无论在网站排名还是网站流量等方面,都有了显著的提高,为提高网站知名度发挥了重要的作用。
4.1 网站排名分析
通过中国网站排名(www.chinarank.org.cn)分析网站的排名情况,发现“贝壳阅读网”在短短3个月内,较改版之前,网站排名提高30几万,图1是2009年11月12日得到的统计结果。
图1 中国网站排名网排名分析
通过世界网站排名ALEXA(www.alexa.com)分析网站排名情况,发现“贝壳阅读网”(改版前)2009年8月初排名6982498,截至2009年11月初,综合排名提高到3788346。就全国地方科技出版社网站在ALEXA的排名情况来看,“贝壳阅读网”由原来的11名提高到现在的第4名[12]。
4.2 网站流量统计监测
对于网站的优化情况好坏的评定,最大的衡量指标就是网站的流量,“贝壳阅读网”改版后短短几个月内,网站流量陆续成倍增长,对于网站品牌的提升起到了非常好的效果。其间,几家图书机构与其联系,有意与“贝壳阅读网”进行业务合作[13]。
为了更好地监测网站流量以及网站访问情况,除了网站定制的统计外,该网站还采用了雅虎的量子横道统计对网站进行检测,通过第三方检测工具反映网站的访客情况、IP来源分析、搜索引擎来源分析、关键词分析、被访页面分析、访问地区分析,等等,及时地检测了访客的兴趣点,辅助管理员对网站内容进行调整,大大提高了网站的访问率。
在这些流量中,通过对其访问来源进行分析,大部分数据来源于搜索引擎,直接输入域名的访问仅占25.23%,如图2所示。
图2 访问来源分析
5 结束语
本文通过总结各种SEO方案,提出基于策划层次、基于开发层次、基于界面层次以及基于内容维护的整套解决方案,从网站生命周期的各方面协同工作,对网站进行各个层次的优化,并将该方案运用于“贝壳阅读网”中,在短期内大大提高了该网站的流量,提高了该网站在国内和世界网站中的排名,给北京市科学技术出版社带来了更多的合作机会和广告业务。
收稿日期:2010-01-07
标签:搜索引擎论文; 网站排名论文; seo论文; 搜索引擎优化论文; 优化策略论文; 搜索引擎收录论文; 关键词排名优化论文; 搜索引擎推广论文; 网页模板论文; 排名优化论文; 网站关键词论文; 网站分析论文; 界面设计论文; 静态页面论文; seo排名论文;