20122月13
排名突然从在第二页徘徊着跃然第了第一页第一位,但发的文章却迟迟不收录。原来在第二页的时候文章在数分钟内容收录,现在呢,发点有内容的文章,排名意外高升,文章却迟迟不收录,三天前的文章现在还没有收录。 要么是我不了解百度,只能怀疑这又是一个沙盒期,与以往经历的沙盒期不同的是,把你高高的挂在前面;相同的是,文章不着急给你放出来。 要么就是百度太了解我,知道前几天发的文章是在吊他的胃口,是有计划的每天发一点,每天按时发,专门为他而发的。 好吧,我先随手记一下这几天的历程: 一天查3次排名,6次是否收录新文章。如果这也是一种沙盒,我愿意待在里面。 过几天再写Google与百度优化时的区别,菜又多了一点。
20122月11
前面我们已经知道了搜索引擎的基本概念和发展简史,在搜索框中输入单词或短语,然后单击,稍等片刻,我们就会看到成千上万的搜索结果。接着要做的就是打开这些网页,查找我们需要的内容。但是除了“搜索即可找到”这个泛泛的概念外,搜索引擎的准确定义又是什么? 衡水网站优化觉得这有点复杂,在搜索引擎的后台,有一些用于搜集网页信息的程序。所收集的信息一般是能表明网站内容(包括网页本身、网页的URL地址、构成网页的代码以及进出网页的链接)的关键词或短语,接着将这些信息的索引放放数据库中。 而在搜索引擎的前台,即供用户输入搜索词(单词或短语)的用户界面,当用户执行搜索时,算法就会在后台的数据库中查找信息,将与用户输入的搜索词相匹配的网页链接呈现给用户。 提示,在未来的第18章会深入的介绍刚才提到的网页爬虫、网络蜘蛛以及网络机器人。 搜集网页信息的程序为爬虫(crawler)、蜘蛛(spider)或机器人(robot)。爬虫会遍历网络中未屏蔽的URL链接,并收集每个网页中的关键词和短语。然后将这些信息存放在搜索引擎的数据库中。想一下,互联网上的网站数量已超过亿个,而且还在以每月超过150万个新网站的速度增长。这就像是要用大脑将所有见到的每一个单词都进行分类,需要的时候再将所有相关信息调用出来,并按多条综合的机制进行排序。 简单点说,这几乎是不可能完成的任务。
20122月10
内容提要: 什么是搜索引擎 搜索引擎的基本结构 搜索引擎的特征 搜索引擎的分类 利用搜索引擎 控制搜索引擎 如何在互联网上寻找信息——例如事件、统计数字、商品、酒店、工厂甚至电话号码,您会怎么做?大部份情况下会使用搜索引擎,输入需要查找的内容,然后点击前面的搜索结果。在中国,70%左右人群使用百度。并且,衡水网站优化认为,一般情况下,人们大约只会关注前几页的搜索引擎,现在搜索引擎每页是10个结果(广告不计在内)。我们这里讲的SEO\网站优化,都是要实现一个目标:让您的企业网站\要推广的网站出现在搜索引擎搜索结果的前列,通常是第1页。 早期的互联网(1990年以前)并不是这样的。实际上,当时的互联网并不像现在这样是一个由数量非常巨大的相互连接的网站构成的网络,也没有成为如此庞大的商业助推器。当时所谓的互联网只是一些用户可以下载(或上传)文件 的FTP(File Transfer Protocol)站点。 要在这些站点寻找每个文件,用户只能浏览每个文件,也幸好当时站点数量非常少,和现在的互联网海洋相比简直相差太多。不过,这也使得用户在互联网上查找文件 成了一件困难费时间的事情。这时在蒙特利尔的McGill大学中,一个学生决定要简化这个工作。1990年,这位名叫Alan Emtage的学生创建了互出多上有始以来的第一个搜索引擎。他的杰作是一份互联网上各种文件的索引,名字叫Archie. 这个搜索引擎Archie不同于现在使用的百度、谷歌,Archie没有自然语言处理能力,他只是像我们现在普通的一个站内搜索,将互联网上的内容加入自己的网站数据库中,供人们搜索。但在当年,这已经是一件很伟大的事情了。 后来,1991年,明尼苏达大学的Mark McCahill创建了Gopher索引纯文本文档,让人们能够在互联网中文件搜索文本,发展成为了互联网最早的网站之一。 1993年,第一个具有现代意义的搜索引擎Wandex被Matthew Gray创建,它是第一个同时具有网页索引和搜索功能的搜索引擎,是第一个使用了网络爬虫的搜索引擎,也成为了后来各种搜索爬虫的基础。从那以后,搜索引擎就开始发展起来,从1993年到1998年,主流搜索引擎都有 Excite——1993年 Yahoo!——1994年 Web Crawler——1994年 Lycos——1994年 Infoseek——1995年 AltaVista——1995年 Inktomi——1996年 Ask Jeeves——1997年 Google——1997年 Msn Seacrh——1998年 今天,搜索引擎已经非常成熟,可以用日常的单词或短语来搜索各种文件、文档、网页、图片。看着现在搜索引擎强大的搜索能力,很难让人相信搜索引擎只有15年的短暂历史。 衡水网站优化在2000年接触网络时,经常使用的Yahoo!搜索。
20122月10
衡水网站优化认为,网站优化,即SEO(Search Engine Optimization)是一个很宽泛的概念,很难简单直观的用几句话就能说明其全部含义。网站优化涉及到很多内容,包括搜索引擎的工作原理,以及不同搜索引擎之间(主要是百度和GOOGLE)的差异、网页框架的设计等。要面面俱到地学习各个方面的知识,在短时间内是不现实的。不过,网站优化并不是一项不可能完成的任务,但如果完全不知道它是什么以及他的原理,那就不可能实现网站优化。 从今天起,Doseo开始介绍网站优化的基础知识。这部份内容对什么是搜索引擎以及搜索引擎的原理做个大概的介绍,并解释什么是长尾搜索以及SEO方案。将这些内容结合 在一起,就能知识如何正确地实施网站优化策略来提高网站的流量。 接下来将介绍: 1、搜索引擎基础知识 2、长发搜索理论 3、制定网站优化(SEO)方案
20121月31
一、高估了原来新发现的排名因素影响力 针对不同的网站,不同的阶段,网站优化的方式方法一定要灵活。例如Doseo本身自己这个站,目前在百度搜索引擎中属于轻度观察期,以更新高质量原创内容、更新频率为参数进行排名。 上个月我更新的排名有12篇,在更新密集之前,排名一直在10-20之前,更新密集的几天内(1月中旬)排名稳定在第2-3名。春节期间停止更新,排名马上恢复到了10名以后了。 不过这个新发现,在百度数次改进之后,肯定会是提高权重、提高排名的重要因素,及早的发现和观察,也不是坏事。 要把握好度,千万别让百度以为我们在作弊。 二、中文URL体验性差,比预期值低 之前尝试在企业站中,产品分类、产品页面使用中文url,但近半年来观察,收录未见明显好转,比传统的方式没有明显优势。反而,在doseo上一篇文章 :又见识了百度的“习惯搜索结果” 却迟迟不被收录。 来看看这个链接:http://doseo.org/2012/01/19/%e5%8f%88%e8%a7%81%e8%af%86%e4%ba%86%e7%99%be%e5%ba%a6%e7%9a%84%e4%b9%a0%e6%83%af%e6%90%9c%e7%b4%a2%e7%bb%93%e6%9e%9c/ 有多长,能数清吗。 想想还是算了,以后尽量少用中文url. 三、长期良好的信用是提高权重的唯一方式 权重,只有2个词,非常简单,但对于网站优化来讲,重要的不能再重 了。 新网站,如婴儿,想要权重,难比登天; 老网站,不用刻意去优化什么,只要没有不良嗜好和记录,简直是越老越值钱,人缘(外链)越来越多,越来越好。 我刚刚在天涯发了一个贴子,这边表发表,出来地址后立即去百度这个地址,马上就收录了。从我提交到天涯的数据库到我去百度搜索到被收录,前后不差10秒。 10秒种,就被百度收录,还有再过多的来解释,来渲染吗? 其实这里的每一篇文章都是一块实验田,不同的布局,不同的外链发布地,找规律,改进,再找规律,再改进,自己就会一点点成熟。最后重点再提一下现在主推的关键词:衡水网站优化
20121月19
doseo.org近半年来因为疏于更新和管理,原本在搜索”衡水网站优化“时一直徘徊在第2页了, 今天搜索,突然到首页第3名了, 最近经常遇到这种排名进首页比较突然的情况,有一例是”习惯搜索结果“,即不是真正的自然搜索结果,是百度人性化的一种微改变吧。 例如我经常用一台电脑搜索 “衡水吧“, 然后点开 http://www.hengshuiba.cn ,到一定程度的时候,伪自然排名就出现了,如下截图: 其实现在真正的排名 : 建议百度在这类搜索结果前面能有标识,减少让人误解。 当然,经过多台电脑测试,doseo目前搜索衡水网站优化的结果不是伪自然排名,是真的自然排名。目前是排第2名,能有这个结果当然很感谢百度 ^_^ 接下来要更加努力的更新,更好的工作,保持住,并向前进才可以。
20121月3
问题 通过最近几天不断的总结网站优化项目,发现一个重要问题:没有及时的去行动。可能由于太过自信,甚至是太过懒惰,总是在最后时刻才去高度集中的努力,导致工期紧张,甚至延期。 以前固有的经验确实宝贵,但这个行业是在不断发展,不断高速发展的,必须及时去调整自己的手法,才能不断修正。换句话说,这有比通过限宽门,宽度代表传统的技术,但路是弯的,并不是笔直的,在一定速度的要求下去完成通过,有比在指定时间,达到指定目标。 出现类似问题的网站优化例子 也幸好发现的及时,现在每天的工作重点先是放到每个站的观察、诊断,从不再放过任何细节。有几个客户的站已经从深陷的“沙盒”中被“释放”了。要记住,从此以后新的项目,都要早一天,早一点开始,一环紧扣一环,时间是很有限的。 比如,在网站未被百度收录前,需要先有一定量的内容,在被收录后,要有一个持续的更新过程;几周后,外链数量要稳步上来,高质量的内容,去获取高质量的外链。每周、每个月都要有进度的要求,再也不能随心的去做,太危险! 回到衡水网站优化 关于网站优化的文章,一直在想系统的有个总结,希望能尽快实现。应该把业务重点放回衡水,从衡水网站优化重点开始。重点放在衡水的 工程橡胶、玻璃钢、以及安平丝网几个方面。
201112月23
今天主要分析一下关于网站优化中分析流量及蜘蛛爬虫行的2种方式。 网站优化的目的是提高网站访问量,转化流量为目标客户的购买力。衡量网站访问量尤如对一个人进行综合的评估评分,要内外兼顾。 1)所谓外,主要是指第三方流量统计工具。例如著名的CNZZ,百度统计,Google analytics。这些工具通过将统计代码加入网页后,有人访问,即触发统计程序进行记录,最后进行汇总和分析。 2)内,是指从服务器的web日志中分析。与刚刚指的 外 不同之处,绝大多数统计服务是通过用户使用浏览器浏览网页时,执行javascript脚本代码,再触发统计行为。但搜索引擎的蛛蛛爬虫是不执行javascript的,他们每次到访问的痕迹只能由底层的web服务器才能感知并记录。再通俗一点说,第三方的统计代码是被动的,只有当浏览器执行了统计代码才会记录;而web服务器是主动的记录。无论是普通浏览器用户,还是蜘蛛用户,都会被web服务器日志忠实的记录下来。如下图1-2所示,被第三方统计监控到的,仅是浏览器用户。而蜘蛛来抓取信息时,只有被web服务器的日志记记录。
201112月22
1) 域名后缀首先.Com 。如果.Com被提前注册,国内的网站也可以选.Cn,或.Com.cn 。尽量少用诸如.in之类的其他国家国别域名,除非您的业务针对那个国家\地区。 2)良好的CMS构架支持。很多用户不了解什么是CMS,CMS即是网站内容管理系统,是Content Management System的缩写。灵活方便的模板机制,方便快捷的信息发布,保证了网站框架的灵活和内容更新的及时性。“内容为王”的SEO时代,每天更新大量内容是必不可少的工作环节,如果选择一套不成熟的系统,或干脆手动管理页面,一开始便走错了路。这里推荐dedecms thinkphp等,成熟稳定,也易用。 3)接上面,有了域名和CMS系统,接下来要落地了,需要找稳定的web空间。建议使用独立IP的虚拟主机,好处A:权重高。好处B:没有同IP网站太牵连的风险,好处B:好全性好。如果大型的网站,自然是独立服务器了。国内的推荐使用息壤独立IP空间,推荐服务商 可信赖网络淘宝店 ,价格公道,服务好。关于虚拟主机商的选择,以后再单独形成文章,重点是网络稳定,服务及时。 4)域名、CMS,空间都有了,接下来是更新。 保持持续有力的更新是一项长期的工作。持续是指不能三天打鱼两天晒网,要有规律的坚持更新,周期不宜长过三天;有力的更新是指更新的内容要给力。A:要优秀,B:原创比例要高。不要把自己的站填塞成无意义的垃圾场,垃圾站。 5)外链。外链为皇,但找外链不要盲目。对于新接触的新站,要慎重,建站一周以上未被收录的要小心;被收录的内容特别少的要小心;内容无意义的垃圾站要坚决拒绝。 相对于内容,外链要有比例的增长,不要一天更新2篇内容,却增加几百个外链。这里要着重说明,请慎用一些外链群发工具,不要图一时之快,不要相信什么捷径。要知道,搜索引擎不是那么好欺骗的,老老实实扎扎实实做站是上上选,没有之一。 关于网站优化,获取好的排名,绝非区区几百字就能概括清楚的。对于非专业和专业的SEOer来讲,立场不同,眼光不同,要求也不同。DOSEO不仅只想做专业SEOer的内容、经验站,更想把专业的SEO知识通过通俗的方式解释出来。让关注、有需求的老板、站长能和我们更好的合作,相互有更好的理解。 本文结束的一句话,凡事欲速则不达,我们理解网站老板要求尽快将排名优化上去的要求,但也希望这些老板也能理解这个过程需要的工作。一般新站,中度以上竞争力的关键词想通过正常手法(即不作弊)的方式达到百度首页,时间需要2-3个月或更长的时间。这中间如果一味按外行的想法来做,会事得其反。
201112月21
根据优化日志,7月4日正常,衡水网站优化这个词排名第9,45 。到28号的时候,首页被拔毛了,排名下降到41,而且是一内页。究其原因,是更新太太太慢了。 最近这段时间终于解脱了,手上的SEO资源越来越多,却没有能科学有效的充份利用。对每个站点的更新、外链、排名情况掌握的不够明朗,统计方式的效率过于低下,基于live.com的skydrive也不稳定,不方便,也不利于共享给用户实时和历史数据。为了解决以上问题,正在着手开发一套综合的SEO管理系统。不仅是简单的统计排名,更有每天Seoer工作的安排、统筹等工作平台。 PHP+MYSQL,smarty框架,现在正在开发核心部份,自动获取、存储排名数据。预计春节前开发完成,这是一个挑战,更是一个希望。 一旦成功,就能充分利用手头这些资源了,也能更科学有效的对各站点进行优化工作。 也从今天起,每天更新doseo.基本不转载,绝大多数要原创,争取早日将首页找回来。