php动态页面如何被搜索引擎收录
常常在google的时候会很精确的得到来自stackoverflow上的答案,但有个疑惑没有想明白,对于由php(或jsp)动态创建的页面,如何被搜索引擎收录?
举个例子来说:
假设我现在在德问上创建一个问题A,那么对于包含问题A的动态页面如何被搜索引擎的爬虫收录到的?因为我新创建的动态页面似乎没有其他页面链接指向它啊?
说到这里,又引申出这样一个问题,对于一个动态生成的页面,有没有比较好的方式来提高自己在pagerank上的排名?(比如说静态页面通过将内容放到‘h1’标签中,会提高页面排名)
Answers
可以举一个动态网页被搜索引擎收录过程的例子:
当当网上书店的产品详细介绍页面都是典型的动态网页,这么一个拥有庞大数据量的网站完全采用静态网页是不现实的,但大量的动态网页并不容易被搜索引擎收录。2004年10月份,新书《网络营销基础与实践》第二版由清华大学出版社出版,并且在当当网上进行网上销售,该书在当当网上书店详细介绍页面的网址是:
http://www.dangdang.com/product_detai...
在当当网上,每个产品介绍页面都有一个类似的URL,这就是一个典型的动态网页URL形式。但这个动态网页并不容易被搜索引擎收录,
除非其上级网页(产品目录列表)已经被搜索引擎收录,并且当搜索引擎spider来抓取信息时,上述产品页面的链接正好在该产品目录页面上
。我们可以用这个实事来验证这一点:
在google上用“《网络营销基础与实践》第二版”作为关键词进行检索时,在搜索结果页面中有一条记录是当当网的产品介绍,不过URL与上面列出的有一点差别:
http://www.dangdang.com/product_detai...
即后面多了一个&from=P-1017102,为什么出现这种状况呢?原因在于,当时我在网上营销新观察的首页为《网络营销基础与实践》第二版的网上销售地址做了一个链接,URL为
http://www.dangdang.com/product_detai...
表明用户点击这个URL是来自于网上营销新观察网站
。结果发现,google收录了当当网上《网络营销基础与实践》第二版详细介绍网页,只不过
获得这个网页URL来源的是通过网上营销新观察的推荐而不是当当网的产品列表页面
。尽管当当网的产品列表页面比网上营销新观察首页更早列出这个产品及其链接URL,但首次被搜索引擎发现的链接并不是来自当当网。
祥见: 动态网页怎样才能被搜索引擎收录