<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>广州网站建设团队博客</title>
	<atom:link href="http://www.cnidea.net/blog/?feed=rss2" rel="self" type="application/rss+xml" />
	<link>http://www.cnidea.net/blog</link>
	<description>建站、营销、推广、分析</description>
	<lastBuildDate>Fri, 13 Jan 2012 02:20:17 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.1</generator>
		<item>
		<title>SEO的13种方法,让你Google名列前茅</title>
		<link>http://www.cnidea.net/blog/?p=176</link>
		<comments>http://www.cnidea.net/blog/?p=176#comments</comments>
		<pubDate>Fri, 13 Jan 2012 02:13:35 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[SEO优化技术]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[SEO]]></category>

		<guid isPermaLink="false">http://www.cnidea.net/blog/?p=176</guid>
		<description><![CDATA[SEO的13种方法,让你Google名列前茅 来自：搜狐 对于数位时代的新创企业来说，搜索引擎优化非常重要，聪明的企业家知道如何利用搜索引擎优化作为营销工具的一部分，知道如何提升Google的搜索排名，以及对不熟悉的外国语言进行SEO，而且最重要的是，这一点都不难！ 年轻企业家协会创办人Scott Gerber长年致力于培育企业家精神，为年轻企业家提供一系列工具、顾问及资源，帮助企业各阶段的成长与发展。现在，就由他辅导的年轻企业家，分享企业如何提昇SEO搜索结果的13种技巧。 1.建立长青内容 （旅游生活博客Exile Lifestyle 作者 Colin Wright） 你会希望你的内容在各种关键字或词汇排名在最前面，所以需必须先要有高品质和权威的内容。最好的方式是确认你建立的内容是永久有效的内容、而非跟随趋势或看过即丢的内容。因此，开始建立人们十年后都还会想要看的内容吧！如此你就可以在整整十年内都获得关键字连入的流量。 2. 检视网络上你的线上档案 Web 2.0行销公司Endagon创办人Logan Lenz 花一点时间检查网络上每一个关于公司介绍的线上档案，是否过时了？是否网址已经更改了？这些档案每一个或许对于Google的演算法没有显着影响，但是当你在网络上有一打帐号的时候，获得的结果可能会出乎你的意料。 3.想像你客户可能输入搜索引擎的每一种方式 - 线上企业整合顾问Nathalie Lussier 想像你目标客户可能在Google上输入的每一个词汇，并从Google免费的关键字工具验证你的想法。记住，25%的关键字从来没有被人输入过，但是你必须找出低竞争却很热门的关键字，然后专门会该关键字撰写相关主题的内容，并试着优化它。 4. 雇用专家： 线上橱具网站Kitchen Cabinet Kings创办人Anthony Saladino 我建议雇用搜索引擎优化的公司或专家，来发展增进关键字排名的有效策略。Google搜索2011年2月推出的新演算法Panda，让产品的搜索结果更难排在前面，因此我建议外包给专家，找到有良好绩效的个人或公司，并每两周检视报告一次。 5. 当客座作家： 校园笔记分享网站MySchoolHelp创办人Ben Lang 开始当客座作家，为其他相关网站发表客座文章。博客喜欢新鲜的内容，而你可以获得很好的方式建立链接，并促进Google的排名。 6. 内容为王，链接为后 行销公司Affiliate Media Inc.创办人Warren Jolly 建立好的内容对于如何在Google排名领先是绝对关键的，但是建立链接则更为重要。Google喜爱链接，特别是从具有相关性或权威性网站来的链接，因此加入任何可以加入的相关产业协会，发表客座文章及连回你的网站，并且将你的网站提交到任何相关的目录，增加更多反向链接。 7. 发布影片 企业行销服务Business Beware创办人Ashley Bodi 影片对于企业经营者很重要，不只赋予企业独特的人格，而且很容易透过网络效用传播，并让使用者链接你的网站。建立一个很棒的影片，并提供人们想要分享并反覆观赏的资讯，而且影片现在可以从一个平台发布到多个平台，这会让Google搜索引擎爱上你！ 8. 善用学校网站： 垃圾清运服务College Hunks Hauling Junk创办人 Nick [...]]]></description>
			<content:encoded><![CDATA[<p>SEO的13种方法,让你Google名列前茅</p>
<p>来自：搜狐</p>
<p>对于数位时代的新创企业来说，搜索引擎优化非常重要，聪明的企业家知道如何利用搜索引擎优化作为营销工具的一部分，知道如何提升Google的搜索排名，以及对不熟悉的外国语言进行SEO，而且最重要的是，这一点都不难！</p>
<p>年轻企业家协会创办人Scott Gerber长年致力于培育企业家精神，为年轻企业家提供一系列工具、顾问及资源，帮助企业各阶段的成长与发展。现在，就由他辅导的年轻企业家，分享企业如何提昇SEO搜索结果的13种技巧。<br />
1.建立长青内容<br />
（旅游生活博客Exile Lifestyle 作者 Colin Wright）</p>
<p>你会希望你的内容在各种关键字或词汇排名在最前面，所以需必须先要有高品质和权威的内容。最好的方式是确认你建立的内容是永久有效的内容、而非跟随趋势或看过即丢的内容。因此，开始建立人们十年后都还会想要看的内容吧！如此你就可以在整整十年内都获得关键字连入的流量。<br />
2. 检视网络上你的线上档案<br />
Web 2.0行销公司Endagon创办人Logan Lenz</p>
<p>花一点时间检查网络上每一个关于公司介绍的线上档案，是否过时了？是否网址已经更改了？这些档案每一个或许对于Google的演算法没有显着影响，但是当你在网络上有一打帐号的时候，获得的结果可能会出乎你的意料。<br />
3.想像你客户可能输入搜索引擎的每一种方式<br />
- 线上企业整合顾问Nathalie Lussier</p>
<p>想像你目标客户可能在Google上输入的每一个词汇，并从Google免费的关键字工具验证你的想法。记住，25%的关键字从来没有被人输入过，但是你必须找出低竞争却很热门的关键字，然后专门会该关键字撰写相关主题的内容，并试着优化它。<br />
4. 雇用专家：<br />
线上橱具网站Kitchen Cabinet Kings创办人Anthony Saladino<br />
我建议雇用搜索引擎优化的公司或专家，来发展增进关键字排名的有效策略。Google搜索2011年2月推出的新演算法Panda，让产品的搜索结果更难排在前面，因此我建议外包给专家，找到有良好绩效的个人或公司，并每两周检视报告一次。<br />
5. 当客座作家：<br />
校园笔记分享网站MySchoolHelp创办人Ben Lang<br />
开始当客座作家，为其他相关网站发表客座文章。博客喜欢新鲜的内容，而你可以获得很好的方式建立链接，并促进Google的排名。<br />
6. 内容为王，链接为后<br />
行销公司Affiliate Media Inc.创办人Warren Jolly<br />
建立好的内容对于如何在Google排名领先是绝对关键的，但是建立链接则更为重要。Google喜爱链接，特别是从具有相关性或权威性网站来的链接，因此加入任何可以加入的相关产业协会，发表客座文章及连回你的网站，并且将你的网站提交到任何相关的目录，增加更多反向链接。<br />
7. 发布影片<br />
企业行销服务Business Beware创办人Ashley Bodi<br />
影片对于企业经营者很重要，不只赋予企业独特的人格，而且很容易透过网络效用传播，并让使用者链接你的网站。建立一个很棒的影片，并提供人们想要分享并反覆观赏的资讯，而且影片现在可以从一个平台发布到多个平台，这会让Google搜索引擎爱上你！<br />
8. 善用学校网站：<br />
垃圾清运服务College Hunks Hauling Junk创办人 Nick Friedman<br />
SEO最大的秘密是，当.edu的网站连向你的网站时，会为你带来更棒的Google排名。快去联络学校单位，并找个理由让他们连向你的网站，例如开放特别的实习生名额之类的…<br />
9. 勤于更新网站<br />
年轻企业家部落格Under30CEO.com创办人Matt Wilson<br />
你越常于更新网站资料，Google就会认为它越重要。如果你可以在博客每天刊登新内容，Google会开始将你的网站视为重要的资讯来源，无论你的关键字为何。只要你多刊一篇文，你就会有多一个机会让更多新的搜索词汇找到你，所以，每一篇文章都可以让你的网站更容易被发现。<br />
10. 使用正确的关键字：<br />
滑板职业选手Lauren Perkins<br />
两个增加网站SEO排名的有效方法是，为文章下标签和关键字分析。你必须确认你的标题具备足够的描述性，并且选择人们会搜索的关键字。所以，先把自己想像成搜索者吧！<br />
11. 避免使用Flash：<br />
数位密码保存网站Entrustet创办人Nathan Lustig<br />
许多小型企业，特别是餐厅或酒吧，因为美观或便宜快速的因素，运用Flash于网站上。虽然网站可能看起来比较优雅，但是会因此造成Google排名落后。快把你的Flash网站改为WordPress或其他平台吧，你的搜索引擎排名将会一飞冲天！<br />
12. 善用地方搜索（Local Search）<br />
卫浴设备网站Just Bath Vanities创办人Andrew Saladino<br />
你是否是地方型企业？你是否有把自己的网站提交到Google、Yahoo和Bing等搜索引擎地方名录呢？如果还没有，快点丢下这篇文章，开始提交你的服务到名录吧！我的网站简单填几个栏位提交到地方资讯后，流量就产生快速的成长。搜索的未来一定是个人化的地方搜寻结果，但这些珍贵的档案常常被忽视。<br />
13. 准确知道人们用来搜索的词汇：<br />
自动化软体Automize创办人 Trevor Mauch<br />
人们在搜寻优化时常犯的最大错误是，对于人们如何实际输入搜索引擎找到你的词汇不太清楚。最简单的方式就是到Google搜索首页，慢慢的打下你的关键字前几字，然后观察Google建议的关键字会是什么，然后把这些准确的关键字用在你网页的标题，这就是人们想要的！<br />
编译：数位时代（VIA：mashable）来源数位时代)</p>
<p>建站实惠，案例超多，请找粤海网络：<a href="http://www.cnidea.net/">http://www.cnidea.net</a></p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.cnidea.net/blog/?feed=rss2&#038;p=176</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Codecademy引领编程方式变革的弄潮儿</title>
		<link>http://www.cnidea.net/blog/?p=173</link>
		<comments>http://www.cnidea.net/blog/?p=173#comments</comments>
		<pubDate>Fri, 28 Oct 2011 03:50:12 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[自由集]]></category>
		<category><![CDATA[Codecademy]]></category>
		<category><![CDATA[编程应用]]></category>

		<guid isPermaLink="false">http://www.cnidea.net/blog/?p=173</guid>
		<description><![CDATA[一个异常火爆的趣味编程应用Codecademy，公司今天宣布已获得250万美元的投资。 Codecademy是今年8月份刚推出的一个编程网站。它是一种基于网络的互动编程教程，手把手帮助用户了解JavaScript的一些基本原理，更重要的是，使用Codecademy学习编程充满了趣味性。Codecademy的注册过程非常特别：无需注册就可以直接使用。用户一旦进入Codecademy.com页面就能轻松完成编程的第一课，如，用户要想知道自己的名字有多少字母，只需将自己的名字输进双引号中，再输入“.length”，最后点击enter键即可。当用户完成了一定的课程学习后，网站会自动建议用户创建自己的账号并进行注册，如果不注册的话，此前的学习记录将全部丢失，这样用户很有可能就会注册了。 编程课程本身也非常简单。网页左方的工具条会指导用户完成每一项任务。网页不仅会告知用户具体怎么做，同时还帮助用户巩固之前的编程知识。随着用户学习编程的不断深入，他们会得到一些积分和奖励，这些都会公开显示在用户的信息中，其他用户也可以看到。如果该网站未来能开发出排行榜和竞争等这样的社交功能，也是意料之中的事。 Codecademy推出后实现了爆发式增长，应用推出仅72小时就获得了20万用户，用户完成的编程练习总量也已达到惊人的210万个。 现在，Codecademy的用户已经遍布全球200多个国家。 Sim和Bubinski是公司的两位创始人，他们的经历也是很多投资者感兴趣的地方。Bubinski刚从大学毕业，而年仅22岁的Sims更是辍学加入了这家初创公司，在此之前，Sims已经在很多科技公司工作过，包括GroupMe和AOL Ventures。 如果你对这也感兴趣的话，不妨进来 Codecademy.com 试试。 via 36氪]]></description>
			<content:encoded><![CDATA[<p>一个异常火爆的趣味编程应用Codecademy，公司今天宣布已获得250万美元的投资。</p>
<p>Codecademy是今年8月份刚推出的一个编程网站。它是一种基于网络的互动编程教程，手把手帮助用户了解JavaScript的一些基本原理，更重要的是，使用Codecademy学习编程充满了趣味性。Codecademy的注册过程非常特别：无需注册就可以直接使用。用户一旦进入Codecademy.com页面就能轻松完成编程的第一课，如，用户要想知道自己的名字有多少字母，只需将自己的名字输进双引号中，再输入“.length”，最后点击enter键即可。当用户完成了一定的课程学习后，网站会自动建议用户创建自己的账号并进行注册，如果不注册的话，此前的学习记录将全部丢失，这样用户很有可能就会注册了。  编程课程本身也非常简单。网页左方的工具条会指导用户完成每一项任务。网页不仅会告知用户具体怎么做，同时还帮助用户巩固之前的编程知识。随着用户学习编程的不断深入，他们会得到一些积分和奖励，这些都会公开显示在用户的信息中，其他用户也可以看到。如果该网站未来能开发出排行榜和竞争等这样的社交功能，也是意料之中的事。  Codecademy推出后实现了爆发式增长，应用推出仅72小时就获得了20万用户，用户完成的编程练习总量也已达到惊人的210万个。</p>
<p>现在，Codecademy的用户已经遍布全球200多个国家。  Sim和Bubinski是公司的两位创始人，他们的经历也是很多投资者感兴趣的地方。Bubinski刚从大学毕业，而年仅22岁的Sims更是辍学加入了这家初创公司，在此之前，Sims已经在很多科技公司工作过，包括GroupMe和AOL Ventures。  如果你对这也感兴趣的话，不妨进来 Codecademy.com 试试。</p>
<p>via 36氪</p>
]]></content:encoded>
			<wfw:commentRss>http://www.cnidea.net/blog/?feed=rss2&#038;p=173</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>以求医为例谈搜索引擎排序算法的基础原理</title>
		<link>http://www.cnidea.net/blog/?p=165</link>
		<comments>http://www.cnidea.net/blog/?p=165#comments</comments>
		<pubDate>Tue, 12 Jul 2011 12:06:07 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[SEO优化技术]]></category>

		<guid isPermaLink="false">http://www.cnidea.net/blog/?p=165</guid>
		<description><![CDATA[　我们向搜索引擎提交一个查询，搜索引擎会从先到后列出大量的结果，这些结果排序的标准是什么呢？这个看似简单的问题，却是信息检索专家们研究的核心难题之一。 　　为了说明这个问题，我们来研究一个比搜索引擎更加古老的话题：求医。比如，如果我牙疼，应该去看怎样的医生呢？假设我只有三种选择： A医生，既治眼病，又治胃病； B医生，既治牙病，又治胃病，还治眼病； C医生，专治牙病。 　　A医生肯定不在考虑之列。B医生和C医生之间，貌视更应该选择C医生，因为他更专注，更适合我的病情。假如再加一个条件：B医生经验丰富，有二十年从医经历，医术高明，而C医生只有五年从医经验，这个问题就不那么容易判断了，是优先选择更加专注的C医生，还是优先选择医术更加高明的B医生，的确成了一个需要仔细权衡的问题。 　　至少，我们得到了一个结论，择医需要考虑两个条件：医生的专长与病情的适配程度；医生的医术。大家肯定觉得这个结论理所当然，而且可以很自然地联想到，搜索引擎排序不也是这样吗，既要考虑网页内容与用户查询的匹配程度，又要考虑网页本身的质量。但是，怎么把这两种因素结合起来，得到一个，而不是两个或多个排序标准呢？假如我们把这两种因素表示成数值，最终的排序依据是把这两个数值加起来，还是乘起来，或是按决策树的办法把它们组织起来？如果是加起来，是简单相加，还是带权重加呢？ 　　我们可以根据直觉和经验，通过试错的办法，把这两个因素结合起来。但更好的办法是我们能找到一个明确的依据，最好能跟数学这样坚实的学科联系起来。说起来，依据朴素的经验，人类在古代就能建造出高楼；但要建造出高达数百米的 摩天大厦，如果没有建筑力学、材料力学这样坚实的学科作为后盾，则是非常非常困难的。同理，依据朴素的经验构建的搜索引擎算法，用来处理上万的网页集合应该是没问题的；但要检索上亿的网页，则需要更为牢固的理论基础。 　　求医，病人会优先选择诊断准确、治疗效果好的医生；对于搜索引擎来说，一般按网页满足用户需求的概率从大到小排序。如果用q表示用户给出了一个特定的查询，用d表示一个特定的网页满足了用户的需求，那么排序的依据可以用一个条件概率来表示： P(d&#124;q) 这个简单的条件概率，将搜索引擎排序算法与概率论这门坚实的学科联系了起来，这就像在大海中航行的船只装备了指南针一样。利用贝叶斯公式，这个条件概率可以表示为： 可以清楚地看到，搜索引擎的排序标准，是由三个部分组成的：查询本身的属性P(q)；网页本身的属性P(d)；两者的匹配关系P(q&#124;d)。对于同一次查询来说，所有网页对应的P(q)都是一样的，因此排序时可以不考虑，即 公式左边，是已知用户的查询，求网页满足该用户需求的概率。搜索引擎为了提高响应用户查询的性能，需要事先对所有待查询的网页做预处理。预处理时，只知道网页，不知道用户查询，因此需要倒过来计算，即分析每个网页能满足哪些需求，该网页分了多大比例来满足该需求，即得到公式右边的第一项P(q&#124;d)，这相当于上文介绍的医生的专门程度。比如，一个网页专门介绍牙病，另一个网页既介绍牙病又介绍胃病，那么对于“牙疼”这个查询来说，前一个网页的P(q&#124;d)值就会更高一些。 　　公式右边的第二项P(d)，是一个网页满足用户需求的概率，它反映了网页本身的好坏，与查询无关。假如要向一个陌生人推荐网页（我们并不知道他需要什么），那么P(d)就相当于某个特定的网页被推荐的概率。在传统的信息检索模型中，这一个量不太被重视，如传统的向量空间模型、BM25模型，都试图只根据查询与文档的匹配关系来得到排序的权重。而实际上，这个与查询无关的量是非常重要的。假如我们用网页被访问的频次来估计它满足用户需求的概率，可以看出对于两个不同的网页，这个量有着极其巨大的差异：有的网页每天只被访问一两次，而有的网页每天被访问成千上万次。能够提供如此巨大差异的量，竟长期被传统的搜索引擎忽略，直到Google发明了pagerank并让它参与到排序中。Pagerank是对P(d)值的一个不错的估计，这个因素的加入使搜索引擎的效果立即上升到了一个新的台阶。 　　这个公式同样回答了上文提出的问题，网页与查询的匹配程度，和网页本身的好坏，这两个因素应该怎样结合起来参与排序。这个公式以不可辩驳的理由告诉我们，如果网页与查询的匹配程度用P(q&#124;d)来表示，网页本身的好坏用P(d)来表示，那么应该按它们的乘积来进行排序。在现代商业搜索引擎中，需要考虑更多更细节的排序因素，这些因素可能有成百上千个，要把它们融合起来是更加复杂和困难的问题。 By 相关性小组 jiangling  http://stblog.baidu-tech.com/?p=121]]></description>
			<content:encoded><![CDATA[<p>　我们向搜索引擎提交一个查询，搜索引擎会从先到后列出大量的结果，这些结果排序的标准是什么呢？这个看似简单的问题，却是信息检索专家们研究的核心难题之一。</p>
<p>　　为了说明这个问题，我们来研究一个比搜索引擎更加古老的话题：求医。比如，如果我牙疼，应该去看怎样的医生呢？假设我只有三种选择：</p>
<ul>
<li>A医生，既治眼病，又治胃病；</li>
<li>B医生，既治牙病，又治胃病，还治眼病；</li>
<li>C医生，专治牙病。</li>
</ul>
<p>　　A医生肯定不在考虑之列。B医生和C医生之间，貌视更应该选择C医生，因为他更专注，更适合我的病情。假如再加一个条件：B医生经验丰富，有二十年从医经历，医术高明，而C医生只有五年从医经验，这个问题就不那么容易判断了，是优先选择更加专注的C医生，还是优先选择医术更加高明的B医生，的确成了一个需要仔细权衡的问题。</p>
<p>　　至少，我们得到了一个结论，择医需要考虑两个条件：医生的专长与病情的适配程度；医生的医术。大家肯定觉得这个结论理所当然，而且可以很自然地联想到，搜索引擎排序不也是这样吗，既要考虑网页内容与用户查询的匹配程度，又要考虑网页本身的质量。但是，怎么把这两种因素结合起来，得到一个，而不是两个或多个排序标准呢？假如我们把这两种因素表示成数值，最终的排序依据是把这两个数值加起来，还是乘起来，或是按决策树的办法把它们组织起来？如果是加起来，是简单相加，还是带权重加呢？</p>
<p>　　我们可以根据直觉和经验，通过试错的办法，把这两个因素结合起来。但更好的办法是我们能找到一个明确的依据，最好能跟数学这样坚实的学科联系起来。说起来，依据朴素的经验，人类在古代就能建造出高楼；但要建造出高达数百米的 摩天大厦，如果没有建筑力学、材料力学这样坚实的学科作为后盾，则是非常非常困难的。同理，依据朴素的经验构建的搜索引擎算法，用来处理上万的网页集合应该是没问题的；但要检索上亿的网页，则需要更为牢固的理论基础。</p>
<p>　　求医，病人会优先选择诊断准确、治疗效果好的医生；对于搜索引擎来说，一般按网页满足用户需求的概率从大到小排序。如果用<strong>q</strong>表示用户给出了一个特定的查询，用<strong>d</strong>表示一个特定的网页满足了用户的需求，那么排序的依据可以用一个条件概率来表示：</p>
<p><strong>P(d|q)</strong></p>
<p>这个简单的条件概率，将搜索引擎排序算法与概率论这门坚实的学科联系了起来，这就像在大海中航行的船只装备了指南针一样。利用贝叶斯公式，这个条件概率可以表示为：</p>
<p><a href="http://stblog.baidu-tech.com/wp-content/uploads/wp-display-data.php?filename=求医_112961182151302588296.jpeg&amp;type=image%2Fjpeg&amp;width=195&amp;height=52"><img title="求医_11296118215" src="http://stblog.baidu-tech.com/wp-content/uploads/wp-display-data.php?filename=求医_112961182151302588296.jpeg&amp;type=image%2Fjpeg&amp;width=195&amp;height=52" alt="" width="195" height="52" /></a></p>
<p>可以清楚地看到，搜索引擎的排序标准，是由三个部分组成的：查询本身的属性<strong>P(q)</strong>；网页本身的属性<strong>P(d)</strong>；两者的匹配关系<strong>P(q|d)</strong>。对于同一次查询来说，所有网页对应的<strong>P(q)</strong>都是一样的，因此排序时可以不考虑，即</p>
<p><a href="http://stblog.baidu-tech.com/wp-content/uploads/wp-display-data.php?filename=求医_212961182461302588504.jpg&amp;type=image%2Fjpeg&amp;width=222&amp;height=38"><img title="求医_21296118246" src="http://stblog.baidu-tech.com/wp-content/uploads/wp-display-data.php?filename=求医_212961182461302588504.jpg&amp;type=image%2Fjpeg&amp;width=222&amp;height=38" alt="" width="222" height="38" /></a></p>
<p>公式左边，是已知用户的查询，求网页满足该用户需求的概率。搜索引擎为了提高响应用户查询的性能，需要事先对所有待查询的网页做预处理。预处理时，只知道网页，不知道用户查询，因此需要倒过来计算，即分析每个网页能满足哪些需求，该网页分了多大比例来满足该需求，即得到公式右边的第一项<strong>P(q|d)</strong>，这相当于上文介绍的医生的专门程度。比如，一个网页专门介绍牙病，另一个网页既介绍牙病又介绍胃病，那么对于“牙疼”这个查询来说，前一个网页的<strong>P(q|d)</strong>值就会更高一些。</p>
<p>　　公式右边的第二项<strong>P(d)</strong>，是一个网页满足用户需求的概率，它反映了网页本身的好坏，与查询无关。假如要向一个陌生人推荐网页（我们并不知道他需要什么），那么<strong>P(d)</strong>就相当于某个特定的网页被推荐的概率。在传统的信息检索模型中，这一个量不太被重视，如传统的向量空间模型、BM25模型，都试图只根据查询与文档的匹配关系来得到排序的权重。而实际上，这个与查询无关的量是非常重要的。假如我们用网页被访问的频次来估计它满足用户需求的概率，可以看出对于两个不同的网页，这个量有着极其巨大的差异：有的网页每天只被访问一两次，而有的网页每天被访问成千上万次。能够提供如此巨大差异的量，竟长期被传统的搜索引擎忽略，直到Google发明了pagerank并让它参与到排序中。Pagerank是对<strong>P(d)</strong>值的一个不错的估计，这个因素的加入使搜索引擎的效果立即上升到了一个新的台阶。</p>
<p>　　这个公式同样回答了上文提出的问题，网页与查询的匹配程度，和网页本身的好坏，这两个因素应该怎样结合起来参与排序。这个公式以不可辩驳的理由告诉我们，如果网页与查询的匹配程度用<strong>P(q|d)</strong>来表示，网页本身的好坏用<strong>P(d)</strong>来表示，那么应该按它们的乘积来进行排序。在现代商业搜索引擎中，需要考虑更多更细节的排序因素，这些因素可能有成百上千个，要把它们融合起来是更加复杂和困难的问题。</p>
<p>By 相关性小组 jiangling  <a href="http://stblog.baidu-tech.com/?p=121">http://stblog.baidu-tech.com/?p=121</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.cnidea.net/blog/?feed=rss2&#038;p=165</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>浅谈互联网页面价值</title>
		<link>http://www.cnidea.net/blog/?p=162</link>
		<comments>http://www.cnidea.net/blog/?p=162#comments</comments>
		<pubDate>Tue, 12 Jul 2011 11:56:57 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[SEO优化技术]]></category>

		<guid isPermaLink="false">http://www.cnidea.net/blog/?p=162</guid>
		<description><![CDATA[搜索引擎每天处理着数以亿计的查询请求，每个查询请求都代表了一个用户对于某种资源的特定需求。多数时候，通过查询返回的网页结果，这些需求被满足了，我们可以认为结果中的某些页面对特定用户的特定需求产生了价值。那么对于搜索引擎而言，页面的价值是指什么，我们为什么要研究页面价值，技术上怎样判断页面的价值呢？本文将逐一回答这些问题。 一、什么页面价值 前面我们说了，某个页面满足了某一用户的特定需求，就体现了这个页面对用户的价值。那么对搜索引擎而言，价值体现在哪些方面呢？一个简单的推论，所有可能会对用户产生价值的页面都是对搜索引擎有价值的，将这些页面建入搜索引擎的索引中能够满足最终检索到它们用户的需求，我们称这种价值为检索价值。只要是能解决某个用户信息需求的，并且是可以通过某些正常检索需求到达的，那么就是有检索价值的。 小学生张三喜欢在qzone上写日记，写他前天吃了什么，今天玩了什么。这些内容，是有价值的。它们对张三的家长、同学、老师，以及其他小学生，和对小学生日记感兴趣的人来说，都是有价值的。对于这个信息体来说，“张三”这个名字是检索的“key”。 有一些信息单元，只有“浏览”价值，而没有到达该信息的检索途径，那么该资源可能是有价值的，但检索价值就很低。比如一张百度大厦附近的地图，从浏览角度，是有价值的；但是如果没有任何周边文字说明（或者link的anchor text），只有一张光秃秃的地图，就没有检索价值。当然，如果图片的内容识别技术，有朝一日能自动识别出这个是“百度大厦附近地图”，或者能够自动分析出地图内的各种大厦、街道、餐馆等的名称，那么这张图一样变得有检索价值了。所以一个页面是否有检索价值，应该取决于两点： 1） 是否能解决某个特定的需求（价值） 2） 是否可以通过某个常规的搜索方式获得该信息（检索） 那么，没有检索价值的页面，是否对搜索引擎就没有价值了呢？仔细想想，答案是否定的。索引只是搜索引擎的一个环节，对于其他环节而言，没有检索价值的页面有可能对我们更好的收录那些检索价值高的页面有帮助。比如对负责抓取互联网资源的spider而言，有一些页面，本身没有检索价值，但通过这些页面的抓取和分析，能够更快的帮助我们掌握这一类页面没有检索价值这一重要信息，从而节省更多的流量进行更加有效的抓取。 考虑到这种价值可以算作一种“间接的”检索价值，最终还是立足于索引价值的，在本文中就不再展开论述，我们只关注“检索价值”这一根本问题。下文中提到的“页面价值”特指页面的“检索价值”。 二、为什么要研究页面价值 首先，互联网上的页面是无穷尽的，而搜索引擎的硬件资源是有限的，想用有限的资源去覆盖无穷尽的互联网，我们就需要对页面价值做出判断，不收录那些无检索价值的页面，少收录那些检索价值低的页面。这是页面价值在收录控制方面的应用。 第二，搜索引擎spider的抓取能力是有限的，出于访问友好性的考虑，对于一个网站或一个IP抓取速率需要有一个抓取速率的上限。在这一限制下，抓取或页面更新就需要有一个先后顺序，而这一排序的主要参考依据就是页面价值，或者说对页面价值的预测（未抓取时）。这是页面价值在spider调度方面的应用。 第三，对于某些页面，页面内容发生变化，导致它的检索价值从有到无，典型的就是变为“死链”，或者“被黑”。对于这些页面，好的搜索引擎会在第一时间将其排除出索引，或在检索时对其进行屏蔽，以保证返回给用户的结果是更多检索价值高的“好页面”。对于另一些页面，它不仅具有很高的检索价值，而且有很强的“时效性”，能够第一时间让用户检索到这些页面对搜索体验有很大的提升。对搜索引擎而言，越快的收录和索引页面意味着越多的额外资源开销，以多快的速度收录和以多短的周期更新索引，需要通过页面价值的分析来指导。这两方面是页面价值在死链率和时效性两大搜索引擎指标提升上的应用。 最后，普遍意义上的页面价值高低对搜索引擎返回给用户的结果排序上也存在着指导意义。理想情况下搜索引擎的结果是按照与查询请求的相关性进行排序的，在相关性大体相当的情况下，用户更倾向与浏览普遍意义上页面价值高的网页。这是页面价值在ranking方面的应用。 可以说，页面检索价值的研究是搜索引擎中的一项较为基础的工作，对页面价值的认识和判断的准确程度直接影响着搜索引擎的覆盖率、死链率、时效性等几大主要指标。 三、如何判断页面价值 前文中提到过一个小学生张三qzone日记的例子。我们认为这个页面是有价值的，对张三的同学，朋友，家人都有价值。与此类似的，百度CEO李彦宏在i贴吧上发表一条十几个字的i贴，也是有价值的，对李彦宏的上千万粉丝都有价值。虽然李彦宏的i贴长度可能远小于张三的日记，但就这两个页面的价值来说，我们都会有一个共同的认识，即从普遍意义上讲，李彦宏的i贴价值远大于张三的日记。（当然，对于张三的妈妈来说很可能这个价值的关系是相反的） 再举个例子，搜索某个人的手机号码，搜索引擎返回了一个结果，是这个人在某个论坛上的一个回复。虽然这个手机号码关心的人不多，但因为资源是绝对稀缺的，对于关心这个手机号码的查询需求，这个页面是完全不可替代的，因此具有极高的价值。 另外，页面检索价值，还受到页面质量的影响。相似的页面，对于满足用户需求来说，往往会有很大差异，比如资源下载速度，页面的布局，广告的多寡。这类差异，姑且称之为页面质量。 最后，有些页面具有明显的公众话题性质，且这些资源往往在刚刚产生时有非常高的关注度，随着时间的推移热度显著下降，有着“新闻”的特征。典型的像各种“门”事件，地震、火灾等大型的自然灾害。我们认为这类资源具有“时效性”特征。 所以，一个页面的检索价值，大致受以下四个要素的影响： 感兴趣的受众群大小 该页面的稀缺程度（可替代性） 该页面的质量高低 该页面的时效性特征强弱 这四种要素，简称受众，稀缺，质量和时效性。 1. 受众 受众群体的大小，即代表了用户检索需求的大小。评价受众的大小主要依据信息发布源的受众和信息内容本身受众两大方面。具体因素包括且不限于： 网站忠实用户群大小 一般来说，拥有自己忠实用户群的知名网站，他们的成功，在于他们的内容和服务，比别人更能吸引和满足用户。从这个角度来说，我们可以推论，拥有更多忠实用户群的网站上的内容，会比忠实用户群较少的网站上的内容，有更多的既有和潜在受众群。这样的话，忠实用户群大小，就可以变成对站点内资源检索价值的一种衡量指标。忠实用户群的好处在于，它是变动的。如果一个网站变差了，那么用户就会用脚投票。超链有过期问题，作弊问题，而虚假用户群作弊很难。一般所谓的网站知名度，会和忠实用户群数量密切相关。 分享到： QQ空间 新浪微博 开心网 人人网 资源分布规律 我们再考虑一个网站内部的资源分布所体现的受众群大小问题。比如新浪新闻首页的那些推介内容。新浪编辑为什么要推这些内容？因为他们认为这些是用户最感兴趣的。那么从索引价值角度而言，相当于有一个庞大的编辑团队，已经对这些内容打上了“符合大众口味”的标签。搜索引擎只需要乐享其成就行了。这样的话，资源相对于某些结构性关键页面（首页、频道页等）的链接深度，也可以成为衡量一个资源受众群大小的指标了。 访问热门度 我们再从访问热门度角度来考虑受众群大小问题。这个是最直接的，当然，它需要第三方的工具来获取关键数据。通过这个途径，获取的不应仅仅是需要入库的页面，还有用户访问一个网站的访问模式。 超链 超链某种程度上也是受众群大小的反映。某个资源的质量越高，接触的受众群越大，那么获得正常链接的数量往往也越大。 内容特征 A：我写博客：“传言郭德纲要上春晚了。” B：我写博客：“我今天吃早饭了。” 同样的来源，前者的受众必然高于后者。即：当在发布源相同的情况下，具有公众属性的内容分值会更高。 2. 稀缺 稀缺主要是描述页面在互联网中的独特性。说到稀缺往往会想到重复，稀缺是否等同于无重复，我们应该怎样解读这一概念呢？可以看一个例子： 某人发表了一篇针对某新闻事件的原创博客，随后被新浪转载到了新闻频道。从描述的内容上讲，这是一种重复。但这种重复仅仅是主体内容上的重复，一方面它的转载带来了访问速度、稳定性等方面的增益，并且之后的检索用户还有可能用“新闻事件+新浪”来检索此新闻。这可以被称之为站点增益。另一方面，它在转载过程中可能会改变页面的标题，而且依托其受众，在转载页面上，还有可能出现更多的有价值评论和回复等，还有可能存在指向其它相关事件的新闻链接。这些可以被称之为内容增益。因此即使主题内容没有任何变化，新浪的这次转载也是有价值的，其稀缺度也是较高的。 同样，反过来说，如果转载的网站相当不知名，则其无法带来站点名/稳定性/速度的增益。更有甚者，转载之后在页面上加入大量广告妨碍阅读，或者只转载了内容中不完整的一部分，这样的转载，或者说采集，就是纯重复的，与采集源相比，就是没有检索价值的了。 综上所述，对于主体内容重复的页面，我们应该评价其是否存在站点增益和内容增益，只有对于大量完全无增益的重复页面，我们才应该认为其稀缺度较低。 [...]]]></description>
			<content:encoded><![CDATA[<p>搜索引擎每天处理着数以亿计的查询请求，每个查询请求都代表了一个用户对于某种资源的特定需求。多数时候，通过查询返回的网页结果，这些需求被满足了，我们可以认为结果中的某些页面对特定用户的特定需求产生了价值。那么对于搜索引擎而言，页面的价值是指什么，我们为什么要研究页面价值，技术上怎样判断页面的价值呢？本文将逐一回答这些问题。</p>
<h2>一、什么页面价值</h2>
<p>前面我们说了，某个页面满足了某一用户的特定需求，就体现了这个页面对用户的价值。那么对搜索引擎而言，价值体现在哪些方面呢？一个简单的推论，所有可能会对用户产生价值的页面都是对搜索引擎有价值的，将这些页面建入搜索引擎的索引中能够满足最终检索到它们用户的需求，我们称这种价值为<strong>检索价值</strong>。只要是能解决某个用户信息需求的，并且是可以通过某些正常检索需求到达的，那么就是有检索价值的。</p>
<p>小学生张三喜欢在qzone上写日记，写他前天吃了什么，今天玩了什么。这些内容，是有价值的。它们对张三的家长、同学、老师，以及其他小学生，和对小学生日记感兴趣的人来说，都是有价值的。对于这个信息体来说，“张三”这个名字是检索的“key”。</p>
<p>有一些信息单元，只有“浏览”价值，而没有到达该信息的检索途径，那么该资源可能是有价值的，但检索价值就很低。比如一张百度大厦附近的地图，从浏览角度，是有价值的；但是如果没有任何周边文字说明（或者link的anchor text），只有一张光秃秃的地图，就没有检索价值。当然，如果图片的内容识别技术，有朝一日能自动识别出这个是“百度大厦附近地图”，或者能够自动分析出地图内的各种大厦、街道、餐馆等的名称，那么这张图一样变得有检索价值了。所以一个页面是否有检索价值，应该取决于两点：</p>
<p>1） 是否能解决某个特定的需求（价值）<br />
2） 是否可以通过某个常规的搜索方式获得该信息（检索）</p>
<p>那么，没有检索价值的页面，是否对搜索引擎就没有价值了呢？仔细想想，答案是否定的。索引只是搜索引擎的一个环节，对于其他环节而言，没有检索价值的页面有可能对我们更好的收录那些检索价值高的页面有帮助。比如对负责抓取互联网资源的spider而言，有一些页面，本身没有检索价值，但通过这些页面的抓取和分析，能够更快的帮助我们掌握这一类页面没有检索价值这一重要信息，从而节省更多的流量进行更加有效的抓取。</p>
<p>考虑到这种价值可以算作一种“间接的”检索价值，最终还是立足于索引价值的，在本文中就不再展开论述，我们只关注“检索价值”这一根本问题。下文中提到的“页面价值”特指页面的“检索价值”。</p>
<h2>二、为什么要研究页面价值</h2>
<p>首先，互联网上的页面是无穷尽的，而搜索引擎的硬件资源是有限的，想用有限的资源去覆盖无穷尽的互联网，我们就需要对页面价值做出判断，不收录那些无检索价值的页面，少收录那些检索价值低的页面。这是页面价值在收录控制方面的应用。</p>
<p>第二，搜索引擎spider的抓取能力是有限的，出于访问友好性的考虑，对于一个网站或一个IP抓取速率需要有一个抓取速率的上限。在这一限制下，抓取或页面更新就需要有一个先后顺序，而这一排序的主要参考依据就是页面价值，或者说对页面价值的预测（未抓取时）。这是页面价值在spider调度方面的应用。</p>
<p>第三，对于某些页面，页面内容发生变化，导致它的检索价值从有到无，典型的就是变为“死链”，或者“被黑”。对于这些页面，好的搜索引擎会在第一时间将其排除出索引，或在检索时对其进行屏蔽，以保证返回给用户的结果是更多检索价值高的“好页面”。对于另一些页面，它不仅具有很高的检索价值，而且有很强的“时效性”，能够第一时间让用户检索到这些页面对搜索体验有很大的提升。对搜索引擎而言，越快的收录和索引页面意味着越多的额外资源开销，以多快的速度收录和以多短的周期更新索引，需要通过页面价值的分析来指导。这两方面是页面价值在死链率和时效性两大搜索引擎指标提升上的应用。</p>
<p>最后，普遍意义上的页面价值高低对搜索引擎返回给用户的结果排序上也存在着指导意义。理想情况下搜索引擎的结果是按照与查询请求的相关性进行排序的，在相关性大体相当的情况下，用户更倾向与浏览普遍意义上页面价值高的网页。这是页面价值在ranking方面的应用。</p>
<p>可以说，页面检索价值的研究是搜索引擎中的一项较为基础的工作，对页面价值的认识和判断的准确程度直接影响着搜索引擎的覆盖率、死链率、时效性等几大主要指标。</p>
<h2>三、如何判断页面价值</h2>
<p>前文中提到过一个小学生张三qzone日记的例子。我们认为这个页面是有价值的，对张三的同学，朋友，家人都有价值。与此类似的，百度CEO李彦宏在i贴吧上发表一条十几个字的i贴，也是有价值的，对李彦宏的上千万粉丝都有价值。虽然李彦宏的i贴长度可能远小于张三的日记，但就这两个页面的价值来说，我们都会有一个共同的认识，即从普遍意义上讲，李彦宏的i贴价值远大于张三的日记。（当然，对于张三的妈妈来说很可能这个价值的关系是相反的）</p>
<p>再举个例子，搜索某个人的手机号码，搜索引擎返回了一个结果，是这个人在某个论坛上的一个回复。虽然这个手机号码关心的人不多，但因为资源是绝对稀缺的，对于关心这个手机号码的查询需求，这个页面是完全不可替代的，因此具有极高的价值。</p>
<p>另外，页面检索价值，还受到页面质量的影响。相似的页面，对于满足用户需求来说，往往会有很大差异，比如资源下载速度，页面的布局，广告的多寡。这类差异，姑且称之为页面质量。</p>
<p>最后，有些页面具有明显的公众话题性质，且这些资源往往在刚刚产生时有非常高的关注度，随着时间的推移热度显著下降，有着“新闻”的特征。典型的像各种“门”事件，地震、火灾等大型的自然灾害。我们认为这类资源具有“时效性”特征。</p>
<p>所以，一个页面的检索价值，大致受以下四个要素的影响：</p>
<ul>
<li>感兴趣的受众群大小</li>
<li>该页面的稀缺程度（可替代性）</li>
<li>该页面的质量高低</li>
<li>该页面的时效性特征强弱</li>
</ul>
<p>这四种要素，简称受众，稀缺，质量和时效性。</p>
<h3>1. 受众</h3>
<p>受众群体的大小，即代表了用户检索需求的大小。评价受众的大小主要依据信息发布源的受众和信息内容本身受众两大方面。具体因素包括且不限于：</p>
<p><strong>网站忠实用户群大小</strong></p>
<p>一般来说，拥有自己忠实用户群的知名网站，他们的成功，在于他们的内容和服务，比别人更能吸引和满足用户。从这个角度来说，我们可以推论，拥有更多忠实用户群的网站上的内容，会比忠实用户群较少的网站上的内容，有更多的既有和潜在受众群。这样的话，忠实用户群大小，就可以变成对站点内资源检索价值的一种衡量指标。忠实用户群的好处在于，它是变动的。如果一个网站变差了，那么用户就会用脚投票。超链有过期问题，作弊问题，而虚假用户群作弊很难。一般所谓的网站知名度，会和忠实用户群数量密切相关。</p>
<div>
<table border="0" cellspacing="0" width="100%">
<tbody>
<tr>
<td height="80"><!-- JiaThis Button BEGIN --></p>
<div id="ckepop"><a href="http://www.jiathis.com/share/?uid=1509051" target="_blank">分享到：</a> <a title="分享到QQ空间">QQ空间</a> <a title="分享到新浪微博">新浪微博</a> <a title="分享到开心网">开心网</a> <a title="分享到人人网">人人网</a></div>
<p><script src="http://v1.jiathis.com/code/jia.js?uid=1509051" type="text/javascript"></script><!-- JiaThis Button END --></td>
</tr>
</tbody>
</table>
</div>
<p><strong>资源分布规律</strong></p>
<p>我们再考虑一个网站内部的资源分布所体现的受众群大小问题。比如新浪新闻首页的那些推介内容。新浪编辑为什么要推这些内容？因为他们认为这些是用户最感兴趣的。那么从索引价值角度而言，相当于有一个庞大的编辑团队，已经对这些内容打上了“符合大众口味”的标签。搜索引擎只需要乐享其成就行了。这样的话，资源相对于某些结构性关键页面（首页、频道页等）的链接深度，也可以成为衡量一个资源受众群大小的指标了。</p>
<p><strong>访问热门度</strong></p>
<p>我们再从访问热门度角度来考虑受众群大小问题。这个是最直接的，当然，它需要第三方的工具来获取关键数据。通过这个途径，获取的不应仅仅是需要入库的页面，还有用户访问一个网站的访问模式。</p>
<p><strong>超链</strong></p>
<p>超链某种程度上也是受众群大小的反映。某个资源的质量越高，接触的受众群越大，那么获得正常链接的数量往往也越大。</p>
<p><strong>内容特征</strong></p>
<p>A：我写博客：“传言郭德纲要上春晚了。”<br />
B：我写博客：“我今天吃早饭了。”</p>
<p>同样的来源，前者的受众必然高于后者。即：当在发布源相同的情况下，具有公众属性的内容分值会更高。</p>
<h3>2. 稀缺</h3>
<p>稀缺主要是描述页面在互联网中的独特性。说到稀缺往往会想到重复，稀缺是否等同于无重复，我们应该怎样解读这一概念呢？可以看一个例子：</p>
<p>某人发表了一篇针对某新闻事件的原创博客，随后被新浪转载到了新闻频道。从描述的内容上讲，这是一种重复。但这种重复仅仅是主体内容上的重复，一方面它的转载带来了访问速度、稳定性等方面的增益，并且之后的检索用户还有可能用“新闻事件+新浪”来检索此新闻。这可以被称之为站点增益。另一方面，它在转载过程中可能会改变页面的标题，而且依托其受众，在转载页面上，还有可能出现更多的有价值评论和回复等，还有可能存在指向其它相关事件的新闻链接。这些可以被称之为内容增益。因此即使主题内容没有任何变化，新浪的这次转载也是有价值的，其稀缺度也是较高的。</p>
<p>同样，反过来说，如果转载的网站相当不知名，则其无法带来站点名/稳定性/速度的增益。更有甚者，转载之后在页面上加入大量广告妨碍阅读，或者只转载了内容中不完整的一部分，这样的转载，或者说采集，就是纯重复的，与采集源相比，就是没有检索价值的了。</p>
<p>综上所述，对于主体内容重复的页面，我们应该评价其是否存在站点增益和内容增益，只有对于大量完全无增益的重复页面，我们才应该认为其稀缺度较低。</p>
<h3>3. 质量</h3>
<p>页面的质量是它对需求的满足程度的一种体现。判断页面质量的高低，应该是从最基础的需求依次递进的。</p>
<p>首先，不能是死链、网站要有一定的稳定性、访问速度要令人满意。其次，主体内容是否完整、版式和字体是否易读、各类广告会不会太多。最后，信息是否丰富、延伸出的次级需求是否满足。</p>
<p>典型的低质量页面存在以下一些特征：</p>
<div>
<ul>
<li>主需求无效/未满足（过期分类广告/软件下载页面，下载链接无效等）</li>
<li>死链</li>
<li>虚假信息/诈骗等</li>
<li>空页面</li>
<li>站点不稳定</li>
<li>影响主需求的权限问题（下载/浏览需要注册会员/积分等）</li>
<li>信息不完整（转载不全等）</li>
<li>浏览体验差（广告/字体/页面布局等）</li>
</ul>
</div>
<p>典型的高质量页面存在以下一些特征：</p>
<ul>
<li>访问速度快（页面加载快/资源下载速度快）</li>
<li>页面整洁干净，主体内容在显著位置</li>
<li>页面信息完整</li>
<li>页面元素丰富（文字、图片、评论、相关推荐等）</li>
</ul>
<h3>4. 时效性</h3>
<p>“时效性”是页面价值的一个属性，它一般体现在两个方面：一是页面所描述的事物本身有着较强的公众话题性，容易被传播。这其实是受众的一个体现。二是页面所描述的事物仅在第一时间有较高热度，随着时间推移热度显著下降。这是一种“新闻”性。对于具有上述两种属性的页面，如果搜索引擎spider发现页面的时间正处于该事物的“爆发期”或“爆发期”之前，我们认为该页面具有时效性。</p>
<p>需要说明的是，搜索引擎的广义“时效性”是指对所有有价值新资源的及时收录提供检索，而所有的有价值新资源中，有一大部分其收录速度的提升对用户的搜索体验改善意义是不大的，比如介绍如何瘦身的知识性文章，张三的日记。页面价值中的“时效性”指得是一种突发时效性，也就是所有有价值页面中最需要及时收录的那些。对页面时效性的判断是为了指导我们将搜索引擎有限的资源投入到最关键的地方，产生最好的性价比。</p>
<p>判断页面的时效性价值，主要通过下面一些途径：</p>
<ul>
<li>页面本身受众是否有短时间的突增，比如超链爆发。贾君鹏的帖子就是一个典型的例子。</li>
<li>描述相同事物的互联网页面是否有段时间的突增。贾君鹏事件短时间内爆发出大量相关讨论、报 &#8230;</li>
<li>根据一个集合内的页面是否具有上述两种特征，推测该集合的时效性价值。比如魔兽世界吧经常 &#8230;</li>
</ul>
<h2>四、页面价值的研究重点</h2>
<p>前文已经介绍了页面价值的含义，研究的意义与价值判断的方法。最后我们再看一下，从技术角度上，这一方向的研究中的重点方向。对页面价值的研究工作主要致力于三方面：</p>
<ol>
<li>对页面价值体系的认识。我们目前对页面价值的认识是来源于前文所述的四个维度，这个认识是否全面，对于不断变化的互联网环境与用户需求，这些维度应该如何扩展与变化才能更好的服务于整体的搜索体验提升，是一个很重要问题。</li>
<li>对于反映页面价值的页面特征提取。巧妇难为无米之炊，挖掘更多的页面特征，更准确合理的特征提取是页面价值判定准确率提升的基础。</li>
<li>对各种页面特征的组合策略（机器学习）。针对不用的应用方向，需要利用相应的特征通过合理且高效的策略拟合出页面价值的最终评价结果。</li>
</ol>
<p>转载自：<a href="http://baiduseoguide.com/a/2011060601.html">http://baiduseoguide.com/a/2011060601.html</a></p>
<p>作者：<a href="http://stblog.baidu-tech.com/" target="_blank">百度搜索研发部</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.cnidea.net/blog/?feed=rss2&#038;p=162</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>国内国外的同ip地址反查域名网站</title>
		<link>http://www.cnidea.net/blog/?p=154</link>
		<comments>http://www.cnidea.net/blog/?p=154#comments</comments>
		<pubDate>Thu, 26 May 2011 11:56:45 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[SEO优化技术]]></category>

		<guid isPermaLink="false">http://www.cnidea.net/blog/?p=154</guid>
		<description><![CDATA[国内国外的ip地址查域名网站 国外的！ http://www.whosonmyserver.com/ http://www.myipneighbors.com/ http://www.domainbyip.com http://www.robtex.com/ http://www.onthesamehost.com http://www.en.dnstools.ch 国内的！ http://rootkit.net.cn/index.aspx http://www.ip-domain.com.cn/ http://www.ip866.com http://ip.wen.la http://www.114best.com/ip www.114best.com http://ip.iy8.net/]]></description>
			<content:encoded><![CDATA[<p>国内国外的ip地址查域名网站</p>
<p>国外的！<br />
<a href="http://www.whosonmyserver.com/">http://www.whosonmyserver.com/</a><br />
<a href="http://www.myipneighbors.com/">http://www.myipneighbors.com/</a><br />
<a href="http://www.domainbyip.com/">http://www.domainbyip.com</a><br />
<a href="http://www.robtex.com/">http://www.robtex.com/</a><br />
<a href="http://www.onthesamehost.com/">http://www.onthesamehost.com</a><br />
<a href="http://www.en.dnstools.ch/">http://www.en.dnstools.ch</a><br />
国内的！<br />
<a href="http://rootkit.net.cn/index.aspx">http://rootkit.net.cn/index.aspx</a><br />
<a href="http://www.ip-domain.com.cn/">http://www.ip-domain.com.cn/</a><br />
<a href="http://www.ip866.com/">http://www.ip866.com</a><br />
<a href="http://ip.wen.la/">http://ip.wen.la</a><br />
<a href="http://www.114best.com/ip">http://www.114best.com/ip</a><br />
<a href="http://www.114best.com/">www.114best.com</a><br />
<a href="http://ip.iy8.net/">http://ip.iy8.net/</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.cnidea.net/blog/?feed=rss2&#038;p=154</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>电子商务的推广部门如何制定 KPI ？</title>
		<link>http://www.cnidea.net/blog/?p=145</link>
		<comments>http://www.cnidea.net/blog/?p=145#comments</comments>
		<pubDate>Tue, 17 May 2011 10:06:10 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[营销策划分享]]></category>

		<guid isPermaLink="false">http://www.cnidea.net/blog/?p=145</guid>
		<description><![CDATA[3个核心KPI： 1、用UV来替换IP，现在UV（独立访客数）对于电商来说更重要一点，IP也作为一个重要参照，但不如UV更具意义； 2、ROI，这个无需多言； 3、引导注册用户数/活跃用户数 其他作为参考指标而非主要考核指标的有： 转化率，不管是什么样的转化率，我倾向于不作为重要考核依据，因为转化率更多的还是要跟运营挂钩，产品的选品、定价，站内的营销活动，发放优惠券等，都会极大影响转化率，这个可作为跟运营部门共同承担的关联指标，而不作为单独考核推广部门的指标。 客单价、ARPU、若干时间的重复购买率等等指标，都不应该作为考核推广部门的KPI，而是运营部门要关注的，这个大家要理清楚。 大家很重视客户数，这个应该是会员经营团队的关键KPI。 观点很多，不统一，这个很大一部分原因是推广部的设置问题。有些公司，推广部隶属于运营部，而有些公司推广部是独立的。 推广部的重点工作是有效率的花钱。 所以，重要的KPI都是围绕如何花钱而展开的。我们比较关注的三点是预算的控制，ROI的提升和点击成本的降低。 预算和点击成本的组合，可以预估流量；预算和ROI的组合可以预知销售状况。其实最大的问题，是需要有效指定预算控制的弹性区间。]]></description>
			<content:encoded><![CDATA[<div>
<div>3个核心KPI：</p>
<p>1、用<strong>UV</strong>来替换IP，现在UV（独立访客数）对于电商来说更重要一点，IP也作为一个重要参照，但不如UV更具意义；</p>
<p>2、<strong>ROI</strong>，这个无需多言；</p>
<p>3、<strong>引导注册用户数/活跃用户数</strong></p>
<p>其他作为参考指标而非主要考核指标的有：</p>
<p>转化率，不管是什么样的转化率，我倾向于不作为重要考核依据，因为转化率更多的还是要跟运营挂钩，产品的选品、定价，站内的营销活动，发放优惠券等，都会极大影响转化率，这个可作为跟运营部门共同承担的关联指标，而不作为单独考核推广部门的指标。</p>
<p>客单价、ARPU、若干时间的重复购买率等等指标，都不应该作为考核推广部门的KPI，而是运营部门要关注的，这个大家要理清楚。</p></div>
<div>
<div>
<div>大家很重视客户数，这个应该是会员经营团队的关键KPI。</p>
<p>观点很多，不统一，这个很大一部分原因是推广部的设置问题。有些公司，推广部隶属于运营部，而有些公司推广部是独立的。</p>
<p>推广部的重点工作是有效率的花钱。</p>
<p>所以，重要的KPI都是围绕如何花钱而展开的。我们比较关注的三点是预算的控制，ROI的提升和点击成本的降低。</p>
<p>预算和点击成本的组合，可以预估流量；预算和ROI的组合可以预知销售状况。其实最大的问题，是需要有效指定预算控制的弹性区间。</p></div>
</div>
</div>
</div>
]]></content:encoded>
			<wfw:commentRss>http://www.cnidea.net/blog/?feed=rss2&#038;p=145</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>现在中国网站备案要多久？</title>
		<link>http://www.cnidea.net/blog/?p=142</link>
		<comments>http://www.cnidea.net/blog/?p=142#comments</comments>
		<pubDate>Tue, 17 May 2011 10:03:35 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[网站建设技术]]></category>

		<guid isPermaLink="false">http://www.cnidea.net/blog/?p=142</guid>
		<description><![CDATA[1.正常的流程而言，备案一般在7-15天内能下来。问题所述快1月还没下来，那么你应该联系你的接入商询问。另外自己留意备案进度，工信部会自动发邮件通知，另外接入商提供的备案网站里也有当前备案状态。 2.代理备案3小时成功的，如果备案主体是你的资料，那么唯一的可能是在通信管理局有后门(在这个神奇的国度，任何一点小权利都可以致富！)。也有个别代理备案的是把你网站域名添加到其他现有备案主体下，审核稍快。 备注：如果你网站需要备案，一定要看看你的空间/服务器提供商有没有接入商(ISP,不是ICP)资质，尤其是在工信部网站是否可以查询到对方公司的备案站点。不同地区和省份的通信管理局办事效率大有差异，必要时候也可以打通信管理局电话催一下，因为接入商一般都不太愿意帮客户催，道理很简单，催急了通信管理局会给小鞋穿，后果很严重！]]></description>
			<content:encoded><![CDATA[<div>
<div>1.正常的流程而言，备案一般在7-15天内能下来。问题所述快1月还没下来，那么你应该联系你的接入商询问。另外自己留意备案进度，工信部会自动发邮件通知，另外接入商提供的备案网站里也有当前备案状态。</p>
<p>2.代理备案3小时成功的，如果备案主体是你的资料，那么唯一的可能是在通信管理局有后门(在这个神奇的国度，任何一点小权利都可以致富！)。也有个别代理备案的是把你网站域名添加到其他现有备案主体下，审核稍快。</p>
<p>备注：如果你网站需要备案，一定要看看你的空间/服务器提供商有没有接入商(ISP,不是ICP)资质，尤其是在工信部网站是否可以查询到对方公司的备案站点。不同地区和省份的通信管理局办事效率大有差异，必要时候也可以打通信管理局电话催一下，因为接入商一般都不太愿意帮客户催，道理很简单，催急了通信管理局会给小鞋穿，后果很严重！</p></div>
</div>
]]></content:encoded>
			<wfw:commentRss>http://www.cnidea.net/blog/?feed=rss2&#038;p=142</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>建一个wap网站需要什么物质和能力要求？</title>
		<link>http://www.cnidea.net/blog/?p=140</link>
		<comments>http://www.cnidea.net/blog/?p=140#comments</comments>
		<pubDate>Tue, 17 May 2011 10:02:40 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[网站建设技术]]></category>

		<guid isPermaLink="false">http://www.cnidea.net/blog/?p=140</guid>
		<description><![CDATA[纯说网站—— 1.域名——.com的大概60——80每年 2.空间——看你的需要，小的一年几百，大的一年几万 3.程序——现成的（免费的或收费的），或者请人写，或者自己写 运营方面—— 1.广告投入 2.各种合作渠道 3.SEO 等等 然后还不知道如何盈利]]></description>
			<content:encoded><![CDATA[<div>
<div>纯说网站——<br />
1.域名——.com的大概60——80每年<br />
2.空间——看你的需要，小的一年几百，大的一年几万<br />
3.程序——现成的（免费的或收费的），或者请人写，或者自己写</p>
<p>运营方面——<br />
1.广告投入<br />
2.各种合作渠道<br />
3.SEO<br />
等等</p>
<p>然后还不知道如何盈利</p></div>
</div>
]]></content:encoded>
			<wfw:commentRss>http://www.cnidea.net/blog/?feed=rss2&#038;p=140</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>从哪里可以得到网站浏览量等数据?</title>
		<link>http://www.cnidea.net/blog/?p=70</link>
		<comments>http://www.cnidea.net/blog/?p=70#comments</comments>
		<pubDate>Fri, 13 May 2011 02:19:59 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[网站数据分析]]></category>

		<guid isPermaLink="false">http://www.cnidea.net/blog/?p=70</guid>
		<description><![CDATA[排名机构： Alexa、Google adplanner、iResearch、Nielsen、Hitwise、ComScore、Compete 以上机构可以看到一些排名和基础的一些数据，但，只能是仅供参考，各个机构采用的统计方式不一样，差异很大。 Web分析： 国外： GA，Clicky，W3Counter，Woopra，W3Perl ，Piwik，TraceWatch，Snoop，goingup，JAWStats，Crazyegg，gostats；Woopra，Crazyegg，clicktale、Omniture 国内：  百度统计，CNZZ，国双统计，51la，量子统计，小艾统计，科捷统计，好耶iDigger ，孔明统计]]></description>
			<content:encoded><![CDATA[<p><strong>排名机构：</strong><br />
Alexa、Google adplanner、iResearch、Nielsen、Hitwise、ComScore、Compete</p>
<p><em>以上机构可以看到一些排名和基础的一些数据，但，只能是仅供参考，各个机构采用的统计方式不一样，差异很大。</em></p>
<p><strong>Web分析：</strong><br />
国外：<br />
GA，Clicky，W3Counter，Woopra，W3Perl ，Piwik，TraceWatch，Snoop，goingup，JAWStats，Crazyegg，gostats；Woopra，Crazyegg，clicktale、Omniture<br />
国内： <br />
百度统计，CNZZ，国双统计，51la，量子统计，小艾统计，科捷统计，好耶iDigger ，孔明统计</p>
]]></content:encoded>
			<wfw:commentRss>http://www.cnidea.net/blog/?feed=rss2&#038;p=70</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>就 SEO 来说，在相同情况下，category 和 tag 哪个权重大？</title>
		<link>http://www.cnidea.net/blog/?p=50</link>
		<comments>http://www.cnidea.net/blog/?p=50#comments</comments>
		<pubDate>Sun, 08 May 2011 05:38:57 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[SEO优化技术]]></category>

		<guid isPermaLink="false">http://www.cnidea.net/blog/?p=50</guid>
		<description><![CDATA[二者没有区别。category和tag本身不会对权重产生影响，category/tag上的keywords，站内链接结构等因素可能会对关键词的排名产生影响。 理论上来讲，Category一般都是从首页链入的，而Tag都是从最终分页链入的，从这个角度来说Category得到的PR可能会大一点，不过这也要看你网站的构架。 tag针对百度的运用需要有技巧，更多的是把tag来辅助页面的收录量，以及内链的建设。且不可滥用。 如果你要拿页面排名的话，二者和什么字母长短没有关系，tag和categroy本身也无权重轻重之分，相反我认为tag才是为用户体验做的，为了让用户更短时间找到信息，如果你想增加收录，你可以多使用tag，但注意不要造成重复页面，但如果自身网站蜘蛛爬取还没完成，且TAG就像blog那样放在首页的话，建议不要使用tag了，会使蜘蛛迷路且浪费抓取，我的建议是没完成自身收录的前提下，不要使用tag，完成后或者缺定蜘蛛抓取无障碍后可以使用tag来增加页面收录。 很多时候tag页面更容易靠前是因为网站内容少，tag页面本身上面的链接较少，分散也少，被指向链接相对categroy页面来说也少，如果你有一万个tag和20个categroy，就知道孰轻孰重了。]]></description>
			<content:encoded><![CDATA[<p>二者没有区别。category和tag本身不会对权重产生影响，category/tag上的keywords，站内链接结构等因素可能会对关键词的排名产生影响。</p>
<p>理论上来讲，Category一般都是从首页链入的，而Tag都是从最终分页链入的，从这个角度来说Category得到的PR可能会大一点，不过这也要看你网站的构架。</p>
<p>tag针对百度的运用需要有技巧，更多的是把tag来辅助页面的收录量，以及内链的建设。且不可滥用。</p>
<p>如果你要拿页面排名的话，二者和什么字母长短没有关系，tag和categroy本身也无权重轻重之分，相反我认为tag才是为用户体验做的，为了让用户更短时间找到信息，如果你想增加收录，你可以多使用tag，但注意不要造成重复页面，但如果自身网站蜘蛛爬取还没完成，且TAG就像blog那样放在首页的话，建议不要使用tag了，会使蜘蛛迷路且浪费抓取，我的建议是没完成自身收录的前提下，不要使用tag，完成后或者缺定蜘蛛抓取无障碍后可以使用tag来增加页面收录。<br />
很多时候tag页面更容易靠前是因为网站内容少，tag页面本身上面的链接较少，分散也少，被指向链接相对categroy页面来说也少，如果你有一万个tag和20个categroy，就知道孰轻孰重了。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.cnidea.net/blog/?feed=rss2&#038;p=50</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

