Google首页代码分析 不指定

2009.6.11 09:36 [ 工作 ] 评论(2) , 阅读(818) | |
Google首页代码分析  src:http://lifesinger.org/blog/2009/06/google-com-src-study/
  by:lifesinger
  机缘巧合,lifesinger 对 google.com 的首页代码产生了浓厚兴趣。一点“分析”,杂记如下:

  不同浏览器推送不同代码
  google_src_chrome.html    7.7k
  google_src_firefox.html      9.5k
  google_src_ie8.html          9.7k
  google_src_opera.html      7.9k
  google_src_safari.html       7.7k
  上是在不同浏览器下,保存的 google 首页代码。
  注意:文件大小是经过 IntelliJ IDEA 格式化处理后的大小,请查看:
  http://lifesinger.googlecode.com/svn/trunk/work/lab/2009/google/
  其中 Chrome 和 Safari 的代码是一样的,Opera 仅仅一个 js 函数的写法与 Chrome 不同。差异最大的是 Firefox 和 IE。
  lifesinger的想法:大部分应用场景下,针对不同浏览器实现不同版本,会增加开发和维护成本。google 首页采取这种差异化方案,很可能是考虑到要最大限度降低网页流量。毕竟对于日访问量上千万的网站来说,减少一个字符都能节约可观的流量。精简节约,在 google 首页上体现得淋漓尽致,下面会继续提及。

  doctype 的写法
  只有 Firefox 用了来激活标准模式。其它浏览器下,都是简单粗暴的 Quirks 模式。
  lifesinger的想法:Firefox 下也可以直接用 Quirks 模式,视觉差异上极小。不清楚 google 为何仅针对 Firefox 开启了标准模式。
  值得注意的是,在 google 搜索结果页,所有浏览器下都使用了. 毕竟结果页复杂些,依旧用 Quirks 模式的话,会增加开发成本。首页因为简单,Quirks 和 Standards 相比,没什么显著差别,因此能省就省。
  关于 doctype, 强烈推荐阅读:Activating Browser Modes with Doctype
  对浏览器来说,doctype 实际上仅影响浏览模式,因此能从简就从简。W3C 校验,lifesinger觉得没必要,很少关注。

  精简,还是精简[/b
  以 Firefox 下 google 首页的源码为例:
  html, body 缺胳膊少腿
  html 元素的很多属性没有用双引号括起来
  class, id 等命名很短
  script 和 style 元素没 type 等属性
  没有 keywords 和 description 等 meta 值,我是搜索老大,哈哈
  balabala 等等
  想起一句话:遵守规范的一个重要标准,就是知道何时打破它,并大胆地打破。从这层意义上讲,google 首页是非常遵守规范的。

  [b]没有完美

  细心点,还可以发现:
  引号去得不彻底,比如
<img alt="Google" ...

  还有padding-left: 0px, px 可以去掉
  js 上,也有进一步精简的余地。比如下面两行完全一样的代码,很囧:

if(google.y) google.y.first = [];
if(google.y) google.y.first = [];

  还有一段代码,div 提前到 script 前面能省去判断:
<script>
function wgjp() {
    var xjs = document.createElement('script');
    xjs.src = '/extern_chrome/1mZ_-PL2Zjc.js';
    (document.getElementById('xjsd') &#124;&#124; document.body).appendChild(xjs)
};
</script>
<div id=xjsd></div>

  也许吹毛求疵了,笑过。

  预加载
  看代码:
<body  onload="sf();if(document.images){new Image().src='/images/nav_logo4.png'}" ...

  这就是 YSlow 34条性能法则中的 Preload Components. google 首页提前加载了搜索结果页的 css sprite. 另外赞一下这个 sprite 图的组织,很 cute.

  延迟加载
  看代码:
window.setTimeout(function() {
    var a = document.createElement("script");
    a.src = "/extern_js/f/.../XRt_2Y4Z5sM.js";
    (document.getElementById("xjsd") &#124;&#124; document.body).appendChild(a)
}, 0);

  上面这个 js 挺大的,包含了 google 的 js 库和输入框的提示补全组件。这个 setTimeout 起到了将下载进程延迟到 window.onload 后。很小的代码调整,却提升了不少用户体验,实在划算。
  另提一下,这个 js 在不同浏览器下也有不同版本,大小差异比较明显。为了尽可能减少流量,google 还真费心。

  奇淫技巧
  代码虽少,淫荡之处却摇曳生姿:
  1. 遍历数组
  for (var i = 0,c; c = ["ad","p","pa","zd","ac","pc","pah","ph","zc"][i++];) {
      // doing something, such as console.log(c)
  }
  2. 短路语句
  function _gjp() {
      !(window._gjwl.hash && window._gjuc()) && setTimeout(_gjp, 500)
  }
  短路表达式很常用,但用短路单独做语句,还真精简。

语义化
  从语义上讲,google 的 html 代码是比较糟糕的。但考虑到各种浏览终端,或许 google 目前的写法非常优化。没有接触过跨n > 20的浏览器开发经验,对此不多说。

小结
  从首页代码中,能看出 google 推崇的是:简单 + 实用 + 性能。lifesinger越来越认同这种观点。
我猜和这篇日志可能类似的也许你会看看:
  • GReader 中度中毒
  • 从10万到15万
  • 收到 Google Analytics 邀请 真快
  • Tags: ,
    有人在2009/07/04 10:26说: Email Homepage
    你的文章很精彩,欢迎到feerbook.com提交你的博客与更多网友分享!
    有人在2009/06/15 12:19说: Homepage
    博主辛苦了zan
    分页: 1/1 第一页 1 最后页
    发表评论
    表情
    emotemotemotemotemot
    emotemotemotemotemot
    emotemotemotemotemot
    emotemotemotemotemot
    emotemotemotemotemot
    打开HTML
    打开UBB
    打开表情
    隐藏
    记住我
    昵称   密码   可以直接留言
    网址   电邮   [注册]