解惑

解己之惑,解人之惑

2006年11月 (第1页共6页)

百度蜘蛛和谷歌分析之间的战斗

前次我说过我的访问很多是来自百度,这几天一直在思考,后来看了一下JR的访问统计(见后面),看到里面同时有两个和百度相关的,一个是baidu,一个是baidu.com,突然想到那个baidu可能是百度的爬虫,要不然不可能来源数量那么高。
这样我就要怀疑百度针对谷歌分析进行了某种处理,让站长们不要轻视百度的影响力,而如果谷歌发现这个情况,会不会有针对性的剔除这个访问呢?

展望3D的互联网

昨天在我的名字起源中提到过VRML,结果今天很巧的看到KESO的日志中提到一个3D的虚拟社区,赶紧注册了一个用户,可惜到后来才发现这个社区原来是需要另外安装客户端的。

借这个机会展望一下我心目中的3D的互联网吧。
首先我想每个人应该有一个自己静态的IP,至少是可以很容易的获得,就像现在的域名一样。
然后就是一个简单通用的3D的语言,就像现在的HTML一样,VRML可能是一个候选。
还有就是需要3D的电脑设备了,记得在一部科幻电影中(可能是黑客帝国)看到过一个场面,就是一个人戴上一个手套以后,就在电脑上操作互联网,展现在用户前的不是屏幕,而是一个虚拟的3D的空间,用户通过拉伸、滑动、交换等等方法可以操作那些虚拟的3D对象。
剩下的就是想像力了,像现在的互联网一样,每个人可以拥有一个属于自己的虚拟空间,我们暂且称之为“虚拟人”,虚拟人可以在自己的空间中写日志,讨论问题,购物,就和现在的互联网一样,不同的是,这些信息主要保存在你自己的空间中,当然,如果你加入某些社区,这些社区也会保存一份同样的信息。
这样,每个人可能会拥有两个空间,一个是现实空间,一个是虚拟空间,在现实中,你可能一穷二白,但是在虚拟空间中,你可能很富有。当然,两个空间的财富可能可以进行交换。
梦想中的这个3D的互联网应该是囊括了现在互联网的功能,搜索、BBS、网络游戏、购物、交友、共享照片、Blog等等。

Cherami的由来和消失的VRML

很多人奇怪我的网名或者英文名为什么叫cherami,其实这个词是一个法语词,意思是亲爱的朋友,一般指男性,还有一个词是cherame,意思一样,指女性。好像是在看一本小说的时候无意中看到的。后来上网的时候就想,什么名字别人不太可能想到用到?我觉得cherami是个好的选择,后来的事实证明我的猜测是正确的。
其中我遇到的最大一次挫折就是在中国人注册,这个名字已经被人使用了,费了很大的劲查到那个人的QQ,就在QQ上要那个人把那个ID让给我,后来慢慢知道她是一个MM,是学法语的,她说我是男的,应该用cherame,她说cherami才是指的女性。她经不住我的纠缠,答应让给我,后来却又不干了。

后来有一件很巧的事情,就是在图书馆里面看到介绍VRML的书,感觉这个是未来Web的方向,那本书最开始的介绍也是说“VRML的英文全称为Virtual Reality Modeling Language,即虚拟现实建模语言,它是第二代WWW的标准语言。”,学习了几个月,掌握了基本语法。后来想到注册一个自己的域名,试了下cherami.com,没想到竟然是一个使用VRML建立的虚拟世界交友网站,可惜那个时候还非常的简单和粗糙。

现在VRML好像已经销声匿迹了,希望cherami不会。但是我更希望真正的下一代3D的Web语言能够尽早出现,这样我们就可以享受一个真正的虚拟世界,而不是在网络游戏中沉沦了。

分享才能进步

一直一来我都坚信分享才能进步,在解决别人的问题的时候你能够学习到光靠自己钻研所不能学习到的内容,原因有几点:

  1. 思维方式不一样
  2. 写代码的风格和习惯不一样
  3. 工作的领域不一样
  4. 经验不一样

无论是哪个方面不一样,都会有一些你可能永远也不会遇到的问题,这些可能对你的帮助不大,但是这些奇怪的问题往往可以帮助我们认识一些你自己不会主动也想不到的知识点,而且做为同事同仁,你不可避免的要帮助别人解决问题(特别是你成为一个高级工程师的时候,你一定会带其它的人做项目)。
另外,你自己理解和让别人也理解是完全不同的,很可能你理解某个问题,但是要让别人也理解并不容易,只有你思考过最好是实践过的时候你才会知道,在把这个知识系统的写下来之后,实际上你对这个知识点也掌握得更加的清楚了。
最后就是很可能你以为你掌握了,实际上掌握得并不全面和彻底,一个典型得例子就是Java类的完整构造执行顺序,原来我以为我掌握得很彻底了,看了别人遇到得问题和分析我才知道我的理解并不全面。所以分享以后,可能对那个方面更加熟悉的人可以看到并指出你的问题。

搞软件的确实比较辛苦,因为你知道的永远少于你不知道的!

要戴眼镜了

近几天视力急剧下降,怀疑是有什么病,一个同事说糖尿病的前兆有视力急剧下降的现象,上网查了下,好像还真的有些病会引起视力急剧下降,请了半天假到五官科医院,结果前面有90个人排队,等了一个半小时,医生说:你这个就是近视。我说我8年多视力都没有下降过啊,从高中毕业至今,为什么现在突然下降呢,最近也没有用眼睛很厉害啊!医生问我多大了,我说二十九,有没有办法可以控制。医生说,你都这把年纪了,又不是小朋友!彻底晕死。
老婆让我先不要急,现在还是假性近视阶段,看看再说。看来这段时间要少用电脑了,也不能打游戏了。可怜的眼睛啊,现在都只有0.4了(视力表简单的粗测),原来一个是0.6一个是1.0的啊。

令人费解的商品价格

一个到新加坡出差的同事回来给我们带了一盒巧克力,新加坡币是9.9元,折合为人民币大概50左右吧,但是记得超市里面至少卖70多,淘宝上好像是卖69,24粒装的那种方盒子,查了一下关税,好像进口巧克力现在才8.8%的关税,不应该差这么多吧。

另外我住在花木地区,隔着没有多远的三林的物价好像比这边便宜很多,例如基尾虾,花木卖14的时候三林卖11,等三林涨到14的时候,花木又卖17了,前两天老婆再在三林买的时候已经涨到17了,没有想到花木去买的时候,进门的那些摊位都是卖25,里面有一家最便宜21。

不知道这些价格到底是如何定的,难道也是像房价一样吗?

学会懒惰

记得有人说过最好的程序员是最懒的程序员,这个懒并不是真正的懒惰,而是学会高效率、低重复的工作。其实对于大多数程序员而言,都是在一个固定的框框里面写一些看似不同实际相同的代码,那么你有没有想过使用什么方法能够不写那些完全一样或者几乎完全一样的代码呢?很多人可能更多的是复制,特别是在IDE的帮助下,拷贝一个类,它会自动帮你替换一些相关的东西。这个方法是不对的。你的代码中如果存在一段代码重复三次以上的情况,你就要想办法不这样重复了。我常用的有两种,一种就是写工具类,还有就是使用Template method模式,基本上可以解决90%的问题。
另外一点就是写代码能够做的事情不要自己一遍一遍的重复做,例如这次我写的EJB单元测试框架,其实我可以要求大家写单元测试的时候自己发布EJB,只发布自己需要的,但是我可以从项目的配置文件中读取到这些信息,就应该让框架自己来做;Entity Bean的finder方法MockEJB不支持,我提供了基础代码可以自己写Finder的实现,但是80%以上的finder的实现都很简单,就是两三行代码重复一下,换个字符串就可以了,但是我费了很多时间写正则表达式去解析这些finder,只有很少一些SQL使用了比较复杂的语法(288个里面只有34个)。
也有很多人说程序员很苦很累经常要加班,就我而言,我工作五年多来只加班过三个月,而且不是因为写代码,而是因为我一个人要解决40个人遇到的问题,我解决不了的或者解决方案会影响项目进度的我就要发邮件到我们的上游承包商的人,每天必须阅读和回复的邮件超过100封,而且要使用我并不是很好的英语写。而且我从来没有通宵加班过,最晚的一次是到半夜两点,还是陪项目组的人发布,我自己其实并不需要加班。
学会懒惰,学会思考,学会更深入的研究问题,你慢慢的会发现程序员其实不需要加班也可以搞定。

MockEJB测试框架之自动发布EJB后续

本来今天已经完成了框架的大部分功能,写的一些测试用例都可以成功执行,但是自动发布是放在BaseTestCase里面的,感觉不好,就重构了一下,扩展了InitialContext类,覆盖了lookup方法(参数为字符串的那个,我们的代码中都是使用的这个),这样代码看起来更好一些的。另外我们的系统里面使用到了一些类似的机制,我为了产品可以进行单元测试还对一些Factory类进行了简单的修改,让他们返回我为了单元测试而写的实现类。如果使用这个扩展的InitialContext类,应该不需要做那些修改了,试了下,发现不行,因为产品的代码好像和Jboss的某些特性进行绑定了,先做简单的重构,以后再研究产品到底使用了JBoss的哪些特性,能否搞定。
代码如下:
阅读全文

百度特立独行?

昨天晚上看到一个比较有意思的插件:Landing sites,但是它不支持百度,看了下源代码,要支持百度很简单,加一个搜索引擎的定义就行了:
            ‘baidu.com’ => ‘wd’,
然后试了下,结果发现页面上显示的查询的关键字显示为乱码,研究了下,发现百度很奇怪的把URL中的中文使用GB2312编码,而不是现在通用的而且是URL编码标准的UTF-8,例如搜索“mockejb 框架”,谷歌的编码为:mockejb+%E6%A1%86%E6%9E%B6,而百度的编码为:mockejb+%BF%F2%BC%DC
百度是为了特立独行还是想表明自己是支持国家标准的民族企业?
本来想修改代码对百度的进行特殊处理,代码中使用urldecode进行解码,但是没有办法指定解码的编码方式,暂时就那么的了,问题应该不大,虽然我的blog来自百度的搜索很多

2007年4月23日更新:
呵呵,TrackBack真的很有用,到我的一个TrackBack的BLOG,我看了下,他又找到了别人的解决百度的编码问题的blog

谷歌比百度更诚实

试了下谷歌和百度收录我的BLOG的情况,发现谷歌更加的诚实一些,而百度差不多有20倍的夸大。百度的结果中翻到17页的时候,搜索结果就变成186了,而不是原来的4890项。不过谷歌也并非没有缺点,就是太不稳定,昨天好像还收录了205个,今天就变成155了。
不过也许我不应该说百度的坏话,因为很奇怪的是,我现在访问量的15%都是百度过来的,比谷歌还多,谷歌只有不到13%,但是我的这个应该属于技术性的站点,按照以前的讨论,应该是谷歌更有优势。

更早的文章

© 2025 解惑

本主题由Anders Noren提供向上 ↑