申's profile和煦阳光PhotosBlogLists Tools Help

Blog


    March 30

    一件小事

    昨天调试c++程序的时候意外发现把一个new新对象的语句放到循环语句外面程序居然快了很多,原来new一个新对象需要耗费一定的时间,虽然这点差别在一般的程序根本看不出来,不过因为这个语句要被重复执行几万次,所以区别就出来了。小心地把程序改好,很惊喜地发现效率提高50%。相比一下我前几天用所谓高级的TT表来截枝,花了半天功夫,七改八弄,结果却只提高了10%(当然,不可否认TT表对别的程序很有效)。其实这样的事情很普遍,理论上很多高级控制技术在工业界里其实也许不如直接用最简单的PID控制来得有效,最简单的2层IF-THEN决策树,或朴素贝叶斯分类器已经可以处理绝大多数数据分类问题。
     
    有时候事情就是这样,通常人们总愿意花力气去追求一些所谓高级的理想,以为那肯定会给自己带来很大的快乐,追求到以后觉得不过如此。却往往忽略了身边的一些容易做到的小事,那些只要你把它踏踏实实做好,就会让你很快乐的平凡小事。
     
    再转载一个朋友blog上一句我很欣赏的话,与上面的主题无关:
    Career and Health
    Career is like a rubber ball, you drop it, it will bounce back( if you work hard).
    Health,however,  is like a glass ball. if you drop it, it will break into pieces.
    March 28

    选定导师和Master Degree Thesis拉~~

    跟了Robert Holte, 一个很nice的老头,人好像挺牛的。如果有人今年7月去温哥华参加AAAI 07会议的话,会有机会见到他,他刚好是今年会议的co-chair。他主要从事Machine Learing(ML), Heuristic Search方面的研究。
     
    更让人高兴的是让我选到了自己很感兴趣的Machine Learning相关的project做thesis的topic。自从选了Machine Learning的课,我就明显感觉到我对这方面有浓厚的兴趣,一直期待能在这方面有所发展,这次终于如愿了。这个project是做Query Refinement. 通俗一点的解释就是,比如你在google里搜一个词,假设你想搜有关电脑游戏AI设计的东西,你输入关键词:computer AI,可是前20项结果都没有你想要的结果。我们要做的就是根据分析搜索结果,给出几个“建议搜索”关键词,比如说:computer AI Design, computer Artificial Intelligence 这样能帮助你搜索的建议。 这个project主要涉及Machine Learning, Natural Language Processing 之类的知识。他刚好从google公司拿到这样一个项目,然后也有2个phd student在part time的研究,所以希望找一个人来全力组织完成这个项目的一期计划。(二期计划是根据用户的第二次关键词输入,或者选择我们提供的建议关键词,综合2次输入的信息,进一步进行query refinement)。
     
    接下来1年零5个月就要贡献给这个project了,从当初大学4年念光电系,学电路和光学,到后来申请机器人方向,也选过AI search algorithms, computer vision和graphic方面的课,到后来对machine  learning产生浓厚兴趣,直到现在终于决定下来做Query Refinement(属于Information Retrieval 大类),虽然在这个曲折的过程中因为个人知识背景的转换使得有时候觉得很painful, suffering,要补的东西很多,可是不断明晰自己想要做的东西的过程带来的满足感鼓励着我不断前进。熬过这个学期,接下来就应该好好补补基础知识,做大量literature review了。像Robert Holte在当我说我没有这方面实际经验时候鼓励我说的话一样:“Don't worry about that. We will make it!"  Yes, Let's make it!~~
    March 18

    我能想到最浪漫的事

    对搞计算机这行的,计算机就是自己的恋人。
    整天没日没夜地对着她,一天16小时地守候着她。
    有时她也会唱歌给你听,放电影给你看,陪你玩游戏,念新闻给你听。
    最近,她陪我做projects.
    这两天在写一个搜索程序,为了提高那么一点点搜索效率,把整个程序几乎重写,重复作业的语句全部改掉,抛弃稍微复杂一点的数据结构全部用繁琐冗长不过耗时少的代码代替。检查每个函数的耗时分析瓶颈。
    bug呀bug,永远让人产生无奈的唠叨。
    可是连续2天的工作却只把单步运行时间从2秒提高到1秒。 就这么1秒钟的时间,却花了我20多小时的时间。
    感觉计算机是生活在天上的,我是生活在人间。 天上1秒,地上1天。 
    我很怀疑,我是不是还有一个影响数量级效率的瓶颈没有解决。
    希望是这样,不然现在这个运行效率,对我来讲太慢了,即使我的恋人拥有两颗每秒跳动1.6*1024*1024*1024次的心脏。
    可我找不出来。
    考GRE那阵早上快醒的时候脑子里就冒单词:"gaunt" "daunt" "taunt"
    今天早上快醒的时候脑子就冒这些玩艺:"i++"  "j++"  "F10"  "F11"
    觉得好心烦,觉得效率好低,觉得时间好紧,
    可是把青春献给我的恋人, 我无怨无悔。 
    敲敲键盘,对笔记本说句情话:“我能想到最浪漫的事, 就是能和你一起debug到老。” 
    March 10

    贴几套照片

    07.1.15 学校顺手拍 
    (Note: 大雪时的系楼附近的雪景, 及系楼室内的一些照片)
     
    07.01 自拍几张
    (Note: 来加后几张对镜自拍, 很傻, 务笑)
     
    06.12.23 Snow Valley滑雪 
    (Note: 不要问为什么没有我)
     
    06.10.31 <宝贝计划>截图
    (Note: 女友很喜欢的小baby, 非常可爱, 混血儿)
     
    06.11.11 圣诞前的West Mall 
    (Note: 我很喜欢那些欧式风格的建筑, 很漂亮)
     
    06.11.11 Remembrance Day 
    (Note: 可以看到苏格兰风笛和穿裙子的男人)
    Google资料: 荣军纪念日(Remembrance Day)11月11日:这天是来纪念那些曾经在战争中为国家服务过的军人,特别是那些在战争中失去性命的军人。这天是加拿大国定假日。红色罂粟花则是当天的象征,用来纪念在第一次世界大战时,欧洲的弗兰德斯战场有很多军人殉职,而在同时则开了很多的罂粟花。每年此时,加拿大退伍军人协会各分部会筹款来帮助一些经济陷入困境的退伍军人家庭。