终于把自己的搜索引擎给写好了,高兴,了解了不少东西。原来校内常用的FTP搜索简单得很,甚至都不用读取文件,只需给文件名作索引即可。也了解了中文搜索和英文搜索的不同,由于断词的区别,我的版本只能搜索校内的英文网页。范围定在校内是因为在校内通过bras上外网再建索引太慢,不具实用性。当然,这还只是一个最基本的模型,速度、存储方面的优化算法几乎没有考虑。
感触最深的,算法的重要性;然后就是Google、baidu的服务器都是,天哪,难以想象的配置。N多台机器一起工作,“爬”的过程一直在进行。了解了很多,也有了自己的作品。大学还只有请外面的老师才能让自己的学生学到东西,悲哀。
<p>是什么样的问题啊?什么分辨率下没问题呢? </p>
[回复]
<p>大学要完工呢 </p>
[回复]
<p>呵呵恭喜恭喜。<br />
外面的老师也不错啊,特别是IT页,校园里的人视野太狭窄了,毕竟IT是很强调应用的 </p>
[回复]
<p>请外面的老师也算一种资源共享吧,什么时候北大清华也会去请外面的老师,那中国教育资源的分布就真正合理了。 </p>
[回复]