李明冲进贾瀞雯办公室时,手里攥着一沓列印纸,手指都在发抖。
「成了!贾总,成了!」
贾瀞雯抬起头:「什么成了?」
「分布式索引!」李明把列印纸铺在她桌上,「你看,测试数据!搜索响应时间平均缩短了百分之五十!最快的时候能达到零点八秒!」
贾瀞雯拿起数据报告。
表格密密麻麻,但结论很清楚:新技术让百度搜索的速度提升了一半。
「怎么做到的?」她问。
「我们把索引彻底打散了。」李明在白板上画图,「以前是集中式索引,所有数据在一个大库里,查询要遍历整个库。
现在是分布式,数据按关键词首字母分片,存在不同的伺服器上。
查询时,系统自动定位到对应的伺服器,只搜那一片数据。」
他顿了顿:「就像图书馆以前把所有书堆在一起,现在分门别类放不同房间。
找小说去A房间,找历史去B房间,不用把所有房间都翻一遍。」
贾瀞雯看着数据,心里一阵激动。
这意味着,百度的搜索速度将达到一个新高度,甚至可能超过那家美国公司。
「稳定性呢?」她问。
「测了一周,没问题。」李明说,「而且分布式架构更健壮。
一台伺服器宕机,只影响一部分数据,其他还能正常服务。
不像以前,主库一挂,全瘫。」
「太好了。」贾瀞雯站起来,「马上部署,尽快上线。」
「等等。」李明说,「还有件事。
陈总昨天打电话,提了个新构想。
他说……光快还不够,要更聪明。」
「什么意思?」
「个性化排序。」李明翻开笔记本,「陈总说,现在的搜索结果是基于全网数据,对所有用户都一样。
但不同用户的需求不同。
比如搜『苹果』,程式设计师可能想找编程资料,果农可能想找种植技术,普通用户可能想买水果。
如果能根据用户的历史行为,给每个人个性化的排序,体验会更好。」
贾瀞雯思考着这个构想。
本章未完,点击下一页继续阅读