第1882章 你是说,个性化过度了?(第1/2页)
方案定下来了。
接下来一个月,团队投入个性化排序的开发。
技术上比分布式索引更复杂,需要建立用户行为模型,需要实时计算偏好,还要保证不影响搜索速度。
但团队热情很高。
这是前沿技术,国内外都还没成熟产品。
如果能做成,百度将在技术上领先一大步。
开发过程中,贾瀞雯每周和陈浩通话汇报进展。
「匿名化处理做得怎么样?」陈浩在电话里问。
「技术团队设计了双重加密方案。」贾瀞雯说,「用户行为数据先脱敏,再加密。
存储伺服器和业务伺服器物理隔离,访问需要多重授权。」
「用户教育呢?」
「我们做了详细的帮助页面,解释个性化功能是什么,需要什么数据,用户有什么权利。
还做了示意图,很直观。」
「好。」陈浩说,「记住,透明是关键。
用户不怕你收集数据,怕的是你偷偷收集。」
一个月后,个性化排序功能进入内测。
选了五千名用户参与,都是自愿报名的。
陈浩也加入了内测名单。
贾瀞雯给他开了个测试帐号。
内测开始一周后,陈浩打来电话。
「功能我试了。」他说,「确实更相关了。
我搜了几次电影,再搜『导演』,结果里电影导演的内容就排前面。」
「有什么问题吗?」贾瀞雯问。
「有。」陈浩顿了顿,「推荐太狭窄了。
比如我搜了几次武侠片,结果后来搜『电影』,出来的全是武侠片。
可我可能也想看看其他类型,只是还没搜过。」
贾瀞雯记下来:「你是说,个性化过度了?」
「对。」陈浩说,「算法太依赖历史行为了,会把用户限制在已有的兴趣里。
但人是有探索欲的,有时候想看看新东西。
所以我们需要一个平衡——既要基于已知兴趣推荐,也要偶尔推荐未知但可能感兴趣的内容。」
「技术上怎么做?」
「可以加一个『探索性推荐』模块。」陈浩说,「比如用户搜『电影』,大部分结果按他的历史偏好排序,但可以插一两条其他类型的优质内容。
或者定期给用户推送『猜你可能还喜欢』的推荐,这些推荐不完全基于历史,而是基于相似用户的行为。」
贾瀞雯飞快地记着。
陈浩的想法总是很超前。
本章未完,点击下一页继续阅读