Fish团队及作品介绍

团队及成员介绍

团队名称:Fish

领队:陈孝旭

队员:陈孝旭

个人介绍:来自中国科学技术大学,计算机软件理论专业2010级硕士。崇尚简单的生活,想做一条自由自在的鱼。喜欢数据挖掘,喜欢云计算,目前正积极寻找与两者相关的工作。

作品介绍

依据对“百度知道”中用户回答问题行为的观察,发现用户有三种渠道寻找问题并进行回答:(1)根据关键字搜索;(2)根据问题分类搜索;(3)随机浏览。结合这个发现,设计的算法中将对问题与用户相关性的计算分为两个部分,通过混合的方式判定该问题是否应该推荐给用户。

算法描述

Algorithm

设给定用户,以及候选n个问题 1. 计算n个问题在“问题分类”上的与用户的相关性,并按降序排序,设得到的数值数组为为; 2. 计算n个问题在“关键词”上的与用户的相关性,并按降序排列,设得到的数值数组为; 3. 依次扫描,若数组值大于等于阈值 (为自定义参数),则将对应问题推荐给用户;若已经推荐了三个问题,则算法停止。若扫描结束,还缺少m个问题(0 < m <= 3),否则从选择中前m个问题推荐给用户。

程序框架