Cheng's Regression Challenge

来源:互联网 发布:怎么程序员简历包装 编辑:程序博客网 时间:2024/06/05 19:06

这是一个机器学习读书会的私人Challenge
数据来自于我个人遇到的一些回归问题

顺便在这里也放一份

目标是实现一个几百或者几千维到几十维的回归

出于相互交流的目的我把其中的一部分数据
公开出来,征询更好的解答。并会请两个表现
最好的算法的作者吃一次饭。如果不在读书会
的人进入前三的话我也会额外请你吃饭的TAT


截止日期

这个好像挺重要的,等我开ICCV回来吧,

定在12月20日吧


下载

文件夹的链接
http://pan.baidu.com/s/19seyW

包含测试框架 RegressionChallenge
和数据集的数据


提交:

测试的框架我写在main.m

大家可以在regressor下面新建一个自己方法的文件夹
并且在main.m中修改第12行的方法名
和第14,15行的训练与测试的函数指针(修改成自己的函数名)

训练函数接口

model = your_trainMethod( feature, target)

feature是n * 特征维度的double矩阵
target 是n * 目标维度的double矩阵
model是任意一个结构体

测试函数接口

response = your_predictMethod( model, feature );
response 是n * 目标维度的double矩阵
    代表你的模型的输出
model 代表你的模型
feature是n * 特征维度的double矩阵

框架下面我已经写了一个岭回归和一个PCA之后岭回归
的样例,大家可以先跑通样例。

算法完成后把你的算法包和函数指针的写法发给我就行了

有什么bug请及时联系我

评价

评价原则上采用l_2度量

不过我的样例只给了一个l_1的

数据:

数据存储在/data/下面的一些mat里,
框架的压缩包里面已经包含了一个数据集Celebrity

对应一个640维到10维的回归问题,包含16000个样例
TrainCelebrity是可以使用的训练数据
ValiCelebrity是供大家自己测试的测试数据
大家可以汇报在Vali上测试的结果来相互比较

除此之外共享的文件夹里面还有一个SparseHelen
的数据集大家也可以下载了放在data里面

我还会陆续更新其他的数据集

此外我还会准备同样维度规模的公共的测试数据来进行测试。



数据的真实来源:

其实这个feature是机器视觉里面的SIFT feature,
而对应的问题是CVPR13的一篇论文
X.Xiong, Fernando.D.Torre, Supervised Descent Method and its Applications to Face Alignment
里面涉及一个SIFT feature到pose的拟合
实际上就是这次challenge的数据
在论文里面作者使用了岭回归,我不清楚有没有更
powerful的解法,所以放在这里大家试一下。