多标签分布/多标记分布
来源:互联网 发布:淘宝代购申诉 编辑:程序博客网 时间:2024/05/21 10:45
多标记分布的损失函数:
根据分布之间距离或者相似度不同的衡量标准,可构成不同的优化目标。下面采用KL散度作为概率分布之间的距离:
利用
确定函数p(yj|xi;θ)
采用最大熵模型来定义函数:
其中
因此,完整的损失函数为:
很容易证明函数
其中
红色部分是仿射函数的线性组合,其是凹函数(或凸函数)。
已知函数:
是凸函数[4],并且
矢量编程
函数
函数值f(θ)
假定训练数据具有格式(详细参考[5]):
trainFeature 为 [2000 2045]的矩阵,其中2000为样本的数量,2045为特征的长度.trainDistribution 为[2000 5]的矩阵,其中2000为样本数量,5为标签分布,并且满足,每行元素之和为1.
modProb = exp(trainFeature * weights); % size_sam * size_YsumProb = sum(modProb, 2);modProb = modProb ./ (repmat(sumProb,[1 size(modProb,2)]));target = -sum(sum(trainDistribution.*log(modProb)));
由上述代码中可以看出,target=
梯度grad(θ )
从上述公式
上述公式表达不够准确,其中第一项对应一个矢量,第二个项对应为一个矩阵。
代码为:
gradient = trainFeature'*(modProb-trainDistribution)
我们同样的我们注意到其是求解
参考文献:
1. 标记分布学习及其应用. [季荣姿]
2. Label Distribution Learning [ tkde 2016]
3. http://cse.seu.edu.cn/people/xgeng/index.htm [geng xin professor]
4. 凸优化 [stephen Boyd]
5. LDLPackage_v1.2
0 0
- 多标签分布/多标记分布
- android 多分布率解决
- 多个图片平均分布
- div标签的箱子分布
- 分布式缓存中多机房分布策略
- 2、kafka伪分布多broker部署
- 分布数据文件访问多个磁盘
- 多IDC的数据分布设计
- selenium实现多机器部署分布执行
- 概率分布-beta分布
- 概率分布(多项分布,Dirichlet分布)
- 联合分布 & 条件分布 & 边缘分布
- 边缘分布、联合分布和条件分布
- edhat 5.4部署完全分布多节点Hadoop集群
- Google 400多号的科学家团队项目分布
- cocos2d-x多分布率适配(iphone5、ipad、android)
- cocos2d-x多分布率适配(iphone5、ipad、android)
- C++多态调用和继承内存分布
- c 系统函数速查表---数学函数,内存管理函数,字符串操作-------
- 第十四周项目1-验证算法(1)-折半查找算法
- 定时器的设置
- 第14周项目1-(2)验证分块查找算法
- Maven编译时出现读取XXX时出错invalid LOC header (bad signature)
- 多标签分布/多标记分布
- pb自动注册ODBC的sqlanywhere数据源
- React-native 中因为计时器导致的异常解决办法
- 系统调度时间
- weblogic环境下报错:can't find java.awt.Color
- SpringMVC学习记录(九)--RequestContextHolder分析
- MSSOAP30.dll 导入 error C4772: #import 引用了缺少的类型库中的类型;“__missing_
- 数据库原理实验实验四 oracle的安全性和完整性控制
- 第十四周 项目3 - 是否二叉排序树?