半监督学习(semi-supervised learning)
来源:互联网 发布:it安全工程师 编辑:程序博客网 时间:2024/06/05 16:36
# 半监督学习(semi-supervised learning)
1 introduction
- why semi-supervised learning?
收集数据很贵,收集有标签的数据更贵!
- superviesd:
D={(xi,yi)}Ni=1 - semi-supervised:
D={(xi,yi)}Mi=1∪{xu}Nj=M+1 ,通常N≫ M
- 转导推理——Transductive Learning:无标签数据就是测试数据
- 归纳学习——Inductive Learning:无标签数据不是测试数据
2 Generative model
initialzation:
θ={P(C1),P(C2),μ1,μ2,∑} - step 1:计算无标签数据的后验概率
Pθ(C1|xu) step 2:更新模型
P(C1)=N1+∑xuP(C1|xu)N ,N1 是属于第一类的实例的个数,μ1=1N1∑xi∈C1xi+1∑xuP(C1|xu)∑xuP(C1|xu)xu 回到step 1
- step 1:计算无标签数据的后验概率
maximum likelihood with labelled data:
logL(θ)=∑xilogPθ(xi,yi) Pθ(xi,yi)=Pθ(xi|yi)P(yi)
- maximum likelihood with labelled + unlabelled data:
logL(θ)=∑xilogPθ(xi)+∑xulogPθ(xu) Pθ(xu)=Pθ(xu|C1)P(C1)+Pθ(xu|C2)P(C2)
3 Assumption
Low-density Separation:分离超平面处数据密度小
- Self-training:1、从有标签数据中学习一个模型
f∗ ;2、应用f∗ 在无标签数据上得到标签(Pseudo-label);3、从原先无标签数据中取出一些数据加入有标签数据集;4、重复之前的步骤 - Hard label v.s. soft label:
[0.7,0.3]T→[1,0]Tor[0.7,0.3]T ,soft label没有用!hard label就是用了low-density seperation的假设。 - Entropy-based Regularization:计算分布的熵来表示分布的集中还是分散,
E(yu)=−∑m=1Mymuln(ymu) ,熵越小越集中,越大越分散。 L=∑xiC(yi,ŷ i)+λ∑xuE(yu) - semi-supervised SVM:穷举所有可能的无标签数据
- Self-training:1、从有标签数据中学习一个模型
Smoothness Assumption:特征接近的数据(在高密度区域若两个数据接近),那么它们有相同的标签
- Cluster
→ label - Graph-based Approach:1、定义 similarity,例如
s(xi,xj)=exp(−γ||xi−xj||2) ;2、添加边:例如KNN/e-neighborhood - 定义图的smoothness:
S=12∑i,jwi,j(yi−yj)2=yTLy ,y=[…,yi,…yj,…]T L:N∗N,L=D(W)−W 矩阵, L=∑xiC(yi,ŷ i)+λS
- Cluster
4 Better Representation
- 找到观察到的事物背后的latent factors(潜在因子),这些东西之后才是better representation
- 待续……
0 0
- 半监督学习(semi-supervised learning)
- 半监督学习(semi-supervised learning)
- [机器学习入门] 李宏毅机器学习笔记-13 (Semi-supervised Learning ;半监督学习)
- 主动学习与半监督学习Active-learning and Semi-supervised learning
- 什么是监督学习(supervised learning)
- 监督式学习(Supervised learning)
- 监督式学习(Supervised learning)
- Unsupervised, Semi-Supervised, Supervised Learning
- 监督学习(supervised learning)和无监督学习(unsupervised learning)
- semi-supervised learning
- Semi-supervised learning
- semi-supervised learning
- Semi-supervised learning
- semi-supervised learning
- Semi-supervised Learning
- Semi-supervised learning
- Machine Learning机器学习 - Supervised Learning监督学习 - Native Bayes
- 主动学习(二)——将 active selecting methods 引入semi-supervised learning
- redis-key
- android错误之android.content.res.Resources$NotFoundException:
- iOS
- 深度学习(Deep Learning) 5.CNN
- 深度学习(Deep Learning) 6.why deep?
- 半监督学习(semi-supervised learning)
- MFC Windows程序设计--文档/视图体系结构
- JavaScript基础介绍
- 使用TreeSet集合存储学生姓名成绩,并按照总成绩从高到低排序。
- EXCEL 汉字转拼音
- CRB and His Birthday
- Gsoap编译
- python 多进程,多线程
- 个人收集整理的一些学习shader的网站/博客(不定时更新)