程序博客网 > 在哪里开通淘宝客

混合专家系统（MoE）

来源：互联网发布：在哪里开通淘宝客编辑：程序博客网时间：2024/05/16 09:55

混合专家系统（Mixture of Experts）

原理：

混合专家系统（MoE）是一种神经网络，也属于一种combine的模型。适用于数据集中的数据产生方式不同。不同于一般的神经网络的是它根据数据进行分离训练多个模型，各个模型被称为专家，而门控模块用于选择使用哪个专家，模型的实际输出为各个模型的输出与门控模型的权重组合。各个专家模型可采用不同的函数（各种线性或非线性函数）。混合专家系统就是将多个模型整合到一个单独的任务中。

混合专家系统有两种架构：competitive MoE 和cooperative MoE。competitive MoE中数据的局部区域被强制集中在数据的各离散空间，而cooperative MoE没有进行强制限制。

对于较小的数据集，该模型的表现可能不太好，但随着数据集规模的增大，该模型的表现会有明显的提高。

定义X为N*d维输入，y为N*c维输出,K为专家数，λ为学习率：
for j in(0...(d−1)) and i in (0...(c−1)):
各专家输出为: Vik=wikx
(其中wik为第k个专家模型对第i列输出的权重，Vik为第k个专家对第i列的预测。（wik添加了bias所以输出为d+1维）)

第k个专家输出均值为： mk=∑c−1i=0Vik

门限模块输出为： gk=emTk∑kemTk
输出yi通过softmax函数转成概率值为：ysi=eyi∑ieyi

对于Cooperative MoE：
Δwik=λ(yi−ysi)gkx
Δmk=λ(yi−ysi)(vik−ysi)gkx

对于Competitive MoE：
Δwik=λfk(yi−yik)x
Δmk=λ(fk−gk)x
yik=eVik∑ieVik
fk=gke∑iyilogyik∑lgle∑iyilogyik

实验结果：

不同数据集相同k值：

k=2使用线性数据集，采用SGD和FTRL两种训练方式，结果如下：
k=2使用非线性数据集，采用SGD和FTRL两种训练方式，结果如下：

相同数据集不同k值：

k=1:
k=2:
k=4:

阅读全文

0 0

在哪里开通淘宝客

在哪里开通淘宝客

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子无线天无线阅读吧无线公司无线英文无线网慢无线网分享莓园无线免费无线无线路由器怎么设置无线路由器设置中文字幕无线中文字幕无线观看无线鼠标怎么连接电脑香港无线电视台 tplink无线路由器怎么设置手机设置无线路由器无线耳机怎么连接手机女朋友带无线蛋跳上课无线鼠标连接无线路由器桥接无线耳机连接手机无线网密码怎么改无线蓝牙耳机亚洲无线观看无线网密码改无线网卡驱动国产无线资源无线鼠标没反应恩山无线论坛无线网络连接无线耳机连接无线耳机什么牌子好中文字幕无线码普联无线路由器设置迅捷无线路由器设置电脑无线网络连接设置无线路由器中国无线论坛无线路由器怎么安装路由器当无线网卡无线破解论坛