三十三期百度技术沙龙笔记整理
来源:互联网 发布:学而时学之不亦说乎 说 编辑:程序博客网 时间:2024/04/27 17:35
此次技术沙龙是由百度的高级架构师陈天健和豆瓣首席科学家王守崑为主讲,大主题是推荐系统。
陈天健的主要话题是百度推荐引擎计算平台架构中的流式计算架构。中间有一种因为几个短信有点错过,等视频出来再听一遍,这个笔记基本没啥整理,主要是个备档,感兴趣的同学可以直接去InfoQ看视频。下面把记的笔记抄上来:
NLP---当前分析热点;
传统架构以Hadoop为主,流式计算加速数据处理;
QueueWorker;
流式计算系统,拓扑S4、DAG;
多样索引
及时计算获得用户访问成倍增长。
整个工程引擎化----这部分需要重听
推荐系统的很多东西需要验证改进
百度的推荐引擎计算平台可能会公开服务
下面是豆瓣首席科学家王守崑的部分,他的主要是围绕算法本身的选择。
算法复杂度选择
增量更新
算法根据用户群、产品、计算框架改变
早期用户群和大众用户群有所区别
豆瓣的推荐存在一个item饱和期-----这个只是我现场想到的,非演讲内容。
缺失值数据也有其作用
矩阵分解和生成模型
文本分析:生成模型、隐马模型、高斯混合模型、贝叶斯模型那个、LDA、RBM。
条目增长趋于稳定
长期指标的改进靠人
从传统媒体信息经济走向现代App体验经济
信息逐渐私有和封闭,要么是平台,要么是平台的一部分。
- 三十三期百度技术沙龙笔记整理
- 第四十期百度技术沙龙笔记整理
- 第四十期百度技术沙龙笔记整理
- 百度技术沙龙-自然语言处理技术及应用笔记整理
- 整理_百度技术沙龙
- 百度技术沙龙&InfoQ笔记
- 【20110115 InfoQ 百度技术沙龙 2010 第 10 期】会议记录
- 百度技术沙龙
- 参加百度技术沙龙
- 滴滴第一期技术沙龙
- infoQ 百度技术沙龙第25期回顾:海量数据处理技术解析
- 百度搜索技术沙龙感悟
- 百度计算广告学沙龙笔记
- 广州技术沙龙第二期活动总结
- 有感于CSDN广州技术沙龙第四期
- 上海Java技术沙龙第6期
- 百度技术沙龙:app engine技术应用
- 【笔记】2016年01月16日百度技术沙龙车库咖啡笔记
- 天天记录 - Android invalidate流程分析-图文
- Java中“性能”问题
- 四个梦中的解决方案
- C#.net 动态生成的button按钮及回发处理的实现
- 《研磨struts2》第三章 Struts2的架构和运行流程 之 3.1 Struts2的系统架构
- 三十三期百度技术沙龙笔记整理
- 开始UltimateGrid 学习之旅
- js读取json数据
- Hibernate 一级缓存和二级缓存的注意事项
- 计算机视觉方向的一些顶级会议和期刊
- CSDN帐号被盗余波未平,我收到了数十条垃圾短信
- 《研磨struts2》第三章 Struts2的架构和运行流程 之 3.2 Struts2的运行流程
- 如何免费下载百度文库、豆丁网等网站的文档
- 整理的计算机视觉领域稍微容易中的期刊