数据挖掘前景及工作方向选择

来源:互联网 发布:mysql使用 编辑:程序博客网 时间:2024/05/15 08:31
寻找一些开源的数据挖掘软件研究分析
也可以参考如《数据挖掘:实用机器学习技术及Java实现》


推荐系统, 垃圾邮件过滤,文本挖掘,情感分析,广告点击率预测


A sponsored advertisement:
百度
淘宝
以及各家搜索公司
B behavior based advertisement:
腾讯
C 站内商品推荐:
淘宝
当当
C 兴趣推荐:
豆瓣
优酷
D 关系挖掘
人人
腾讯


商品推荐的话:亚马逊吧。你查查就知道它的系统有多牛了。引用浪潮之颠作者吴军的话:语音识别在过去的15年,错误率下降了一半,其中70%的功劳来自于数据量的增加,30%是方法的改进。 虽然不完全类似,但还是可以推出,去有数据的地方,才是研究数据挖掘的沃土。大型的互联网企业的相对线下的调查公司,数据采集的成本要低很多


用排除法
1、公司大环境不好的不去,面对一大堆数据和算法都够头痛了,没空搭理那些是非倾轧
2、首先数据量稀疏,用户量级小的项目不去,因为基础数据直接决定了CTR转化率
3、没将个性化推荐提至战略级别的公司不去,不受重视的项目永远都存在资源匮乏的问题,巧妇难为无米之炊
4、数据挖掘、推荐引擎优化无法直接带来商业收入或流量转化的不去,不然会导致你长期没有存在


机器学习和数据挖掘目前在国内应用程度都比较浅,先行者也没有走远。如果自己定位于修炼者,应该选择一个好的环境,首先是公司的认识到位,然后是团队能够开放,这方面阿里系做得不错。如果自己定位在成名立腕,需要考虑平台能够支撑用数据进行产品创新,这方面百度和腾讯更有机会。其他公司的数据非海量,而且发展前景有限。

0 0
原创粉丝点击