根据网站相关数据可以考虑做如下方面的研究

来源:互联网 发布:编程思想知乎 编辑:程序博客网 时间:2024/06/07 01:45

 目前,我们可以拿到如下的数据,web server logs 以及相关的业务数据,那么就可以考虑做如下的数据分析:
       1.用户分类:
    根据用户的行为,判断用户的类型:潜水型、发布信息型、渴望与人交往型、随便看看型等;其中发布信息能产生内容的用户对我们来说意义更大。
       2. 户访问路径分析:
   用户在web上的访问路径长度、频繁访问的路径/行为、访问路径的预测、用户异常访问和孤立点分析(判断出网站访问异常以及spammer用户的发现)。
3.用户流失预测分析:
   根据目前流失用户的信息,预测将会有那些用户流失,流失的原因是什么。
4.各产品之间的联系:
   那些产品是用户经常一起访问而在产品设计上两个产品之间联系不大。那些网页是用户经常一起访问,而产品设计上却不相邻等。
5. 预测网站的流量:
   分析和预测出未来一个星期的流量、一个月的流量等。
6. 建立OLAP:
   构建自己的OLAP,减轻日常繁琐的数据提取和简单的分析工作。
7.竞争对手分析:
   竞争对手最新策略动态信息的收集、竞争对手的流量和访问量的估算与分析(具体可以采用Alexa上的流量与本站流量信息进行估算)。主要应该采用情报学的相关理论进行分析。
8.用户群体分析:
   那些用户之间联系紧密,可以构成一个群体(好友圈),所有用户在整体上是否能满足6度理论,好友圈里面的核心人物是谁等。
9.明星用户特征分析:
   明星用户的年龄、职业、性别、地域、收入等信息,除了访问本站以外,还经常访问那些网站,来本站并留下来的原因是什么等。
10.数据中心展现界面的设计以及性能优化:
   常规报表的展现界面是否可以设计的更漂亮些、更灵活、更易用。报表的访问速度是否可以优化等等。
    要实现以上的分析,应该具备的基本知识:DM、DW、统计学、perl、php、DB、shell、C/C++、Excle、Web Usaging Mining、SPSS/SAS、R语言、JS、Apache日志等。


本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/emili/archive/2009/02/06/3865597.aspx

原创粉丝点击