数据分析的一些思考

来源:互联网 发布:mac app atore验证 编辑:程序博客网 时间:2024/05/01 00:05

是否可以从个体的金钱流动中发现社会运行机制,这是我感兴趣的地方,此idea由集智百科的社区划分算法所引发。

最近在试图花大量时间读懂AP算法论文,大概半月到一月左右,之后看能否应用于二部图聚类,避免聚类数目指定的问题。计划先实现单机测试版,可行的话再分布式测试实际数据。

金钱、物质等都可归于信息流动范畴。

人理解事物是非线性的,但是大脑是由一个个神经细胞连接起来的,是否可以通过理解电流在这个神经网络的流动来考察其输入-流动-输出。不必具备生物学知识,可以抽象为一个立体网络范畴;同样,考察社会机制也是不必分析社会机制,仅需把人当神经细胞,把社会当成一个大脑。可以先按照理想交换模型:每人想完成年度10%的利润,分析其输入输出(输入是每年发行量、输出是总量),可先简化为每年一次流通、起初分配分别设为(均匀、随机、正态);随后稍微复杂一点,考虑共生关系、意外衰落因素、交易欺骗(是10%数倍)。

之前看过有文章提到美国根据养鸡场的数据+simrank解决蛋生鸡还是鸡生蛋的问题。说说自己的见解,这类何为因问题其实就像现有大狗还是先有小狗的问题一样,必须考察进化历史——狗是由谁进化的、谁又是由谁进化的.....

假如剥去了时间维度,就把非线性的关系变为线性的黑盒子来简化了,显然这是不正确的。

这个认知对于数据分析至关重要,不要盲目认为算法能搞定一切。

0 0
原创粉丝点击