第四届中文网志年会参会感想

来源:互联网 发布:淘宝知己知彼多少钱 编辑:程序博客网 时间:2024/05/16 10:12
    非常高兴能够代表CIC公司参加了在广州举办的第四届中文网志年会,并通过题为《博客内容挖掘与分析》的演讲和与会者分享了CIC在博客分析方面的心得。CIC在近几年的网络口碑研究和咨询时间中总结出一些关于博客内容挖掘和分析技术上的挑战和解决方案,正如演讲中所提到的,博客内容的分析牵涉到一系列的技术问题,其中包含数据采集,自然语言分析,数据汇总统计,数据展现等。其中某些技术已经比较成熟(例如数据采集,数据汇总等),有些技术还不是很完善,针对中文网络语言还有很多完善和优化的空间(例如自然语言分析等)。我们的技术部门也在对这些技术进行不断的研究和发展,希望能够发挥计算机技术在处理海量数据上的速度优势,来为博客内容的价值挖掘做贡献。
    虽然中文网志年会不是一次技术性的会议,但是感觉大家对本次演讲的技术主题还是比较感兴趣的,演讲完也有几位朋友提出了非常好的问题,例如如果通过技术手段甄别博客上出现的带有商业性质的内容,虚假内容;我们所研究的博客内容挖掘技术与google / baidu等基于页面分析的技术的区别;以及我们是否为博客提供服务等等。我也一一做了解答,其实有些问题如同博客分析的技术解决方案一样很难有最完美的答案(例如第一个问题:如果通过技术手段甄别博客上出现的带有商业性质的内容,虚假内容),很多公司和个人都在对此做相应的技术研究,只有更好的方法,但没有最好的方法。另外,除了技术方面的提问,通过大家的提问, 我们也看到了广大博客对于保持博客内容的真实性,原创性的愿景,并且期望在此基础上来更好的发挥博客的商业价,这也为博客分析产品开发的原则和必要性提供了借鉴。
由于这次演讲时间有限,只能简单列举了一些博客内容挖掘和分析的技术问题和大家一起分享, 希望以后有更多的机会可以进一步和广大的博客们探讨和交流。另外, 我们也会在我们的技术博客中持续的分享我们的一些技术经验, 欢迎有兴趣的朋友一起参阅。
    这次演讲的内容可以通过slideshare直接浏览。如果有感兴趣的朋友错过了这次中文网志年会,也可以参阅中文网志年会官方博客,新浪上中文网志年会的主题报道,网易的主题报道以及网志年会视频录像.
    欢迎大家通过我们的技术博客和我们继续交流!