数据新闻网站的规划

来源:互联网 发布:中科院空间中心 知乎 编辑:程序博客网 时间:2024/06/15 00:14

      随着技术的发展,媒体行业对于计算机的依赖日益增加,传统纸媒受到冲击,而新媒体行业则蒸蒸日上。我们的系统正是基于媒体业与计算机交叉的方向而进行的一个构思,旨在实现一个全面,创新的新闻分析,文本处理工具。

      我们的系统共分为数据新闻,文本分析工具,HistoryMap功能,数据新闻模板,四个大部分,接下来我将对它们进行逐一的介绍。

       数据新闻模块是我们所完成的一些数据新闻报道。数据新闻是一种近几年才真正兴起的新闻报道模式,通过挖掘数据来讲述故事,透过数据来分析其背后的现象。这个模块需要新闻学院共同参与创作,他们负责提供报道的思路和文字,而我们则负责数据处理和前端实现。

       文本分析工具是我们这次项目完成的主要目标。这个工具主要由两大模块组成,第一个模块是新闻分析工具。用户可以上传固定格式的大量新闻文本,由我们的系统进行分析。我们能够批量生成这些新闻文本的情绪值(从积极的到消极的对应了数字1到 -1),这些文本的关键词以及摘要。我们将根据得到的一系列数值进行可视化展示,同时也提供用户通过关键词搜索文章的功能。第二个模块叫做结构化摘要工具,这个功能是我们系统中一个很大的创新点。在第一个模块中,我们使用的是现成的算法,二在这个模块中,我们则是对已有的算法进行优化,让它更符合我们的需求。在这个模块中,我们实现了比传统的textrank效果更好的文本摘要结构,同时这个模块里也提供了搜索引擎,让用户可以通过搜索关键词查找想要的文章。

      HistoryMap功能是基于之前已经完成的一个系统进行优化的,这个系统用时间轴的形式展示了世界各地的历史事件,通过这个功能,几乎能找到有历史记录以来任何时期任何地点发生的大事件,我们主要对它进行BUG的修复以及数据库的优化。

     数据新闻模板是一个实现数据新闻报道的快速生成的功能,这个功能主要是面向对编码不熟悉的新闻工作者,通过这个模板,新闻工作者可以直接将自己想要的新闻图片,视频,声音,文字放入网页当中,能够快速地生成一篇具有融媒体特性的现代化新闻报道。

     以上就是我们的网站系统目前包含的功能,如果以后有新的需求,还可在此基础上进行扩展。