Mathematica数据处理(3)

来源:互联网 发布:软件测试基本知识 编辑:程序博客网 时间:2024/05/17 09:23

今天,我们来讲一下在数据处理中,比较常用的两个函数,还有一个功能很强大的函数


Rescale

好了,第一个函数是Rescale,他可以使数据归一化

工作原理: x - min/max - min

简单一点说就是可以把数字变到0--1之间

我们来看一个例子:

Rescale[{1, 2, 3, 4}, {0, 10}]

得到
{1/10, 1/5, 3/10, 2/5}



Tally
第二个函数是来统计一个数字的重复次数的
例如
Tally[{1, 1, 2, 2, 3, 3, 3, 4, 5, 5, 5}]
返回
{{1, 2}, {2, 2}, {3, 3}, {4, 1}, {5, 3}}

这是一个非常有用的函数

我们再来看一个例子
x = NormalDistribution[1, 4];data = Table[IntegerPart[Random[x]], 1000];datause = Sort@Tally[data]BarChart[Labeled[#2, #1, Above] & @@@ datause, BarSpacing -> None]
第一句话是 产生一个服从正态分布的数
第二句话是 产生1000个随机数,服从上述正态分布
第三句话是 统计出现的频数并排序
第四句话是 将得到的数据画成条形图

得到如下的图




下面就来看一下我觉得非常强大的函数 Import
相信大家都已经用过了,这个函数不仅可以导入文件,也是可以解析网页的


Import["http://blog.csdn.net/WMN7Q/article/category/6357421","Elements"]
这句话可以返回网页中有的元素
<span style="font-size:18px;">{"Data", "FullData", "Hyperlinks", "ImageLinks", "Images","Plaintext", "Source", "Title", "XMLObject"}
这是返回的值

那我们来看一下这个网页中的图片有哪些呢

Import["http://blog.csdn.net/WMN7Q/article/category/6357421","Images"]

于是得到返回值


要是用这个写爬虫,会不会方便很多呢


今天就讲这三个函数。

这篇文徵本来是昨天写的,昨天在做了些其他的,就今天补上,应该一会还会再发一篇的。


2016/8/10

以上,所有。














1 0
原创粉丝点击