Udacity机器学习(进阶)P3用到的函数笔记

来源:互联网 发布:国外聊天软件app 编辑:程序博客网 时间:2024/05/22 07:44

pandas.DataFrame.drop

DataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')

示例:

>>> df = pd.DataFrame(np.arange(12).reshape(3,4),                      columns=['A', 'B', 'C', 'D'])>>> df   A  B   C   D0  0  1   2   31  4  5   6   72  8  9  10  11

删除列:

>>> df.drop(['B', 'C'], axis=1)   A   D0  0   31  4   72  8  11>>> df.drop(columns=['B', 'C'])   A   D0  0   31  4   72  8  11

由索引号来删除行

>>> df.drop([0, 1])   A  B   C   D2  8  9  10  11

sklearn.tree.DecisionTreeRegressor

class sklearn.tree.DecisionTreeRegressor(criterion=’mse’, splitter=’best’, max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=None, random_state=None, max_leaf_nodes=None, min_impurity_decrease=0.0, min_impurity_split=None, presort=False)

示例:

>>> from sklearn.datasets import load_boston>>> from sklearn.model_selection import cross_val_score>>> from sklearn.tree import DecisionTreeRegressor>>> boston = load_boston()>>> regressor = DecisionTreeRegressor(random_state=0)>>> cross_val_score(regressor, boston.data, boston.target, cv=10)...                    ...array([ 0.61..., 0.57..., -0.34..., 0.41..., 0.75...,        0.07..., 0.29..., 0.33..., -1.42..., -1.77...])

对中值和平均值相差很大的歪斜函数做非线性缩放

  • 一种实现这个缩放的方法是使用Box-Cox 变换,这个方法能够计算出能够最佳减小数据倾斜的指数变换方法。

  • 一个比较简单的并且在大多数情况下都适用的方法是使用自然对数。
    numpy.log()

numpy.percentile

示例:

>>> a = np.array([[10, 7, 4], [3, 2, 1]])>>> aarray([[10,  7,  4],       [ 3,  2,  1]])>>> np.percentile(a, 50)3.5>>> np.percentile(a, 50, axis=0)array([[ 6.5,  4.5,  2.5]])>>> np.percentile(a, 50, axis=1)array([ 7.,  2.])>>> np.percentile(a, 50, axis=1, keepdims=True)array([[ 7.],       [ 2.]])
>>> m = np.percentile(a, 50, axis=0)>>> out = np.zeros_like(m)>>> np.percentile(a, 50, axis=0, out=out)array([[ 6.5,  4.5,  2.5]])>>> marray([[ 6.5,  4.5,  2.5]])
>>> b = a.copy()>>> np.percentile(b, 50, axis=1, overwrite_input=True)array([ 7.,  2.])>>> assert not np.all(a == b)

python list extend函数

  • 用法:extend() 函数用于在列表末尾一次性追加另一个序列中的多个值(用新列表扩展原来的列表)

  • 语法:

list.extend(seq)
  • 这里可以注意一下extend和append的区别

    extend是直接在list后面加
    append会变成[[1,2,3],[4,5,6]]

  • 示例:

#!/usr/bin/pythonaList = [123, 'xyz', 'zara', 'abc', 123];bList = [2009, 'manni'];aList.extend(bList)print "Extended List : ", aList ;
  • 输出:
Extended List :  [123, 'xyz', 'zara', 'abc', 123, 2009, 'manni']
阅读全文
2 0
原创粉丝点击