学习笔记-10.13

来源:互联网 发布:sql开发工程师招聘 编辑:程序博客网 时间:2024/06/05 20:46

Python学习


初识Python

Python是著名的“龟叔”Guido van Rossum在1989年圣诞节期间,为了打发无聊的圣诞节而编写的一个编程语言(大佬果然任性)。

  • 主要优点:简便,通俗易懂(看了一些代码感觉就像Chinglish),跨平台,有丰富的库
  • 主要缺点:运行速度较慢(但多数情况无影响)

Python语法

基本数据类型

整数,浮点数,字符串,和布尔值与以前接触过的语言没有多少区别。

  • 或与非:Python使用“or”、“and”、“not”来表示“||”、“&&”、“!”。
  • 空值:空值是Python里一个特殊的值,用None表示。None不能理解为0,因为0是有意义的,而None是一个特殊的空值。

容器Containers

  • 列表Lists
    类似于C语言中的数组但比它强大,例如如果要取最后一个元素,除了计算索引位置外,还可以用-1做索引,直接获取最后一个元素:
>>> classmates = ['Michael', 'Bob', 'Tracy']>>> classmates['Michael', 'Bob', 'Tracy']>>> classmates[-1]'Tracy'

以此类推,可以获取倒数第2个、倒数第3个:

>>> classmates[-2]'Bob'>>> classmates[-3]'Michael'

而且还有一些函数(append, insert, pop等)来对list进行操作。list里面的元素的数据类型也可以不同并且list元素也可以是另一个list。

  • 元组Tuples:
    tuple和list非常类似,但是tuple一旦初始化就不能修改。因为tuple不可变,所以代码更安全。如果可能,能用tuple代替list就尽量用tuple。当你定义一个tuple时,在定义的时候,tuple的元素就必须被确定下来,比如:
>>> t = (1, 2)>>> t(1, 2)

如果要定义一个空的tuple,可以写成():

>>> t = ()>>> t()

Python规定,定义一个只有1个元素的tuple必须加一个逗号,,来消除歧义:

>>> t = (1,)>>> t(1,)

Python在显示只有1个元素的tuple时,也会加一个逗号,,以免你误解成数学计算意义上的括号。

  • 字典Dictionaries
    字典用来储存(键, 值)对,与Java中的Map差不多。字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中 ,格式如下所示:
d = {key1 : value1, key2 : value2 }

键必须是唯一的,但值则不必。值可以取任何数据类型,但键必须是不可变的,如字符串,数字或元组。

  • 集合Sets:
    集合是一个无序不重复元素的集。基本功能包括关系测试和消除重复元素。创建集合:大括号或 set() 函数可以用来创建集合。大括号不可以创建元素含有字典与列表的集合。

函数

在Python中,定义一个函数要使用def语句,依次写出函数名、括号、括号中的参数和冒号:,然后,在缩进块中编写函数体,函数的返回值用return语句返回。

def my_abs(x):    if x >= 0:        return x    else:        return -x

如果没有return语句,函数执行完毕后也会返回结果,只是结果为None。return None可以简写为return。

面向对象最重要的概念就是类(Class)和实例(Instance),必须牢记类是抽象的模板,比如Student类,而实例是根据类创建出来的一个个具体的“对象”,每个对象都拥有相同的方法,但各自的数据可能不同。
在Python中,定义类是通过class关键字:

class Student(object):    pass

class后面紧接着是类名,即Student,类名通常是大写开头的单词,紧接着是(object),表示该类是从哪个类继承下来的,继承的概念我们后面再讲,通常,如果没有合适的继承类,就使用object类,这是所有类最终都会继承的类。
定义好了Student类,就可以根据Student类创建出Student的实例,创建实例是通过类名+()实现的:

>>> bart = Student()>>> bart<__main__.Student object at 0x10a67a590>>>> Student<class '__main__.Student'>

可以自由地给一个实例变量绑定属性,比如,给实例bart绑定一个name属性:

>>> bart.name = 'Bart Simpson'>>> bart.name'Bart Simpson'

由于类可以起到模板的作用,因此,可以在创建实例的时候,把一些我们认为必须绑定的属性强制填写进去。通过定义一个特殊的init方法,在创建实例的时候,就把name,score等属性绑上去:

class Student(object):    def __init__(self, name, score):        self.name = name        self.score = score

注意:特殊方法“init”前后有两个下划线!!!
注意到init方法的第一个参数永远是self,表示创建的实例本身,因此,在init方法内部,就可以把各种属性绑定到self,因为self就指向创建的实例本身。
有了init方法,在创建实例的时候,就不能传入空的参数了,必须传入与init方法匹配的参数,但self不需要传,Python解释器自己会把实例变量传进去:

>>> bart = Student('Bart Simpson', 59)>>> bart.name'Bart Simpson'>>> bart.score59

和普通的函数相比,在类中定义的函数只有一点不同,就是第一个参数永远是实例变量self,并且,调用时,不用传递该参数。除此之外,类的方法和普通函数没有什么区别,所以,你仍然可以用默认参数、可变参数、关键字参数和命名关键字参数。
数据封装:
面向对象编程的一个重要特点就是数据封装。在上面的Student类中,每个实例就拥有各自的name和score这些数据。我们可以通过函数来访问这些数据,比如打印一个学生的成绩:

>>> def print_score(std):...     print('%s: %s' % (std.name, std.score))...>>> print_score(bart)Bart Simpson: 59

但是,既然Student实例本身就拥有这些数据,要访问这些数据,就没有必要从外面的函数去访问,可以直接在Student类的内部定义访问数据的函数,这样,就把“数据”给封装起来了。这些封装数据的函数是和Student类本身是关联起来的,我们称之为类的方法:

class Student(object):    def __init__(self, name, score):        self.name = name        self.score = score    def print_score(self):        print('%s: %s' % (self.name, self.score))

要定义一个方法,除了第一个参数是self外,其他和普通函数一样。要调用一个方法,只需要在实例变量上直接调用,除了self不用传递,其他参数正常传入:

>>> bart.print_score()Bart Simpson: 59

这样一来,我们从外部看Student类,就只需要知道,创建实例需要给出name和score,而如何打印,都是在Student类的内部定义的,这些数据和逻辑被“封装”起来了,调用很容易,但却不用知道内部实现的细节。
封装的另一个好处是可以给Student类增加新的方法,比如get_grade:

class Student(object):    ...    def get_grade(self):        if self.score >= 90:            return 'A'        elif self.score >= 60:            return 'B'        else:            return 'C

同样的,get_grade方法可以直接在实例变量上调用,不需要知道内部实现细节:

>>> bart.get_grade()'C'

KNN算法实现(Python)

#-*- coding: utf-8 -*-from numpy import *import operatordef classify(inputPoint,dataSet,labels,k):    dataSetSize = dataSet.shape[0]     #已知分类的数据集(训练集)的行数    #先tile函数将输入点拓展成与训练集相同维数的矩阵,再计算欧氏距离    diffMat = tile(inputPoint,(dataSetSize,1))-dataSet  #样本与训练集的差值矩阵    sqDiffMat = diffMat ** 2                    #差值矩阵平方    sqDistances = sqDiffMat.sum(axis=1)         #计算每一行上元素的和    distances = sqDistances ** 0.5              #开方得到欧拉距离矩阵    sortedDistIndicies = distances.argsort()    #按distances中元素进行升序排序后得到的对应下标的列表    #选择距离最小的k个点    classCount = {}    for i in range(k):        voteIlabel = labels[ sortedDistIndicies[i] ]        classCount[voteIlabel] = classCount.get(voteIlabel,0)+1    #按classCount字典的第2个元素(即类别出现的次数)从大到小排序    sortedClassCount = sorted(classCount.items(), key = operator.itemgetter(1), reverse = True)    return sortedClassCount[0][0]if __name__ == "__main__" :    dataset = array([[1, 2, 3, 4, 5], [5, 4, 3, 2, 1], [3, 3, 3, 3, 3], [-3, -3, -3, -3, -3], [1, 2, 3, 4, 4], [4, 4, 3, 2, 1], [3, 3, 3, 2, 4], [0, 0, 1, 1, -2]])    labels = ['A', 'B', 'C', 'D', 'A', 'B', 'C', 'D']     X = array([1, 2, 3, 2, 4])      Y = array([8, 7, 2, 3, 5])    Z = array([-4, -4, -4, -4, -4])    k = 3    labelX =  classify(X,dataset,labels,k)    labelY =  classify(Y,dataset,labels,k)    labelZ =  classify(Z,dataset,labels,k)    print ("Your input is:", X, "and classified to class: ", labelX)    print ("Your input is:", Y, "and classified to class: ", labelY)    print ("Your input is:", Z, "and classified to class: ", labelZ)

运行结果:
这里写图片描述

原创粉丝点击