字典的基础及字典的使用实例

来源:互联网 发布:蓝牙串口软件ymodem 编辑:程序博客网 时间:2024/06/05 16:41


1.字典:针对非序列集合而提供的一种数据类型

  通过任意键值查找集合中值信息的过程叫做映射。

  python中通过字典实现映射。

  字典是一个键值对的集合。该集合以键为索引,同一个键信息对应一个值。

2.字典的操作

  1)为字典增加一项dictionaryName[key]=value

  举例:

 

2)字典的遍历

for key in dictionaryName:

      print(key+”:”+str(dictiionaryName[key]))

   

遍历字典的键key

  for key in dictionaryName.keys():

print(key)

遍历字典的值value

  for value in dictionaryName.values():

print(value)

遍历字典的项

  for item in dictionaryName.items():

print(item)

遍历字典的key-value

  for item,value in adict.items():

print(item,value)

3)是否一个键在字典中

  in 或者 not in

4)字典的标准操作符

  -,<,>,<=,>=,==,!=,and,or,not

5)字典方法

keys():tuple 返回一个包含字典所有key的列表

values():tuple 返回一个包含所有value的列表

items():tuple  返回一个包含所有键值的列表

clear():None 删除字典中的所有项目

get(key):value 返回字典中key对应的值

pop(key):val 删除并返回字典中key对应的值

update(字典) 将字典中的键值添加到字典中

6)字典的实例一:统计词频的问题

IPO模式

输出:从文件中读取一篇英文文章

处理:统计文件中每个单词的出现频率

输出:将最常出现的10个单词及出现次数,以图表形式输出

 

统计词频

第一步:输入英文文章

第二步:建立用于词频计算的空字典

第三步:对文本的每一行计算词频

第四步:从字典中获取数据对到列表中

第五步:对列表中的数据对交换位置,并从大到小进行排序

第六步:输出结果

第七步:用Turtle库绘制统计词频结果的图标

 

#统计一行词频processLine()

def processLine(line,wordCounts):

    #用空格替换标点符号

    line=replacePunctuations(line)

    #从每一行获取每个词

    words=line.split()

    for word in words:

        if word in wordCounts:

            wordCounts[word] += 1

        else:

            wordCounts[word] = 1

 

#符号替换relpeacePunctuation

def relpacePunctuations(line):

    for ch in line:

        if ch in "~@#$%^&*()_-+=<>?/,.:;{}[]|\'""":

            line = line.replace(ch, " ")

    return line

 

#输入英文文本名称

filename=input("enter a filename:".strip())

infile=open(filename,"r")

 

 

import turtle ##全局变量###词频排列显示个数count = 10#单词频率数组-作为y轴数据data = []#单词数组-作为x轴数据words = []#y轴显示放大倍数-可以根据词频数量进行调节yScale = 6#x轴显示放大倍数-可以根据count数量进行调节xScale = 30 ################# Turtle Start  ####################  #从点(x1,y1)到(x2,y2)绘制线段def drawLine(t, x1, y1, x2, y2):    t.penup()    t.goto (x1, y1)    t.pendown()    t.goto (x2, y2) # 在坐标(x,y)处写文字def drawText(t, x, y, text):    t.penup()    t.goto (x, y)    t.pendown()    t.write(text) def drawGraph(t):    #绘制x/y轴线    drawLine (t, 0, 0, 360, 0)    drawLine (t, 0, 300, 0, 0)     #x轴: 坐标及描述    for x in range(count):        x=x+1 #向右移一位,为了不画在原点上        drawText(t, x*xScale-4, -20, (words[x-1]))        drawText(t, x*xScale-4, data[x-1]*yScale+10, data[x-1])    drawBar(t) #绘制一个柱体def drawRectangle(t, x, y):    x = x*xScale    y = y*yScale#放大倍数显示    drawLine(t, x-5, 0, x-5, y)    drawLine(t, x-5, y, x+5, y)    drawLine(t, x+5, y, x+5, 0)    drawLine(t, x+5, 0, x-5, 0)     #绘制多个柱体def drawBar(t):    for i in range(count):        drawRectangle(t, i+1, data[i])    ################# Turtle End  ####################          #对文本的每一行计算词频的函数def processLine(line, wordCounts):    #用空格替换标点符号    line = replacePunctuations(line)    #从每一行获取每个词    words = line.split()     for word in words:        if word in wordCounts:            wordCounts[word] += 1        else:            wordCounts[word] = 1 #空格替换标点的函数def replacePunctuations(line):    for ch in line:        if ch in "~@#$%^&*()_-+=<>?/,.:;{}[]|\'""":            line = line.replace(ch, " ")    return line def main():    #用户输入一个文件名    filename = input("enter a filename:").strip()    infile = open(filename, "r")         #建立用于计算词频的空字典    wordCounts = {}    for line in infile:        processLine(line.lower(), wordCounts)             #从字典中获取数据对    pairs = list(wordCounts.items())     #列表中的数据对交换位置,数据对排序    items = [[x,y]for (y,x)in pairs]     items.sort()      #输出count个数词频结果    for i in range(len(items)-1, len(items)-count-1, -1):        print(items[i][1]+"\t"+str(items[i][0]))        data.append(items[i][0])        words.append(items[i][1])             infile.close()         #根据词频结果绘制柱状图    turtle.title('词频结果柱状图')    turtle.setup(900, 750, 0, 0)    t = turtle.Turtle()    t.hideturtle()    t.width(3)    drawGraph(t)#调用main()函数if __name__ == '__main__':    main()

7)字典的实例二:使用字典结构合并新地址簿的问题

 

#利用字典将两个通讯录文本合并为一个文本def main():        ftele2=open('TeleAddressBook.txt','rb')        ftele1=open('EmailAddressBook.txt','rb')         ftele1.readline()#跳过第一行        ftele2.readline()        lines1 = ftele1.readlines()        lines2 = ftele2.readlines()         dic1 = {}   #字典方式保存        dic2 = {}          for line in lines1:#获取第一个本文中的姓名和电话信息                elements = line.split()                #将文本读出来的bytes转换为str类型                dic1[elements[0]] = str(elements[1].decode('gbk'))                         for line in lines2:#获取第二个本文中的姓名和电话信息                elements = line.split()                dic2[elements[0]] = str(elements[1].decode('gbk'))         ###开始处理###        lines = []        lines.append('姓名\t    电话   \t  邮箱\n')         for key in dic1:            s= ''            if key in dic2.keys():                    s = '\t'.join([str(key.decode('gbk')), dic1[key], dic2[key]])                    s += '\n'            else:                    s = '\t'.join([str(key.decode('gbk')), dic1[key], str('   -----   ')])                    s += '\n'            lines.append(s)                     for key in dic2:            s= ''            if key not in dic1.keys():                    s = '\t'.join([str(key.decode('gbk')), str('   -----   '), dic2[key]])                    s += '\n'                   lines.append(s)         ftele3 = open('AddressBook.txt', 'w')        ftele3.writelines(lines)         ftele3.close()        ftele1.close()        ftele2.close()        print("The addressBooks are merged!")if __name__ == "__main__":            main()