readDataToDic.py文件升级改版(附加各个属性的list、dic方法)
来源:互联网 发布:伤感网络歌曲下载 编辑:程序博客网 时间:2024/05/24 06:59
#coding=utf8import csv import loggingimport os'''Author:ewangData:2017/07/12该模块的主要功能函数:readDataToList():把csv中的数据,数据项以字典类型存储在列表中。getAllServiceId():获取所有的serviceId列表printListData():输出数据list中的每项数据createDataDic():创建一个数据字典表,以serviceId为key,相同的数据项列表为valueprintDicData():输出数据字典中的每项数据'''PATH=lambda p:os.path.abspath(os.path.join( os.path.dirname(__file__), p))logging.basicConfig(level=logging.DEBUG, format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s', datefmt='%a, %d %b %Y %H:%M:%S', filename=PATH('../Log/readDate.log'), filemode='w')class GenExceptData(object): def __init__(self,filePah=PATH("../LastCSV/20170510174450.csv")): try: #存放csv中读取的数据 self.mdbuffer=[] #打开csv文件,设置读的权限 csvHand=open(filePah,"r") #创建读取csv文件句柄 readcsv=csv.reader(csvHand) #把csv的数据读取到mdbuffer中 for row in readcsv: self.mdbuffer.append(row) #把数据穿件为为字典类型的 except Exception,e: logging.error("Read Excel error:"+e) finally: #关闭csv文件 csvHand.close() def readDataToList(self): try: #在数组最后添加一个空白行 #该行的作用是为了成功获取最后一条json数据 #在数组endLine添加空白字符 endLine=[" " for num in range(len(self.mdbuffer[1])) if num>=0] #把以空字符的endLine添加到末尾 self.mdbuffer.append(endLine) #获取mdbuffer中的元素个数 rowNumber=len(self.mdbuffer) #设置当前行号 currentrow=1 #设置json数据的属性值 propertyJson={} #读取列表中的元素 dataList=[] try: for row in range(1,rowNumber): #创建一个临时变量用来存取一次循环的属性键值 temp={} #获取列表中一个元素 item=self.mdbuffer[row] #获取当前元素,当前元素代表的是每个 #事件起始的位置 currentItem=self.mdbuffer[currentrow] #获取serviceId并进行解码 mdEvent=currentItem[0].decode("gbk") serviceId= currentItem[2].decode("gbk") #获取属性并进行解码,把解码的值存入propertyName propertyName=item[3].decode("gbk") #获取属性值并进行解码,把解码的值存入propertyValue propertyValue=item[4].decode("gbk") try: #判断埋点事件与serviceId是否相等 if item[0]==currentItem[0] and item[2]==currentItem[2]: #用来保存埋点事件 propertyJson["mdEvent"]=mdEvent #把serviceId方式字典propertyJson中 propertyJson["serviceId"]=serviceId #把属性/值对放入temp字典中 temp[propertyName]=propertyValue #调用字典的update函数,把temp中的键值对 #添加到 propertyJson字典中 propertyJson.update(temp) #使用continue,如果为if条件为true则循环执行if语句模块 continue else: #把行号设置为当前行 currentrow=row #把当前的属性解码放入propertyName propertyName=currentItem[3].decode("gbk") #把当前的属性值解码放入propertyName propertyValue=currentItem[4].decode("gbk") #用来保存埋点事件 mdEvent=currentItem[0].decode("gbk") #把serviceId方式字典propertyJson中 propertyJson["serviceId"]=serviceId #把属性/值对放入propertyJson字典中 propertyJson[propertyName]=propertyValue #propertyJsonList.append(propertyJson) dataList.append(propertyJson) ''' 在这说下: propertyJson.clear()与propertyJson={}的区别: propertyJson.clear()是删除字典的值,不创建引用,会改变字典本身的值; propertyJson={}是创建新的引用,字典的中的值不发现变化; 如果想让 self.dataDic.append(propertyJson)该语句执行成功,而且添加每次循环的值, 需要使用propertyJson={}方法; 如果使用propertyJson.clear(),只会把最后一次propertyJson存储的值,添加到self.dataDic中 ''' propertyJson={} except Exception,e: logging.error("Get Property Json Error:" +e) #print "Get Property Json Error:",e except Exception,e: logging.error("Get Date Error:"+e) #print "Get Date Error:",e #返回dataList return dataList except Exception,e: #把信息写入日志中 logging.error("Reading Data TO Dic Error:"+e) #print "Reading Data TO Dic Error:",e def __propertyValueList(self,propertyName): try: #调用readDataToList函数创建一个数据list dataList=self.readDataToList() #把数据list中的所有propertyName放入表propertyValueList中 propertyValueList=[item[propertyName] for item in dataList if item[propertyName] ] #对propertyValueList中的数据去重,分为两步: #第一步把列表转换成集合:set(propertyValueList) #第二步:把集合转换为list:list(set(propertyValueList)) #集合和list的区别:集合中的数据是唯一性,不存在相同部分 propertyValueList=list(set(propertyValueList)) #返回serList return propertyValueList except Exception,e: print "Create Property Value List Error:",e #获取所有serviceId列表 def getAllServiceId(self,): return self.__propertyValueList("serviceId") #获取所有srcPage列表 def getAllsrcPage(self): return self.__propertyValueList("srcPage") #获取所有srcPageId列表 def getAllsrcPageId(self): return self.__propertyValueList("srcPageId") #获取所有srcModule列表 def getAllsrcModule(self): return self.__propertyValueList("srcModule") #获取所有itemId列表 def getAllitem(self): return self.__propertyValueList("item") #获取所有itemId列表 def getAllitemId(self): return self.__propertyValueList("itemId") #获取所有srcPosition列表 def getAllsrcPosition(self): return self.__propertyValueList("srcPosition") #获取所有memberType列表 def getAllmemberType(self): return self.__propertyValueList("memberType") #获取所有eventGroup列表 def getAlleventGroup(self): return self.__propertyValueList("eventGroup") #获取所有albumType列表 def getAllalbumType(self): return self.__propertyValueList("albumType") #获取所有srcSubModule列表 def getAllsrcSubModule(self): return self.__propertyValueList("srcSubModule") #获取所有type列表 def getAlltype(self): return self.__propertyValueList("type") #获取所有function列表 def getAllfunction(self): return self.__propertyValueList("function") #获取所有shareType列表 def getAllshareType(self): return self.__propertyValueList("shareType") #输出list中的数据信息 def printListData(self): try: #调用readDataToList方法获取dataList列表 dataList=self.readDataToList() #对列表中的数据执行for循环 #并输出类似与json样式的数据 for item in dataList: print "{" #输出键值对 for key,val in item.items(): print "\t",key,":",val,"," print "}" #设置以#格式的分隔符 print "#"*50 except Exception,e: logging.error("OutPut List Data Error:"+e) #print "OutPut List Data Error:"+e #创建数据字典 def __createDataDic(self,properyName,propetyList): try: #定义个数据字典变量 dataDic={} #调用函数readDataToList创建一个dataList表 dataList=self.readDataToList() #判断列表中是否有元素,如果有执行if语句 if len(propetyList)>0 and len(dataList)>0: #对propetyList进行循环,以property作为key for Property in propetyList: #创建一个list用来存放Property相同的数据项 samePropertyJosnList=[] #对数据列表执行循环 for item in dataList: #获取字典中键为Property值,放入变量中 itemProperyName=item[properyName] #如果值不为空,执行if语句 if itemProperyName: #判断Property与数据项中itemProperyName的值是否相等 #如果相等执行if语句块 if Property==itemProperyName: #把数据项加入samePropertyJosnList列表中 samePropertyJosnList.append(item) else: logging.debug("Property is null") #给字典赋值,以Property作为key, #Property相同的数据项列表作为值 dataDic[Property]=samePropertyJosnList else: logging.debug("Property List or dataList is null") #返回字典类型的数据 return dataDic except Exception,e: logging.error("Create Data Dictionary Error:"+e) def get_ServiceId_DataDic(self): try: servicIdList=self.getAllServiceId() return self.__createDataDic("serviceId", servicIdList) except Exception,e: logging.debug("create serviceId data dictionary:"+e) def get_srcPage_DataDic(self): try: srcPageList=self.getAllsrcPage() return self.__createDataDic("srcPage", srcPageList) except Exception,e: print "create srcPage data dictionary:",e def get_srcPageId_DataDic(self): try: srcPageIdList=self.getAllsrcPageId() return self.__createDataDic("srcPageId", srcPageIdList) except Exception,e: logging.debug("create srcPageId data dictionary:"+e) def get_srcModule_DataDic(self): try: srcModuleList=self.getAllsrcModule() return self.__createDataDic("srcModule", srcModuleList) except Exception,e: logging.debug("create srcModule data dictionary:"+e) def get_item_DataDic(self): try: itemList=self.getAllitem() return self.__createDataDic("item", itemList) except Exception,e: logging.debug("create item data dictionary:"+e) def get_itemId_DataDic(self): try: itemIdList=self.getAllitemId() return self.__createDataDic("itemId", itemIdList) except Exception,e: logging.debug("create itemId data dictionary:"+e) def get_srcPosition_DataDic(self): try: srcPositionList=self.getAllsrcPosition() return self.__createDataDic("srcPosition", srcPositionList) except Exception,e: logging.debug("create srcPosition data dictionary:"+e) def get_memberType_DataDic(self): try: memberTypeList=self.getAllmemberType() return self.__createDataDic("memberType", memberTypeList) except Exception,e: logging.debug("create memberType data dictionary:"+e) def get_eventGroup_DataDic(self): try: eventGroupList=self.getAlleventGroup() return self.__createDataDic("eventGroup", eventGroupList) except Exception,e: logging.debug("create eventGroup data dictionary:"+e) def get_albumType_DataDic(self): try: albumTypeList=self.getAllalbumType() return self.__createDataDic("albumType", albumTypeList) except Exception,e: logging.debug("create albumType data dictionary:"+e) def get_srcSubModule_DataDic(self): try: srcSubModuleList=self.getAllsrcSubModule() return self.__createDataDic("srcSubModule", srcSubModuleList) except Exception,e: logging.debug("create srcSubModule data dictionary:"+e) def get_type_DataDic(self): try: typeList=self.getAlltype() return self.__createDataDic("type", typeList) except Exception,e: logging.debug("create type data dictionary:"+e) def get_function_DataDic(self): try: functionList=self.getAllfunction() return self.__createDataDic("function", functionList) except Exception,e: logging.debug("create function data dictionary:"+e) def get_shareType_DataDic(self): try: shareTypeList=self.getAllshareType() return self.__createDataDic("shareType", shareTypeList) except Exception,e: logging.debug("create shareType data dictionary:"+e) #打印字典信息 def printDicData(self,propertydic): try: #对字典中的数据进行循环,获取键值对 for Property,dataitem in propertydic.items(): print "{" print "\t",Property,":","[" #由于值是列表,列表中的数据项类型是字典类型 #每一数据项是哈希表 for item in dataitem: print "\t\t{" #输出哈希表中的数据 for key,val in item.items(): print "\t\t\t",key,":",val,"," print "\t\t}," print"\t]" print "}\n" print "#"*50 except Exception,e: print "print data error:",e def getDicDataValue(self,serviceId="pageview"): try: dataDic=self.createDataDic() if serviceId: return dataDic[serviceId] except Exception,e: logging.error("Get Dic Data Error:"+e) #print "Get Dic Data Error:",edef test(): filepath="../LastCSV/20170510174450.csv" gen =GenExceptData(filepath) print gen.getAllsrcPage() srcpatdic=gen.get_ServiceId_DataDic() gen.printDicData(srcpatdic) #print gen.getDicDataValue() if __name__=="__main__": test()该脚本在之前的基础上进行优化,通过对各个属性值分类,写入相应的list,根据相应的list,构造相关的dict,用于后期json数据的比对,改代码在调试阶段,只供参考!
阅读全文
0 0
- readDataToDic.py文件升级改版(附加各个属性的list、dic方法)
- dic 的遍历方法
- py处理list的方法
- dic文件
- 上传时,各个文件的属性
- python 当list,dic作为默认参数的正确写法
- python 按照list中的dic的某key排序
- Python中list、tupe、dic、set的使用小记
- py文件编译为exe的方法
- Python dic 方法汇总
- List的方法和属性
- 2、文件的各个属性 3、目录文件的操作
- Python list dic tuple string
- eclipse新建.dic文件注意——由使用IKAnalyzer分词器新建ext.dic文件引发的思考
- Day26、文件操作(write)、文件的附加属性、文件重定向、mmap映射文件
- python下将py文件转成pyc文件的方法
- UIImageVIew的各个属性
- RelativeLayout的各个属性
- JavaWeb程序运行缓慢原因分析之一
- java中的sleep()和wait()的区别
- 三天入门Python---文件操作(第三天)
- 使用build.grade文件配置相关参数与多渠道打包
- es6学习笔记1
- readDataToDic.py文件升级改版(附加各个属性的list、dic方法)
- Git撤销修改
- Java精选笔记_JavaBean
- 以太坊之部署智能合约
- spring boot 项目代理配置
- ANDROID 高性能图形处理 之 二. OPENGL ES
- 面向对象学习第四节
- 文章标题
- imx6板卡移植官方yocto