适用于 PHP 开发人员的 Python 基础知识

来源:互联网 发布:大数据建设是什么 编辑:程序博客网 时间:2024/06/04 00:38


Thomas Myer 是一名顾问、作家和讲师,居住在 Austin。他创立了 Triple Dog Dare Media。

简介: 您是一名经验丰富的 PHP 开发人员,并且希望学习 Python 吗?本文将从 PHP 开发人员的角度来探索 Python 开发的世界,将大家熟悉的 PHP 概念(如变量、列表、函数)转换成同等的 Python 概念。

您是一名 PHP 开发人员。您在过去 五年(或更长时间)中可能一直都编写应用程序,您已经将许多想像变成了可能 — 电子商务系统、简单内容管理系统、Twitter 和 Facebook 集成以及各种自定义实用工具。您可能还需要维护大量代码 — 从简单的显示页面到包含数千行其他人编写的代码的自定义应用程序,不一而足。

常用缩略语

  • Ajax:异步 JavaScript + XML
  • XML:可扩展标记语言(Extensible Markup Language)

您已经在 PHP 上花费了大量时间,转向另一种语言势在必行。您也知道原地不动就意味着被动挨打。其实,学习新语言就像是去国外旅行:您会接触到新事物,品尝新食物,领略不同的文化,与不同的人对话,了解一切新奇,然后再回到家中体会原来的环境。

本文将带领您前往 Python 的世界遨游一番。本文假定您不具备 Python 编程语言的任何知识,但至少应具备一些基本的编程知识。我们将侧重于对 Python 和 PHP 进行比较 — 并不是为了分出两者孰优孰劣,而是因为一个简单的真理:在学习新知识时参照已有知识会更加轻松。

本文的目标相当简单:简要介绍 Python 的基本知识,为读者自己进行深入搜索打下基础。幸运的是,您将认识到 Python 实际上与您之前所使用的语言并无不同之处。再次以旅游为例,您并不需要到太远的地方,只需要去语言相通的邻国即可。

什么是 Python?

Python 的定义是一种 “通用的高级编程语言”。它以简洁性和易用性著称,而且是少有的几种对空格和缩进有要求的语言之一。Python 的主要作者 Guido Van Rossum 在社区中仍然非常活跃,并且被人们戏称为仁慈的独裁者

Python 的灵活性和紧凑性是值得称赞的。它支持面向对象编程、结构化编程、面向方面编程以及函数编程等。Python 采用小内核设计,但具备大量扩展库,从而确保了该语言的紧凑性和灵活性。

从语法的角度来说,您会发现 Python 的简洁性异常突出 — 几乎可以说是一种纯粹的境界。PHP 开发人员要么会对这种方法的语法深深陶醉,要么会发现它的局限性。这主要取决于您自己的见解。Python 社区推动这种美感的态度是非常明确的,它们更加重视的是美学和简洁性,而不是灵动的技巧。已形成 Perl 传统(“可以通过多种方式实现它”)的 PHP 开发人员(像我自己)将面对一种完全相反的哲学(“应该只有一种方法可以实现它”)。

事实上,该社区定义了一种特有的代码风格术语,即 Python 化(pythonic)。您可以说您的代码是 Python 化,这是对 Python 术语的良好运用,同时还可展现语言的自然特性。本文并不打算成为 Pythonista(或 Pythoneer),但如果您想继续 Python 之路,那么千万不能错过本文的知识点。就像 PHP 有自己的编程风格,Perl 有自己的概念方法,学习 Python 语言必然也需要开始用该语言来思考问题。

另一个要点:在撰写本文时,Python 的最新版本是 V3.0,但本文主要侧重于 Python V2.6。Python V3.0 并不能向后兼容之前的版本,而且 V2.6 是使用最为广泛的版本。当然,您可以根据需求使用自己喜好的版本。


Python 与 PHP 有何不同?

一般来说,PHP 是一种 Web 开发语言。是的,它提供了一个命令行接口,并且甚至可用于开发嵌入式应用程序,但它主要还是用于 Web 开发。相反,Python 是一种脚本语言,并且也可用于 Web 开发。从这方面来说 — 我知道我会这样说 — 它比 PHP 更加接近 Perl。(当然,在其他方面,它们之间并无实际不同。我们继续往下看。)

PHP 的语法中充斥着美元符号($)和大括号({}),而 Python 相对来说则更加简洁和干净。PHP 支持switchdo...while 结构,而 Python 则不尽然。PHP 使用三元操作符(foo?bar:baz)和冗长的函数名列表,而命名约定更是无所不有;相反,您会发现 Python 要简洁多了。PHP 的数组类型可同时支持简单列表和字典或散列,但 Python 却将这两者分开。

Python 同时使用可变性和不变性的概念:举例来说,tuple 就是一个不可变的列表。您可以创建 tuple,但在创建之后不能修改它。这一概念可能要花些时间来熟悉,但对于避免错误极为有效。当然,更改 tuple 的惟一方法是复制它。因此,如果您发现对不可变对象执行了大量更改,则应该重新考量自己的方法。

之前提到,Python 中的缩进是有含义的:您在刚开始学习该语言时会对此非常难以适应。您还可以创建使用关键字作为参数的函数和方法 — 这与 PHP 中的标准位置参数迥然不同。面向对象的追随者会对 Python 中真正的面向对象思想感到欣喜,当然还包括它的 “一级” 类和函数。如果您使用非英语语言,则会钟爱于 Python 强大的国际化和 Unicode 支持。您还会喜欢 Python 的多线程功能;这也是最开始令我为之着迷的特性之一。

综上所述,PHP 和 Python 在许多方面都彼此类似。您可以方便地创建变量、循环,使用条件和创建函数。您甚至可以轻松地创建可重用的模块。两种语言的用户社区都充满活力和激情。PHP 的用户群体更加庞大,但这主要归因于它在托管服务器及 Web 专注性方面的优势和普及性。

很好 — 简要介绍到此为止。我们开始探索之旅。


使用 Python

清单 1 展示了一个基本的 Python 脚本。


清单 1. 一个简单的 Python 脚本

for i in range(20):print(i)            

清单 2 展示了脚本的必然结果。


清单 2. 清单 1 的结果

012345678910111213141516171819            

在深入探索之前,我们先来了解一些预备知识。首先从变量开始。

变量

可以看到,表示变量并不需要任何特殊的字符。变量 i 就是一个纯粹的 i — 毫无特殊之处。表示代码块或语言结束也不需要任何特殊字符(比如分号和括号);只需要在for 行使用一个简单的冒号即可(:)。还需注意,缩进会向 Python 指示哪些内容属于for 循环。举例来说,清单 3 中的代码会在循环中为各编号输出一个说明。


清单 3. 为各循环添加一条语句

for i in range(20):print(i)print('all done?')            

相反,清单 4 中的代码会在循环结束处输出一条说明。


清单 4. 在循环后添加一条语句

for i in range(20):print(i)print('all done!')            

现在,我第一次看到这样的代码时,我认为这完全是无稽之谈。什么?让我相信换行和缩进能保证代码的结构和运行?请相信我,不用多久,您就会习惯它(但我需要承认必须到达到分号处才会结束语句的运行)。如果您与其他开发人员共同开发 Python 项目,则会发现这种可读性的用处是多么大了。您不再像以前那样总是猜测 “这个聪明的家伙在这里究竟想干些什么?”

在 PHP,您使用 = 操作符为变量分配值(参见 清单 5)。在 Python 中,您使用相同的操作符,只是需要标记或指向值。对于我来说,它就是赋值操作而已,我不需要过多担心专门的术语。


清单 5. 创建变量

yorkie = 'Marlowe' #meet our Yorkie Marlowe!mutt = 'Kafka'     #meet our mutt Kafkaprint(mutt)  #prints Kafka            

Python 的变量名称约定与 PHP 类似:您在创建变量名时只能使用字母、数字和下划线(_)。同样,变量名的第一个字符不能是数字。Python 变量名是区分大小写的,并且您不能使用特定的 Python 关键字(比如if、else、while、def、or、and、not、inis 开始符)作为变量名。这没有什么值得奇怪的。

Python 允许您随意执行基于字符串的操作。清单 6 中的大多数操作应该都是您熟悉的。


清单 6. 常见的基于字符串的操作

yorkie = 'Marlowe'mutt = 'Kafka'ylen = len(yorkie) #length of variable yorkieprint(ylen) #prints 7print(len(yorkie)) #does the same thinglen(yorkie) #also does the same thing, print is implicitprint(yorkie.lower()) #lower cases the stringprint(yorkie.strip('aeiou')) #removes vowels from end of stringprint(mutt.split('f')) #splits "Kafka" into ['Ka', 'ka']print(mutt.count('a')) #prints 2, the number of a's in stringyorkie.replace('a','4')  #replace a's with 4's             

条件语句

您已经了解了如何使用 for 循环;现在,我们来讨论条件语句。您会发现 Phyon 中的条件语句与 PHP 基本相同:您可以使用熟悉的if/else 型结构,如清单 7 所示。


清单 7. 一个简单的条件测试

yorkie = 'Marlowe'mutt = 'Kafka'if len(yorkie) > len(mutt):print('The yorkie wins!')else:print('The mutt wins!')            

您还可以使用 if/elif/elseelif,等价于 PHP 中的 elseif)创建更加复杂的条件测试,如清单 8 所示。


清单 8. 一个比较复杂的条件测试

yorkie = 'Marlowe'mutt = 'Kafka'if len(yorkie) + len(mutt) > 15:print('The yorkie and the mutt win!')elif len(yorkie) + len(mutt) > 10:print('Too close to tell!')else:print('Nobody wins!')            

您可能会说,目前为止并没有什么与众不同的地方:甚本上和想像中没有太大区别。现在,我们来看 Python 处理列表的方式,您会发现两种语言之间的不同之处。

列表

一种常用的列表类型是 tuple,它是不可变的。在 tuple 中载入一系列值之后,您不会更改它。Tuple 可以包含数字、字符串、变量,甚至其他 tuples。Tuples 从 0 开始建立索引,这很正常;您可以使用-1 索引访问最后一个项目。您还可以对 tuple 运行一些函数(请参见清单 9)。


清单 9. Tuples

items = (1, mutt, 'Honda', (1,2,3))print items[1]  #prints Kafkaprint items[-1] #prints (1,2,3)items2 = items[0:2]  #items2 now contains (1, 'Kafka') thanks to slice operation'Honda' in items #returns TRUElen(items) #returns 4items.index('Kafka') #returns 1, because second item matches this index location            

列表与 tuple 类似,只不过它们是可变的。创建列表之后,您可以添加、删除和更新列表中的值。列表使用方括号,而不是圆括号(()),如清单 10 所示。


清单 10. 列表

groceries = ['ham','spam','eggs']len(groceries) #returns 3print groceries[1] #prints spamfor x in groceries:print x.upper() #prints HAM SPAM EGGSgroceries[2] = 'bacon'groceries #list is now ['ham','spam','bacon']groceries.append('eggs')groceries #list is now ['ham', 'spam', 'bacon', 'eggs']groceries.sort() groceries #list is now ['bacon', 'eggs', 'ham', 'spam']            

字典类似于关联数组或散列;它使用键值对来存储和限制信息。但它不使用方括号和圆括号,而是使用尖括号。与列表类似,字典是可变的,这意味着您可以添加、删除和更新其中的值(请参见清单 11)。


清单 11. 字典

colorvalues = {'red' : 1, 'blue' : 2, 'green' : 3, 'yellow' : 4, 'orange' : 5}colorvalues #prints {'blue': 2, 'orange': 5, 'green': 3, 'yellow': 4, 'red': 1}colorvalues['blue'] #prints 2colorvalues.keys() #retrieves all keys as a list:    #['blue', 'orange', 'green', 'yellow', 'red']colorvalues.pop('blue') #prints 2 and removes the blue key/value paircolorvalues #after pop, we have: #{'orange': 5, 'green': 3, 'yellow': 4, 'red': 1}            


在 Python 中创建一个简单的脚本

现在,您已经对 Python 有了一定的了解。接下来,我们将创建一个简单的 Python 脚本。该脚本将读取位于您的服务器 /tmp 目录下的 PHP 会话文件的数量,并在日志文件中写入摘要报告。在该脚本中,您将学习如何导入特定函数的模块,如何使用文件,以及如何写入日志文件。您还将设置一系列变量来跟踪所收集的信息。

清单 12 展示了整个脚本。打开一个编辑器,并将代码粘贴到其中,然后在系统中将该文件保存为 tmp.py。然后,对该文件运行 chmod + x,使它成为可执行文件(假定您使用 UNIX® 系统)。


清单 12. tmp.py

#!/usr/bin/pythonimport osfrom time import strftimestamp = strftime("%Y-%m-%d %H:%M:%S")logfile = '/path/to/your/logfile.log'path = '/path/to/tmp/directory/'files = os.listdir(path)bytes = 0numfiles = 0for f in files:if f.startswith('sess_'):info = os.stat(path + f)numfiles += 1bytes += info[6]if numfiles > 1:title = 'files'else:title = 'file'string = stamp + " -- " + str(numfiles) + " session " /+ title +", " + str(bytes) + " bytes/n"file = open(logfile,"a")file.writelines(string)file.close()            

在第一行中,您可以看到一个 hash-bang 行:它用于标识 Python 解释器的位置。在我的系统中,它位于 /usr/bin/python。请根据系统需求调整这一行。

接下来的两行用于导入特定的模块,这些模块将帮助您执行作业。考虑到脚本需要处理文件夹和文件,因此您需要导入 os 模块,因为其中包含各种函数和方法,可帮助您列出文件、读取文件和操作文件夹。您还需要写入一个日志文件,因此可以为条目添加一个时间戳 — 这就需要使用时间函数。您不需要所有时间函数,只需要导入strftime 函数即可。

在接下来的六行中,您设置了一些变量。第一个变量是 stamp,其中包含一个日期字符串。然后,您使用 strftime 函数创建了一个特定格式的时间戳 — 在本例中,时间戳的格式为2010-01-03 12:43:03

接下来,创建一个 logfile 变量,并在文件中添加一个实际存储日志文件消息的路径(该文件不需要实际存在)。为简单起见,我在 /logs 文件夹中放置了一个日志文件,但您也可以将它放置在别处。同样,path 变量包含到 /tmp 目录的路径。您可以使用任何路径,只要使用斜杠作为结束即可 (/)。

接下来的三个变量也非常简单:files 列表包含指定路径中的所有文件和文件夹,另外还包含 bytesnumfiles 两个变量。这两个变量都设置为0;脚本会在处理文件时递增这些值。

完成所有这些定义之后,接下来就是脚本的核心了:一个简单的 for 循环,用于处理文件列表中的各文件。每次运行循环时,脚本都会计算文件名;如果它以sess_ 开头,则脚本会对该文件运行os.stat(),提取文件数据(比如创建时间、修改时间和字节大小),递增 numfiles 计数器并将该文件的字节大小累计到总数中。

当循环完成运行后,脚本会检查 numfiles 变量中的值是否大于 1。如果大于 1,则会将一个新的 title 变量设置为files;否则,title 将被设置为单数形式的file

脚本的最后部分也非常简单:您创建了一个 string 变量,并在该变量中添加了一行以时间戳开始的数据,并且其后还包含 numfiles(已转换为字符串)和字节(也已转换为字符串)。请注意继续字符(/);该字符可允许代码运行到下一行。它是一个提高可读性的小技巧。

然后,您使用 open() 函数以附加模式打开日志文件(毕竟始终需要在该文件中添加内容),writelines() 函数会将字符串添加到日志文件中,而close() 函数用于关闭该文件。

现在,您已经创建了一个简单的 Python 脚本。该脚本可用于完成许多任务,举例来说,您可以设置一个 cron 作业来每小时运行一次这个脚本,以帮助您跟踪 24 小时内所使用的 PHP 会话的数量。您还可以使用 jQuery 或其他一些 JavaScript 框架通过 Ajax 连接这个脚本,用于为您提供日志文件提要(如果采用这种方式,则需要使用print 命令来返回数据)。


结束语

作为开发人员,我们投入大量时间学习特定的语言和方法。有时,这样做会引起各种语言之间孰优孰劣的争议。我参加了不少这样的争论,相信读者们也是如此。需要承认的是,大多数这样的讨论最终都会以相同的结果结束 — “你能做的,我都可以更好的完成” — 这其实毫无意义。

但是,当您将目光转移到另一种语言时,您会发现大多数语言都具备相似的工具、原理和方法。学习第一种语言是艰辛的,但将自己所掌握的知识应用于另一种语言可以极大地简化学习过程。即使您实际上并不用迁移到第二种语言,但是可以将自己对编程思想和方法的领悟提升一个层次。

所幸的是,本文为您提供了一些关于 Python 的知识。我希望您可以继续学习这个优秀的语言。您可能从未离开 PHP 的世界(毕竟,它是您赖以生存的工具),但请不要停止学习的脚步。

参考资料

学习

  • 访问 Python 并了解关于该语言的更多信息。
  • 阅读 Python 文档
  • Python 入门者指南 是开始学习 Python 语言的好去处。
  • 免费查阅 Python WikiBook
  • 阅读 “探索 Python”,了解 Python 的方方面面。
  • 访问 developerWorks Web 开发专区,其中提供了用于 Web 2.0 开发的各种工具和信息。
  • PHP.net 是 PHP 开发人员的集中资源库。
  • 请访问 “推荐 PHP 读物列表”。
  • 浏览 developerWorks 上的所有 PHP 内容
  • 查阅 IBM developerWorks 的 PHP 项目资源,扩展您的 PHP 技能。
  • 想聆听针对软件开发人员的有趣访谈和讨论,请访问 developerWorks 播客
  • 想结合使用数据库与 PHP?请获取 Zend Core for IBM,它是一个无缝、开箱即用、易于安装的 PHP 开发和生产环境,可支持 IBM DB2 V9。
  • My developerWorks 社区涵盖了大量主题,是一个成功社区的典范。
  • 查阅最近将在全球举办的面向 IBM 开放源码开发人员的研讨会、交易展览、网络广播和其他 活动
  • 访问 developerWorks Open source 专区获得丰富的 how-to 信息、工具和项目更新以及最受欢迎的文章和教程,帮助您用开放源码技术进行开发,并将它们与 IBM 产品结合使用。
  • 随时关注 developerWorks 技术活动网络广播
  • 查看免费的 developerWorks 演示中心,观看并了解 IBM 及开源技术和产品功能。

获得产品和技术

  • Python Cookbook:访问 ActiveState Code,参考可以利用的 Python 代码示例。
  • 使用 IBM 产品评估试用版软件 改进您的下一个开源开发项目,可以下载获得。
  • 下载 IBM 产品评估试用版软件IBM SOA Sandbox for People,开始使用来自 DB2®、Lotus®、Rational®、Tivoli® 和 WebSphere® 的应用程序开发工具和中间件产品。

讨论

  • 参与 developerWorks 博客 并加入 developerWorks 社区。
  • 参与 developerWorks PHP 论坛:使用 IBM 信息管理产品 (DB2、IDS) 开发 PHP 应用程序

关于作者

author

Thomas Myer 是一名顾问、作家和讲师,居住在 Austin。他创立了 Triple Dog Dare Media。

来源:http://www.ibm.com/developerworks/cn/opensource/os-php-pythonbasics/index.html

原创粉丝点击