“Life is short, you need Python. —— Bruce Eckel。”
上一篇文章,我们学习了Python中的“方法”(也叫函数)。方法最大的作用,就是把重复的代码打包起来,做成一个可以反复使用的小工具。
不过,现实世界中的问题,往往不只是“算一个结果”这么简单。很多时候,我们要处理的并不是一个单独的数据,而是一类“对象”。
比如,在知识图谱领域,我们经常会遇到这些东西:
一个“学生”
一个“实体”
一篇“论文”
一个“节点”
一条“边”
一个“三元组”
它们都不只是一个数字,也不只是一个字符串,而是“带有很多属性的数据集合”。这个时候,前面学过的列表、字典、方法虽然还能凑合用,但会越来越乱。于是,就轮到今天的主角登场了:
类(class)和对象(object)
别怕,这两个词听起来很高级,其实没那么吓人。今天我们还是坚持一个原则:
不求最严格,但求最容易懂。
为什么需要“类”?
我们先来看一个问题。
假设现在我们要存储一个学生的信息,这个学生叫小明,年龄18岁,成绩90分。根据前面学过的知识,我们完全可以这样写:
student1 = { 'name': '小明', 'age': 18, 'score': 90}
很好,没有任何问题。
接着,又来了一个学生,小红,年龄19岁,成绩95分:
student2 = { 'name': '小红', 'age': 19, 'score': 95}
还是没有问题。
但是现在,我们不仅想存储学生的信息,还想让每个学生都能“自我介绍”,或者判断自己是否及格。那怎么办?
我们可以再写几个方法:
def introduce(student): print("大家好,我叫" + student['name'])def is_pass(student): if student['score'] >= 60: return True else: return False
调用的时候:
introduce(student1)print(is_pass(student1))
这也能完成任务。但你有没有感觉到一种微妙的别扭:
学生的信息在字典里,学生的功能在方法里。
也就是说,本来“学生”应该是一个完整的东西,但现在却被拆开了,数据和行为分家了,不够优雅,也不够直观。
这个时候,就需要“类”出场了。
你可以先这样理解:
类,就是一张设计图。对象,就是按照这张设计图制造出来的具体东西。
举个例子:
“学生”这个概念,是一个类
“小明”这个具体的人,是一个对象
“小红”这个具体的人,也是一个对象
同样:
“汽车”是类
你家楼下那辆白色比亚迪,是对象
所以,“类”描述的是一类事物长什么样、有什么属性、会做什么事情;“对象”则是这一类事物中的具体实例。
直接看代码:
就这么简单,这就是一个类。
第1行中的class,是Python中的关键字,表示“我要定义一个类了”。后面的Student,是这个类的名字。按照习惯,类名一般首字母大写。
后面的冒号也不能丢。
第2行的pass是什么意思呢?意思是:先占个位置,什么也不做。
因为Python要求,class下面必须得有缩进的代码块。可我们现在还没想好要往里面写什么,那就先写个pass顶一下。
这就好像你开了一家店,先挂了个招牌,但店里还没摆货。
前面定义了一个Student类,这只是“图纸”。那怎么根据这张图纸制造出具体的学生呢?
像这样:
class Student: passstudent1 = Student()student2 = Student()
第3行和第4行,就是在创建对象。
Student() 的意思,可以粗略理解成:
按照Student这个类,造一个具体的东西出来。
所以:
student1 是一个学生对象
student2 也是一个学生对象
虽然它们都来自同一个类,但它们是两个不同的对象。
现在虽然已经创建了student1和student2,但它们里面还是空的。没有名字,没有年龄,也没有成绩。
那怎么给对象添加信息呢?很简单:
class Student: passstudent1 = Student()student1.name = '小明'student1.age = 18student1.score = 90print(student1.name)print(student1.age)print(student1.score)
这里的:
student1.name
student1.age
student1.score
就叫做对象的“属性”。
你可以先简单理解为:
属性,就是这个对象身上存储的数据。
所以现在,student1这个对象就有了3个属性:
name
age
score
这样,我们就可以通过“点”来访问它们。
虽然上面的写法能用,但是问题很明显:
每创建一个学生,都要手动写三行赋值,麻烦不麻烦?
比如:
student1 = Student()student1.name = '小明'student1.age = 18student1.score = 90student2 = Student()student2.name = '小红'student2.age = 19student2.score = 95
如果有1000个学生,我们可能会写到天亮。
所以,Python给我们准备了一个更方便的机制:初始化方法。
直接看代码:
class Student: def __init__(self, name, age, score): self.name = name self.age = age self.score = score
第一次看到这段代码,不要慌,我们慢慢拆开。
1)__init__ 是什么?
它是Python中的一个特殊方法。名字长得有点奇怪,两边各有两个下划线。
你可以先把它理解成:
对象一创建,就会自动执行的方法。
所以,当我们写:
student1 = Student('小明', 18, 90)
Python就会自动去调用:
__init__(self, '小明', 18, 90)
2)self 是什么?
初学者最容易被self吓到。其实你先不用把它想得太复杂。
你可以非常粗糙但很好用地理解为:
self,就表示“对象自己”。
比如,现在创建的是student1,那么在这个对象创建过程中,self就可以理解成student1自己。
所以:
意思就是:
把传进来的name,保存到“这个对象自己的name属性”里。
同理:
self.age = ageself.score = score
就是把年龄和成绩也存到对象自己身上。
看代码:
class Student: def __init__(self, name, age, score): self.name = name self.age = age self.score = scorestudent1 = Student('小明', 18, 90)student2 = Student('小红', 19, 95)print(student1.name)print(student2.score)
现在就很舒服了。
我们在创建对象的时候,直接把名字、年龄、成绩传进去即可。
这就相当于,原来是:
先造一个空学生
再手动填名字
再手动填年龄
再手动填成绩
现在变成了:
一步到位,造出来时就已经填好了
这显然更合理。
前面我们说过,一个对象不仅有“属性”,还应该有“行为”。
比如,学生应该可以做什么?
自我介绍
判断是否及格
那这些“行为”怎么写呢?答案是:写在类里面,作为方法。
看代码:
class Student: def __init__(self, name, age, score): self.name = name self.age = age self.score = score def introduce(self): print("大家好,我叫" + self.name) def is_pass(self): if self.score >= 60: return True else: return False
上面这个类里面有3个方法:
__init__
introduce
is_pass
其中:
__init__用来初始化对象
introduce用来自我介绍
is_pass用来判断是否及格
注意,它们都写在类里面,并且都要缩进。
还是直接看:
class Student: def __init__(self, name, age, score): self.name = name self.age = age self.score = score def introduce(self): print("大家好,我叫" + self.name) def is_pass(self): if self.score >= 60: return True else: return Falsestudent1 = Student('小明', 18, 90)student2 = Student('小刚', 20, 50)student1.introduce()student2.introduce()print(student1.is_pass())print(student2.is_pass())
运行结果大概会是:
大家好,我叫小明大家好,我叫小刚TrueFalse
可以发现:
student1.introduce()表示让student1这个对象执行自我介绍
student1.is_pass()表示让student1这个对象判断自己是否及格
这就很符合我们的直觉了。
因为“是否及格”这件事,本来就是学生对象自己的事情。
学到这里,你可能会问:
“老师,前面用字典也能存名字、年龄、成绩啊,为什么还要学类?”
问得非常好。
确实,字典也能存数据,比如:
student = { 'name': '小明', 'age': 18, 'score': 90}
但是字典更适合:
临时存一些数据
结构不太固定的数据
而类更适合:
一类对象拥有固定的属性
这一类对象还有自己的方法
希望代码更清晰、更像现实世界
你可以先这样记:
字典更像“杂物袋”,类更像“标准模具”。
在知识图谱里,如果只是临时存一个三元组,字典也许够用;但如果你要定义“实体”“关系”“节点”这些东西,并且它们还有自己的方法,那么类通常就更合适。
现在,我们试着写一个最简单的“实体类”。
class Entity: def __init__(self, name, entity_type): self.name = name self.entity_type = entity_type def introduce(self): print("我是一个实体,我的名字是" + self.name + ",我的类型是" + self.entity_type)
然后我们创建两个实体对象:
entity1 = Entity("北京大学", "学校")entity2 = Entity("曹雪芹", "人物")entity1.introduce()entity2.introduce()
输出结果大概会是:
我是一个实体,我的名字是北京大学,我的类型是学校我是一个实体,我的名字是曹雪芹,我的类型是人物
这样是不是就已经开始有“知识图谱那个味儿”了?
知识图谱里最经典的东西之一,就是三元组:
实体1 - 关系 - 实体2
比如:
曹雪芹 - 作者 - 红楼梦
北京大学 - 位于 - 北京
我们可以把三元组写成一个类:
class Triple: def __init__(self, head, relation, tail): self.head = head self.relation = relation self.tail = tail def show(self): print(self.head + " - " + self.relation + " - " + self.tail)
使用方法:
triple1 = Triple("曹雪芹", "作者", "红楼梦")triple2 = Triple("北京大学", "位于", "北京")triple1.show()triple2.show()
结果:
曹雪芹 - 作者 - 红楼梦北京大学 - 位于 - 北京
看到这里,你应该已经能体会到“类”的价值了:
它可以把一类结构相同的数据,整整齐齐地组织起来。
前面的方法都只有一个self参数。其实,类里面的方法也可以像普通函数一样,接收其他参数。
例如:
class Student: def __init__(self, name, score): self.name = name self.score = score def add_score(self, num): self.score = self.score + num
使用时:
student1 = Student("小明", 90)student1.add_score(5)print(student1.score)
结果是:
这里的意思是,给student1这个对象加5分。
所以:
self 表示对象自己
num 表示额外传进来的参数
这是类和对象一个很重要的特点。
看代码:
class Student: def __init__(self, name, score): self.name = name self.score = scorestudent1 = Student("小明", 90)student2 = Student("小红", 80)student1.score = 100print(student1.score)print(student2.score)
结果会是:
说明什么?
说明student1和student2虽然都来自Student这个类,但它们是两个不同的对象,彼此独立,互不影响。
这就好比两个学生都来自“学生”这个类别,但小明考100分,并不会导致小红也自动变成100分。
讲到这里,我们用最朴素的话总结一下:
类是什么?
类是一个模板,是一个设计图,是一类事物的共同描述。
对象是什么?
对象是按照类这个模板,创建出来的具体实例。
属性是什么?
属性是对象身上存储的数据。
方法是什么?
方法是对象能执行的动作。
self是什么?
self表示对象自己。
__init__是什么?
对象创建时自动执行的初始化方法。
最后,把今天的知识点整合成一个完整例子:
class Student: def __init__(self, name, age, score): self.name = name self.age = age self.score = score def introduce(self): print("大家好,我叫" + self.name + ",今年" + str(self.age) + "岁。") def is_pass(self): if self.score >= 60: return True else: return False def add_score(self, num): self.score = self.score + numstudent1 = Student("小明", 18, 90)student2 = Student("小刚", 19, 50)student1.introduce()student2.introduce()print(student1.is_pass())print(student2.is_pass())student2.add_score(20)print(student2.score)print(student2.is_pass())
这里顺便出现了一个前面没专门讲过但其实见得很多的写法:
因为字符串和整数不能直接用 + 拼接,所以要先把年龄这个整数,用 str() 转成字符串。
这个知识点记一下就行,以后会经常见到。
按照惯例,我们还是布置一个简单的作业:
请你定义一个Entity类,这个类有两个属性:
name:实体名称
entity_type:实体类型
并且,这个类有一个方法 show_info(),用于打印:
“实体名称是xxx,实体类型是xxx”
然后,创建两个对象:
“鲁迅”,“人物”
“狂人日记”,“作品”
并调用 show_info() 方法。
答案:
class Entity: def __init__(self, name, entity_type): self.name = name self.entity_type = entity_type def show_info(self): print("实体名称是" + self.name + ",实体类型是" + self.entity_type)entity1 = Entity("鲁迅", "人物")entity2 = Entity("狂人日记", "作品")entity1.show_info()entity2.show_info()