得到文章大概,让你的文本主次分明﹉﹉用python来实现文章的分割.
在信息爆炸的今天,人的时间是宝贵的。我们读到一文本,将觉定是否要在其上面耽误时间。我们需要知道其中出现词频最高的几个词,为下一步分割做准备。
导入结巴库

用open打开
b=open("?.txt","r").read()

将b用jieba分割

用set去重,再次列表

用列表的count方法,统d中和元素的的次数
把g("词名")和h(出现的次数)组成一个字典
用sorted()方法,对h排序。
注意sorted不改变h的序列,python3中还有一个方法list.sort(),改变原列表序列,没有返回值。不要混合。

找出前十,因为sorted是从小到大,依据的是ASCII码排位。
找出前十

我们对字典筛选

发现有意义的词只有"软件"
我们可以知道这个文本是关于计算机的东西
再分害刂,可以把关键信息找出来了。

如果果你再将其change,加入敏感词,很好你做出了一个审查系统。
如果你再??,此处省略,自己脑补。