分享一下10个Python脚本程序。虽然简单,不过还是蛮有用的。有兴趣的可以自己去实现,找到对自己有帮助的技巧。
#方法一:camelotimport camelottables = camelot.read_pdf("tables.pdf")print(tables)tables.export("extracted.csv", f="csv", compress=True)#方法二:tabula,需Java8import tabulatabula.read_pdf("tables.pdf", pages="all")tabula.convert_into("table.pdf", "output.csv", output="csv")
图片格式转换,以前可能第一时间想到的是【格式工厂】这个软件。
如今编写一个Python脚本就能完成各种图片格式的转换,此处以jpg转成png为例。
有两种解决方法,都分享给大家。
#方法一:PTLfrom PIL import Imageimg = Image.open('test.jpg')img.save('test1.png')#方法二:cv2from cv2 import imread, imwriteimage = imread("test.jpg", 1)imwrite("test2.png", image)
如果你有100个或更多的PDF文件需要加密,手动进行加密肯定是不可行的,极其浪费时间。
使用Python的pikepdf模块,即可对文件进行加密,写一个循环就能进行批量加密文档。
#方法一:加密import pikepdfpdf = pikepdf.open("test.pdf")pdf.save('encrypt.pdf', encryption=pikepdf.Encryption(owner="your_password"))pdf.close()#方法二:解密import pikepdfpdf = pikepdf.open("encrypt.pdf", password='your_password')pdf.save("decrypt.pdf")pdf.close()
import pandas as pd# 文件名filename = "test.xlsx"# 表格数量T_sheets = 5df = []for i in range(1, T_sheets+1): sheet_data = pd.read_excel(filename, sheet_name=i, header=None) df.append(sheet_data)# 合并表格output = "merged.xlsx"df = pd.concat(df)df.to_excel(output)
import cv2# 读取图片img = cv2.imread("img.jpg")# 灰度grey = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)invert = cv2.bitwise_not(grey)# 高斯滤波blur_img = cv2.GaussianBlur(invert, (7, 7), 0)inverse_blur = cv2.bitwise_not(blur_img)sketch_img = cv2.divide(grey, inverse_blur, scale=256.)# 保存cv2.imwrite('sketch.jpg', sketch_img)cv2.waitKey(0)cv2.destroyAllWindows()
from zipfile import ZipFileunzip = ZipFile("file.zip","r")unzip.extractall("output Folder")
#方法一:mssfrom mss import msswith mss() as screenshot: screenshot.shot(output='scr.png'#方法二:PIL.ImageGrabimport PIL.ImageGrabscr = PIL.ImageGrab.grab()scr.save("scr.png")