本文共 3064 字,大约阅读时间需要 10 分钟。
2010年12月10日,黑客组织匿名者发布了一条消息,解释了他们发起最近一次代号为”复仇行动”的攻击的大致动机(Prefect,2010)。由于被那些放弃支持维基解密网站的公司所激怒,匿名者组织号召要通过对涉及的一些机构进行分布式拒绝服务攻击(DDoS)以实现报复。这个稿子上既没有签名,也没有标注消息来源,只是以PDF(Portable Document Format,便携式文档格式)文件的形式被发布出来。
(不要问我资源是哪里来的,作为程序员,对于获取资源的套路还是懂一些的...)
import PyPDF2from PyPDF2 import PdfFileReaderimport sysimport osimport re#获取目录下所有的pdf文件目录def getFiles(): files = os.listdir() # 如果输入了单个pdf文件,则只输出单个pdf元数据 try: if sys.argv[1]: files = [sys.argv[1]] except: pass pdf_files = list() for file_name in files: try: result = re.match(r".*\.pdf$", file_name) if result: pdf_files.append(file_name) except Exception as e: pass return pdf_files# 打印文件的元信息def printMeta(files): for filename in files: try: pdfFile= PdfFileReader(open(filename, "rb")) docInfo = pdfFile.getDocumentInfo() print ("===文件%s的元信息为:"%filename) for metaItem in docInfo: print(metaItem,":",docInfo[metaItem]) except Exception as e: print("---文件%s元数据无法读取,已经跳过!"%filename)if __name__ == "__main__": filenames = getFiles() printMeta(filenames)
import sysimport osimport refrom PyPDF2 import PdfFileReader, PdfFileWriter#获取目录下所有的pdf文件def getFiles(): files = os.listdir() pdf_files = list() for file_name in files: try: result = re.match(r".*\.pdf$", file_name) if result: pdf_files.append(file_name) except Exception as e: pass return pdf_filesdef get_page_num(file_name): #获取一个pdfFileReader对象 my_pdf = PdfFileReader(open(file_name,"rb")) # 获取页数 page_num = my_pdf.getNumPages() print("PDF文件%s的页数为%s"%(file_name, page_num)) return page_num def create_new_pdf(file_names): try: os.mkdir("./pure") except Exception as e: pass for file_name in file_names: try: # 获取原pdf的信息 my_pdf = PdfFileReader(open(file_name,"rb")) # 创建一个PdfFileWriter对象 new_pdf = PdfFileWriter() for i in range(0, get_page_num(file_name)): page_info = my_pdf.getPage(i) new_pdf.addPage(page_info) new_pdf.write(open("./pure/%s"%file_name, "wb")) print("文件%s已清除元数据!"%file_name) except Exception as e: print("文件%s编码有问题,已自动跳过!"%file_name)if __name__ == "__main__": create_new_pdf(getFiles());
转载地址:http://lowlo.baihongyu.com/