背景
我的老板让我想出一种方法,普通用户可以使用免费软件编辑 PDF 文件中的信息。我们收到了大量扫描文档,我们的客户要求在将 PDF 中的敏感信息上传到他们的系统之前对其进行编辑。这就是我想出的。我已经说服自己,这将有效地破坏原始文档中潜在的敏感客户端元数据,并且无法删除任何覆盖敏感信息的黑条。然而,我也发现我知道的几乎没有我想的那么多。
许多关于此主题的论坛成员都非常坚定地表示,只有 Adobe Acrobat 或其他付费软件可以安全地执行此操作。如果您持这种观点,请解释原因。我很难弄清楚为什么这不起作用。
概述
在某些 PDF 程序中,用方框掩盖敏感内容,然后将其转换为 TIFF 文件。然后将 TIFF 文件转换回 PDF。
- 这行得通吗?TIFF 文件是否保留有关对象或图层的任何信息?是否有任何潜在的敏感元数据可能会通过,或者所有元数据都会像我希望的那样被更改?
我具体是怎么做的
我不知道我是否应该包括这个,因为一般问题可能会更有用,但这是我的具体设置:
软件:
PDFCreator 和 Foxit PDF。
设置:
更改 PDFCreator 中的设置,以便它将文档转换为 TIFF,而不是 PDF。对于输出,将 PDFCreator 设置为打印回 FoxIt,而不是打开文档。
过程:
- 在 Foxit Reader 中打开 PDF,并用黑色矩形覆盖任何可见的敏感数据。
- 将文档打印到 PDFCreator。
- 在后台,PDFCreator 将文件保存为 TIFF,然后将 TIFF 打印到 Foxit 的 PDF 打印机。Foxit 询问您要将 PDF 保存在哪里。
有关的
灵感来自于将 PDF 的一部分涂黑,或在 AskDifferent 上编辑文本。
这与如何从 PDF 文件中删除元数据和敏感数据有关?,但我们都在 Windows 上,而不是 Unix。
也与超级用户相关:如何从 PDF 中删除 OCR?
其他人的类似过程的分步说明:快速和肮脏的编辑
概括
从安全的角度来看,将 PDF 转换为图像,将一部分涂黑,然后将其转换回 PDF 是否足以从文档中删除信息?