我可以通过将 PDF 转换为 TIFF 并返回来进行编辑吗?

信息安全 隐私 pdf
2021-08-19 07:50:19

背景

我的老板让我想出一种方法,普通用户可以使用免费软件编辑 PDF 文件中的信息。我们收到了大量扫描文档,我们的客户要求在将 PDF 中的敏感信息上传到他们的系统之前对其进行编辑。这就是我想出的。我已经说服自己,这将有效地破坏原始文档中潜在的敏感客户端元数据,并且无法删除任何覆盖敏感信息的黑条。然而,我也发现我知道的几乎没有我想的那么多。

许多关于此主题的论坛成员都非常坚定地表示,只有 Adob​​e Acrobat 或其他付费软件可以安全地执行此操作。如果您持这种观点,请解释原因。我很难弄清楚为什么这不起作用。

概述

在某些 PDF 程序中,用方框掩盖敏感内容,然后将其转换为 TIFF 文件。然后将 TIFF 文件转换回 PDF。

  • 这行得通吗?TIFF 文件是否保留有关对象或图层的任何信息?是否有任何潜在的敏感元数据可能会通过,或者所有元数据都会像我希望的那样被更改?

我具体是怎么做的

我不知道我是否应该包括这个,因为一般问题可能会更有用,但这是我的具体设置:

软件:

PDFCreator 和 Foxit PDF。

设置:

更改 PDFCreator 中的设置,以便它将文档转换为 TIFF,而不是 PDF。对于输出,将 PDFCreator 设置为打印回 FoxIt,而不是打开文档。

过程:

  1. 在 Foxit Reader 中打开 PDF,并用黑色矩形覆盖任何可见的敏感数据。
  2. 将文档打印到 PDFCreator。
  3. 在后台,PDFCreator 将文件保存为 TIFF,然后将 TIFF 打印到 Foxit 的 PDF 打印机。Foxit 询问您要将 PDF 保存在哪里。

有关的

灵感来自于将 PDF 的一部分涂黑,或在 AskDifferent 上编辑文本。

这与如何从 PDF 文件中删除元数据和敏感数据有关?,但我们都在 Windows 上,而不是 Unix。

也与超级用户相关:如何从 PDF 中删除 OCR?

其他人的类似过程的分步说明:快速和肮脏的编辑

概括

从安全的角度来看,将 PDF 转换为图像,将一部分涂黑,然后将其转换回 PDF 是否足以从文档中删除信息?

1个回答

如果扫描的文档没有通过 OCR 过程,并且没有敏感元数据,则渲染为 TIFF,正确更改要编辑为统一黑色(或任何其他颜色)的像素,展平 TIFF,然后将其写回作为PDF就足够了。这是因为您创建了一个全新的文档。如果它有元数据,则该元数据将涉及您的流程,而不是以前的流程。

根据编辑文档的要求,您可以在其上运行 OCR,和/或添加您的自定义元数据。但是,同样,这将在您的控制下完成。

理想情况下,扫描将作为 TIFF 输入,您对其进行处理,然后才创建 PDF。这将简化工作流程。

在任何情况下,您都需要一个能够理解 TIFF 和 PDF 的图像编辑器,并在图像编辑器中进行编辑。