我有一个其他人想要使用的恶意软件检测项目的数据集。该数据集的一部分是我通过搜索 *.exe 文件从我的 PC 中检索到的系统二进制文件(用作良性数据集)。共享这些文件是否安全,或者它们是否包含有关帐户/身份等的敏感信息?
我的 Windows 系统二进制文件是否包含敏感信息?
每个人(包括我)对这样一个问题的反射性回答通常是:呵呵(从椅子上摔下来)。不!你认为这怎么可能奏效?现在可执行文件已签名,这可以防止它们被修改!
但是,如果您考虑一般的“exe”文件,而不仅仅是那些来自全新裸 Windows 安装的文件,答案必须是:小心!.
一些可执行文件(越来越多)是专门为您设计的。是的,他们已经签署,没有任何区别。
这至少包括一些,但更有可能是您从这些现代软件即服务或在线商店之一下载的可执行文件,或者您称之为的任何东西。Adobe、Steam、Office360,应有尽有。
我不知道每一个的技术细节,它们只是我想到的可能候选人的例子。然而可以肯定的是,在其他方法中,存在自定义签名的可执行文件(不仅仅是在 PC 上,例如 Nintendo shop 肯定以这种方式工作)。
因此,如果您的 Windows 系统不仅仅是一个 Windows 系统,而是一个包含自定义签名(或者人们称之为什么?自定义品牌?)可执行文件的系统,那么您可能会泄露敏感信息。
此外,并非所有可执行文件都是相同的版本,并且并非所有可执行文件都存在于每台计算机上。除非还考虑文件创建日期,否则说它们提供唯一指纹可能有点牵强,但这些信息肯定可以或多或少地用于识别您的系统,但有一点误差。
虽然在理论上,可能有足够的功能和版本组合来识别每台计算机中的每个原子,但实际上大多数安装将具有大部分相同的功能,并且大部分是相同的版本。这相当于可能有几千万个真正的排列。但是,如果有人可能会说这是一个问题,那就是这个和那个组合指向您的特定计算机,例如,85-90% 的可能性,那么......请注意。
请注意,基因分析并没有太大的不同,尽管在这种情况下数字当然要大得多。民间传说告诉我们,兄弟姐妹有 50% 的基因相同,但实际上,完全陌生98%的基因相同。那是因为,嗯,它们甚至需要特定组成中的这些基因才能存在(你会惊讶于你与老鼠或兔子有多少共同点!)。但是,即使人们在几乎所有事情上都大体相同,但仍有足够的微小的、剩余的部分来讲述关于某人的很多事情。
Windows 系统可执行文件不包含任何敏感信息。它们可能会透露您正在使用的操作系统的版本,但个人信息不会存储在可执行文件中。相反,它存储在整个系统中保存的配置文件或数据库中。虽然理论上可以将敏感信息存储在可执行文件中,但我想不出有什么理由这样做。
它们可以包含来自编译它们的系统的文件路径,如果这些是您在自己的系统上编译的程序,这可能是敏感的。
内部/公司特定应用程序很可能包含敏感算法(例如定价/折扣规则、欺诈检测)。敌对方可能会分析它们的安全漏洞。
揭示哪些版本的商业/第三方应用程序被积极使用(特别是如果没有完全更新安全补丁)也可能允许敌对方使用这些版本中的已知漏洞来攻击您的公司。