什么是清晰逻辑(在分类领域)?

机器算法验证 分类 模糊
2022-03-29 14:09:08

我有一个简短的问题。我很难找到一个很好的参考来解释什么是清晰的逻辑。

我的想法:

我有两个分类模型,一个决策树和一个规则集,我认为它们是清晰的模型。因为他们说一个实例要么是 A 类,要么不是。

我有另一个分类模型,一个逻辑回归,它并不清晰,因为它给出了一个实例属于这个类的概率。

我想在今天晚些时候的演讲中提到这一点。我尝试查找这个主题,但如果有人能确认我是如何解释它的,那就太好了。我也可以在我的论文中使用一个很好的参考。

谢谢,

3个回答

清晰与模糊逻辑

据我所知,清晰逻辑与布尔逻辑相同。一个陈述要么是真实的,要么不是,同时模糊逻辑捕捉到某事真实的程度。

考虑一下声明:“同意在 12 点见面,但本没有准时。”

  • 清晰的逻辑:如果 Ben 在 12 岁时出现,他是准时的,否则他太早或太晚了。
  • 模糊逻辑:Ben 准时的程度取决于他出现的早晚多少(例如,0,如果他在 11:45 或 12:15 出现,1 在 12:00 和线性增加/减少之间)。

我不知道是谁第一次使用了“crisp”这个词,但我在密切相关的Fuzzy Set Theory中多次看到它,它被用来区分Cantor 的集合论和 Zadeh 的集合论。因此,如果您正在寻找参考资料,Zadeh 的原创作品或该地区的教科书可能是一种选择。

...在机器学习中

在机器学习中,大多数分类器都会产生所谓的分数,通常或多或少是对得分实例属于特定类的概率的粗略估计。

据我所知,这些分数与模糊逻辑没有明确的联系。模糊逻辑和概率论彼此接近,但在技术上它们并不相同(Fuzzy_logic#Comparison_to_probability(英语维基百科))。

因此,将 Logistic Regression 的输出标记为模糊是不正确的。此外,上面提到的决策树还计算分数(叶子中的实例属于特定类的主观概率),这通常会导致叶子的多数决策。

概括

但是如果为了简单起见,你愿意放弃模糊逻辑和概率之间的区别,你可能会说合适的分类器产生的分数是模糊的,而基于分数的分类决策是清晰的。例如,在直邮活动中,您可以计算客户回复的可能性分数,但最终您必须明确决定您将向哪些客户发送实际信件。

这篇论文可能很有趣(Eyke Hüllermeier-机器学习和数据挖掘中的模糊集)。从摘要:

在过去的几年中,模型自动归纳和从经验数据中提取有趣模式的方法在模糊集社区引起了相当大的关注。本文简要回顾了一些典型应用,并强调了模糊集理论对机器学习、数据挖掘和相关领域的潜在贡献。本文最后对最近的发展进行了批判性考虑,并对未来的研究方向提出了一些建议。

  • 清晰/模糊用于模糊逻辑
  • 硬/软有时也用于 [0, 1] 中的连续分类器分数,例如在遥感社区中。

连续 [0, 1] 分数的解释各不相同:

  • 测量无法分辨的纯、硬/脆类的混合物
  • 真正在类之间的案例
  • 概率,一个案例(完全)属于该类。

请注意,模糊逻辑通常不是关于概率,而是关于真正属于多个类别(部分),即前两个要点。

Reichenbach 开发了一种概率逻辑(在 1930 年代)。

您可能想查看斯坦福哲学百科全书中的许多有价值和模糊逻辑的文章

我有一篇即将发表的论文(关于使用带有软/模糊参考的样本进行分类器验证),但它还没有通过审查过程,所以我还不能在这里公开。如果您对手稿感兴趣,请给我发送电子邮件(Claudia dot Beleites at ipht minus jena dot de)一旦被接受,该论文将在 arxiv 上可用。

对或错但不是两者的陈述称为比例,用大写字母表示,简单的比例也称为原子,为了表示复杂的信息,必须建立一个比例序列链接使用连接词或运算符 有五个主要的运算符如下 .... 1. AND (^) 2. OR (/) 3. NOT ~ 4. IMPLICATION => 5. EQUALITY =

请忽略我的拼写错误,因为我是学生,所以如果您在我的回答中发现任何拼写错误,请不要介意