我正在查看外汇和债券市场的时间序列数据(以测试极端走势的回归)。不幸的“tick”数据,即高频数据,容易出现许多问题,它们显然会严重干扰分析。我想知道哪个 R 库可以帮助解决以下类型的相当频繁的数据清理问题:
1)一个尖峰:

这通常是当一个做市商在一个报价单中打印出错误的报价时创建的,但在该价格下不会有可交易性,因为它持续了一瞬间。我想消除尖峰(但前提是只有一个(或可能 2 个)打印件)
2) 买卖差价:

在这种情况下,市场流动性相当低,数据算法在买卖之间跳跃(在这种情况下为 2 个基点宽),从而导致了这种奇怪的云。
我应该从哪里开始清理这些东西,显然是试图丢弃最少量的真实数据。我意识到“查看数据”的格言适用于此,但是当您查看 1000 个系列,每个系列都有 100 天的数据时,您会发现这将很快变得不切实际,因此我需要一些自动化帮助。如果 Python 语言方法可用或更好,我也会看看它们。