Javascript 正则表达式匹配在实际页面上失败,但正则表达式测试工作正常

IT技术 javascript regex
2021-03-17 09:54:00

我有一个关于 Javascript 中的正则表达式匹配的非常具体的问题。我正在尝试匹配一段源代码,更具体地说是此处的一部分:

<TD WIDTH=100% ALIGN=right><a href="http://forum.tibia.com/forum/?action=main&amp;sectionid=2">World Boards</a> | <a href="http://forum.tibia.com/forum/?action=board&amp;boardid=106121">Olympa - Trade</a> | <b>Bump when Yasir...</b></TD>

我试图匹配boardid=106121">Olympa - Trade</a>的部分,我实际需要的部分是“Olympa”。因此,我使用以下 JS 代码行来获取匹配项并返回“Olympa”:

var world = document.documentElement.innerHTML.match('/boardid=[0-9]+">([A-Z][a-z]+)( - Trade){0,1}<\/a>/i')[1];

( - Trade)部分在我的问题中是可选的,因此{0,1}在正则表达式中。

也没有更简单的方法可以通过例如 getElementsByTagName 缩小代码范围,因此搜索完整的源代码是我唯一的选择。

现在有趣的是。我使用了两个在线正则表达式匹配器(其中一个专门用于 JS-regex)来针对完整的源代码测试我的正则表达式。两次,它都进行了匹配并完全按照应有的方式返回了“Olympa”。但是,当我让 Chrome 在实际页面上包含脚本时,它会出现以下错误:

Error in event handler for 'undefined': Cannot read property '1' of null TypeError: Cannot read property '1' of null

显然,我的行的第一部分返回“null”,因为它没有找到匹配项,并且取 [1] 的“null”不起作用。

我想我可能没有对源代码进行匹配,但是当我让脚本输出document.documentElement.innerHTML到控制台时,它会输出完整的源代码。

我看不出这个正则表达式失败的原因,所以我一定是忽略了一些非常愚蠢的事情。有没有其他人看到这个问题?

感谢所有帮助,肯尼斯

1个回答

您将正则表达式放入字符串中。它不应该在字符串内。

var world = document.documentElement.innerHTML.match(/boardid=[0-9]+">([A-Z][a-z]+)( - Trade){0,1}<\/a>/i)[1];

另一件事 - 看起来您有一个document object,在这种情况下,所有这些 HTML 已经为您解析,您可以利用它而不是重新发明一个脆弱的轮子。

var element = document.querySelector('a[href*="boardid="]');
var world = element.textContent;

(这假设您不需要 <=IE8 支持。如果您需要,还有更好的方法。)

(PS?是 的简写{0,1}。)

当然哦。我现在觉得好傻!它在不使用“exec”的情况下工作正常。我不太明白你试图制造的差异。我会尽快将您的答案标记为正确答案(还有 2 分钟的等待时间)。
2021-05-03 09:54:00