交换机在缓慢到快速故障后死机现在即使使用新交换机,DHCP 也无法跨网络运行

网络工程 第 3 层 管理 堆叠
2022-02-13 13:17:00

好的,所以我在这里没有想法了。

我们的服务器机架中有 3 台托管交换机,壁橱中有 1 台;一个 hp procurve 3500yl 48 端口,带有用于 2 个 AP 和 2 个 Catalyst 2960 的 poe,位于机架底部,用于 proliant 刀片服务器和到 equallogic 数据存储的链接。

我相信壁橱里的那个是另一个 procurve 相同的模型。

与 HPE 合作并同意我的观点,即机架 3500yl 已死(控制台端口间歇性和配置命令似乎已损坏/报告为无效)

他们下一个商务日使用 aruba 3810 并进行了设置并将我们的交换机配置的备份克隆到其中以匹配 vlan(不是很多,只有 8 个左右加上默认值)没有特殊的计量或优先级,只是在部门和建筑物之间分离 ip 池领域。

即使我有一个辅助 dhcp 服务器启动并在运行 server 2012 的硬件 r230 上运行,我也可以在我的一生中没有任何系统连接到 aruba 或两个催化剂来获取有效的 dhcp 链接。dns 是一个 vm在刀片服务器上并且正在运行,但只能到达刀片机箱上的其他 vm,在所有 vm 之间切换子网可以让 DC vm 在机架 RDP 上与它们通信,但它不会连接到刀片之外的任何东西即使我将静态 ip 设置为我知道它是有效的租用 ip(或任何其他)。

如果我在默认 vlan 范围 (192.168.100.x) 中设置静态 IP,我可以从任何物理系统访问新 aruba 交换机的 Web 管理,因此我知道 aruba 的网络支路正在工作至少。

任何建议都会受到欢迎,在这里真的让我很头疼,更不用说这份超过 1 年的工作压力很大,而且这种情况发生了

谢谢

2个回答

事实证明,我无法从刀片服务器中获取任何 DHCP 或 DNS 的原因是刀片服务器中的一部分(至少)背板坏了,导致网络模块刀片无法与外部任何东西通信外壳。(测试购买只需连接一个交换机并尝试 ping 同一个网络模块以及其他托架中的其他模块的其他 IP/端口,所有静态 ip 在同一子网上)

所以最终不得不快速跟踪我们已经在新主机上测试并启动我们的主控制器的 VM 主机硬件升级。

可取之处在于 vm 的所有数据文件都从主机和服务器卸载到专用的 equallogic 中,因此一旦我可以将主机连接到存储中,我只需导入 DC 虚拟机并通过一些摆弄将所有内容重新联机。

kicker 是刀片机箱的自诊断报告(仍然)所有模块和 I/O 托架的绿色。

我能想到的唯一能杀死交换机的是,当背板出现故障时,其中一个网络模块出现了某种浪涌,它沿着线路上行并杀死了交换机。

如此缓慢地,我们正在恢复秩序。

很可能,3500 配置在整个 3800 中不起作用,或者备份缺少重大更改。

要使 DHCP 正常工作,您需要

  1. 将 DHCP 服务器连接到每个 VLAN
  2. 在每个 VLAN 中为 DHCP 服务器设置一个 DHCP 中继

对于 1.,确保客户端和服务器连接到相同的 VLAN = 相同的广播域。通过检查交换机的 MAC 表中的客户端和服务器 MAC 进行验证。

对于 2.,中继交换机需要 VLAN 内的 IP 地址,并且需要能够 ping DHCP 服务器。中继交换机是否路由到 DHCP 服务器的 VLAN 或者是否有额外的路由器并不重要,只要有路由即可。