Notre entreprise a récemment mis à niveau notre site WordPress, passant d'un serveur unique à un cluster à équilibrage de charge, mais contre toute attente, cette mise à niveau a été marquée par de nombreux problèmes.
Nous sommes actuellement confrontés à une situation particulièrement étrange : notre système de surveillance indique que tous les serveurs fonctionnent normalement et que tous les contrôles de santé sont satisfaisants. Cependant, certains utilisateurs signalent régulièrement qu'ils ne parviennent pas à accéder au site web et reçoivent un message « Origin DNS Error » (Erreur DNS d'origine). Étrangement, ces utilisateurs sont répartis dans différentes régions et utilisent divers réseaux, et le problème se produit sans qu'aucun schéma ne se dégage.
Notre équipe opérationnelle enquête depuis près de sept heures maintenant. Nous avons vérifié plusieurs fois les enregistrements DNS et examiné les journaux du serveur, mais nous ne parvenons toujours pas à identifier la cause du problème. Le plus frustrant, c'est que nos tests au bureau fonctionnent parfaitement, mais que le client continue de signaler des erreurs.
Quelqu'un a-t-il déjà rencontré une situation similaire ? Dans un environnement à équilibrage de charge, pourquoi la surveillance peut-elle indiquer un fonctionnement normal alors que les utilisateurs rencontrent en réalité des échecs d'accès ? Par où faut-il généralement commencer pour résoudre ce type de problèmes ? Nous avons déjà essayé de vider le cache DNS et de redémarrer le serveur, mais le problème persiste de manière intermittente.
Comme il s'agit du site officiel de l'entreprise, ce problème a déjà un impact sur les opérations commerciales, ce qui est assez urgent. Je serais très reconnaissant si des experts expérimentés pouvaient me donner des conseils ou me suggérer des solutions pour résoudre ce problème ! Merci d'avance !



- le plus récent
- le plus chaud
Ne voyez que l'auteur.