Ast_ari_websocket... : Problem occurred during websocket write to 127.0.0.1....websocket closed

Bonjour à tous

Tout d’abord, je vous souhaite à tous une excellente année 2021 pleine de douceurs et de projets…

Un étrange problème ce jour sur un wazo 18.03 supportant une cinquantaine d’utilisateurs :
de grosse lenteur et, sur la CLI, un message
NOTICE[41207]: ari/ari_websockets.c:178 ast_ari_websocket_session_write: Problem occurred during websocket write to 127.0.0.1:34900, websocket closed

et ce message défile avec parfois quelques pauses et reprend de plus belles (je dirais 100 à 200 fois par seconde).

Ce wazo fonctionnait normalement jusque la.

Une idée, une piste, un bout de pelotte de laine à tirer ?

Salut,

Bonne année aussi, sur une 18.03, je dirais de regarder les logs du service ctid-ng.

Sylvain

Effectivement quelques erreurs la dedans que je n’ai jamais vu sur les autres… :thinking:

2021-01-05 10:24:01,823 [3081] (WARNING) (xivo_ctid_ng.ari_): ARI connection error: Connection is already closed....
2021-01-05 10:24:01,827 [3081] (WARNING) (xivo_ctid_ng.ari_): Reconnecting to ARI in 10 seconds
2021-01-05 10:27:59,966 [3081] (WARNING) (xivo_ctid_ng.ari_): ARI connection error: Connection is already closed....
2021-01-05 10:27:59,968 [3081] (WARNING) (xivo_ctid_ng.ari_): Reconnecting to ARI in 10 seconds
2021-01-05 10:30:24,591 [3081] (WARNING) (xivo_ctid_ng.ari_): ARI connection error: Connection is already closed....
2021-01-05 10:30:24,592 [3081] (WARNING) (xivo_ctid_ng.ari_): Reconnecting to ARI in 10 seconds

bizarrement, les notifications continuent

[Jan 18 10:33:26] NOTICE[3088]: ari/ari_websockets.c:178 ast_ari_websocket_session_write: Problem occurred during websocket write to 127.0.0.1:41590, websocket closed

Le fichier de log xivo_ctid_ng est vide de chez vide et le service xivo-ctid-ng est lancé sans erreur particulière.

un systemctl status xivo-ctid-ng donne ca :

● xivo-ctid-ng.service - xivo-ctid-ng server
   Loaded: loaded (/lib/systemd/system/xivo-ctid-ng.service; enabled; vendor preset: enabled)
   Active: active (running) since Mon 2021-01-18 10:34:48 CET; 13min ago
  Process: 27618 ExecStart=/usr/bin/xivo-ctid-ng (code=exited, status=0/SUCCESS)
  Process: 27614 ExecStartPre=/usr/bin/install -d -o www-data -g www-data /var/run/xivo-ctid-ng (code=exited, status=0/SUCCESS)
 Main PID: 27656 (xivo-ctid-ng)
    Tasks: 30 (limit: 9830)
   CGroup: /system.slice/xivo-ctid-ng.service
           └─27656 /usr/bin/python /usr/bin/xivo-ctid-ng

wazo-service status m’indique que tous les services sont up.

Pour info, c’est un wazo 18.03 qui a une cinquantaine d’utilisateur et recoit une centaine d’appel simultanés, tous en mode SIP de base (pas de WebRTC ni de provisionning) sans aucun BLF. Le CTI de Wazo n’est pas utilisé. Il est hébergé sur un VM très très dimensionnée (14 vCPU, 10 giga de mémoire…dans le doute :wink:

Qqun a une idée de génie ?

Avec une autre info qui vient d’apparaitre

[Jan 18 11:24:37] -- Inactive Stasis app 'callcontrol' missed message

Cela pourrait il avoir un lien avec le nombre maxi de session http (sessionlimit dans http.conf) ?

Je ne vois pas trop pourquoi … A part probablement un bug, est-ce que cela crée un problème à part le log ?

Pourquoi ne pas passer sur wazo-platform qu’on maintient et qui est à jour. On parle d’une version qui a bientôt 3 ans et qu’on ne maintient plus du tout et qu’on ne veut plus vraiment s’en occuper, même dans la communauté.

Tu as 200% raison Sylvain. C’est en cours mais pas encore mis en service…je dois dire que j’ai hâte :wink:

Oui cela crée un problème de lenteur générale alors que tout est particulièrement dimensionné.