About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 24.02.2011
lexus-omsk #
07:12
Повторю своё сообщения для вновь присоединившихся dvolodin и noc-logger:
07:12
После одного из нескольких последних обновлений (r3311-r3312) падает активатор. Такой вот traceback выдаёт: http://pastie.org/1600796
dvolodin #
07:13
забавно
07:13
какая платформа и какая версия python?
lexus-omsk #
07:15
freebsd 7.2, i386
07:16
python 2.6.4 из портов
dvolodin #
07:17
что выдает вот такое
07:18
python
07:18
import socket
07:18
dir(socket)
lexus-omsk #
07:39
выдаёт кучу протоколов типа AF_INET и т.п... могу запостить на pastie.org
dvolodin #
07:45
давай
lexus-omsk #
07:52
http://pastie.org/1601325
dvolodin #
07:54
r3314 попробуй
07:55
а такое
07:55
python
07:55
import select
07:56
dir(select)
lexus-omsk #
08:03
сейчас проверю... activator пока не падает, но влогах смущает [SNMPGetSocket(0x2947806c)] Process/System file table is full - раньше не было вроде такого... 112й тикет как раз об этом?
dvolodin #
08:03
ммм
08:04
сразу же такое высыпает?
lexus-omsk #
08:08
ну не сразу, минуты через 2, позапускал кучу get_config и get_version и потом такое
08:11
http://pastie.org/1601359
Dmitry1 #
08:30
Странно. В портах вроде как python-2.6.6 ?
dvolodin #
08:34
а попробуй в etc/noc.conf в секции main прописать polling_method = poll
Dmitry1 #
08:35
http://www.python.org/download/releases/2.6.6/NEWS.txt
08:35
Искать слова "socket.py"
08:38
Issue #1193577 ?
08:40
Issue #2302: Fix a race condition in SocketServer.BaseServer.shutdown, where the method could block indefinitely if called just before the event loop started running. This also fixes the occasional freezes witnessed in test_httpservers.
08:41
Issue #3890, #8222: Fix recv() and recv_into() on non-blocking SSL sockets. Also, enable the SSL_MODE_AUTO_RETRY flag on SSL sockets, so that blocking reads and writes are always retried by OpenSSL itself.
08:42
Короче - обнови python до 2.6.6
lexus-omsk #
09:29
не, если прописать poll - то опять падает активатор... нужен трейсбэк?
09:30
обновлять пока не пробовал... нормально noc работает на 2.6.6 ?
dvolodin #
09:31
да
09:31
traceback нужен
lexus-omsk #
09:36
http://pastie.org/1601511
Dmitry1 #
11:19
Не знаю ничего. У мена на 8.2-PRERELEASE и Python-2.6.6 работает без проблем
11:20
Чё нужно сделать, чтобы свалился в traceback? Я попробую у себя повторить это.
11:25
Хм. После r3314 тупит на простых скриптах. В traceback не падает, но постоянно перезапускает noc-sae, noc-activator, noc-probe
11:26
После полуминутного "тупления" выдал "Task failed:" без никаких других строчек
lexus-omsk #
11:27
ну так и есть, активатор падает, в логах - traceback... раньше сам падал, после сегодняшнего обновления - падает только если включить метод poll
Dmitry1 #
11:27
В логах traceback нету.
dvolodin #
11:27
там парочки констант не хватает, похоже
11:27
c select нормально работает?
Dmitry1 #
11:28
В логах лаунчера вижу такое:
11:28
2011-02-24 13:21:16,419 Daemon noc-sae[#0] started as PID 77828
11:28
2011-02-24 13:21:16,423 noc-activator[#0] daemon is terminated with status 77825
11:28
2011-02-24 13:21:16,424 noc-probe[#0] daemon is terminated with status 77826
11:28
и так раз 10
dvolodin #
11:29
а в логах демонов?
Dmitry1 #
11:30
В логах демонов только "Started" раз по 10-20
11:31
Это как раз я описывал работу с "select"
11:33
2011-02-24 13:24:00,318 MRT task=600/3448 object=Котляревского 15(10.116.0.30) script=DLink.DxS.get_chassis_id status=running
11:33
2011-02-24 13:24:00,319 script DLink.DxS.get_chassis_id(Котляревского 15)
11:33
2011-02-24 13:26:03,573 Map task 3448 suddently disappeared
11:33
2011-02-24 13:24:00,328 Script DLink.DxS.get_chassis_id(10.116.0.30). Timeout set to 120
11:33
2011-02-24 13:24:00,328 1 script threads (50 max)
11:33
2011-02-24 13:26:00,654 Canceling stale script DLink.DxS.get_chassis_id(10.116.0.30)
11:33
2011-02-24 13:26:00,692 [script-10.116.0.30-DLink.DxS.get_chassis_id] Cancelled
11:33
2011-02-24 13:26:00,692 Script DLink.DxS.get_chassis_id(10.116.0.30) is cancelled
11:33
2011-02-24 13:26:00,692 0 script threads left (50 max)
lexus-omsk #
11:35
у меня с select (вариант по умолчанию?) вроде не падает сейчас, но что-то странные cancelled скрипты - по непонятным мне причинам... но это разбираться надо ещё...
Dmitry1 #
11:36
Вроде "тупление" только на SSH. С telnet все работает нормально
11:38
Подтверждаю. Проблема только с SSH.
dvolodin #
11:40
а старый lib/nbsocket.py попробуйте подложить
Dmitry1 #
11:42
Со старым (до r3311) все работало нормально.
dvolodin #
11:43
подложи старый и попробуй
11:43
если что - буду разницу смотреть
Dmitry1 #
11:49
C r3284 потупил, но отработал
11:54
Даже с r3284 тормозит
12:19
Попробую переставить весь NOC.
dvolodin #
12:23
странно
12:23
проверял на mac os x и linux
12:23
никакой разницы
mmoya #
18:32
what is the url of the hg repo ?
Tweet
Share this page
Share this page: Tweet