About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 10.03.2011
free|wk #
05:06
dvolodin, хай
05:06
я таки подогнал тебе информацию по стале скриптам
05:47
{{instance}} не работает. в конфиге. напрмер вот такая pidfile = /var/log/noc/noc-activator.{{instance}}.pid или я не понимаю ка коно должна работать
05:47
оно превращается в 0
05:47
хотя я ожидаю что в listen_instance
dvolodin #
05:49
все нормально
05:49
instance id задается ключом -i
05:49
[noc-activator]
05:49
enabled = true
05:49
user =
05:49
config.0 = etc/noc-activator.conf
05:49
config.1 = etc/noc-activator.conf
05:50
а в etc/noc-launcher.conf прописывается, сколько istance пускать и с какими конфигами
06:02
free|wk: с последними апдейтами зависший скрипты есть?
free|wk #
06:02
вот как. а я клонировал активаторы. и вписывал их в стартапный скрипт :)
06:02
да
dvolodin #
06:09
на каких скриптах виснет?
free|wk #
06:48
на алкателях в основном :)
06:48
когда гетконфиг
dvolodin #
06:52
уже после того, как снимает конфиг?
free|wk #
06:53
нет. он где то в середине конфига перестает его получать. когда одновременно 3-4 штуки.
06:54
потом алкатель начиает сам раз в 60 секунд кипалайвы слать.
dvolodin #
06:54
сами железки конфиг отдают при этом?
free|wk #
06:54
сессия получается не разывается
dvolodin #
06:55
NOC теряется в середине конфига
06:56
или железка тупо не отдает его?
free|wk #
07:03
железка бы рада его отдать.
07:03
есть подозрение что какая то начинает тупить.
07:03
и отдавать медленно
07:03
это влияет на весь активтор
07:04
он кушает 100% проца
dvolodin #
07:06
и уходит в себя?
free|wk #
07:06
думаю да
07:06
влоге тишина
07:07
я думаю это GIL
dvolodin #
07:07
вряд ли
free|wk #
07:10
тогда я не знаю.
dvolodin #
07:12
на debug-script не проявляется?
free|wk #
07:15
нет
07:15
я не знаю как сделать паралеьный опрос в дебугскрипте
dvolodin #
07:22
может конфиг слишком быстро отдают и не хватает буферов сокетов?
07:22
точнее - ssh может и успевает отработать, а вот PTYSocket - нет
08:10
free|wk: попробуй с r3333
08:10
может в этом дело
free|wk #
08:22
зрительно без изменений
`kk #
08:23
мм... а что за баг? скопипастите сверху плз -)
free|wk #
08:38
да без изменений.
08:38
телнет и ssh сесси не убиты
08:48
все телнет сесси все померли
08:48
а ssh висит. алкатель упорно отдает кипалайв
08:49
сае об окончании задачи доложил
08:50
задания висят. а сае считает что по ним таймаут. cm.config_pull: bsr03, status=UNKNOWN, reason=Timed out
08:53
и вот только теперь умерли ssh сесси
dvolodin #
08:55
может ему -oTCPKeepAlive=no воткнуть?
09:02
поправлю сейчас debug-script, чтобы запускал параллельно несколько скриптов
free|wk #
09:02
так кипалайв шлет не он
09:02
а алкатель
09:02
в итоге сессия поддерживается.
09:03
до 20 минут
09:03
у алкателя это дефолтный параметр. по всей видлимости разный в зависимости от кробки
10:18
блин
10:19
2011-03-10 15:18:41,611 [script-10.245.15.1-DLink.DxS.get_config] Trying to kill already dead thread
10:37
dvolodin, какая то еще диагностика нужны ?
dvolodin #
10:39
сейчас
11:16
free|wk: попробуй накатить r3334
11:16
теперь можно так делать
11:16
python manage.py debug-script get_config obj1 obj2 ... objN
11:17
будет параллельно скрипт выполнять
free|wk #
11:19
ага
11:19
но 3333 получилось не удачным
11:20
http://pastie.org/1655187
11:21
race
11:21
ибо все активторы начинают его убивать
dvolodin #
11:27
еще фикс ушел
free|wk #
11:49
ну. вроде стало лучше. но самоубийства активаторов не прекратились
11:54
эскалироват ьпричину смерти активтора можно ? а то он молча мрет ?
dvolodin #
11:58
мрет или виснет?
11:58
что сейчас вообще творится?
free|wk #
12:03
так
12:42
не удается воспроизвести багу.
Tweet
Share this page
Share this page: Tweet