nocproject.org
11:36
dvolodin, в Cisco.IOS get_spanning_tree надо кусочек подправить - если в MST не указано имя конфигурации(а технически на циске такое возможно) - скрипт валится в трейс. Банально добавить if match по отношению к переменной region надо.
11:36
я уже закоммитил это
11:36
поправил регулярку
11:37
ага, увидел. Я просто вчера ночью обновлялся и заметил
11:38
ллдп кстати ищет на ура
11:38
попингуйка работает?
11:38
на ежах вчера затестил
11:38
пинг не глядел
11:38
я еще набросок для отчета по доступности закоммитил
11:38
видел в репо, ага..
11:39
теперь надо эту часть отлаживать
11:40
нифига
11:40
на ежах падает ллдп
11:40
и глючит
11:40
(разумеется, я использую port security)
12:33
ufir, пришли уже трейс на почту
12:33
я ж не телепат лечить по тырнету)
13:38
чета активаторы валятся
13:38
2013-01-26 17:43:17,502 noc-activator[#4] daemon is terminated with status 1
14:33
а кто знает - у нас так и не разрешили 5ГГц диапазон 802.11n к использованию?
15:12
dvolodin, я там issue накидал, в том числе про пинговалку. а еще по поводу репорта, я не знаю, ты не видел или тебе не понравилось мое предложение но есть такое
NOC-639
15:13
_4ePTeHok: да у нас и на 2.4 фиг разрешение получишь
15:13
проще плюнуть и уйти на 70Ghz
15:14
zi_home: там фокус именно в том, что оно пробует пинговать недоступную железку?
15:15
dvolodin, два раза закончилось именно на этом, могу еще раз проверить если хочешь
15:16
и после этого попингуйка дохнет?
15:16
dvolodin, да начинается молчание, ждал где-то минуту, ничего не менялось
15:17
они в том же сегменте?
15:17
в ответ host unreachable прилетает?
15:17
да вроде нет
15:18
как есть dump так я его и выложил
15:18
во первых, пингуются лупбеки
15:18
во вторых эти железки еще никогда не были установлены
15:19
unreach не будет, нет маршрута, уйдет по дефолту (в аплинк)
15:20
вот это сильно странно, я проверял
15:21
exception'ов в логах активаторов не видно было?
15:21
нет, я даже грепнул все логи
15:21
ни у активаторов ни у кого-то еще ничего не было
15:22
dvolodin, ты на что проверял? на недоступные железки или на отсыхание по таймауту?
15:23
на отсыхание по таймауту на недоступных железках
15:23
может то что все заканчивается на железке которая не отвечает это лишь следствие чего-то другого
15:25
можно было бы конечно попробовать проверить будет ли он отсыхать если у меня все МО будут доступны, но это надо с десяток железок из нока выпилить
15:26
да нет, надо разбираться
15:26
активатор не отлетает от SAE?
15:28
нет
15:28
по крайне мере в логах про это ни слова
15:28
конфиги и прочие задачи продолжают выполняться
15:29
надо ловить, на чем дохнет
15:29
dvolodin, ты говоришь что проверял, ты хочешь сказать что на твоей инсталляции это не воспроизводится?
15:35
не воспроизводилось
15:38
странно, интересно как дела у отсальных
15:40
подскажите, как отучить noc ломится на D-Link 3010G c get_lldp_neighbors? ведь он LLDP не подддерживает. Профиль выставлен DxS
15:40
sa > setup > object profiles
15:44
да не, у меня indoor wifi надо развернуть, универ один в перди накрыть
15:44
тоже могут настучать по башке за 5ГГц,)
15:46
zi_home: закоммитил ./scripts/ping_test
15:46
запускать от рута
15:46
попробуй разные адреса попринговать
15:46
можно несколько сразу
15:47
_4ePTeHok, а ты обновлялся? у тебя с новой пинговалкой проблем нет?
15:47
dvolodin, синтаксис какой? название мо примет или нужен адрес?
15:47
просто запускай
15:47
и в ответ на пропт забивай адреса
15:48
> ./scripts/ping_test.py
15:48
Running socket factory
15:48
READY
15:48
IP> 127.0.0.1
15:48
IP> % RESULT: 127.0.0.1 [0.0001900196075439453, 0.00010395050048828125, 9.584426879882812e-05]
15:48
%% STOP
15:48
понял, сколько запускать?
15:50
надо попробовать закономерности отловить
15:50
чтобы оно либо совсем не ответило, либо exeption вывалился
15:51
а кстати
15:51
уж не замочило ли оно его как stale socket?
15:51
ммм, не знаю, как узнать?
15:52
вбил адрес железки на которой прекратлся один из экспериментов, нормально отработало
15:52
[None, None, None]
15:54
попробую сейчас 2-3 минуты прождать
15:54
я там косметический фикс еще накатил
15:55
3 минуты с какого момента?
15:55
уже больше 3-х прошло
15:55
или мне обновиться и опять наблюдать как работает система?
15:56
между пингами
15:56
нет, не оно это
15:57
попробуй дебаг на активаторе врубить
15:57
поллинг какой?
15:57
kevent
15:58
запустил активатор -f ыефке
15:58
*start
15:59
2 минуты, время пошло
16:00
у меня два дня пингуется
16:02
все закончилось на
16:02
2013-01-26 20:06:14,196 <Ping4Socket(0x804e44350, )> set_status: -WRITE
16:02
2013-01-26 20:06:15,197 <Ping4Socket(0x804e44350, )> set_status: +WRITE
16:02
2013-01-26 20:06:15,197 <Ping4Socket(0x804e44350, )> set_status: -WRITE
16:02
ну нормально, отписали
16:02
но таких сообщений и во время работы вагон
16:03
пакет системе отдали, больше писать нечего
16:03
-WRITE это хорошо
16:03
и все, больше не пингуем?
16:03
а потом просто тишина наступает, он продолжает выполнять другие задачи
16:03
всякие get_version и прочее
16:09
но та как ты не говоришь что "нашел почему это происходит", я делаю вывод что радоваться рано
16:11
попробуй с патчиком
16:14
вдруг это оно
16:14
r7455
16:17
dvolodin, 5 минут, полет нормальный
16:19
похоже на то
16:19
7 минут, все в порядке
16:20
странно, если это бага в системе, почему у тебя не проявилось
16:21
разбираюсь, просто на той площадке, где тестировал, свичи просто так не падают
16:21
зато у меня зашибись как падают
16:22
ufir: апдейться
16:22
и смотрите availability report
16:22
правда, я не уверен, что он правильно считает :)
16:23
dvolodin, посмотри в
NOC-639, потому что в репорте меня смущают пара моментов, например железка ни разу еще даже не смонтирована, а ей в репорте 100% забабахали
16:23
может все же почините интерфейсы для браса хуавей ? ;)
16:24
ufir: я не смотрел еще
16:24
там валится на том, что распарсить не может, или тупо не парсит?
16:25
валится там все...
16:25
а парсит он только л3 интерфейсы
16:25
zi_home: это примерно то же, только с фильтрами
16:25
может скрипт фигеет от нескольких тысяч сабов..
16:26
ерунда
16:26
он не фигеет от конфига алика 7450
16:27
zi_home: попингуйка держится?
16:27
dvolodin, ну тут вариантов не много, а просто пытался описать детали, а у тебя просто первая версия, где детали еще не учитываются, будет неплохо если учтешь предложения описанные в issue
16:27
dvolodin? 14 vbyen? ,tp bpvtytybq? dct jr
16:27
dvolodin может тогда я пришлю на beef@ - посмотрите ?
16:28
ufir: шли, постараюсь посмотреть
16:29
мне вот интересно, сколько инсталляций NOC в РТ :)
16:30
у меня в Марий Эл - одна :)
16:30
все с подачи человека с ником _4ePTeHok
16:30
а у меня в Москве - ни одной :)
16:31
интересно, что мешает сделать одну инсталляцию и разграничить права
16:31
я вяло разбираюсь в питоне, очень плохо - просто ужасно в ноке - это документация
16:31
zi_home: принятая практика - делать такие вещи в масштабах МРФ
16:32
самая клюква, которая наиболее популярна - это несомненно FM
16:32
по моему ипам больше рулит
16:32
мои хуавеи шлют килотонны трапов, а как их всех "УЗНАТЬ" - я хз
16:33
IPAM врезапно оккупировал Индонезию
16:33
так и валяются как unknown
16:33
ufir: было видео как правила классификации делать
16:33
и в VC у меня пропали все интерфейсы
16:33
виланы есть - а интерфейсы ВСЕ - пустые
16:33
привезку железок к vc domain проверь
16:34
dvolodin а это в каком меню ?
16:34
ufir, начни хотя бы issue с трапами делать, когда научишься правила рисовать, приложишь их к своим же issue
16:34
zi_home я уже чоткий юзер, я уже одно issue делал ;)
16:35
правда егор закрыли за 20 минут
16:35
\его
16:36
у меня сейчас 88 открытых
16:36
и неизвестное число уже закрытых
16:37
ты выиграл
16:37
зато у меня в датакоме хуавея 21 кейс ;)
16:37
правда все закрытые уже
16:37
нашел, в багтрекетре всего 159 моих issue
16:37
ufir: поправил этот кусок
16:38
из 900
16:42
ufir, у часто в китайщине баги ловите?
16:43
zi_home d gthdjt dhtvz pfgecrf? z 'njve Ntgkjde yf eib rbgznjr kbk gjcnjzyyj
16:43
блин
16:43
вообщем - вначале было всё плохо
18:37
zi_home: попингуйке полегчало?
18:38
dvolodin, без изменений, все работает
18:39
в плане - работает, или так же дохнет
18:40
пинги идут
18:40
все работает
18:40
отлично
18:40
надо собирать список улучшений для попингуйки
18:42
dvolodin, полечи сначала чтобы он при рестарте активатора не переоткрывал алармы
18:57
я удалил все ивенты-алармы
18:57
а база монги все осталась такая же в 60гб
19:05
ты наверняка только активные стер. или вообще все?
19:17
ufir: db.repairDatabase()
19:18
и compact collection
19:19
zi_home: алармы он переоктрывает абсолютно правильно
19:19
нужен либо механизм гашения алармов при плановых работах
19:20
либо можно просто приоритет этих алармов сбрасывать до 0
19:23
ну моет быть правильно, только неудобно
19:24
желеок на сети нет и когда они появятся, тоже не ясно, а алармы висят
19:31
или как предполагается работа при добавлении новых устройств?
19:32
рестарт активатора, вообще говоря, не штатная ситуация, но пока что происходит довольно часто, при каждом обновлении
19:37
is_managed на них снять можно
19:40
и не забыть обратно повесить
19:44
dvolodin, по поводу плюшек пинговалки, может прикрутить к енй пробу чтобы можно было сайты пинговать и следить за задержкой
19:44
это не в ней
19:44
в пробе будет тот же ping socket
19:44
и еще ты не сделал возможность отключения
19:44
ping_instance = -1
19:44
или ping_instance = off
19:45
не вижу пояняющих комментариев в доке
19:45
нет, я серьезно, кто бы догадался
19:46
оно не планировалось :)
19:46
но ты выяснил эмпирическим путем
19:47
не планировалось отключение? как интересно, и в чем логика таких планов?
19:49
не суть важно
19:49
доку писать надо, но я понятия не имею, кто будет это делать
19:50
в доке многое надо писать, но ты хотя бы когда вводишь новые переменные в конфиг, добавляй их доку
19:56
dvolodin, можно даже делать так, когда тебя спрашивают что значит тот или этот параметр, писать ответ в доке, а не в чате, а чат отсылать в доку, пользы больше будет
Share this page
Share this page: