nocproject.org
05:27
dvolodin, ты говорил что пробу можно как активатор, несколькими строками в конфиге лаунчера настрогать инстансов. ни фига, это не работает
05:28
zi_rus: почему не работает?
05:29
dvolodin, ты такие интимные вопросы задаешь. чтоб я знал почему
05:29
вот лаунчера конфиг [noc-probe]
05:29
enabled = true
05:29
user = noc
05:29
group =
05:29
config.0 = etc/noc-probe.conf
05:29
config.1 = etc/noc-probe.conf
05:29
config.2 = etc/noc-probe.conf
05:29
config.3 = etc/noc-probe.conf
05:29
ну
05:29
а выход?
05:29
4 процесса запущено?
05:29
root@noc:/home/iz # ps aux | grep probe
05:29
noc 4145 0.0 0.2 259032 36404 ?? S 9:44PM 14:33.28 /opt/noc/bin/python ./scripts/noc-probe.py launch -c etc/noc-probe.conf -i 0 (python2.7)
05:29
root 10454 0.0 0.0 16332 1936 0 S+ 9:32AM 0:00.00 grep probe
05:29
один процесс
05:32
хм, посмотрю попозже
05:49
05:49
новая инсталляция
05:49
ничего еще не ломал
05:49
а whois уже не работает
05:50
update whois cache не обновляет
05:51
есть такой индекс уже
05:51
дропни его
05:52
не только у zi_rus такая грабля
05:52
у меня тоже такое есть.
05:52
но для другой коллекции
05:52
commands котоаря
05:53
удаленный классифкатор на неепостомянно ругается
05:53
да, я понял
05:53
это из-за TTL indexes
05:53
старая монга их криво создавала
05:53
да видимо так
05:53
дропнуть все индексы ?
05:54
нет, не все
05:54
а на которые ругается
05:54
надо их выловить и подропать в миграции
05:55
dvolodin, а причем здесь старая? у меня новая инсталляция, монга сразу 2,6,4. после установки проблема сразу появилась
06:03
я говорю, mongoengine криво делала ttl индексы
06:05
бонжур! а кто нить обновлялся с текущего develop на future/graphite?
06:08
вот давай без извращений в понедельник
06:09
да ладно
06:09
я обновлялся
06:09
норм все
06:09
только в графите делать нечего
06:10
тююю, то в пятницу ничего не делаем, теперь и в понедельник )))
06:10
zi_rus: понял - не буду пробовать
06:15
Kostua, ну ты же знаешь, в понедельник отходим от выходных, в среду работаем, а в пятницу готовимся к выходным
06:19
06:19
оказывается я его написал
06:19
а в апстрим не отправил
06:19
скрипт рабочий
06:19
даже линки у меня находил
06:22
так а вот по линкам
06:22
чего оно перестало определять линки по lldp в эджкорах?
06:22
всё ж работало
06:23
я видел комиты чинили это в цисковском профиле
06:35
эджкор с эждкором или как?
06:37
evyscr: да, эджкора с эджкорой одиноковых моделей даже
06:37
3528M
06:39
ну ты знаешь - смотришь на обоих концах lldp, смотришь debug-script опять же на обоих концах
06:42
e_zombie, Управление Неуправляемые
06:42
что там эксплуатировать
06:42
неуправляемое.
06:44
06:54
evyscr: ./noc debug-script get_lldp_neighbors на двух концах нормально отрабатывает, друг друга они видят
06:55
что подтверждает и линкует два устройства в инвентори?
06:56
Kostua: начти отладку с get_chassis_id
06:56
ну и log_jobs включи, чтобы логи видеть
07:02
" ./noc debug-script get_lldp_neighbors на двух концах нормально отрабатывает, друг друга они видят"
07:02
у меня такого добра (на длинках) наваом, а дискавери не коммитит линки
07:03
*навалом
07:06
dvolodin: get_chassis_id отрабатывает нормально, у меня в продакшене между этими устройствами линки оперделеяет, но там стоит девелоп еще за апрель кажись, а на тестовом с последним девелопом нивкакую
07:07
так что я грешу не на скрипты в профиле, а что то в кишочках инвентори поламалось
07:11
TSergey: фикси чо-нить-)
07:12
в таком виде они и не закоммитятся
07:13
evyscr: в смысле фикси?
07:13
ошибку пока найти не могу
07:13
профиль один и тот-же
07:14
почему с обеих сторон кандидат находится, но не комистится, так и не понимаю
07:14
*не комитится
07:15
ага
07:15
но это же уже кучу раз правили?
07:16
имя этим багам - легион
07:17
как обычно, sh lldp rem, debug-script с обеих сторон
07:18
evyscr: ну так видят они по lldp
07:18
скрипт отрабатывает без ошибок и выдает результат
07:18
Kostua: ваши слова не значат ничего. Логи, пасты, ещё раз логи и пасты
07:20
"скрипт отрабатывает без ошибок" так весь стопор в том, как lldp-discovery отрабатывает данные
07:21
evyscr: может уже начать компанию за то, что бы стандартизировать выдачу портов в get_lldp_neighbors?
07:30
evyscr: причесать 1/25 -> 25, 1:25 -> 25, Gi0/11 -> Gi0 11
07:39
галочки выделить все не хватает
07:40
у меня 600 железок
07:40
еще терпимо
07:40
а каково e_zombie с тыщами
07:40
угу.
07:40
и бляди сетевики забили на добавление в бд новых хостов со стройки.
07:40
пидорасы.
07:41
автодискавери надо прикручивать
07:41
на самом деле это действительно удобно
07:41
одни забивают, другие забывают
07:42
"zi_rus: галочки выделить все не хватает"
07:42
+1
07:43
и поиска по platform
07:43
TSergey: ну а как ты будешь стандартизировать стековые порты?
07:44
да, а сейчас этой проблемой прям пронизан нок, с ходу режется "1:"
07:44
Я, честно говоря, начал в своё время патчить на предмет доставания local port id из sh lldp local_ports, но потом выцепил корень своей проблемы и забил.
07:45
У тебя же, вполне вероятно, в очередной раз какой-нить хак сработал.
07:45
freeseacher, а ты понял что надо дропнуть чтобы захорошело по проблеме с индексами? а то у меня еще при asset discovery такая же фигня вылезает
07:45
у меня, к сожалению, нет стэковых, не могу ответить как бы их стандартизировать
07:46
но то, что get_lldp_neighbors выдает 1\27, ну точно неправильно
07:46
ну хотя бы в 1:27 переводить
07:47
zi_rus, хз
07:47
я пока не занимался
07:51
бугага
07:51
нашел абонента, у которого на порту 1.4 миллиона CRC
07:51
у него небось телеко нормально показывает, инет не тупит
07:54
народ чего не так
07:54
07:54
get_ip_discovery в IOSXR профиле
07:54
в словаре нет ключа DELETE
07:55
вот у тебя маппинг и не работает, ругается Key error
07:55
mikevlz|2: гыгыгыгы. у меня счас отчёты кадждый день строятся. есть хлопцы с серьёзными проблемами.
07:56
e_zombie: чем собираешь?
07:56
mikevlz|2, точно, вижу
07:56
Dmitry1, ты тут?
07:56
поправь пожалуйста
07:56
mikevlz|2: через cli-command
07:56
e_zombie: в смысле - ноком?
07:56
да
07:56
ежедневно утром.
07:56
а то может еще что придумано и украдено
07:57
fsw-8-3moskovproezd-5-35-sar 1/12 1682763 0
07:57
fsw-2-tarhova-41-32-sar 1/24 697418 0
07:57
fsw-2-2magnitnyjprd-5-64-sar 1/24 539816 0
07:57
fsw2-4-zarubina-84-27-sar 1/4 144398 0
07:57
а зачем кли-комманд?
07:57
asw2-35-sar GigabitEthernet0/0/23 6045 0 asw2-367-sar GigabitEthernet0/0/20 930 0 asw2-385-sar GigabitEthernet0/0/22 724 0 asw2-27-sar GigabitEthernet0/0/17 341 0
07:57
asw2-35-sar GigabitEthernet0/0/23 6045 0
07:57
asw2-367-sar GigabitEthernet0/0/20 930 0
07:57
asw2-385-sar GigabitEthernet0/0/22 724 0
07:57
asw2-27-sar GigabitEthernet0/0/17 341 0
07:57
потому что я на питоне не програмлю
07:57
эээээ?
07:57
ну get_snmp_getnext ?
07:58
есть такой скрипт. Опросит все дерево RMON MIB CRC, вернет тебе список со списками =)
07:58
это быстрее, чем телнетом лазить
08:00
e_zombie: хорошая шутка =)
08:00
удалился.
08:00
жаль.
08:01
снмп говоришь. если бы оно было настроено в ноке.
08:01
и для всех железок работает?
08:01
для тех, которые умеют
08:01
и снмп и rmon mib
08:01
на длинках его включать приходилось
08:01
когда-то
08:01
ща не знаю
08:01
интересная идея.
08:02
достойна статьи "лучшие кулинарные рецепты"
08:03
e_zombie: картинка - это тебе зарплату выдали?
08:04
но я всё равно не представляю как это на уровне нока это сделать.
08:04
зарплата да ..... хорошо что не так.
08:04
знакомая сфоткала за кордоном
08:04
Всем радости и счастья
08:05
я у вас спроить хотел, вдруг кто трогал. 15-й ios на l3-свитчах лицензии крякали?
08:06
фуууу как не опенсорсно
08:06
Что купили, то и шатаем
08:06
e_zombie: это про циску?
08:08
Про циску, да. Там не совсем кряк, там с лицензиями мне не ясно.
08:11
08:12
проблема следующая: не детектятся линки по lldp
08:17
Kostua: ты логи job'а смотри
08:17
Kostua: а в SA\MO\Edit\Discovery lldp_discovery чего пишется?
08:19
dvolodin, ну что, проба проде пробает, что дальше? графики будут?
08:19
уже 227585K данных набралось
08:21
TSergey: пишет wait сосотояние
08:21
не, справа у тебя есть текст? настроено логирование?
08:22
так вот насчет логирования по подробнее
08:22
где его включиьт?
08:22
включить
08:22
noc.discovery
08:22
log_jobs=/srv/noc/jobs
08:23
у меня так
08:23
куда-то к логам, короче
08:23
а так он уже включен
08:24
прописано log_jobs = /tmp/jobs но фаил не создается
08:24
и loglevel = debug
08:27
может с правами что-то? файло обязательно там должно быть, с нулевым размером как минимум
08:27
у меня loglevel=info
08:28
ну и на всякий случай --- в noc.conf [lldp_discovery] enabled = true?
08:31
dvolodin: научи, где искать object.profile.convert_interface_name(port) из
08:31
noc / inv / discovery / jobs / lldp_discovery.py / get_remote_port_by_name
08:31
в __init__.py профиля объекта такой функции нет
08:32
значит в базовых классах есть
08:32
это в scripts?
08:34
dvolodin: тут есть noc / sa / profiles / __init__.py
08:36
и если я правильно понимаю, то это псевдо-конвертация:
08:36
# Dumb translation
08:36
def convert_interface_name(self, s):
08:36
return s
08:37
и видимо такую функцию можно зафигачить ниже, в __init__.py в профиле?
08:37
TSergey: это искать не хочешь ты
08:39
может и так, но начиная с noc / sa / profiles / DLink / DxS / и вверх, такая функция впервые находится в noc / sa / profiles / __init__.py
08:39
и там она ничего не конвертит
08:40
И?
08:40
типа, в более других профилях её овердоадят, видимо
08:40
*оверлоадят
08:41
мне нужен конкретный профиль, DxS, и увидеть, кто переделывает 1/27 для DxS
08:41
и видимо никто
08:42
grep -r "def convert_interface_name" sa/
08:42
Dmitry1: все в скриптах для lldp пытался конверсию сделать
08:42
TSergey: посмотри еще get_interface_names
08:42
а там её по большей части не надо, btw
08:43
dvolodin, почему в алармах Timestamp: 2014-09-15T14:21:57+02:30 - такая таймзона? должно быть уж или +0 или +4, но не 2:30
08:44
ну а кто кроме
08:44
ну нет в системе настроек на два часа
08:44
dvolodin: погоди
08:44
в lldp_discovery.py дергается get_lldp_neighbors или нет?
08:47
да, get_interface_names режется "1\" и "1:"
08:49
e_zombie подтвердит, тоже страдает
08:51
dvolodin: в каких случаях дергается get_interface_names, а в каких get_remote_port_by_local? get_interface_names используется только во втором случае
09:03
TSergey: вот я лох! ты был прав - noc.conf [lldp_discovery] enabled = false facepalm.jpg
09:15
Kostua: ну вот, теперь дело пойдет
09:16
уже все залинковалось
09:44
Dmitry1: привет
09:44
в каких случаях дергается get_interface_names, а в каких get_remote_port_by_local? get_interface_names используется только во втором случае
09:45
у меня не линкуется пара коммутаторов на профиле DxS
09:46
покажи вывод обоих debug-script
10:01
Dmitry1: раз уж речь за DxS/get_lldp_neighbor.py, насколько осмысленно оставлять там дёртихаки ремоут порт дескрипшна и ремоут порт мака при наличии вроде как работающих соответствующих методов в lldp_discovery.py?
10:08
TSergey: у тебя две беды, похоже
10:08
какие?
10:08
Dmitry1: и посмотри
NOC-1442, там совсем мелочь
10:08
а ещё ты самое вкусное не приложил
10:09
evyscr: говори, ща добавлю
10:09
sh lldp r?
10:09
а именно - результаты работы get_lldp_neighbors
10:09
которые уже в json
10:10
nmae
10:10
это я слепой
10:11
в обчем, первую беду мы уже однажды фиксили - обрабатывается дескрипшн вместо мака
10:11
как ты смотришь json? чем форматируешь?
10:13
evyscr: да, запросто я снес те изменения, я разок полностью скрипты перезаливал
10:14
форматирую - глазками
10:15
а в
NOC-1442 лучше бы использовать "\n\s*\n\s*Port ID\s+:\s+"
10:17
10:18
evyscr: почему это? "\n\s*\n\s*Port ID\s+:\s+"
10:18
Но не факт, что его хватит в данном случае
10:19
evyscr: посмотри приложенный файл
10:19
А я, кажись, где-то наткнулся, что и предыдущая строка может пробелы содержать
10:19
я попроверял, мои DGS3100 даже линковаться после этого стали
10:19
Все ли?
10:20
Я по твоим данным гонял, у меня часть не разделялась нормально
10:20
по моему все
10:20
ща сделаю тэг, гляну
10:22
Dmitry1, в интерфейсе ipv6 neighbor нет статуса delete. или надо в интерфейс добавить или delete ассоциировать с уже существующим, incomplete например
10:23
evyscr: ну с нулевым линком ни одного DGS-3100 нет
10:24
Хм, а в интерфейсе нока не сделали ещё возможность копирования? Например, копирование мака со страницы MacDB?
10:24
из грида копируется без пробем
10:25
А уже из мак-хистори?
10:25
а хз :) я ни разу ее не видел
10:25
evyscr: только с циской есть незакомиченные линки
10:29
10:29
проба трейсится
10:34
evyscr: я поставил JSONView chrome, половчее смотреть
11:05
народ. фм кто-нибудь пользуется?
11:05
какой-то дико странный глюк
11:06
не приходят письма по авариям link down
11:06
по остальным все норм
11:06
бред какой-то
11:06
алармы в ноке поднимаются
11:06
и даже письма по закрытию алармов приходят
11:07
а вот открытие аларма линк даун нок не считает нужным оповещать
11:07
нужен хоть кто-нибудь на ветке графит
11:07
и с работающим фм
11:07
это явно не мой баг
11:07
на старом сервере было так
11:08
переехоал на новый, таже херня
11:58
у тебя задержка отправки сообщений для алармов не стоит?
12:05
dvolodin, нет никакой задержки. по крайней мере сознательно не ставил. ладно бы вообще криво работало, но почему только по одному классу???????
12:05
остальные приходят нормально
12:05
пинги
12:05
eigrp
12:05
pim
12:05
mpls
12:05
все прилетает сразу
12:06
а пот линк даун вообще не приходит
12:06
только закрывающий
12:07
блин
12:07
оживить бы нок
12:07
до рабочего состояния и заморозить
12:07
как уже достали баги
12:08
то вам фичей не хватает, то багов
12:09
багов хватает, но ты фичами поломал вообще все
12:09
нок тормозит
12:09
половина процессов тресит
12:09
фм не работает
12:10
в интерфейсе еще 100500 мелких багов
12:10
пока оживлял сегодня нок, потенциально нашел ещенесколько
12:11
напримересли уже развернутому профилу поменять тип, с Raise alarm на log
12:11
он похоже не отрабатывает
12:13
dvolodin, почини нок, а тебе машину под CDN нарисую
12:15
e_zombie, это что за выражение глаз?
12:18
да устал я сильно душевно от всяких мелких недоделок.
12:18
опять гонка за новым функционалом в ущерб всего остального.
12:19
e_zombie, нужна гонка за всем остальным в ущерб функционалу
12:19
не совсем. ну есть же море багов мелких которые надо просто взять и планомерно вычистить. чтобы работало.
12:20
12:20
есть
12:20
нужно
12:20
но...
12:21
раз два месяца можно посвятить фиксам.
12:21
пользователь спасибо скажет.
12:22
я же не прошу вот такое фиксить
NOC-1380
12:23
e_zombie, если ты запостил баг, ты уже просишь его пофиксить. тем более ставишь критический приоритет
12:23
12:24
ну и у нас как происходит. начинаем вычищать такие мелкие - встревает ктонить со своими глобальными пиздецами и процесс чистки прекращается.
12:25
в результате и баги не зачищены и нихера не работает то что прервало процесс
12:25
это да
12:25
кто бы мелочь разобрал
12:26
пулл реквестов наделал
12:29
а потом кто будет тестировать что всё работает?
12:49
те, кто регулярно апдейтится
12:49
кто же еще?
12:52
кэп намекает что коммиты лучше тестить сразу пока коммиттер онлайн
12:56
кэп намекает, что нужно не только потреблять, но и производить Ж)
12:58
мы производим углекислый газ
12:58
2 литра в секнду
13:00
что кроме углекислого могу - то ои произвожу.
13:01
даже кривых моделей наделал.
13:01
и потеститировать под нагрузкой могу.
13:03
dvolodin, ты видишь, тут 39 человек из qa отдела, мы готовы производить тесты
13:03
хотя если выкинуть еще freeseacher, будет 38
13:04
но это уже нюансы подсчета
13:09
отлично
13:09
давайте разобъем вас пополам
13:09
половина будет фиксить баги, половина - тестить
13:09
qa фиксит баги? новый подход в управлении однако
13:11
Достаточно не вводить новые фичи, а закрыть текущие баги. Причём не говоря, что "этот модуль вообще переделаю и он будет в N раз лучше, но не совместим ни с чем, да."
13:11
и не факт что заработает
13:11
а если заработает, что не будет стоять раком
13:12
dvolodin, пофикси багу с уведомлением по авариям link down. реально хуйня какая-то
13:21
dvolodin: эта... а как посчитать процент успешных задач в reduce или после get_result?
13:37
уже посчитал
14:56
Dmitry1, ты тут?
14:57
GLEAN - еще один тип для ipv6
15:00
тоже инкомплит надо
15:13
живые есть?
15:13
после переезда на новый нок
15:13
SNMP Authentication Failure for 8.8.8.8
15:14
это гугл шалит, или еще один глюк новой инсталляции
16:23
16:35
возможно, нужно разбираться
16:38
(
16:42
это в логах коррелятора постоянно валится
16:54
кто-нибудь W-IX пользует?
Share this page
Share this page: