nocproject.org
04:07
комрады, кто использует proxy?
04:07
noc.conf
04:07
[proxy]
04:07
http_proxy
04:07
https_proxy
04:07
ftp_proxy
04:11
как завернуть апгрейд через прокси?
05:46
dvolodin: привет
05:46
расскажи, плс, можно завернуть апгрейд через прокси
05:48
и
05:48
-exec &> $UPGRADE_PIPE
05:48
+exec > $UPGRADE_PIPE 2>&1
05:48
в 88:upgrade чинит заливку лога в upgrade.log
05:48
(решение подсказал evyscr)
05:49
только при условии, что это bash
05:52
05:52
только исправь чтобы ngnix рестартовал в конце установки
05:52
dvolodin: подскажи про прокси
05:53
TSergey: он должен хавать https_proxy из окружения
05:53
teroni: спасибо, уже неплохо
05:53
dvolodin: порт нужно указывать?
05:54
TSergey: да
05:54
05:54
Я дошел до SA
05:54
dvolodin: из окружения? или из noc.conf?
05:54
новая часть должна быть быстрее и устойчивее текущей реализацииъ
05:54
TSergey: да
05:55
из плохих вещей -- переписана низкоуровневая механика парсинга потоков
05:55
придется перепроверять на всех платформах
05:56
из хороших вещей -- скрипты не будут залипать
05:56
teroni: ты еще попробуй syslogcollector и trapcollector
05:56
проверь, что события в базу упадут и до классификатора дойдут
05:57
я щас попробую на несколько поставить компов
05:57
dvolodin: а можно пример? в окружении есть, но апгрейд не идет
05:58
что у тебя в окружении?
05:58
и еще раз долгий молчаливый деплой на новый комп
05:58
teroni: почему он молчалилвый
05:59
он стримит прогресс ансибла сразу
05:59
10 минут на вебе ни чего не показывет
05:59
что у тебя за браузер?
05:59
а tcpdump'ом посмотри
05:59
последний
05:59
потом пачкой выходит
05:59
ок
05:59
что в браузер летит
06:00
на сафаре он красиво в откно попадает
06:00
и светофор щелкает
06:00
dvolodin: прям upgarde должен понимать proxy?
06:03
dvolodin: нет, он апгрейду не нужен
06:03
его pip хавает
06:05
ну и чего делать-то
06:05
это правильно?
06:05
06:08
да
06:09
сам проверь
06:09
./bin/pip search xxxxx
06:14
./bin/pip search six
06:14
например так
06:29
TSergey: ну вот он у тебя его подхватил
06:47
ну вот исторический момент
06:47
отработал первый скрипт на новой платформе
06:50
отработал неправильно и вообще вернул ошибку :)
06:54
2015-10-22 09:45:17,353 [script] [Vyatta.Vyatta.get_version] [172.16.222.101] Result: {'platform': 'VyOS', 'version': '1.1.6', 'vendor': 'VyOS'}
06:54
2015-10-22 09:45:17,353 [script] [Vyatta.Vyatta.get_version] [172.16.222.101] Complete (5270.63ms)
06:54
где тут ошибка?
06:56
тут может и нет
06:57
но откуда нам знать что это лог с новой платформы
06:57
ни один sa_maptask не пострадал
06:57
и вообще что это лог, а не ты руками набил
06:57
:)
06:57
старый нок такие же логи штампует
06:57
и вообще я набил, а не мой кот :)
06:58
Failed to ping managed object (IP: ). All SA tasks to this object are temporary suspended
06:58
новый нок так же будет писать?
06:58
ты про IP:?
06:59
будь уверен
06:59
это письма alarm #5628756c4a5e68462c4f2e04: Ping Failed
06:59
да, мы все их видели
07:00
07:00
кот глянул код и прифигел
07:01
кот умнее тебя
07:01
бояйся
07:01
ему вас жалко
07:01
он еще маленький, всего 6 кил
07:01
Привет! Может кто знает как почистить macdb?
07:01
чет у него 1 глаз даже вылез
07:03
mrDen1: совсем или выборочно?
07:03
совесм можно коллекцию в монге дропнуть
07:04
бойтесь кота, он накодерит :)
07:04
накотерит, точнее
07:04
может и лучше
07:04
а то нок пока разрабатывался вот так
07:04
07:04
уже нашкодил похоже - судя по довольной морде
07:05
вполне может быть что как раз в процессе он
07:05
bee26: нет, это он попугая разглядывает
07:05
делает вид, что ему неинтересно
07:06
у меня амазон и британец
07:06
"8[12:28] dvolodin: TSergey: ну вот он у тебя его подхватил"
07:06
07:07
на снимке между ними сантиметров сорок
07:09
даже не хочется загадывать, кто кому навешает при случае
07:09
но пока ставим на птицу, он боевитее
07:09
mrDen1: db.noc.macs.remove();
07:09
ну не remove, а drop
07:12
dvolodin: скажи, а прокси, указанный в noc.conf, где-то используется?
07:18
dvolodin: все, работает
07:18
да, использовался некоторыми скриптами
07:18
TSergey: лучше принудительно прописывай /bin/bash в шебанг
07:18
прикол в том, что теперь SA NOC'а можно использовать без самого NOC'а
07:19
и без его базы
07:19
в скриптах башизмов хватает
07:19
просто вытащить репо, прописать конфиг активатору и дергать его по http
07:19
evyscr: это про скрипт upgrade?
07:20
про любой ноковский скрипт, в котором #!/bin/sh
07:21
я не понимаю почему апгрейд через раз работает
07:21
и еще NOC умеет выполнять команды на железках, которых нет в базе
07:21
можно вернуться к идее с discovery объектов
07:22
dvolodin: да мы же знаем, тот нок что у тебя --- он все умеет :) а у нас то коммутаторы не те, то дизайн сети :)
07:22
а я с этим что сделаю?
07:23
это же риторический вопрос? мне-то известен ответ
07:33
добавил в
07:33
07:33
dvolodin: а нод может быть много? на один Envir.....
07:34
teroni: нод должно быть много
07:34
:)
07:34
у меня новые ноды затирают старые
07:35
есть нода 1
07:35
говорю создать новую пишу внутрь фигню.
07:35
сохраняю
07:35
остается только последняя
07:36
или датацентр то-же должен быть новый?
07:37
нет
07:37
она должна просто добавиться
07:37
нетуть
07:37
только одна запись все врея
07:39
хорошо, перепроверю
07:39
а если отрефрешить страницу?
07:40
так как оно периодически дохнет - то постоянно полный рефреш
07:41
хорошо бы кто-нибудь помог подиагностировать
07:41
и поправить
07:41
не успеваю за всем
07:42
тама столько по наворочено....
07:47
да нет, там очент простой JS
07:48
TSergey: эй, ты в kb типа объединил два варианта решения-)
07:48
хватит только /bin/bash
07:53
dvolodin: не понял прикола
07:53
с какого-то момента начал создавать новые записи
07:54
целительная фотка кота
07:54
:)
08:02
Приветсвую всех. После перехода на develop столкнулся с тем, что перестали работать Event Trigger. При наличии хотя бы одного из них классификатор отказывается работать и все ивенты копятся в new.
08:02
С Alarm Trigger вроде всё нормально, но насчет этого не уверен. Кто-нибудь еще с подобным встречался?
08:03
а в failed смотрел?
08:03
в failed не переходят
08:03
в new висят
08:03
странно
08:03
у меня такое только когда проц не справляется
08:03
либо срабатфывает либо в файлед
08:04
в new задерживаются из-за тормозов проца
08:04
тут проблема явно в триггере, без них всё отрабатывает как надо
08:04
а с ними классификатор даже не стартует
08:05
лог идет по кругу - загрузил правила, загрузил триггеры, наткнулся на первый - сдох, начал заново
08:05
тригер без регексов ?
08:05
указание хэндлера в триггерах теперь обязательное?
08:06
проверь регексы. оно через веб сохраняет но потом БД крашится. смотри логипостгреса.
08:06
пробовал разные RE, в том числе просто текст без спецсимволов
08:07
kokozzi:
NOC-1392 может у тебя что то подобное.
08:09
08:10
а трейсбеки не валяются где-нить?
08:15
кто-то в монге отсутствует, походу
08:15
это нок (q)
08:17
Хотел проверить кривой RE через Alarm Trigger с таким же RE - к крашу не приводит. Хотя, возможно ими заведует не классификатор, в этом я не уверен.
08:18
у кого-нибудь есть RE, которое работает в триггере? поставлю для теста
08:29
а в support > crashinfo ничего не сваливается?
08:33
ну тогда совсем грусть печаль
08:34
жди когда к тебе придет dvolodin и скажет что пора ставить башню
08:34
ага, особенно жалко что до перехода на девелоп они прекрасно работали
08:34
а что унутре 'select * from fm_eventtrigger;' ?
08:37
толиещё будет. счас он затестирует у меня башню и пиздарикифанарики.
08:41
охтыжблин, кавычки
08:42
после добавления кавычек вокруг RE крашиться перестало
08:43
раньше не требовало =\
08:45
у меня и без кавычек не падает...
08:45
(пока)
08:47
угу
08:47
без пируля, though
08:48
а тебя не затруднит скинуть какой-нибудь из своих RE для теста?
08:48
je
08:48
оу
08:48
без пируля это через хэндлер?
08:48
безо всего
08:48
нотификейшн груп онли
08:50
эти триггеры рестарта нока не требуют?
08:50
требуют, как я понял
08:51
хм
08:51
опять через тернии к гландам
08:51
не, твой случай воспроизвести не удалось. RE без кавычех, без пируля с нотиф.группой - крашит. всё тоже самое, но с кавычками - работает
08:55
да, всплыло
08:55
#поравалитьснока
08:59
кстати про кавычки, кажется у кого-то это уже всплывало
08:59
evyscr: пора
09:00
а куда
09:00
либо говнонок либо 100500 систем за которыми надо следить
09:00
dvolodin: нода привязывается только к датацентру?
09:00
а сервисы к пулу?
09:04
нода - к ДЦ
09:05
сервис -- если глобальный -- к ноде
09:05
если в пуле -- к ноде и пулу
09:06
ааа точно
09:06
но у меня теперь сервисы не видит пул :-)
09:07
я удалил ноды на которые были галочки для глобала
09:08
ну так переставь галочки
09:08
там табличка с общим итогом есть
09:08
и табличка не пашел
09:08
вообще не нажимается
09:09
environment выбери
09:09
и смотри в js console
09:10
Uncaught TypeError: Cannot read property 'pools' of undefined
09:11
да в консоли
09:11
после выбора сервисы
09:11
уже много раз
09:16
и тут то-же какой-то жуткий однострочный js
09:17
на 1.5 метра..
09:20
evyscr: да-да, валить на микросервисы
09:26
они чудесным образом уберут все баги? hurray!
09:27
Добрый день. После апгрейда нока с default на develop перестали обрабатываться события сислога. Счетчик новых событий увеличивается, а активных 0. Как можно это поправить?
09:27
и сейчас ты скажешь что у тебя используются ивент триггеры
09:27
:)
09:28
смотри noc-classifier.log
09:28
смотрел
09:29
ничего аномального
09:29
на уровне дебаг, вообще не отличается от инфо
09:29
вот что постоянно там повторяется
09:29
2015-10-22 12:28:16,414 [noc-classifier] Using rule lookup solution: noc.fm.classifier.rulelookup.RuleLookup
09:29
2015-10-22 12:28:16,415 [noc-classifier] Loading enumerations
09:29
2015-10-22 12:28:16,423 [noc-classifier] 3 enumerations loaded
09:29
2015-10-22 12:28:16,424 [noc-classifier] Loading rules
09:29
2015-10-22 12:28:16,430 [noc-classifier] 0 cloning rules found
09:29
2015-10-22 12:28:26,309 [noc-classifier] 1060 rules are loaded in the 98 profiles
09:29
2015-10-22 12:28:26,310 [noc-classifier] Loading triggers
09:29
2015-10-22 12:28:32,763 [noc.lib.perf] Stats are disabled
09:30
а если запустить ./scripts/noc-classifier.py -f start
09:30
он так больше пишет
09:30
даже больше чем дебаг
09:30
из под юзера нока только запускай
09:31
а то права на файлы лога побьет
09:31
скорее всего триггеры 2015-10-22 12:28:26,310 [noc-classifier] Loading triggers
09:31
dkul: ну ребутится у тебя классификатор
09:31
во, выдал трайс
09:31
трейс
09:31
su noc -c "./scripts/noc-classifier.py -f start"
09:31
not trusting file /usr/local/noc/.hg/hgrc from untrusted user root, group wheel
09:31
2015-10-22 12:30:09,400 [noc.lib.perf] Stats are disabled
09:31
2015-10-22 12:30:09,401 [noc-classifier] Using rule lookup solution: noc.fm.classifier.rulelookup.RuleLookup
09:31
2015-10-22 12:30:09,402 [noc-classifier] Loading enumerations
09:31
2015-10-22 12:30:09,409 [noc-classifier] 3 enumerations loaded
09:31
2015-10-22 12:30:09,409 [noc-classifier] Loading rules
09:31
2015-10-22 12:30:09,412 [noc-classifier] 0 cloning rules found
09:31
2015-10-22 12:30:17,894 [noc-classifier] 1060 rules are loaded in the 98 profiles
09:31
2015-10-22 12:30:17,894 [noc-classifier] Loading triggers
09:31
2015-10-22 12:30:18,757 [noc-classifier] Trigger 'Refresh Config' for classes:
09:31
Traceback (most recent call last):
09:31
File "./scripts/noc-classifier.py", line 12, in <module>
09:31
Classifier().process_command()
09:31
лол
09:32
а говорил - не триггеры
09:32
как сказал kokozzi - бери Refresh Config в кавычки
09:33
Я его вроде не включал
09:33
спасибо, вырубил, понеслось
09:33
_dhjlt_
09:33
*вроде
09:33
какое удивительное совпадение
09:33
это встроенный
09:33
он просто тебя ждал
09:34
я понял, это была проверка, я ее не прошел :)
09:34
если даже я на develop обновился, то уже точно пора)
09:35
пора что, простите?-)
09:36
пора начинать его форсить)
09:37
а кстати
09:37
этого ивент триггера уже давно нет
09:37
его заменили хендлером
09:37
или какой-то другой ебалой
09:38
я давно и безуспешно пытаюсь понять, что есть хэндлер
09:38
этого никто не знает
09:41
почему-то вспоминается классическое "из говна и палок"
09:43
evyscr: dvolodin же говорил, что каждый пишет свои костыли, а нок это попытка собрать все костыли воедино чтобы не приходилось их каждый раз заново создавать
09:43
единый API для всех костылей
09:44
пиши костыль правильно! :)
09:45
костыль не пишется правильно
09:45
в особенности, в ноке
09:47
если кто-то вдруг сумеет найти текст, в котором написано, как _правильно_ писать костыли для нока - дайте почитать
09:51
да, ещё можно поделиться ссылкой на текст "Debugging NOC"
10:08
это была неудачная шутка
10:12
10:16
10:34
evyscr: помогло, без кавычек в триггере классификатор поднялся
10:38
спасибо
10:39
я не понимаю, почему поднимался с кавычками
10:40
он точно так же должен был вываливать KeyError
10:41
вывод: где-то есть ещё один баг
10:42
вообще, подобный подход с повторной инициализацией внутри except - зло
10:42
нецелевое расходование ресурсов
10:43
(я, конечно же, своровал приём из AlarmTriggers)
10:45
kokozzi: попробуешь ещё один патч?
10:47
такой механизм с try/except раньше был и в EventTrigger
10:47
попробую
10:49
со вторым патчем тоже поднялось
10:50
с первым хоть раз отработало?
10:50
ну и, конечно же, отработало ли хоть раз с кавычками?
10:51
это отдельный вопрос, который я как раз собирался потестировать)
10:52
dvolodin: что-то не правильно работает пункте Services
10:53
не выдает при выбраном пуле сервисы
10:53
обещали же микросервисы - вот их и не видно
10:54
а зачем
10:54
я вот и не хочу их видеть
10:54
я хочу чтобы нок работал
10:55
тяжко жить во время революции и становления
10:55
ты многого хочешь (fxd)
10:55
teroni804: здесь так всегда
10:56
конечно всегда... замахнуться на такую глобальную фигню...
10:56
революция на революции
10:56
не, ну пункт "до основанья мы разрушим" выполняется лишь частично
10:56
нее в украине когда то было нормально..
11:08
evyscr: с последним патчем drop_event отрабатывает нормально
11:08
сейчас попробую вернуть как было и потестить с кавычками
11:16
вариант с кавычками не работает совсем
11:16
вероятно, валится на кавычках в re
11:17
а под это какая-то соломка подстелена без записи в логи
11:18
вернее сам классификатор работает, но триггеры не работают
11:21
а алармтриггеры у тебя есть?
11:22
там по-хорошему тоже надо на if-else переходить
11:26
./noc rpc sae.script 9 get_version
11:26
{u'platform': u'VyOS', u'version': u'1.1.6', u'vendor': u'VyOS'}
11:27
вот так веселее
11:27
:)
11:35
а трабл, что новый МО не дискаверится не пофиксили?
11:36
нет
11:36
всем насрать
11:37
наверное в башне будет пофиксено
11:39
через кнопку save дискаверит
11:50
я думал умеешь запускать дискавери
11:50
жму save и дискаверит
11:50
достало уже
11:51
а как ты жмешь дискаверит?
11:51
скрипт создает - мне нужно нажать кнопку
11:52
а скрипт как создаёт?-)
11:52
я руками завел МО, дискавери назначено на время, которое прошло
11:52
МО сэйвил, профиль сэйвил, ран в дискавери пробовал жать
11:52
похрен
11:52
наверное дизайн подвел
11:53
ну да
11:53
статусы в Wait?
11:54
ну, крути джобы по созданному тобой же топику
11:55
я давно нового не заводил, траблы такой не помню
11:56
да у меня уже вечер, поди до утра отлипнет
11:58
evyscr: у меня из техучета тянется скриптом и обычно я замечаю сильно позже
11:59
скриптами не отлипнет. или ручками скрипт из шела запускать
11:59
bee26: а если после mo.save() сделать mo.apply_discovery()?
11:59
не пробовал
12:00
ща спробую
12:00
хотя вряд ли поможет
12:00
там что-то другое ещё должно быть
12:01
я вот так делаю:
12:01
DiscoveryJob.apply_object_jobs(m)
12:03
какого хера вообще это нужно делать
12:03
это нок, детка
12:03
TSergey: да, так и надо
12:04
развесистое клюквенное дерево
12:04
чота сегодня день хейтеров, btw
12:06
и ведь ещё Dmitry1 не заходил
12:16
хейтерствро - это хорошо, но непродуктивно
12:16
всех забанить (с)
12:16
и калёным железом
12:17
некто at@ любил писать нечто вроде "Мужчинки! Вы пидорасы!" и прикладывать патчи
12:18
так вот, патч у меня есть.
12:20
кто возьмется поддерживать develop до слияния с микросервисами?
12:27
мы сколько-то там месяцев хотим, чтобы пофиксились баги pagerless
12:27
и что вы сделали для пофикшения?
12:28
лично я долго-долго читал доки по extjs
12:28
заводил ряд issue
12:29
несколько месяев кричал о проблеме, которую игнорировали
12:31
ой, ни одного патча от меня никогда не было, конечно.
12:33
evyscr: аларм триггеров нет, могу завести на потестить
12:36
кстати, а в дискавери скрипты из Suspend через какой срок выходят?
12:36
evyscr: ну так я тебе и предлагаю - проверять патчи и накатывать
12:36
я за всем не успеваю
12:38
ну можешь добавить. я там тоже evyscr
12:45
хорошо, добавил
12:45
можешь разгребать pull request'ы и накатывать патчи на develop
12:45
пидранутый рхел блять.
12:46
какого хера создавать виртуалку 32 битную если хост 64 битный изачальна
12:46
блять
12:47
я бы понял возмущения об обратном, но 32 бита временами очень даже нужны
12:48
по дефолту карл!!! по дефолту
12:49
и что, фридрих?
12:49
32 < 64
12:51
а то что ты пихаешь туда 64 битную виртуалку и она не стартует и не видно изза чего .
12:51
потому что стоит quiet
12:57
всё. всем пиздетц. я сделал виртуалку для тестов башни с микросервисами
12:59
БЕГИТЕГЛУПЦЫЫЫЫЫ!!!! (С)
12:59
один послушался
13:33
kokozzi: у функции должен быть один параметр -- event
13:35
kokozzi: а без патча прикидывалось рабочим?
13:35
evyscr: да вот хз, без патча не тестил, сейчас буду посмотреть
13:35
коррелятор вообще как-то тухло дебажится, инфы отдает очень мало
13:36
нок - это боль (q)
13:38
kokozzi: учти ещё, что в случае, например, алярма ping failed, нок благополучно теряет event
13:38
оный объявится только при появлении stop_event
13:38
я на Chassis | PSU | PSU Failed навесил drop_event
13:38
хотя
13:38
может это было неправильно как раз
13:39
если есть start_event/stop_event - есть шансы словить фигню
13:39
попробую без пируля
13:40
аларм приходит раз в час, такой вялотекущий дебаг получается)
13:44
положи свич на стол
13:44
и отрывай ему порты
13:49
зачем дропать отказ блоков питания?
13:49
я вообще поймал какую-то магию. есть ивент - Config | Config Changed. в ивент триггере для него стоит правило обновлять конфиг железки. он не работает. в тоже время, есть ивент Config | Config Corrected - для него триггера нет, но по нему конфиг обновляется.
13:49
более того, для этого самого второго типа ивентов до апгрейда был написан обновляющий конфиг триггер, который я удалил еще утром
13:50
т.е. удаленный триггер работает, а вновь созданный - нет
13:50
стукнись завтра во второй половине дня в приват, может подскажу чего
13:50
сейчас занят
13:50
хорошо, если ничего не придумаем стукну
14:33
evyscr: с патчем без пируля вроде как отработало
14:33
по крайней мере в логах чисто
14:34
в трейс ничего не упало
14:38
вероятнее всего проблема была в несовместимости аларма и пируля drop_event
Share this page
Share this page: