About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 13.06.2013
freeseacher #
05:02
господа, а как длинные регулярки к pep8 приводить ?
05:19
dvolodin, хай
05:19
а как в get_arp врф то отдавать ?
dvolodin #
05:21
параметром
freeseacher #
05:21
в словаре ?
dvolodin #
05:22
смотря откуда отдать хочешь
05:22
:)
freeseacher #
05:23
ну что бы записи о хостах в IPAM создались в нужных vrf
05:23
посмотрел cisco ios и juniper не понимаю как там get_arp отдает инфу о Vrf-е
dvolodin #
05:26
его доработать, наверное, надо
05:26
он сейчас принимает на вход VRF и не отдает его в результате
05:27
а надо бы добавить на выходе поле VRF
05:27
чтобы махом дернуть все
freeseacher #
05:34
ладно оставим это пока
05:34
я думал может я чего не так делаю
zi_rus #
05:37
dvolodin, а можешь алиасы для команд в консоли сделать чтобы вместо ./noc wipe managed-object можно было писать ./noc wipe mo
05:37
а для user просто u
dvolodin #
05:45
а зачем?
05:45
нужен просто job, который аккуратно все вытрет в фоне
freeseacher #
05:46
да :)
05:47
пора бы уже
zi_rus #
05:57
затем что в консоли набирать длинные названия параметров неудобно, это по мотивам win server http://habrahabr.ru/post/183012/
05:57
очень уж аналогия подходящая
06:31
подумал, больно много алармов с макфлапами висят без дела
06:31
надо их позакрывать
06:32
реально ли налабать пируль который закроет алармы определнного класса которые висят слишком долго (срок задать)
06:32
???
06:32
то есть что
06:32
написать пируль который будет запускаться шедулером раз в сутки
06:33
пируль берет список всех активных алармов
06:34
и по каждому проверяет класс и Duration, если класс совпал а продолжительность превысила порог, то установить аларму статус closed
06:42
mikevlz, ты тут?
07:22
народ, научите управлять временем :)
07:23
>>> s-alarms[1].timestamp
07:23
datetime.timedelta(225, 74553, 179810)
07:23
как дельту сравнить с промежутком времени
07:23
указать например 7 дней
07:42
разобрался
08:01
вычистил все эти говны что накопились
08:01
теперь акуратненько светятся только актуальные аварии
08:09
Dmitry1, ты тут?
Dmitry1 #
08:17
временно да
zi_rus #
08:22
Dmitry1, ты так %TRANSCEIVER-DFC2-6-INSERTED: не сделал
Dmitry1 #
08:22
там issue есть?
zi_rus #
08:26
вроде был
08:26
я рисовал про это точно
08:26
может быть с отклонениями
08:29
Dmitry1, ты мог его закрыть, как можно увидеть твои закрытые issue?
Dmitry1 #
08:30
там фильтр поиска есть
zi_rus #
08:31
Dmitry1, NOC-955, но это новые сообщения.
08:31
Jun 13 10:26:57: %TRANSCEIVER-DFC2-6-REMOVED: Transceiver module removed from TenGigabitEthernet2/0/0
08:31
Jun 13 10:26:59: %TRANSCEIVER-DFC2-6-INSERTED: transceiver module inserted in TenGigabitEthernet2/0/0
08:31
переоткрыть или новый слздать?
Dmitry1 #
08:31
переоткрой
08:32
и комментарий напиши. Возможно я что-то в regex напутал
zi_rus #
08:32
Dmitry1, коммент написал, но ты не напутал, сообщение несколько иное
Dmitry1 #
08:33
х.з.
zi_rus #
08:33
сам смотри
Dmitry1 #
08:33
я всегда лезу в гугль, чтобы посмотреть подобные сообщение, и из них скомпилировать regex. Видать чего-то перемудрил
zi_rus #
08:34
глянь в iisue увидишь
08:34
такое одним regexp не разберет
08:35
в смысле оба типа сообщений
09:06
странный странный странный баг
09:06
не поднимается аларм по падению 10G порта
09:07
ивент Link down есть и нормально классифицировался, но аларм не поднялся
09:07
не первый раз такое, думал меня глючит, но сейчас я уверен
MindGames #
09:40
привет всем!
09:41
есть вопрос по поводу поднятия аларма по одному из событий..
09:41
события приходят по IP SLA.. при переключении маршрута на резервный
09:41
падают два события:
09:41
51b992eec42d890617002103 korenovsk_seti_2811 13.06.2013 13:37:50 Active Unknown | Syslog SYSLOG: 55: Jun 13 13:37:49.248 Moscow: %TRACKING-5-STATE: 161 rtr 161 reachability Down->Up
09:41
51b992eec42d890617002102 s247_3945 13.06.2013 13:37:50 Active Unknown | Syslog SYSLOG: 522708: Jun 13 13:37:49.094 MSK: %TRACKING-5-STATE: 161 ip sla 161 reachability Down->Up
09:42
как мне правильно организовать? По идее, упадут два аларма.. ну, если быть точным, этими двумя собыитями алармы закрыться должны
09:42
но по-логике, должен упасть один аларм, мол, лег основной канал в сторону кореновска..
09:43
в моем случае, 3945 - центральный узловой маршрутихатор и от него до кропоткина есть два туннеля через разных провайдеров
09:43
при падении марщрута падают два события со тороны узлового роутера и со стороны филиального роутера
09:44
имеет смысл поднять два аларма на двух роутерах и один аларм убрать под root cause?
09:44
Володина нет что-то :(
Dmitry1 #
09:46
Теретически, если между двумя железками "линк", то оно как-то коррелирует с ним. Но реально - без понятия
MindGames #
09:52
Dmitry1, ну, это если есть линк в базе и наверное, если новая версия нока ;))) я так и не обновился.. почитал ваши страсти-мордасти на прошлой неделе и перехотелось пока что
09:53
ладно, попробую пока алармы поднимать просто. как теперть сделать, чтобы после того, как создам успешно правила, эти правила в кодовую базу нока попали и при следующем обновлении, они не слетели?
Dmitry1 #
09:53
А Володин начал рисовать новые модули, а стрпые подзабросил. Видать ему на его работе они понадобились
MindGames #
09:54
что за новые модули?
zi_rus #
09:54
Dmitry1, просто мы умеем мягко подтолкнуть его в нужном направлении
Dmitry1 #
09:54
Workflow, PM
zi_rus #
09:54
ну кроме workflow, это его личная инициатива, которая непонятно во что вылилиась
Dmitry1 #
09:55
И PM тоже. Я не вижу до сих пор интерфейсов SA, которые могли бы снимать каиие-то счетчики
MindGames #
09:55
ну, PM ни когда не работал.. та и особо ни кто не пользовался им. а что за воркфлов такой?
Dmitry1 #
09:56
Чего-то про планирование задач. Какое он имеет отношение к NOC - неизвестно
09:57
По крайней мере этот WorkFlow ни с каким другим модулем NOC не связан
MindGames #
09:57
ну, можно прикрутить.. к примеру, планируем включать какие-то каналы.. сразу адреса зарезервировать, запустить проверку включения канала.. что-то вроде этого
zi_rus #
10:25
Dmitry1, это дело наживное, но я уже говорил что надо как-то привязки делать
MindGames #
10:34
коллеги, есть в нок Event Classification Rule: Cisco | IOS | Security | Authentication | Login (SYSLOG). Как узнать, поднимается ли какая-то аларма по этому ивенту*
10:38
или как в
10:38
в этой классификейшен руле открыть аварию?
10:38
что то я запутался ;)
Dmitry1 #
10:53
Аларм не поднимется
10:53
Можешь сделать ивенттриггер, и по нему какие-то события
MindGames #
10:54
а как сделаьб, чтобы аларм поднялся? просто пытаюсь на основе этого создать свой аларм.
10:55
и еще.. в евенте есть переменные.. типа, user и ip,. и он пишет что мол. такой то юрер с такого то IP залогинился
10:55
как заставить репорт отправить аткой*
10:56
пишу шаблон? На девайс {{event.managed_object.name}} залогинился {{user}}!
Dmitry1 #
10:56
Это никто не знает :(
MindGames #
10:56
он шлет письмо, но в нем написано "На девайс sed142_DGS3100 залогинился !"
10:56
то есть он не смог увидеть, что в переменной user :((
Dmitry1 #
10:57
Я уже с год говорил о необходимости наклепать кучу шаблонов на ивенты, а потом дать юзеру возможность сделать их активными по выбору
MindGames #
10:57
Dmitry1, так как вытащить значение переменной? :(((
Dmitry1 #
10:58
Не знаю :(
MindGames #
10:58
в Event Classification Rule: Cisco | IOS | Security | Authentication | Login (SYSLOG) написана такая конструкция: %SEC_LOGIN-5-LOGIN_SUCCESS: Login Success \[user: (?P<user>.*)\] \[Source: (?P<ip>\S+)\] \[localport: (?P<lport>\d+)\]
10:58
и он прекрасно определяет что в ивенте: Extracted variables:
10:58
lport 22
10:58
ip 10.40.9.14
10:58
user noc
10:59
вот как эти извлеченные переменные в ивенте вытащить в шаблон письма? :((
11:03
может, в исходниках где подсмотреть можно? :(
zi_rus #
11:15
Dmitry1, знато есть workflow, который не работает
MindGames #
11:20
блин! В Classification Rule если создать правило.. То как добавить переменные в колонке Vars?
11:21
нашел.. в евент классах это хранится
11:21
блиать
dvolodin #
11:49
ну что, pull request'ы опробовали
freeseacher #
11:49
гг
11:49
пиши политику приема патчей
11:52
и алиасить надо как то
11:52
а то у меня пара коммитов от хрен знает кого :)
MindGames #
11:52
dvolodin, есть мануал какой-нибудь, как мне создать новый аларм? Настроил IP SLA на циске. хочу поднимать аларм, когда произойдет переключение на резервный линк. Я так понял, надоа евент класс создать сначала. там переменные определить. потом классифике
11:52
йшн руле?
dvolodin #
11:53
да
11:53
и alarm class
11:53
в fm/collections смотри
MindGames #
11:54
надо создавать в консили? nano? Через веб морду не получится?
11:54
черт.. ;) замороченно
dvolodin #
11:55
правила классификации - через морду
MindGames #
11:55
и еще вопрос.. Я хотел отправлять уведомление, что какой-то хрен залогинился на устройство.. не могу вытащить переменную USER и IP из самого EVENT'а.. чтобы в письме написать.. пробовал На девайс {{event.managed_object.name}} залогинился {{user}}! - не подставляет.. пробов
11:55
ал {{event.user}}! все-равно болт.
11:56
dvolodin, правило да, видел.. правжа, там переменные не вставить. потому надо создать собственный класс.. ;) в общем, тут я поэксперементирую. если получится, скину на форум код.
dvolodin #
11:59
вроде более-менее определился с API для проб
11:59
и сделал поддержку counter'ов
MindGames #
12:01
dvolodin, так что, как вытащить значение переменных из евента? меня инетересуют user и ip на евенте Log On
zi_rus #
12:01
когда можно будет пробовать?
dvolodin #
12:01
zi_rus: да в общем в базу уже кладет
zi_rus #
12:02
а итог?
dvolodin #
12:02
подмога с javascript'ом нужна
zi_rus #
12:02
как заставить снимать данные?
dvolodin #
12:02
сейчас закину еще начальные миграции
zi_rus #
12:02
да чего там мигрировать
dvolodin #
12:02
заставить снимать - через web
zi_rus #
12:02
ничего же не было
dvolodin #
12:02
как что -- database и storage создать
zi_rus #
12:04
dvolodin, такой баг нашел, не поднимается аларм падение 10G линков, для 1G все поднимается
12:04
ивенты приходящие нормально классифицируются
dvolodin #
12:04
не классифицируются события?
zi_rus #
12:05
клссифицируются
12:05
в этом фишка
12:05
в ивнтах событие нормально классифицировано
12:05
Link Down Te2/0/0
12:05
а аларма нет
dvolodin #
12:06
https://bitbucket.org/nocproject/noc/src/56b46329ee5b1583c001c782c34a353974e672ba/pm/pmprobe/checks/mongodb/check.py?at=default
12:06
zi_rus: посмотри логи коррелятора
zi_rus #
12:06
а вообще ни у кого такого больше не встречалось?
dvolodin #
12:06
вполне жизненный пример пробы
12:07
вроде доступно для написания?
zi_rus #
12:07
видимо придется на новом сервере с нуля поднимать
12:08
dvolodin, generic snmp oid можно будет указывать?
freeseacher #
12:08
dvolodin, слишком сложно.
12:08
не будут писать пробы.
12:08
надо что бы проба не знала ничего
12:08
ей все давали
dvolodin #
12:09
zi_rus: да, SNMP можно будет дернуть
freeseacher #
12:09
и на выходе только цифры
dvolodin #
12:09
freeseacher: проба не знает ничего
freeseacher #
12:09
munin глянь
dvolodin #
12:09
и на выходе выдает только цифры
freeseacher #
12:09
тупо отдает результаты
dvolodin #
12:09
https://bitbucket.org/nocproject/noc/src/56b46329ee5b1583c001c782c34a353974e672ba/pm/pmprobe/checks/test/check.py?at=default
12:09
вот пример
12:09
проба выдает рандрмный bool, int и float
12:10
что там сложного-то
12:10
описать -- какие параметры конфигурации --- в любом случае будет
12:10
описать -- что она выдает
12:11
указать форму для конфигурирования
12:11
а handle выдает результат в виде хеша -- название параметра - значение
12:11
минимальнее некуда
12:14
проверки настраиваются из морды
12:14
красиво и через формочки
12:14
монговская проверка махом выдает тучу параметров
zi_rus #
12:25
херня какая, каждый день по сто раз так делают тут все, чего тут сложного, это даже дети могут
dvolodin #
12:27
эстетам предлагаю подумать над оберткой для проб NAGIOS :)
12:40
ладно, если без шуток
12:40
после апгрейда до последних коммитов появятся два демона
12:40
noc-pmwriter и noc-pmprobe
12:41
первый пишет в базу результаты измерений и, в дальшейшем, будет проверять threshold'ы и генерить event'ы
12:41
раньше этим SAE занимается
12:42
он цепляется за STOMP
12:42
pmprobe -- запускает сами пробы
12:43
Из настроек -- в pm > setup > PB Database, Storage и Probe должны лечь дефолтные значения
12:43
их должно хватить
12:43
сами проверки создаются в pm > checks
12:44
из параметров -- название, probe -- название демона probe, на котором запускать проверку (аналог proxy в zabbix)
12:44
storage -- где хранить результаты
12:45
при выборе check'а откроется дополнительная форма с параметрами проверки
12:45
после сохранения в pm > time series автоматом появятся новые ряды
12:46
например, для монги параметры будут host = 127.0.0.1, port = 27017, database = noc
12:46
pmprobe подтягивает свой конфиг автоматом
12:47
сейчас тянет при запуске
12:47
дальше сделаю перегрузку при изменении
zi_rus #
12:48
как можно такое элементарное действие так усложнить
dvolodin #
12:48
в заббикве проще?
zi_rus #
12:49
не знаю, но в кактусе вынос мозга, но в сто раз проще
dvolodin #
12:49
при работе реально ты работаешь только с PM > Checks
12:49
все
zi_rus #
12:52
добейте до стабильного состояния и я новую копию разверну на другом сервере, похоже баги наложились очень странно и теперь лезет непонятное
dvolodin #
12:54
чтобы добить до стабильного состояния нужно тестирования, предложения по доработке, поиск багов и фиксы :)
zi_rus #
12:57
dvolodin, есть все кроме последнего, посмотри в багтрекер, там и предложения и баги и тесты
12:57
а фиксов нет
12:57
так они и висят
12:57
третий год скоро пойдет
dvolodin #
12:58
это для чего критического третий год висят?
ufir #
13:00
zi_rus а в кактусе-то тебе чего не нравится ? бегает себе, поллером шуршит да складывает
zi_rus #
13:02
ufir, если стандартный шаблон счетчики интерфейса то да, одной галочкой, а если надо какой-нибудь конкретный оид или пару графиков сложить, начинается порно
13:03
всякие data source, перевод байты в биты и прочая херня
ufir #
13:03
ааа, с этим жопа, да ;(
Dmitry1 #
13:06
Народ, а у кого есть железки Brocade ? Нужно потестировать скрипты
dvolodin #
13:06
вообще-то я считаю, что нужны просто галочки в профилях интерфейсов
13:07
один раз профили и классификацию настроил - они автоматом на мониторинг встают
zi_rus #
13:07
dvolodin, да, это нужно
13:07
но
13:08
что мониторить
13:08
input
13:08
output
13:08
error всякие
13:08
dom
13:09
dvolodin, галочки не только интерфейсам нужны, есть еще желзки, у них cpu, memory, temperature
13:09
а sla
13:09
настроить чтобы пингала в разные стороны
dvolodin #
13:09
я вобще думал вот так сделать
13:10
SLA Profile
zi_rus #
13:10
замеряла время/jitter и на график его
dvolodin #
13:10
и к профилями интерфейсов их цеплять
13:10
про перекрестную измерялку я уже думал, есть наработки у меня
13:12
и для тестирования связности
zi_rus #
13:24
я не понял связь sla profile и интерфейсов
dvolodin #
13:24
что именно проверять и на какую тему орать
13:24
:)
zi_rus #
13:24
жесть какая
13:24
профиль для профиля
13:24
матрешка получается
dvolodin #
13:25
не совсем
zi_rus #
13:28
как нет , когда да
myself757485 #
14:08
hi all
hartmy #
14:08
i made cd /usr/local/noc
14:08
hg pull -u
14:09
and post-update gone
14:09
script directory does not have post-update script
14:10
and starting noc do traceback
14:10
Traceback (most recent call last):
14:10
File "/usr/local/noc/scripts/noc-launcher.py", line 12, in <module>
14:10
from noc.main.launcher import Launcher
14:10
ImportError: No module named noc.main.launcher
venter #
14:18
You need to rename upgrade.default to upgrade.conf,
14:18
edit it, after that start scripts/upgrade.sh insted of post-update
14:21
http://forum.nocproject.org/index.php?topic=192.msg651#msg651
hartmy #
14:28
venter, thanks! it helped
venter #
14:38
you're welcome
Tweet
Share this page
Share this page: Tweet