About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 05.08.2011
lexus-omsk #
03:47
Приветствую.
03:47
Есть предложение забацать класс для событий вида system: FAN2 RPM value 2746 is lower than its limit RPM value
03:47
И соответсвенно system: The RPM of the fan has recovered to normal state
03:48
Где-нибудь в Chassis
dvolodin #
03:53
ну да
03:53
Chassis | Fan |
03:54
Нужны JSON'ы с событиями
03:54
желательно с разных систем
03:54
и в issue их
04:02
У junos вот такое есть
04:02
<message>Fans and impellers are now running at normal speed</message>
04:02
<message>Fans and impellers being set to full speed [<variable>reason</variable>]</message>
04:02
<message>Fans and impellers being set to intermediate speed</message>
04:02
<message>Fan Fail for power supply <variable>pem-slot</variable> </message>
lexus-omsk #
04:04
у меня пока только с zyxel - просто прилетели события, вот я и вспомнил о них... вроде раньше на длинке что-то подобное видел, но сейчас нет под рукой таких логов
dvolodin #
04:10
хотя бы с зухеля для начала
04:12
Я немного покурочил коррелятор
04:12
теперь он компилирует правила классификации в нативный питоновский код
04:13
посмотрите за ним повнимательнее
freeseacher #
04:14
dvolodin, icmp результаты уже игнорятся?
04:14
я выключил пока всю подсистему
dvolodin #
04:14
пинги то?
freeseacher #
04:14
ога
dvolodin #
04:14
Нет, пока честно живут один день
freeseacher #
04:16
давай табличку сосздеим с игнорированием триггеров
04:16
типа триггер такой то не писать в бд.
dvolodin #
04:17
достаточно просто время жизни задавать
04:17
и время жизни в архиве
zi_rus #
05:51
почему не отображаются алярмы в ФМ, хотя в таблице managed object они присутствуют и по ссылке нормально переходит?
wad_ #
05:52
Дмитрий ты по Алармы-EIGRP что то исправлял?
dvolodin #
05:54
zi_rus: статус у них не closed стал?
05:54
wad_: вроде ничего не трогал
05:54
заработали?
wad_ #
05:55
неа
zi_rus #
05:57
dvolodin, нет. Может быть это связано с тем что они уже 2 дня висят? В евентах, как положено, пинг failed
dvolodin #
05:57
нет, срок жизни alarm'а не ограничен
zi_rus #
05:58
добавил тестовый объект, пинг файлед, но в алярмах тоже не показывает
06:00
а вот еще, если сделать фильтр по конкретному объекту, то его алярм показывает, а всех сразу нету
06:03
нок обновлял, перезапускал, не помогло
dvolodin #
06:05
коррелятор живой?
zi_rus #
06:06
2011-08-05 10:01:32,329 46 events are disposed (success: 46, failed: 0)( 0.4374 second elapsed. 105.1652 events/sec)
06:06
однозначно
dvolodin #
06:08
alarm какого типа?
06:08
ping failed?
zi_rus #
06:08
да
razered #
06:14
Добрый день
06:15
Подскажите, а заигнорить можно Event: NOC | Periodic | Periodic OK?
wad_ #
06:19
(event.vars['to_state'].lower() in ['full']) а у меня to_state -- up
06:19
исправил на (event.vars['to_state'].lower() in ['full','up']) результата нету...
06:20
чего делаю неверно?
dvolodin #
06:30
wad_: как целиком JSON выглядит?
06:30
razered: зачем его игнорить?
06:31
повисит денек и уйдет само
06:34
Закоммичу скоро archivation rules
razered #
06:40
Все понял, спасибо :)
wad_ #
06:42
JSON правило или событие?
dvolodin #
06:42
правило
06:42
ну и событие не помешает
wad_ #
06:42
я стандартное исправлял
06:46
события EIGRP Up http://pastebin.com/ubuFNnHa Down http://pastebin.com/7jrw67Gk
06:52
правило на Up http://pastebin.com/iYtJAha8
dvolodin #
06:53
не condition а match_condition
06:53
я же говорю - последние патчи править надо
wad_ #
06:54
а почему тогда Down работает?
dvolodin #
06:54
а
06:54
тьфу
06:54
там не поправил
06:54
точнее, запутался :)
06:54
все нормально в правилах
wad_ #
06:55
вот вот...
dvolodin #
06:55
down тупо поднимает alarm
06:55
без условий
06:56
to_state у него какой на UP ?
wad_ #
06:56
to_state -- up
dvolodin #
06:57
"condition": "('to_state' not in event.vars) or (event.vars['to_state'].lower() in ['full'])", в pastebin
06:57
"condition": "('to_state' not in event.vars) or (event.vars['to_state'].lower() in ['full', 'up'])",
06:57
а вот так по идее должно быть
wad_ #
06:58
ну я уже в копиях запутался...
06:58
выше писал <wad_> исправил на (event.vars['to_state'].lower() in ['full','up']) результата нету...
dvolodin #
07:01
./noc sync-collections?
wad_ #
07:01
угу
07:01
в веб морде этот JSON и видно
dvolodin #
07:01
в event hiererchy?
wad_ #
07:03
а это что такое?
dvolodin #
07:12
блин
07:12
ну и правильно он делает
wad_ #
07:12
эээ :-)
dvolodin #
07:12
нечего бедному коррелятору мозг иметь
07:12
смотри
07:12
смотрим описание alarm class "Network | EIGRP | Neighbor Down"
07:13
смотрим дискриминатор
07:13
["interface", "neighbor"]
07:13
это уникальный ключ аварии
07:13
дальше смотрим событие down
07:13
interface = tun 10 neighbor 192.168.221.41
wad_ #
07:14
дискриминатор только Json можно увидеть?
dvolodin #
07:14
смотрим событие up - interface tun 10 neighbor 192.168.221.42
wad_ #
07:15
ну не от того дал...
dvolodin #
07:15
да, в морде надо доделать
07:16
noc> ./noc inject-event msk-ap2 ~/tmp/json/cisco_ios_eigrp_*
07:16
4e3b98c25a2090525e000000
07:16
4e3b98c25a2090525e000001
07:16
поправил адрес и заливаю
07:16
классификатор говорит
07:16
2011-08-05 11:16:18,545 Matching class for event 4e3b98c25a2090525e000000 found: Network | EIGRP | Neighbor Down (Rule: Cisco | IOS | Network | EIGRP | Neighbor Down (SYSLOG))
07:16
2011-08-05 11:16:18,575 Matching class for event 4e3b98c25a2090525e000001 found: Network | EIGRP | Neighbor Up (Rule: Cisco | IOS | Network | EIGRP | Neighbor Up (SYSLOG))
07:17
2011-08-05 11:16:18,589 2 events are classified (success: 2, failed: 0)( 0.1666 second elapsed. 12.0054 events/sec)
07:17
коррелятор говорит
07:17
2011-08-05 11:16:21,521 Network | EIGRP | Neighbor Down: dispose: Contributing event 4e3b98c25a2090525e000000(Network | EIGRP | Neighbor Down) to active alarm 4e3b970b5a2090521f00001c(Network | EIGRP | Neighbor Down)
07:17
2011-08-05 11:16:21,538 Network | EIGRP | Neighbor Up: dispose: Event 4e3b98c25a2090525e000001(Network | EIGRP | Neighbor Up) clears alarm 4e3b970b5a2090521f00001c(Network | EIGRP | Neighbor Down)
07:17
2011-08-05 11:16:21,543 2 events are disposed (success: 2, failed: 0)( 0.1186 second elapsed. 16.8570 events/sec)
07:17
все пучком
07:17
да, disposition rules обрабатываются коррелятором
wad_ #
07:17
вот от одного адреса и интерфейса куски http://pastebin.com/B881SEZR
dvolodin #
07:17
его тоже надо перезапустить
07:18
я уже поправил у себя в json
wad_ #
07:18
а вот рестарт не подумал
animage #
07:22
Доброго времени суток коллеги
wad_ #
07:23
мде я мего тормоз... Спасибо Дмитрий
dvolodin #
07:26
патчик на eigrp ушел
07:26
коллеги, при работе с FM обязательно регулярно посматривайте на Failed Events
07:27
Прямо в event manager'е
07:27
traceback'и мне скидывайте
wad_ #
07:29
Дмитрий следующий вопрос.
07:29
интерфейсы у циски http://pastebin.com/9NpbGy7i
07:29
к какому типу отнести Virtual-Access2 ?
dvolodin #
07:31
я не уверен, что они нужны в get_interfaces
wad_ #
07:31
игнорировать?
dvolodin #
07:31
подумать надо
07:31
нужны ли динамические subscriber интерфейсы
07:32
они же меняются регулярно и в базу их пихать смысла нет
wad_ #
07:33
:-) ну и убрать..
dvolodin #
07:40
вот и ответ на вопрос
07:40
нет virtual-access, нет проблемы :)
07:41
то же и с темплейтами
zi_rus #
07:44
может все-таки кто знает почему у меня не отображаются активые алармы?
razered #
07:46
Интресно, а почему досих пор не добавили в проифиль DxS Possible spoofing attack from? =)
07:46
Кто занимается классами для D-Link'а?
dvolodin #
07:50
razered: а какая проблема?
07:51
JSON'ы соответсвующие в issue на сайте
07:51
В Main > Reports есть прикольный отчет Classification Quality
07:51
у меня на двух инсталляциях
07:51
Active Events 85 223 160 506 53%
07:52
Active Events 140 144 404 351 34%
07:52
Active Events, 85 223, 160 506, 53%
07:53
Active Events, 140 144, 404 351, 34%
07:53
есть еще куда двигаться
07:53
В основном - ACL, IPsec и с f5
gnu-linux #
07:54
Уже несколько дней немогу добавить новый клас "Sensors" в нок - Fault Management -> Setup -> Event Classes Падает: http://pastie.org/2324052
dvolodin #
07:54
JSON'ом
07:54
формы не доделаны
gnu-linux #
07:55
Хорошо попробую JSON'ом
dvolodin #
07:55
вот, кстати, и работа для людей, знакомых с django
07:55
сделать добавление и редактирование alarm и event class'ов через морду
lexus-omsk #
07:56
zi_rus: пару дней назад мозг ломал о ту же проблему
07:57
в итоге оказалось что "сам дурак" - поудалял ненужные объекты, а в алармах ссылки остались... ну и вылезала 500 ошибка http, только вот невидно невооружёным глазом её было
dvolodin #
07:58
индикатор какой-нибудь в javascript надо, что зафейлились
`kk #
08:00
как посмотреть все возможные {{ event.* }} ?
08:00
чтоб в templates вставлять
dvolodin #
08:00
атрибуты?
08:00
fm/models.py
`kk #
08:00
аг
08:00
сп
dvolodin #
08:00
class ActiveEvent
08:00
это instance
zi_rus #
08:01
lexus-omsk, дык нет 500 ошибки, есть окно с алармами где нет ни одного аларма, а если начать фильтровать по managed object, то аларм к нему относящийся показывается
08:01
а всех сразу нету
lexus-omsk #
08:02
точно так же и было, 500 не видно, но она есть :)
`kk #
08:02
кста. письмо приходит 2 раза при срабатывании Refresh Config
razered #
08:03
Странно. Сегодня обновился и шедеудер при забирании конфига и diff его, начал выдавать:
08:03
2011-08-05 13:52:46,729 UNHANDLED EXCEPTION (2011-08-05 13:52:46.721536)
08:03
Working directory: /opt/noc
08:03
<type 'exceptions.ValueError'>
08:03
too many values to unpack
zi_rus #
08:03
lexus-omsk, "- ты суслика видишь? - нет! - и я нет, а он есть", и как это лечить?
dvolodin #
08:06
razered: traceback мне
lexus-omsk #
08:09
zi_rus: я где-то ещё трейсбэк видел, то ли в логах классификатора или коррелятора, то ли ещё где-то... там был id удалённого объекта, я удалял эти записи вручную из коллекции events и alarms
wad_ #
08:09
а есть тут люди умеющие понимать Cisco?
zi_rus #
08:10
wad_, а что надо?
wad_ #
08:11
это дурацкая штука у нее 2 интерфейса (нас интересуют)
08:11
Vlan249 192.168.249.2
08:11
Loopback1 192.168.222.2
zi_rus #
08:11
lexus-omsk, все логи стерильны
08:11
wad_, продолжай ))
wad_ #
08:11
строка logging source-interface Loopback1 -- отсылать от лоопбака - сислог
08:12
и в ноке периодически вылазит... Unknown Event Source: 192.168.249.2
08:12
откуда это пролазит.....
dvolodin #
08:12
trap source какой пробит?
wad_ #
08:12
192.168.222.2
dvolodin #
08:12
wad_: а на трапы?
wad_ #
08:13
?
lexus-omsk #
08:14
да вот я и не помню точно, где я эти id увидел... может и не в логах... можно попробовать debug включить и в foreground режиме запустить... страно, не так давно было, а детали не помню :(
dvolodin #
08:14
пятница :)
wad_ #
08:15
и все ловится .. нормально но периодически приходит.. с левого ареса..
dvolodin #
08:17
бывает
08:17
каталистка?
wad_ #
08:17
2811 и 2821
zi_rus #
08:23
как бы с таком случае очестить всю базу евентов и алармов, так нчего не могу найти
wad_ #
08:26
оо Дмитриий а можно в Mercurial в игнор поставить файлы .orig а то после реверта чистить потом...
gnu-linux #
08:28
Как лучше обозвать комнату? Box, Rac, Room ну для контроля доступа?
wad_ #
08:29
Rac ^-)
dvolodin #
08:33
wad_: сделал
08:34
gnu-linux: area :)
08:34
или location
wad_ #
08:36
уря
dvolodin #
08:39
?
lexus-omsk #
08:40
zi_rus: я вот такой конструкцией делал db.noc.events.active.remove( {"managed_object": 2824} ), если без условий, то вроде всё покоцает
dvolodin #
08:40
да
lexus-omsk #
08:40
ну и соответственно с алармами аналогично
dvolodin #
08:40
без условий все покоцает
zi_rus #
08:40
это куда загнать?
lexus-omsk #
08:41
это в консольке mongo
dvolodin #
08:41
mongo
08:41
use noc
08:41
ну и дальше
zi_rus #
08:41
/opt/noc/noc db.noc.events.active.remove( {"managed_object": 2824} )
08:41
та?
08:42
я не понимаю
`kk #
08:43
[root@zab]#mongo /opt/noc/ :)
08:43
MongoDB shell version: 1.8.1
08:43
connecting to: test
08:43
> use noc
08:43
switched to db noc
08:43
> db.noc.events.active.remove()
08:44
ну и iotop можно глянуть =)
dvolodin #
08:44
да ладно, монго шустрый
`kk #
08:44
у меня ой сколько эвентов
zi_rus #
08:44
сделал, проверяю
08:45
сработало!!!
08:46
всем спасибо!!!
08:46
а теперь пожелания: может встроить в нок механизмы не позволяющие приходить к такому, ведь не я первый
dvolodin #
08:50
можно
08:50
к релизу сделаем
08:51
Сейчас это ранняя альфа :)
08:51
Идет отработка концепции и набивка базы знаний
wad_ #
08:59
еще предложение. Если какие то события происходят несколько раз в течении 2-5 минут то Аларм долгий делать
09:00
точнее не события а аларм - появляется исчезает..
dvolodin #
09:00
wad_: там еще по частоте можно будет делать
09:01
напримере, пока событие повторяется чаще 5 раз за 5 минут, будет держаться alarm
wad_ #
09:02
вот вот
dvolodin #
09:04
это будет
`kk #
09:04
блин. всё таки оооочень не хватает поискаа по логам irc =(( чтоб сразу и по всем. или за период
wad_ #
09:05
а вроде яндекс ищет же?
dvolodin #
09:05
IRC клиент ищет :)
wad_ #
09:05
если ты сам пишешь логи
`kk #
09:06
dvolodin, я через 3 клиента в разных местах.
09:07
хотя надо баунсер повесить -)
09:07
dvolodin, beef@
zi_rus #
09:10
я настроил тестовый свич для отправки логов и трапов, что надо чтобы нок их принял?
`kk #
09:11
activator.conf
09:11
listen_syslog
09:11
listen_traps
09:23
и в Managed Objects Trap Source IP:
zi_rus #
09:28
это прописал, тепрь надо понять почему TrapCollector(0x804e490d0)] Permission Denied
_4ePTeHok #
09:29
потому что от рута надо запускать слушалку чтобы порт системный забиндить
09:29
ну активатор то есть
`kk #
09:30
ага.
_4ePTeHok #
09:30
[noc-activator]
09:30
enabled = true
09:30
user = root в ./etc/noc-launcher.conf раньше было
09:30
как счас хз, давно не обновлял
zi_rus #
09:32
сейчас там user = noc
_4ePTeHok #
09:37
угу
zi_rus #
09:42
от нока тоже запускается, слушает, я вижу что евенты приходят, но в логе активатора все равно появляется запись Permission Denied
_4ePTeHok #
09:43
от нока активатор не сможет забиндится на системный порт
09:43
если конечно в судо где нибудь не прописано
zi_rus #
09:43
udp4 0 0 172.18.254.250.syslog *.*
09:43
udp4 0 0 172.18.254.250.snmptra *.*
09:43
запустил от нока
09:44
вернее в конфиге прописал user=noc
`kk #
09:50
поставь рута. на тест
zi_rus #
10:02
поставил
10:03
tail /var/log/noc/noc-activator.0.log
10:03
2011-08-05 14:03:11,423 In-bundle package. Skiping software updates
10:03
2011-08-05 14:03:11,425 Registering as 'noc'
10:03
2011-08-05 14:03:11,430 Registration accepted
10:03
2011-08-05 14:03:11,430 Authenticating as noc
10:03
2011-08-05 14:03:11,435 Authenticated
10:03
2011-08-05 14:03:11,435 Sending capabilities
10:03
2011-08-05 14:03:11,437 [TrapCollector(0x804e470d0)] Initializing at 172.18.254.250:162
10:03
2011-08-05 14:03:11,437 Requesting event source filter
10:03
2011-08-05 14:03:11,438 [TrapCollector(0x804e470d0)] Address already in use
10:03
2011-08-05 14:03:11,438 [PMCollectorSocket(0x804e47150)] Address already in use
_4ePTeHok #
10:04
а больше ничего не слушает у тебя там?
`kk #
10:05
кто-то уже есть на этом адресе/порту
_4ePTeHok #
10:05
угу
zi_rus #
10:05
остановил нок
10:06
netstat -an | grep 162 gecnj
10:06
пусто*
10:06
запустил
10:06
netstat -an | grep 162
10:06
udp4 0 0 172.18.254.250.162 *.*
10:07
2011-08-05 14:06:47,240 [TrapCollector(0x804e470d0)] Initializing at 172.18.254.250:162
10:07
2011-08-05 14:06:47,240 Requesting event source filter
10:07
2011-08-05 14:06:47,241 [TrapCollector(0x804e470d0)] Address already in use
_4ePTeHok #
10:08
cat ./etc/noc-activator.conf |grep listen_instance
10:08
чего кажет?
zi_rus #
10:08
listen_instance = 0
_4ePTeHok #
10:09
ну странно. один инстанс должен тогда биндится, а кто там мешает тогда
zi_rus #
10:10
он биндится и слушает, но в логах пишется already in use, не порядок
razered #
11:47
Добрый день, еще раз
Dmitry1 #
11:48
FM -> Alarm Classess -> System == Object Not Found
razered #
11:48
Я добился того чтобы нужные мне Events приходили на почту
11:48
Только вот как поправить шаблон, чтоб мне еще в теле письма указывалась с какого коммутатора (object) пришел шторм =)
dvolodin #
12:06
{{event.managed_object.name}}
zi_rus #
12:07
Dmitry1, сделаете правила классификации для длинков snmptrap link up/link down?
Dmitry1 #
12:07
кинь мне в приват, что именно посылает d-link
razered #
12:10
dvolodin: Спасибо большое, все появилось
zi_rus #
12:27
dvolodin: snmptrap link down неправильно классифицируется
12:27
в чем причина
dvolodin #
12:30
zi_rus: JSON с события нужен
zi_rus #
12:31
dvolodin, вот http://pastie.org/2324967
dvolodin #
12:43
жопа там
12:43
нет имени интерфейса, только ifindex
12:43
с такими подождать придется пока интерфейсы в базу не уложу
zi_rus #
12:46
в смысле, имени?
12:47
ладно, я не спешу,будет,когда будет
dvolodin #
12:53
в трапе только ifindex
`kk #
13:01
dvolodin, beef@
Tweet
Share this page
Share this page: Tweet