About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 19.08.2013
lexus-omsk #
04:02
куда-то подевалось упоминание о severity в алармах - вроде раньше было, но точно не помню, когда пропало
04:03
может, когда на fm-new-ui перешёл, а может и только с последними апдейтами
04:05
по коммитам на bitbucket не могу сориентироваться
dvolodin #
04:13
может и потеряли
04:13
вернем, это не проблема
04:18
доделываю морду для classification rule
04:19
может быть, по аналогии получится сделать нормальное создание классов событий и alarm'ов из web-морды
04:20
по планам - на этой неделе по максимуму допилить морду для FM
04:20
на следующей -- сделаем предрелизное тестирование
04:20
и таки выпустим 0.7
04:20
или 0.8 :)
04:23
в релиз должны попасть fm-new-ii, notification-center
04:24
в идеале - ranged-chassis-id, если удастся проверить, что он не сломал нам discovery
teroni #
04:35
дада мы все дружно ждем FM
dvolodin #
05:34
teroni: его не ждать надо, а работать над ним
05:34
:)
teroni #
05:37
дык с радостью бы..
05:37
если бы знал чего делать...
05:38
ждем магической кнопки для проверки classification rule
zi_rus #
05:39
dvolodin, вопрос такой, если есть аларм триггер (по-старому еще), в нем пируль и нотификация, возможно ли не получать уведомление об аларме елси пируль его как child подшил к другому аларму. например, приходит линк даун, а через какое-то время ping failed, на пинг
05:39
висит пируль который его подшивает под линк, тогда по пингу я не хочу видеть нотификации
05:40
я придумал только делать нотификацию не встроенным средством а тем же пирулем
05:41
и как это выглядит в новой системе нотификаций?
dvolodin #
05:45
teroni: закоммитил с утра первую часть этой волшебной кнопки :)
05:45
осталось дополировать шаблон
teroni #
05:45
видел
05:45
но не понял куда жать чебы увидеть
dvolodin #
05:46
zi_rus: либо NotificationGroup.send
05:46
либо код писать
05:46
кнопка test в форме
05:46
если что -- ./noc sync-perm и login/logout
zi_rus #
05:47
ну то есть я понял только самим пирулем, действия выполняются независимо и повлять одно на другое не может
dvolodin #
05:50
да
teroni #
05:51
dvolodin: а заходить то куда? FM - setup - clas rule-и в какой-то руль?
dvolodin #
05:51
да
teroni #
05:51
не заходит
05:52
там есть иконка редактирвоания -- ни какой реакции
dvolodin #
05:54
открой правило
teroni #
05:54
как?
05:55
в табличках в строке есть иконка Edit я ее нажимаю реакции ноль
dvolodin #
06:05
js console смотри
06:05
все должно быть
06:05
ты на какой ветке?
teroni #
06:34
hg branch
06:34
feature/fm-new-ui
06:34
набор изменений: 8210:a74c1bb8af7d
06:34
ветка: feature/fm-new-ui
06:34
ошибок в консоле нету
06:45
нубас :-)
06:45
ты же писал перелогиниться надо
zi_rus #
06:57
Dmitry11, NOC-1071, достаточно вводных?
Dmitry11 #
06:59
yes
teroni #
07:02
ошибка в EventClasses
07:02
на записи
07:02
description': u'Failed Clock module or linecard',
07:02
'disposition': [{'action': u'raise',
07:02
'alarm_class': ObjectId('51ece6707d995939a92934b4'),
07:02
не может перевести в json - ObjectId
lexus-omsk #
07:43
а поле Duration в Alarm так и не вернули или снова потеряли потом?
ss_ #
07:47
Привет! Кто сможет подсказать как настроить параметры логротейта в моне?
07:47
монге
teroni #
07:48
а хочется то чего?
ss_ #
07:51
да чет логи растут до нескольких гигов
07:51
руками чистить лень
07:52
конфига где лежит не нашел
07:52
)
teroni #
07:52
именно логротейт?
07:52
у мну на дебиане /etc/logrotate.d/mongodb-server
07:52
можно врубить ежедневку
07:53
но думаю стоит глянуть что всетаки в логах и уменьшить уровень логирования
07:55
у мну вот в логе пишится очень много операций..
07:55
убить бы их
ss_ #
08:01
а где конфиг то монги лежит?
teroni #
08:06
-- /etc/mongodb.conf
ss_ #
08:14
а я думал что своя директория /etc/mongodb/
08:14
)
teroni #
08:15
не дорос он
lexus-omsk #
08:21
у меня там много было записей на тему медленных операций - увеличил таймаут
08:22
теперь меньше спамит
08:23
slowms=300 в /etc/mogodb.conf
ss_ #
08:25
logappend=false
08:25
diaglog = 0
08:25
еще полезно
08:28
/var/lib/mongodb была в 40 гиг
08:28
dialog весили ДОХЕРА
08:29
diaglog Creates a very verbose diagnostic log for troubleshooting and recording various errors. MongoDB writes these log files in the dbpath directory and names them diaglog.<time in hex>, where <time-in-hex> is the initiation time of logging as a hexadecimal string.
teroni #
08:29
а диалог откель?
ss_ #
08:29
0 Off. No logging.
08:29
у меня 1 стояло по дефаулту
08:29
http://docs.mongodb.org/manual/reference/configuration-options/
teroni #
08:29
издевательство :-)
09:42
dvolodin: новая кнопка тестирует только сислог?
dvolodin #
09:42
нет
09:42
что угодно
teroni #
09:42
значит чето не пашет
dvolodin #
09:42
либо id события, либо json с event'ом
teroni #
09:43
беру класифицированный эвент мой любимый Configuration changed
dvolodin #
09:43
ну
teroni #
09:44
захожу в Cisco | IOS | Config | Config Changed #1 (SNMP)
09:45
вставляю джесон из эвента
09:45
вставляю
09:45
жму тест
09:45
Result: Not matched
09:47
но ждесон из евента уже .. обработанный..
09:48
ну и варианты выхода из теста - только Close -- не хорошо..
09:48
потом возвращаться для редактирования надо
dvolodin #
09:52
шаблон доделываю еще, мелочи потом поправлю
teroni #
09:55
дык с SNMP фича или бага?
ufir #
09:57
а с жуниперами попрежнему болт
dvolodin #
09:58
ufir: id не выдирается?
ufir #
09:58
ага. такое впечатление, что просто не отрабатывает
teroni #
09:59
а debug_script что говорит?
ufir #
10:00
в том-то и дело, что там все нормально
10:00
а если из service activation - то получаю
10:00
2013-08-19 13:54:23,536 [inv.discovery] Running job version_inventory(jnr01-yla-gts)
10:00
2013-08-19 13:54:24,930 [inv.discovery] Job version_inventory(jnr01-yla-gts) is completed successfully
10:00
2013-08-19 13:54:48,314 [inv.discovery] Running job interface_discovery(jnr01-yla-gts)
10:00
2013-08-19 13:54:52,248 [inv.discovery] Job interface_discovery(jnr01-yla-gts) is completed successfully
10:00
2013-08-19 13:55:07,992 [inv.discovery] Running job lldp_discovery(jnr01-yla-gts)
10:00
2013-08-19 13:55:11,441 [inv.discovery] Job lldp_discovery(jnr01-yla-gts) is completed successfully
10:00
2013-08-19 13:55:13,663 [inv.discovery] Running job bfd_discovery(jnr01-yla-gts)
10:00
2013-08-19 13:55:16,087 [inv.discovery] Job bfd_discovery(jnr01-yla-gts) is completed successfully
10:00
2013-08-19 13:55:42,847 [inv.discovery] Running job ip_discovery(jnr01-yla-gts)
10:00
2013-08-19 13:55:48,681 [inv.discovery] Job ip_discovery(jnr01-yla-gts) is completed successfully
10:00
и всё
10:00
типа всё нормально, всё ништяк ;)
teroni #
10:01
ID_discovery нету
ufir #
10:02
lf
10:02
да
10:02
ни трейсов, ни ошибок...
teroni #
10:03
дык ты его толкни рукой его у тебя в списке нету
ufir #
10:03
всмысле ?
10:04
как ето - нету
teroni #
10:04
ты привел список дискавери который прошел
10:04
ИД дискавери нету там
10:04
ИП есть
ufir #
10:05
ну да, я вижу.
10:05
а в чем может быть дело ?
dvolodin #
10:06
в логах ее поищи
ss_ #
10:07
как изменить Classification Rule ?
teroni #
10:07
запусти в ручную через МО- Run discovery now
10:07
потом в логи
zi_rus #
10:07
dvolodin, для stp discovery обязательно чтобы на рут свиче тоже был включен стп дискавери?
ss_ #
10:08
валится при попытке Fault Management Classification Rule http://pastebin.com/wfzhyMeJ
10:08
Когда пытаюсь выбрать правило
dvolodin #
10:11
zi_rus: да
10:11
ss_: это поправлено в ветке fm-new-ui
zi_rus #
10:11
тогда понятно почему у меня не дискаверится
10:12
у меня 7600 руты, я на них отключил его
ss_ #
10:12
dvolodin, что за ветке? Как её использовать?
dvolodin #
10:14
ss_: http://forum.nocproject.org/index.php?topic=238.0
ss_ #
10:14
dvolodin, спасибо, сейчас попробую
ufir #
10:14
teroni дык в том-то и дело, что я руками из MO запускал
dvolodin #
10:16
ufir: потому и посмотри в логах, где оно там
ufir #
10:17
опа
10:17
нашел много таких ошибок
10:17
2013-08-19 13:56:05,143 event_proxy failed: code: ERR_INTERNAL
10:17
text: "RPC Call to event failed"
teroni #
10:17
это что-то другое :-)
10:18
ды в дискавери гляди
ss_ #
10:19
Switching to branch feature/fm-new-ui
10:19
abort: uncommitted local changes
10:19
upgrade: : Failed to update to branch feature/fm-new-ui
10:19
как найти то что мешает?
teroni #
10:19
либо за коммить либо отмени
ufir #
10:20
teroni нет, в дискавери всё чисто - везде completed successfully
teroni #
10:20
hg diff
10:20
ufir: tcnm pfgbcm c шв_вшысщмукн ?
10:20
блин
10:20
есть запись с id_discovery?
ufir #
10:21
нету
10:21
точнее была
teroni #
10:23
не обновилась? после нажатия на пимпочку? в МО
ss_ #
10:23
teroni, как отменить?
teroni #
10:24
ss_: hg revert --all
10:24
восстановить ВСЕ файлы до их состояния в хранилище
ss_ #
10:25
ого сколько я всего наворотил)
teroni #
10:25
может что полезное было??
dvolodin #
10:26
ufir: смотри логи сразу после запуска noc-discovery
ufir #
10:27
дык у меня постоянно перед носом отдельное окно с tail -f noc-discovery.log | grep jnr
teroni #
10:31
насильственный запуск дискаверинга из командной строки
10:31
http://pastebin.com/1TAB6he5
10:32
dvolodin: скажи мне за SNMP
ss_ #
10:33
ufir, а что в дискавери ломаете? Раскажите тоже буду ломать
dvolodin #
10:33
http://www.imagebanana.com/view/njx8lxsx/ScreenShot20130819at2.34.57PM.png -- результат тестирования правила
10:33
вроде нормально
10:34
ufir: ты проверь логи сразу после запуска демона
10:34
вдруг он отключил задачу
teroni #
10:34
ID же вроде не отключается?
10:36
dvolodin: event_class__name Config | Config Changed' by rule 'Cisco | IOS | Config | Config Changed #1 (SNMP)"
10:36
вставляю это
10:36
[
10:36
{
10:36
"profile": "Cisco.IOS",
10:36
"event_class__name": "Config | Config Changed' by rule 'Cisco | IOS | Config | Config Changed #1 (SNMP)"
10:36
"raw_vars": {
10:37
"1.3.6.1.4.1.9.9.43.1.1.6.1.5.452": "2",
10:37
"source": "SNMP Trap",
10:37
"1.3.6.1.4.1.9.9.43.1.1.6.1.3.452": "1",
10:37
"1.3.6.1.6.3.1.1.4.1.0": "1.3.6.1.4.1.9.9.43.2",
10:37
"1.3.6.1.4.1.9.9.43.1.1.6.1.4.452": "3",
10:37
"collector": "192.168.13.110:10162"
10:37
}
10:37
может не то?
dvolodin #
10:37
то
10:37
кинь на пасту
10:38
ss_: http://forum.nocproject.org/index.php?topic=237.0
10:38
вот это мы ломаем
teroni #
10:38
http://pastebin.com/uS67Vw2Z
ss_ #
10:39
Полезная вещь
dvolodin #
10:40
teroni: да, понял все
teroni #
10:46
dvolodin: еще глюк нашел погляди??
10:46
ошибка в EventClasses
10:46
на записи
10:46
description': u'Failed Clock module or linecard',
10:46
'disposition': [{'action': u'raise',
10:46
'alarm_class': ObjectId('51ece6707d995939a92934b4'),
10:46
не может перевести в json - ObjectId
dvolodin #
10:50
это где?
10:59
teroni: проверку SNMP пофиксил
ss_ #
11:05
тоже добавил
freeseacher #
11:28
господа у кого ест ьвыделенный дев сервер ?
ufir #
11:34
э.. ну могу сделать, впринципе..
zi_rus #
11:52
Dmitry11, почему ты в DOM ивенте не парсишь полезную инфу вроде
11:52
Rx power low warning; Operating value: -21.2 dBm, Threshold value: -19.0 dBm
freeseacher #
11:53
ufir, я тут просто задумался ка кпрогнать программеров с боевого нока.
11:54
надо дев сервер как то делать и как то коммитить их изменения
11:55
у мя получается два сервера с которых надо забирать "фичи" ?
zi_rus #
11:59
в subj ничего нет, а это важно и полезно
ufir #
12:10
freeseacher есть esxi на блейде, практически незагруженный, могу там сделать. даже темплейт был с бубунтой 12.04
zi_rus #
12:21
Dmitry11, NOC-1092, NOC-1093
ufir #
12:22
хы. identity от MX480 нашла, но линки - нифига
dvolodin #
12:39
freeseacher: тяни на боевой сервер изменения с дева
12:39
:)
ufir #
12:40
dvolodin identity от всех mx-ов нашло - а линки - нифига
dvolodin #
12:41
identity нормально нашло?
ufir #
12:41
даже пробовал выкашивать их из MO/добавлять обратно
dvolodin #
12:41
диапазонами?
ufir #
12:41
да, прошло нормально у всех
dvolodin #
12:41
это хорошо
12:41
а чего тупило так?
12:42
teroni: проверил snmp?
ufir #
12:42
не знаю... пока не удалил МО - не добавляло
12:42
сейчас все коробки нашло диапазонами, интерфейсы и адреса отдискаверились - но линков нет
dvolodin #
12:43
надо lldp дебажить
12:43
что lldp discovery пишет?
ufir #
12:44
что оно succesfuly
12:44
и всё
dvolodin #
12:44
поставь loglevel debug демону
ss_ #
12:49
dvolodin, все равно трейсбеки валит при редактировании класификатора FM
ufir #
12:49
2013-08-19 16:47:21,397 [inv.discovery: lldp_discovery(jnr01-yla-pet)] get_neighbor(78:19:F7:07:FF:C0, 4) -> None
12:49
2013-08-19 16:47:21,470 [inv.discovery: lldp_discovery(jnr01-yla-pet)] get_neighbor(78:19:F7:08:27:C0, 4) -> None
mikevlz|3 #
12:49
наши сегодня сервер уронили...
ufir #
12:49
и Job lldp_discovery(jnr01-yla-s42) is completed successfully ;)
mikevlz|3 #
12:49
точнее даже целое шасси
dvolodin #
12:49
ufir: ну не покрашился, значит успешно :)
mikevlz|3 #
12:49
двухсерверное...
dvolodin #
12:49
а маки эти discovery нашло?
mikevlz|3 #
12:50
с середины стойки на ИБП... Перебили провод питания единственной железки, у которой блок питания всего один
12:50
праздник, блядь...
12:51
феерверк, писк, никто не умер
ss_ #
12:51
dvolodin, Select Classification Rule to change http://pastebin.com/wgmyBn3y
dvolodin #
12:51
ss_: обновись
12:51
хотя бы на devel
ss_ #
12:52
Это как?
ufir #
12:52
dvolodin да, но странно.. 2013-08-19 16:47:22,502 [inv.discovery: lldp_discovery(jnr01-vol-ats)] get_neighbor(78:19:F7:07:FF:C0, 4) -> None - .С0 это адрес первого гигабита этого шасси, а линк подключен на десятку, в адрес .16
ss_ #
12:52
только что обновлялся вроде
ufir #
12:52
т.е. он попадает в диапазон
dvolodin #
12:52
ufir: это адрес соседа
ufir #
12:52
дык я на соседе и смотрю
dvolodin #
12:53
это его же собственный мак?
ufir #
12:53
да
dvolodin #
12:53
кинь show lldp neighbors с нее
ss_ #
12:54
dvolodin, так как?
12:54
пока с работы не выгнали еще пару минут есть
dvolodin #
12:54
ss_: обновлялся на бранч default?
ufir #
12:54
@jnr01-yla-laz> show lldp neighbors
12:54
Local Interface Chassis Id Port info System Name
12:54
xe-5/2/0 64:87:88:5d:e8:60 xe-0/0/0 jnr01-vol-ats
12:54
@jnr01-vol-ats> show lldp neighbors
12:54
Local Interface Chassis Id Port info System Name
12:54
xe-0/0/0 78:19:f7:07:ff:c0 xe-5/2/0 jnr01-yla-laz
12:55
вот эти линки друг в друга включены
dvolodin #
12:55
ufir: на пасту
ufir #
12:55
пардон
ss_ #
12:55
dvolodin, а хз, hg pull -u
dvolodin #
12:55
BRANCH=develop в upgrade.conf пропиши
ss_ #
12:56
f
ufir #
12:57
ss_ причем желательно другой закомментить ;)
12:57
dvolodin вот так получается http://pastebin.com/2NQa4XZj
ss_ #
12:57
ufir, какой:
12:57
?
ufir #
12:58
ss_ любой, как я понял - надо чтобы активный был только один
ss_ #
12:58
больше нет никто)
ufir #
12:58
а.
12:59
тогда нормуль
ss_ #
13:00
Pulling revision 'tip' from http://hg.nocproject.org/noc
13:00
не то?
dvolodin #
13:00
ufir: и при этом они в chassis id пишуте свои же маки
13:00
ss_: ./scripts/upgrade
ss_ #
13:00
вот оно и выдало
dvolodin #
13:01
ну нормально
ss_ #
13:01
FOLLOW=tip File: etc/upgrade.conf
13:01
не мешает?
dvolodin #
13:01
нет
ss_ #
13:01
UNHANDLED EXCEPTION (2013-08-19 16:55:27.253918)
13:01
Working directory: /opt/noc
13:01
<class 'django.core.urlresolvers.NoReverseMatch'>
13:01
Reverse for 'preview' with arguments '(ObjectId('4e7c607d08b54174d90001b8'),)' and keyword arguments '{}' not found.
13:01
START OF TRACEBACK
13:01
все так же
13:02
ладно меня выгоняют с работы
ufir #
13:02
dvolodin да, маки свои же.. http://pastebin.com/eHPTkw2E
13:02
специально две разных коробки взял
dvolodin #
13:03
погоди
13:03
почему свои
13:03
ах вот он ежик
13:09
кони педальные они в juniper'е
13:09
по lldl отдают private address
ufir #
13:10
скинул
13:11
хым. действительно, весёлые они там ребята
mikevlz|3 #
14:06
ээээх... опоздал...
14:06
вот решил покрутить lldp от брокейда...
mikevlz #
16:44
уотон...
16:44
dvolodin: на Catalyst3550 не определяется интерфейс в stp - это норма?
16:46
и еще, брокейд всем свои интерфейсы анонсит типом MAC-address. Чтобы их определяло - надо чтоб get_interfaces для брокейдов возвращал MAC интерфейса? если да, то нахрена в get_lldp_neighbors надо возвращать local_interface_id?
dvolodin #
16:49
смотреть надо, почему не определяется
16:59
mikevlz: да, нужно чтобы get_interfaces брокейда вернули маки
mikevlz #
17:20
окай
Tweet
Share this page
Share this page: Tweet