nocproject.org
04:17
lexus-omsk: теперь коллектор не отваливается при багах?
04:17
отваливается, я ещё трейс закинул
04:18
правда от ибп трап нормально распарсился сегодня, а вот asr-ка роняет коллектор
04:20
он именно слушать перестает?
04:20
или только трейс выдает
04:22
перестаёт слушать
04:22
через netstat сравниваю вывод сразу после запуска и после трейса
04:23
а логи сразу после трейса посмотри
04:23
там что-то вроде Closing socket есть?
04:25
нет, не вижу такого
04:42
трап чудной :)
04:42
OLD-CISCO-TCP-MIB::loctcpConnElapsed
04:42
типа телнет закрылся ;)
04:46
надо поковыряться в конфиге, может отключить определённые трапы... вроде такого
04:50
не надо
04:50
там в другом заковырка
04:51
судя по описанию MIB'а там значение типа TimeTicks
04:51
он вообще-то application type
04:51
для SNMP
04:52
а в трапе оно прилетает как universal type примитивный
04:52
причем совсем с безумным тегом
04:56
не только длинк значит косячит с snmp :)
04:58
я не уверен, что косячит
04:58
в значении - откровенный ноль
04:58
но вот либо декодировать его как ноль, либо все-таки как int
04:58
а snmp - еще тот кошерный завет
05:03
главное, чтоб коллектор не падал.. сейчас вот прибил активатор, он перезапустился - вроде пока слушает
05:03
ждём, что ещё прилетит ему..
06:16
Dmitry1, тут?
07:05
народ, а чего в ФМ по поводу алармов для которых нет закрывающего ивента, но они гадят периодически в логи об актуальности проблемы?
07:05
не придумали костылей?
07:05
стоило бы сделать что-нибудь
07:05
такое постоянно происходит
07:05
впервые про упсы эта тема поднималась
07:05
сейчас у меня есть циски которые в некоторых случаях ведут себя также
07:14
добрый день
07:15
никто не помнит, как игнорировать некоторые интерфейсы ФМ, например lsi* на джунах
07:15
а то весь ФМ засирают
07:15
что именно игнорить?
07:16
физические - в профиле интерфейса задаются настройки
07:16
dvolodin, кстати, хочу игнорить SVI. это реально?
07:18
и еще нужно групповое действие над алармами, минимум удаление
07:18
было как-то
07:18
то ли в МО надо было указывать, то ли еще где, но не могу найти
07:18
да, галочки там есть, только кнопку для них сделать
07:19
misak: это сейчас в профиле интерфейса. Можно только на физике
07:24
групповые действия - возможно
07:26
только я не уверен, что групповая чистка alarm'ов - это правильно
07:26
письма приходят на алармы?
07:32
а как сделать письма по отбою алармов ?
07:36
галочка в sa > setup > object notification
07:39
кстати насчёт писем - меня просто заваливает теперь, хочется более тонкой настройки...
07:40
с теми же упсами - ping failed - это мне, например, а power failed - энергетикам
07:44
нужен фильтр по класам, наверное... или ещё как-то
07:46
ну и на узлах агрегации к примеру: упал линк на дом - ну и пусть он в алармах висит, но письмо - не обязательно
07:48
mikevlz: это страшно неудобно ... у нас полно маложивущих МПЛС интерфейсов, не напасешься профилей
07:48
dvolodin: это для того чтобы алармы с таких интерфейсов чистить
07:48
хотя наверное можно пируль написать ... но мне сыкотно
07:49
подумать надо, из-за чего они вообще выскакивают
07:49
ну как, трапы приходят
07:49
можно на джунах поппробовать настроить, чтобы для них не генерилось, но есть ли такая возможность не знаю
08:02
lexus-omsk: поправил декодер
08:02
NULL там
08:03
сейчас попробую
08:21
пока вроде живёт
09:11
misak: кинь мне на почту SELECT * FROM cm_objectnotify;
09:14
там две строчки
09:14
09:30
ERROR: update or delete on table "sa_reducetask" violates foreign key constraint "task_id_refs_id_7fb7d148" on table "sa_maptask"
09:30
DETAIL: Key (id)=(26920) is still referenced from table "sa_maptask".
09:30
STATEMENT: DELETE FROM "sa_reducetask" WHERE "id" IN (26920)
09:30
почему такое может быть ?
09:32
это из лога postgresql. Нок соответственно тоже сыпет ошибки.
09:39
можно игнорировать
09:39
misak: зафиксил
09:40
lexus-omsk: ну так настрой уведомления по селектору
09:40
остальное и так будет в alarm'ах висеть
09:42
хотел сказать, что более серьёзные аварии с этих устройств я хочу на почту получать... например, линк на соседний агрегатор
09:42
а домовые линки - нет, но полностью игнорировать тоже не надо
09:43
или пример про ибп я приводил выше
09:43
алармы по питанию - электрикам, а пинг фейлед - сетевикам
09:53
lexus-omsk, а как там сейчас?
09:54
я к тому что с аларм триггером все было просто и понятно хоть и криво
09:54
и не было сообщений о закрытии алармов
09:55
по селектору и notification group - этими параметрами рулишь... плюс тип уведомления: конфиг, аларм и т.д.
09:55
а сейчас что? он шлет письма просто о любом аларме?
09:55
о любом аларме на объекте из селектора
09:55
мляяя
09:56
у меня они сотнями валятся
09:56
макфлапы
09:56
это дикость
09:56
зато и о закрытии тоже - т.е. как в рекламах "до двух раз больше"
09:56
раньше хоть по классу фильтр был
09:56
не
09:57
так дело не пойдет
09:57
это нельзя релизить
09:57
я не согласен
10:01
я не вижу как сейчас
10:01
dvolodin, чего с ОАМ? я бы перешел на ветку с нотификатором
10:01
посмотрел бы
10:02
посмотрю сейчас
10:02
может опечатался где
10:38
zi_rus: да, бага
10:38
опечатка была
10:38
пофиксил
10:38
хорошо, значит не я дурак
10:38
я этого не говорил :)
10:39
при всем желании не могу воспроизвести все разнообразие комбинаций дикой природы
10:39
у меня и так в virtualbox дикий mesh из 3 olive, аристы и вайаты
10:40
а как у НОК-а с Экстримами, мы ими затоварились на 40Г кольцо
10:41
я их даже не трогал еще
10:41
misak: делал базовую поддержку года полтора назад для индонезии
10:41
dvolodin, знаешь еще багофича. я не понял почему так было если говорите что есть дефолт, но когда я в профиле циски прописал command_exit = "exit" - нок стал правильно соединение закрывать, а не просто рвать
10:41
честно говоря - CLI тошный
10:42
zi_rus: это в каждом профиле надо писать
10:42
а говорили что есть дефолт
10:42
какой там дефолт может быть вообще :)
10:42
значит надо
10:42
можешь закинуть в циски?
10:43
мне только IOS и XR хватит :)
10:43
dvolodin, вообще может быть дефолт "exit" если не указано иное
10:43
у Длинков logout например
10:44
да, отуда и копировал
10:44
10:44
так?
10:44
нет, дефолта для всех точно не будет
10:44
dvolodin, подтверждаю
10:47
dvolodin, дискавери ОАМ выполнился, линков не нашел
10:48
может потому, что они уже найдены другими типами?
10:49
нет, линков в базе нет
10:50
тогда бери две железки, передергивай discovery на них и показывай логи для OAM
10:50
dvolodin, это две ASR9k под другие методы в ноке скриптов то нет
10:50
ну и вывод get_oam_status
10:51
а что, там CDP/LLDP нет разве?
10:51
выключен глобально
10:51
мы этим не пользуемся
10:52
а чем вас lldp напряг?
10:54
да в принципе отключен за ненадобностью, я не знаю, я хотел cdp включить, не хотят его
10:55
cdp рекомендуют выключать, как минимум на интерфейсах в сторону клиента
10:56
на каталистах на uni портах он и не включен
10:59
это поведение по умолчанию для ME3400
10:59
возможно это делали когда на сети стояли 3550
11:01
кстати, никто не обратил внимание
11:02
в сторону клиентов все выключать надо
11:02
новый нок не сохраняет положение полей в гриде
11:02
я отключаю некоторые
11:02
переоткрываю нок
11:02
и они снова отображаются
11:04
например
11:04
в ивентах
11:04
id скрываю
11:04
а он возвращается
11:12
в event'ах может и едет, проверю
11:13
в modelapplication должен сохранять
11:13
кстати, заметили, ExtJS 4.2.1 сильно шустрее 4.0.7
11:13
native scrolling рулит
11:29
да, есть такое
11:29
я было первым делом подумал, что новый сервер мощнее, все дела
11:29
а потом понял что они одинаковые
11:44
они скорость отрисовки и JS оптимизировали
11:44
сильно отзывчивее интерфейс стал
12:29
закончили тестирование бранча OAM
12:29
с oam_discovery
12:29
итого, все бранчи слиты вместе
12:36
давайте давить баги в том, что получилось
12:36
:)
12:37
zi_rus: взял на себя
12:38
dvolodin, как правильно баг для get_version отрепортить, у IOS XR через snmp - ok, через консоль трейс. тушенку к issue приложить? или сам трейс
12:38
там просто в переменных ОООООООЧЕНЬ длинный вывод команды
12:39
а ошибка
12:39
<class 'noc.sa.script.exception.UnexpectedResultError'>
12:39
START OF TRACEBACK
12:46
создал issue
12:48
Dmitry1, я думал ты запилишь всего делов, там работы на 5 минут, закоммитить что уже написано
12:52
для Cisco.IOSXR.get_fqdn и Cisco.IOSXR.get_arp
12:52
сейчас закину
13:00
Dmitry1, fqdn приложил, с остальным не так гладко
13:10
признавайтесь, какой скрипт делает привязку л3 интерфейса к врф?
13:10
хочу для ios xr правильные команды найти
13:15
get_mpls_vpn
13:16
да и get_interfaces для того же juniper'а
13:17
dvolodin, значит надо по примеру джунимера
13:17
*джунипера
13:17
на IOS XR "show vrf" не показывает интерфейсы
13:17
а show ip interface показывает
13:20
нет такой команды
13:20
show ip interface
13:20
BVI5002 is Up, ipv4 protocol is Up
13:20
Vrf is default (vrfid 0x60000000)
13:22
хотя блин
13:22
так он показывает только один врф
13:22
и это скрытая команда вообще
13:24
буду курить команды
13:24
show vrf all
13:24
VRF RD RT AFI SAFI
13:24
**nVSatellite not set
13:24
shpd 8371:23
13:24
import 8371:23 IPV4 Unicast
13:24
export 8371:23 IPV4 Unicast
13:25
но ни одного интерфейса
13:25
для iosxr есть get_mpls_vpn
13:25
:)
13:27
да, только что увидел
13:29
dvolodin, у меня в инвентори ни у одного Л3 интерфейса не стоит параметр врф
13:29
даже у тех которые сидят в врф
13:30
interface Loopback10
13:30
description SHPD LO
13:30
vrf shpd
13:30
ipv4 address 172.18.224.7/32
13:31
скрипты выполняются
13:31
но результата нет
13:32
show vrf all detail показывает врф но не показывает интерфейсы
13:33
это плохо
13:33
дискаверить будет криво
14:57
to run an activator on another host, can I just just the activator process or do I need to have other processes running as well?
15:03
giesen, you can run ./scripts/clone-activator, and start only cloned activator on other machine
15:05
do I still need mongodb/mysql on the other machine
15:05
trying to make it lightweight as possible
15:05
since I anticipate running dozens of these
15:06
no
15:06
you need only python as i know
Share this page
Share this page: