nocproject.org
02:16
lexus-omsk: привет
02:16
"upgrade: NOC is running now. Shutdown it first." --- знаешь что за зверь? я нок предварительно стопанул
02:17
"root@noc:/opt/noc# ps ax | grep noc-
02:17
1500 pts/0 S+ 0:00 grep --color=auto noc-"
02:17
а апргейдить не дает
02:21
Привет
02:21
Недавно Dmitry1 что-то про это коммитил вроде, надо посмотреть
02:22
я вот и хотел его коммиты про 3028 подлить
02:22
по идее он pid файлы смотрит, но может там что-нибудь дистрибутивоспецифичное
02:23
"rx_lldp_gs = re.compile(r"LLDP Status\s+: Enabled?")"
02:23
разве такой регэксп разберет и Enable и Enabled ?
02:23
02:23
по идее ? - это необязательность символа
02:24
последнего в выражении? я думал что просто символа
02:25
да, ты прав, написано "квантор ? --- 0 или 1 +"
02:26
как же проапгрейдиться-то
02:26
а, нашел файло с расширением pid, грохнул его
02:27
апдейчусь
02:30
там ещё вкусняшка должна быть - подавление флапающих алармов
02:31
я пока до FM не добрался
02:40
да, на 3028 LLDP на портах увиделось
03:23
dvolodin: привет
03:26
патч про noc.sa.models.reducetask.DoesNotExist не помог
03:27
опять вылетает?
03:27
что именно?
03:35
давай трейс
03:35
трэйс влогах
03:35
но дальше все работает
03:35
ща сделаю
03:38
03:43
закоммитил еще один фикс
03:48
поставил, понаблюдаю
03:51
dvolodin: расскажи, плс, какую инфу нужно собрать, чтобы было видно почему два длинка не линкуют друг друга по lldp, хотя кандидатами друг друга выставляют
03:52
посмотреть, что они пишут с концов
03:52
ну и проверить, что интерфейсы у них найдены
03:55
dvolodin: так в этом и вопрос :) с каких скриптов собрать инфу, что-бы было видно почему не линкуются
04:59
dvolodin: ты писал "посмотреть, что они пишут с концов, ну и проверить, что интерфейсы у них найдены"
05:00
результат работы каких скриптов собрать?
05:00
get_lldp_neighbors, get_interfaces
05:07
вчерашние патчи для FM кто-нибудь посмотрел?
05:17
05:22
в интрефейсах есть кандидаты с Commited x
05:23
передискаверил --- исчезли
05:33
с нормализацией интерфейсов разбирайтесь
05:33
там 1:24 и прочая дрянь
05:33
так работало жэ это
05:33
Dmitry1 забарывал это как-то
05:34
05:34
в конфиге все норм
05:38
все та же лобуда с postgis
05:40
And_V, юзай поиск по логам канала.
05:40
раз в день спрашивают
05:41
и еще постгрес 9,3 ?
05:46
если я снесу постгрес объекты МО у меня останутся?
05:50
тут я тебе не подскажу
05:51
более 300 не хочется заново вбивать
05:51
нет, они как раз там живут
05:51
забэкапить или экспортировать в csv
05:57
не знаешь как эспортировать?
05:58
из 0.8 или из 0.8.dev?
05:59
*экспортировать
06:01
из 0.8 -- SA, выделить все, экспорт
06:01
даст файлик csv
06:02
с небольшими правками сможешь его подтянуть в 0.8.dev
06:05
а что значит "с небольшими правками"?
06:07
в 0.8.dev нужно чуть меньше полей
06:08
можно будет в dev завести один МО и выгрузить его и будет ясно
06:08
или посмотреть чего говорит импорт\экспорт про обязательные поля
06:08
а чего у тебя ценного в списке МО?
06:09
логин\пароли разные?
06:10
везде телнетом ходишь?
06:11
тогда (имхо), имя-IP, профиль --- все что тебе нужно
06:16
VCDomain matching query does not exist.
06:17
русским по бело му же написано
06:18
а у тебя VCDomain не заполнен?
06:20
неа, только в нем дело?
06:22
выгружаю из 0.8, VCDomain не заполнен, не ругается
06:23
стоит дефолтный, "---"
06:25
то же самое, стоит дефолтный
06:26
а как выгружаешь? поставил галку, затем из действий "Export..."?
06:27
может чего для 0.8 апдэйтили
06:31
ну и выбери для одного VCDomain и попробуй его экспортнуть
06:38
если в экселе редактировать то просто удалить столбец, раз не используется vcdomain
06:38
и вообще все лишнее удалить
06:39
оставить только поля которые заполняешь и которые обязательны
06:41
С профессиональным праздником, коллеги ;)
06:42
zi_rus: так он вроде именно экспортнуть еще не может
06:43
ааа
06:43
странно это тогда
06:43
если это свичи
06:44
пусть создаст дефолтный профиль и всех туда положит
06:44
так проще будет
06:44
мне кажется
06:52
dvolodin: помоги, плс, Dmytry1 по моей LLDP проблеме говорит, что это не про порты проблема
06:52
а про что?
06:52
проверяй тогда chassis id
06:53
совпадает
06:54
уже не знаю чего и смотреть
06:54
06:56
они кандидатами у друг-друга видны
07:01
dvolodin: ага, вроде нашел. Оно локальный интерфейс неверно рисует
07:01
07:02
это в дискаверинге или что-то неправильно отдается?
07:02
т.е. нужно костыль в виде object.profile.get_interface_names() совать в функцию get_interface_by_name() файлика link_discovery. Вместе с костылем для JUNOS
07:06
dvolodin: Понял мою мысль?
07:07
ура?
07:08
меня правда удивляет, что оба кандидата нашлись и они показывают порты друг друга правильно (см.скрин)
07:09
но не апрувятся
07:10
не так
07:11
первый нашел второго: Link candidate found: 1:20 -> s448-1-1.intt:25
07:11
второй нашел первого: Link candidate found: 25 -> s67-1-1.intt:20
07:12
как видим в первом случае неверное имя локального интерфейса
07:12
а на скрине ремут 1:20
07:13
07:13
s67, 1:20 s448 25
07:13
s448 25 s67 1:20
07:13
там мегакостыль для d-link'а. Он в зависимости от прошивки, фазы луны и т.п. может отдавать как "20", так и "1:20"
07:13
я же глазами вижу, что порты правильно прописаны?
07:14
но в моем случае, на скрине я вижу:
07:14
s67, 1:20 s448 25
07:14
s448 25 s67 1:20
07:15
dvolodin: Дим, кстати у меня тоже некоторые линки в таком же подвешенном состоянии.
07:15
Сделай, плиз какой-то debug, чтобы оно написало, по какой причине их не линкует
07:15
Т.е. линки найдены, но не "commited"
07:16
и вроде как потом линк удаляется и все по новой
07:18
Dmitry1: смотри:
07:18
Pending link check: s448-1-1.intt:25 -> s67-1-1.intt:1:20
07:18
Scheduling check for s448-1-1.intt:25 -> s67-1-1.intt:20
07:18
в пендинге он показывает порт 1:20
07:18
а в шедулинге 20
07:18
как-то так оно должно быть
07:22
dvolodin: посмотри, у тебя в Pending link check порт "1:20", а в Scheduling check "20"
07:24
есть возможность применить ко всем МО объектам одно изменение, например у всех поменять VC domain?
07:25
07:25
это только консолью
07:25
там даже есть "а тут назначим всем MO "VC Domain" = 'default'"
07:26
(убегу)
07:29
спасибо
07:44
все получилось, домен выставил, табличку получил
07:46
только вот он мне сделал каждый МО как одну строку, т.е не разбил информацию по столбцам
07:49
все, допетрил
07:58
а как csv обратно в нок импортнуть, через main -- csv ex/im ?
08:00
да
08:00
правда будь готов к тому что это может не сработать
08:08
dvolodin, ValidationError(Field is required: ['control_time'])
08:09
08:09
править все созданные ?
08:10
<e_zombie> интересно...
08:10
как быть тогда?
08:11
ребят как на редхат нок поставить
08:11
And_V: править БД (с) володин
08:11
RudW0lf: как как. берёшь и ставишь .
08:11
не знаю что поправить
08:11
ага
08:11
делаешь папку /opt/noc
08:11
error: command 'gcc' failed with exit status 1
08:11
----------------------------------------
08:11
Cleaning up...
08:11
Command /opt/noc/bin/python -c "import setuptools, tokenize;__file__='/opt/noc/build/gmpy/setup.py';exec(compile(getattr(tokenize, 'open', open)(__file__).read().replace('\r\n', '\n'), __file__, 'exec'))" install --record /tmp/pip-t6DK9O-record/install-record.txt --single-version-externally-managed --compile --install-headers /opt/noc/include/site/python2.6 failed with error code 1 in /opt/noc/build/gmpy
08:11
Traceback (most recent call last):
08:11
File "./bin/pip", line 11, in <module>
08:11
sys.exit(main())
08:11
File "/opt/noc/lib/python2.6/site-packages/pip/__init__.py", line 185, in main
08:11
return command.main(cmd_args)
08:11
File "/opt/noc/lib/python2.6/site-packages/pip/basecommand.py", line 161, in main
08:11
text = '\n'.join(complete_log)
08:11
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe2 in position 67: ordinal not in range(128)
08:11
upgrade: 203: Cannot update python libraries
08:11
Terminating
08:11
djn c 'nb xnj ltkfnm
08:11
идёшь туда и через mercurial вытягиваешь.
08:11
вот с этим что делать
08:12
это уже сделано все
08:12
я на последнем пункте
08:12
во первых такими объемами лучше на пасту
08:13
<e_zombie> это как ее править?
08:13
можно поподробнее
08:13
выучить SQL и через UPDATE
08:14
SELECT * From sa_managedobject where tags is null limit 10;
08:14
UPDATE sa_managedobject set tags = {-1,-1,-1}' where name = '10.64.21.2' ;
08:14
UPDATE sa_managedobject set object_profile_id = '18' where name like 'fsw%-sar' and profile_name = 'Huawei.VRP';
08:14
UPDATE sa_managedobjectselector set filter_tags = '{s.20.0.13}' where name = 's.20.0.13';
08:14
INSERT into sa_managedobjectselector (name,filter_tags) VALUES ('s.20.720.1','{s.20.720.1}');
08:14
INSERT into inv_networkchart (name,is_active,selector_id) VALUES ('s.96.957.6','t',(SELECT id From sa_managedobjectselector where name = 's.96.957.6'));
08:14
DELETE FROM sa_managedobjectselector WHERE name like 's.%' ;
08:14
DELETE FROM main_notification WHERE notification_method = 'xmpp';
08:14
ну и тд
08:15
ну одно другому не мешает
08:15
йода-извращенец
08:17
проблема в том, что БД на другом сервере и нок после обновления отказывается ее находить. если задампить БД на тот же сервак где и нок, проблема может решится?
08:17
посмотрел последние коммиты и понял что пора как-то съезжать с ветки feature/inventory. А как переехать назад на develop ?
08:17
также
08:17
как попал на нее
08:18
And_V: проверь noc.conf на предмет правильных параметров доступа.
08:20
а заодно и на сервере бд проверь pg_hba.conf
08:20
вкупе с фаерволом
08:21
MinskSNV: может бэкап, новую, проапгрейдится до девелопа и взять данные из бэкапа? (чисто теоретически)
08:21
*проапгрейдиться
08:22
да вот хз... пробовал 2 месяца не обновляться а потом обновиться на другую ветку. Не проканало :(
08:22
походу только через новую установку :(
08:23
или ручками патчить
08:23
все норм должно быть
08:23
геморно
08:23
но нормально
08:24
все когда то спрыгивали с фиче на девелоп
08:26
<e_zombie> там все норм
08:26
тогда врубай дебаг и смотри что в логи падает
08:31
такие есть иде что можно сделать?
08:39
или noc вообще не встает на rhel?
08:41
таки что не встает тогда
08:41
насколько я понимаю там проблема в компиляции gmp
08:43
Ребята, подскажите плиз! При обновлении вываливается ошибка: - Migrating forwards to 0083_objectnotification_alarm_reopened.
08:43
> sa:0082_termination_group
08:43
DEBUG:south:south execute "CREATE TABLE "sa_terminationgroup" ("id" serial NOT NULL PRIMARY KEY, "name" varchar(64) NOT NULL UNIQUE, "description" text NULL);" with params "[]"
08:57
dvolodin:
08:57
Pending link check: s67-1-1.intt:24 -> s548-1-1.intt:1:24
08:57
Scheduling check for s67-1-1.intt:1:24 -> s548-1-1.intt:24
08:57
скажи, здесь не видно, что разный порт в пендинг и шедулинг?
08:57
(патч поставил, эффекта нет)
08:58
dvolodin: Дим, подобавляй дебаги в link_discovery.py
08:59
зачем?
08:59
чего там дебажить-то
08:59
08:59
осталась такая же картинка
08:59
скажите, что тут не так?
08:59
почему они не линкуются-то?
08:59
Дим, у меня есть объекты, которые не линкуются. И я не могу понять, почему
09:07
Pending link check: s448-1-1.intt:25 -> s67-1-1.intt:1:20
09:07
Scheduling check for s448-1-1.intt:25 -> s67-1-1.intt:20
09:07
порт то 1:20, то 20
09:08
я согласен это была не ошибка (Migrating forwards to 0083_objectnotification_alarm_reopened. > sa:0082_termination_group) это дебаг, но на этом процесс обновления НОКа висит уже минут 30
09:08
пиши багрепорт длинку
09:08
в чем проблема может быть?
09:08
TSergey: ага. нет заявленной проблемы - проблема не существует (с)
09:09
sdmitri: смотри загрузку системы. может сейчас БД там корячится.
09:09
ты тоже не видишь? что лин-дисквери в одном случае работает с одним именем, в другом --- с другим? это просто ошибка, при чем длинк? порты собрали до этого
09:10
*ллдп-дискавери
09:10
думаешь нок придумывает названия портов?
09:10
09:10
видишь, что порты одинаково называются? справа --- слева?
09:11
09:11
трабл в методе
09:12
кандидаты найдены верно, но не проапрувлены
09:13
согласен что порты видсятся верно? и локал и ремут? в данной паре
09:13
*видятся
09:16
предполагаю, что вот эта часть: "Scheduling check for" неправильно кушает порты
09:19
Ребят никто не знает что делать то с не рабочим инсталятором?
09:20
Может чего доставить надо?
09:28
09:30
для s67-1-1.intt discovery\lldp_discovery:
09:30
Pending link check: s448-1-1.intt:25 -> s67-1-1.intt:1:20
09:30
Scheduling check for s448-1-1.intt:25 -> s67-1-1.intt:20
09:30
может ли быть причиной, что в пендинге порт виден как "1:20", а в шедулинг запуливается как "20"?
09:49
TSergey может там всяких print'ов понапихать и посмотреть?
09:50
знать бы куда напихать
09:50
не зря Дима просит отладочной инфы про дискавери
09:59
dvolodin: Не могу очистить аларм. Пишет "Failed to clear alarm"
10:01
И опять вопрос. вырубить шедулер check_link ?
10:01
Пройтись по паре тысяч портов и поменять им профиль - не предлагать
10:02
У меня за выходняе набежало сорок тысяч логов "login/logout"
10:03
Должна быть кнопка: "Отключить нахер!"
10:03
Иначе мне административно запретят мониторить свичи
10:04
Каждая свистелка/перделка должна быть отключаемой. Человеческим способом, не лазя в код.
10:07
dvolodin: Дима! У меня сейчас человек за несколько десятков километров от меня пытается в логах свича найти полезную информацию. И ему мешают куча лишних записей в логе. Если учесть, что этот человек один из учредителей нашей фирмы, то мне проще вырубить н
10:20
пропиши ему прямо в job'е -- ingored = True
10:20
dvolodin: и при следующем обновлении из репозитория оно потрется
10:20
Уже раз пять прописывал
10:21
dvolodin: Дим. Оно все должно быть отключено по умолчанию
10:21
да нифига
10:22
по умолчанию должна быть аккуратность и порты должны быть подписаны
10:22
и покрашены
10:22
А не так, как с IPAM и таблицей MAC: Сначала мы вам засрем пару десятков гигов дискового пространства, а потом научим, как это отключить
10:23
dvolodin: Все порты были магистральными. Но оператор решил перед праздниками потушить один порт
10:23
В результате с 1-го мая забился весь буфер свича логами
10:23
При этом потерлись важные события
10:23
И меня только что сношали за это
10:26
граждане питонисты. Как мне модифицировать значение в копии списка, при этом не затронув list-исходника с которого оно было скопировано? оно падло иж вяжет меж собой.
10:29
>>> a = [1,2,3]
10:29
>>> b = a
10:29
>>> a.append(5)
10:29
>>> b
10:29
[1, 2, 3, 5]
10:32
а, там надо b = list(a) делать просто.
10:34
a[:]
10:34
:)
10:36
Dmitry1: ты все важные логи должен увидеть в fm
10:39
dvolodin: Дим за несколько десятков километров от меня сидит человек. Ему нужно смотреть логи со свича. Просто со свича. Без всяких syslog, snmp trap и т.п.
10:40
На ночь и на выходные их офисный компьютер тушится, поэтому логи не собираются
10:40
вот syslog и посмотрит
10:40
Вот сегодня он вышел на работу, зашел на свич посмотреть логи и охуел. И сношал мне мозг пару часов, какого хрена я каждую минуту захожу на его свич
10:41
либо ты мониторишь его свич, либо он идет в пень и отвечает за него сам
10:41
что за детский сад?
10:42
У нас так работа построена
10:42
У операторов доступ только "на посмотреть"
10:42
Вот он и решил посмотреть логи
10:43
Он учредитель. И главнее меня и моего директора. Свич лично его.
10:43
ну это ничего не отменяет.
10:44
а только усугубляет
10:44
хотя нок тоже тот ещё кусок
10:46
Dmitry1, ему скучно и он медитирует над логами?
10:46
очень вероятно. надо ему ставить линукс
10:46
У него к этому свичу подключен его район с парой тысяч абонентов.
10:47
e_zombie: Причем здесь линукс, если они в офисе компы на ночь и выходные тушат ?
10:47
И логи сохраняются только на свиче
10:47
ещё один повод сделать файлохранилище с сислогом
10:48
Каким образом ему поможет мое файлохранилище?
10:49
Или у нас теперь бензин бесплатный, что он будет ездить ко мне в офис смотреть логи своего свича?
10:49
пусть фапит на отдельный файл который ты ему будешь присылать по почте. перед этим пройдясь по нему грепом\седом
10:50
А не проще ли в NOC сделать кнопку: "отключить нафиг check_link на всех свичах, и больше никогда его не включать"
10:50
Dmitry1, скажи ему что ты заходил на свич каждую минуту потому что хотел задрочить свич и посмотреть после какой попытки он начнет тебя узнавать и пускать без пароля
10:51
Я же предлагал запуск этого джоба вынести в алармтриггер. Чем моя идея плоха?
10:51
Dmitry1: сделать файлохранилище с сислогом проще чем перетряхнуть логику нока. тем более это никто делать не будет.
10:52
триггер запускать периодически нельзя
10:52
Триггером запустить джоб
10:53
то что нок раз в минуту ебет мозги свичу это конечно неправильно, но отключать эту фишку нельзя. я уже предалгал адаптивный таймер, с течением времени увеличивать интервал проверки
10:54
хух. кажется доделал гет-инвентори для нексусов..
10:54
zi_rus: но так и не придумал алгоритм :)
10:54
Почему нельзя отключить? Вот мне НАДО. Для всех железок
10:54
удваиваем время каждую попытку
10:54
dvolodin, мне не надо его придумывать, есть 100500 алгоритмов в разных протоколах, берешь любой и юзаешь
10:55
dvolodin: Дим, в чем сложность переноса запуска джоба в алармтриггер?
10:56
Дим, я тебе сказал, как его можно отключить совсем и нафиг
10:56
если вытаскивать обновления через hg, оно смержит нормально все
10:56
dvolodin: я время от времени полностью сношу рабочую копию NOC и вместо нее тяну из репозитория
10:57
dvolodin, это не значит что другим это не надо
10:59
У нас есть триггеры, привязанные к селекторам. Я могу их включать и отключать для определенных селекторов. Удобная вещь
10:59
Почему ими не воспользоваться?
11:00
Я на вскидку тебе с десяток триггеров могу придумать, которые гораздо улучшат существующий FM
11:00
придумай
11:00
я за
11:00
фм рулит
11:01
опять же, если на то пошло, то get_interface_status на многих профилях работает по snmp
11:01
ивенттриггер на поднятие линка, если линк поднялся в полудуплексе. Должен генерировать аларм "Network | Link | Half-Duplex"
11:02
Привязывается к селектору
11:08
да кстати, Dmitry1 пропиши snmp community этому свичу и нок его по снмп тиранить будет, зато в логах тишина наступит
11:09
там нету снмп
11:09
т е лучше забыть)
11:09
у меня на всех L3 длинках отключено snmp
11:10
zi_rus, ты сейчас нарвешься, что в репо отключат по дефолту все дискавери)
11:10
я уже на таком
11:10
у меня все дискавери скопированы в конфиг
11:10
мне поуху вообще дефолты
11:10
zi_rus: May 7 10:43:54 10.116.0.33 WARN: Safeguard Engine enters EXHAUSTED mode
11:11
железка ушла в каматоз
11:11
Это означает, что свич из L3 превратился в "мыльницу"
11:11
и на тыканье палкой не реагирует
11:13
Это при попытке выгрести таблицу FDB, RDB или ARP при около 2000 записей по snmp
11:14
в скрипт костыль поставить если это такие длинки то не использовать снмп
11:14
на 3627 пока они были в ноке никаких проблем с тысячами арп не было, нок все достал и никто не завис
11:15
Через CLI оно нормально достается
11:15
если какие-то конкретные модели при конкретных условиях виснут их просто исключить
11:15
а get_interface_status через снмп еще нормальней
11:16
zi_rus: Ты предлагаешь провести эксперименты над несколькими тысячами абонентоа? Подвиснет ли у них централтный свич, или не подвиснет?
11:16
зачем, ты знаешь конкретные модели
11:16
вам тут скоро подканал придется выделять)
11:18
# Vendor Platform Version Count
11:18
1 DLink DGS-3627G 3.00.B30 8
11:18
2 DLink DGS-3627G 2.82.B13 4
11:18
3 DLink DGS-3612G 2.82.B13 3
11:18
4 DLink DGS-3612G 3.00.B30 2
11:18
5 DLink DGS-3627G 3.00.B24 1
11:18
6 DLink DGS-3627G 2.84.B10 1
11:18
7 DLink DGS-3620-28SC 2.60.B019 1
11:18
8 DLink DGS-3627G 3.00.B33 1
11:18
9 DLink DGS-3627G 2.84.B11 1
11:18
zi_rus: расскажи мне, какие модели и на каких прошивках подвисают?
11:18
я не знаю какие у тебя виснут
11:19
тебе виднее
11:19
у меня нет длинков
11:20
zi_rus: Мне виднее, когда мне с матами начинают звонить по телефону учредители, что я провожу какие-то эксперименты на ИХ оборудовании и страдают ИХ абоненты
11:20
Тема про D-link и SNMP закрыта
11:22
а мы еще и виноваты оказались
11:24
Я внес разумное предложение. Сделать часть фичей конфигурируемыми и отключаемыми
11:26
Например, мне пришлось отключить mac_discovery и ip_discovery из-за засырания мусором баз
11:27
При этом ip_discovery даже не умеет в IPAM добавлять сами железки
11:28
Что делает его не просто бесполезным, а даже тупо мешающим
11:30
все методы требуют настройки
11:30
а сами железки в IPAM точно абсолютно не нужны
11:31
Как это не нужны?
11:31
Как мне еще узнать, что за железка соответсвует данному IP ?
11:33
Точнее где это еще искать, как не в IPAM ?
11:34
Или что за железка соответсвует заданному MAC адресу?
11:34
Где это искать, как не в "Mac DB"
11:34
Но в текущем состоянии оба этих модуля не только бесполезны, но и тупо мешают
11:37
Причем об этом я говорю уже не в первый раз
11:38
А об возможностью управления задачей check_link наверное уже в десятый
11:39
Причем жто то, что реально нужно
11:41
dvolodin: Дим, вот сам подумай, зачем нужен IPAM, если там нету реальных железок ?
11:57
у кого как.
11:57
у меня все привязано и все есть
12:02
_4ePTeHok: а у меня тридцать шесть тысяч ненужных записей IP, которые я раздаю абонентам по DHCP
12:03
А реальные железки без включенного ip_discovery туда не попадают
12:03
Кроме того, туда попадает та запись IP, которая успела найтись первой.
12:04
Т.е. оно по get_arp увидел IP какой-то железуи и записало его как "ip-10-109-36-9.example.com 00:25:22:68:52:D5 Seen at Гагарина:Gagarina "
12:05
и пусть потои 100500 раз будет вызываться get_interfaces для этой железки, она все равно в IPAM будет обозвана как "ip-10-109-36-9.example.com"
12:08
Вот реальная ситуация. Приходит мне аларм "BGP Peer 10.110.0.53 session down"
12:08
И что мне с ним делать?
12:08
Где мне искать, что такое "10.110.0.53" ?
12:10
Открываю IPAM и радуюсь: 10.110.0.53 - ip-10-110-0-53.example.com
12:11
Охренеть помогло!
12:11
напиши пируль, пусть ходит по базе инвентори и все ip с интерфейсов заносит в ipam. у меня у самого руки чешутся его написать
12:12
zi_rus: Это костыль. Если оно будет штатным, то эти IP можно будет потом использовать как datasource в FM, как сейчас используются имена VLAN'ов и description от интерфесов
12:13
и это не первый костыль который придется делать, dvolodin хуй забил на базовые вещи, ofm пилит
12:14
Соответственно и MAC адреса можно будет использовать в FM для событий типа такого: "ARP 10.109.215.190 moved from F4:EC:38:83:C9:A9 to B0:48:7A:E3:26:6B on Gi 0/14"
12:14
Ведь гораздо информативнее будет выглядеть сообщение так:
12:16
"ARP 10.109.215.190 (роутер1) moved from F4:EC:38:83:C9:A9 (роутер1 порт Gi 0/1) to B0:48:7A:E3:26:6B (роутер1 порт Gi0/2) on Gi 0/14 (внешник)"
12:16
Но Дима нас тупо игнорит.
12:22
Dmitry1: а ты настрой IP Pool'ы правильно, он и не будет DHCP-адреса в IPAM писать
12:22
все, что нужно сделать, это привязку адреса к интерфейсу
12:22
dvolodin: Дим, оно сначала мне стопяццот адресов накидает, прежде чем я пойму, что эта сеть раздается по DHCP
12:23
сделайте dhcp pool discovery :)
12:24
Дим. У меня стоит NOC с настройками "по умолчанию". Результат - засратый IPAM и MAC DB, километры логов на свичах.
12:25
И ноль целых ноль десятых пользы от этого
12:25
попробовал бы ты древний NNM с настройками по умолчанию поставить
12:25
там мануал листов на 800 был, как что настроить, чтобы он хлама не насыпал
12:28
Dmitry1, решение тут простое
12:28
или настроить
12:28
или по дефолту нок ничего делать не будет
12:28
и будут в канал сыпаться вопросы - а чо маки не собираются? а чо все пустое
12:28
ничо не делается и т д
12:29
и в любом случае настраивать надо будет
12:29
Вот скажи мне. Зачем должны собираться маки?
12:29
Открой для меня тайный смысл этого действия?
12:29
мне - разгребать аварии типа флуда и флапа
12:29
а так же смотреть историю действа этого
12:30
найти абонента опять же
12:30
отследить смену клиентского спе
12:31
Постой. Ты хочешь сказать, что если я включу mac_discovery, то оно мне сделает таблицу MAC адресов, привязанных к моим железкам, а не таблицу абонентов, которые поставили себе неуправляемый свич и там стопиццот записей MAC ?
12:34
если у меня на порту абона 100500 маков - я ему пиздюлей выпишу и заблокирую порт. Ибо это регламентом сети запрешено
12:35
DGS-3627G:admin#show fdb
12:35
Command: show fdb
12:36
Total Entries: 2097
12:36
Из них мне нужны только 6 штук
12:37
Это MAC адреса интерфейсов свича
12:38
мак адреса интерфейсов в chassis_id
12:38
в макдб цель - сбор всей фдб
12:38
Это тебе классные железки попадались
12:39
Спустись с ентерпрайз левела хотя бы на корпоративный уровень
12:39
бля.
12:39
ну если еджкоре это интерпрайз, я хз.
12:40
Ну вот скажи мне, чем мне помогут 2000 записей в MAC DB для толькло одного свича?
12:40
вся суть твоего предложения сейчас - "я не хочу ничего настраивать и прописывать. У меня оборудование не может\не хочет\не поддерживает"
12:40
Что мне с ними делать то?
12:40
"давайте отключим все",
12:41
у меня для твоего сведения тоже есть говно на доступе, и говно покруче длинка - оптицины древние
12:41
но я даже с них научился дергать интерфейсы и маки - и написал пируль автомаркировки портов
12:42
зачем вам pyrule, злодеи
12:42
и теперь они дергают то что мне надо, и фм реагирует на то что надо
12:42
Обрати внимание на дату
12:42
dvolodin, Дим, это было давно
12:42
собственно я могу его дергать, скажем, при линковке еще
12:43
типа если слинковали непокрашенный порт - проверить
12:43
Я предлагаю, чтобы NOC по умолчанию заносил только статические данные в IPAM и MAC DB
12:43
не, у меня там железо-специфичное
12:43
Dmitry1, создай уже пулы адресов, для этого и внедряли их
12:43
Или как-то это настроить можно было.
12:43
у пула можно отключить дискавери
12:44
У пула ОТКЛЮЧЕН ip_discovery
12:44
всегда
12:44
:)
12:44
ну епрст
12:44
дим, вылезь из криокамеры
12:44
У меня по DHCP раздается сеть /16
12:44
ну если в адресном пространстве бардак, то не выход..
12:45
ну и сделай пул на сеть /16
12:45
среди которой есть и статика, да?)
12:45
где куча IP, принадлежащих интерфейсам железлк
12:46
10.109.0.0/22 10.110.0.62 UGS 0 44546 em0
12:46
10.109.4.0/22 10.110.0.62 UGS 0 9510 em0
12:46
10.109.8.0/22 10.110.0.64 UGS 0 0 em0
12:46
10.109.12.0/22 10.110.0.54 UGS 0 0 em0
12:46
10.109.16.0/21 10.110.0.60 UGS 0 4705021 em0
12:46
10.109.24.0/22 10.110.0.63 UGS 0 508935 em0
12:46
10.109.28.0/22 10.110.0.60 UGS 0 456284 em0
12:46
10.109.32.0/21 10.110.0.52 UGS 0 579574 em0
12:46
10.109.36.0/22 10.110.0.62 UGS 0 1269463 em0
12:46
10.109.40.0/21 10.110.0.61 UGS 0 1111393 em0
12:46
10.109.48.0/21 10.110.0.58 UGS 0 1450051 em0
12:46
10.109.56.0/21 10.110.0.52 UGS 0 1757328 em0
12:46
10.109.64.0/21 10.110.0.56 UGS 0 308825 em0
12:46
10.109.72.0/21 10.110.0.53 UGS 0 3550116 em0
12:46
10.109.80.0/21 10.110.0.55 UGS 0 3161647 em0
12:46
10.109.88.0/21 10.110.0.57 UGS 0 2652846 em0
12:46
10.109.96.0/20 10.110.0.58 UGS 0 5607440 em0
12:46
10.109.112.0/21 10.110.0.59 UGS 0 308641 em0
12:46
10.109.120.0/21 10.110.0.66 UGS 0 159722 em0
12:46
10.109.128.0/20 10.110.0.65 UGS 0 4822150 em0
12:46
10.109.144.0/22 10.110.0.67 UGS 0 1924067 em0
12:46
10.109.148.0/22 10.110.0.68 UGS 0 1699090 em0
12:46
10.109.152.0/21 10.110.0.69 UGS 0 1047874 em0
12:46
10.109.160.0/22 10.110.0.62 UGS 0 110048 em0
12:46
10.109.164.0/22 10.110.0.52 UGS 0 2281817 em0
12:46
10.109.168.0/21 10.110.0.70 UGS 0 2351841 em0
12:46
10.109.176.0/21 10.110.0.80 UGS 0 0 em0
12:46
10.109.184.0/22 10.110.0.81 UGS 0 189160 em0
12:46
10.109.188.0/22 10.110.0.83 UGS 0 870928 em0
12:46
10.109.192.0/22 10.110.0.67 UGS 0 2098365 em0
12:46
10.109.196.0/22 10.110.0.82 UGS 0 2762907 em0
12:46
10.109.200.0/22 10.110.0.85 UGS 0 56228 em0
12:46
10.109.204.0/22 10.110.0.71 UGS 0 0 em0
12:46
10.109.208.0/21 10.110.0.84 UGS 0 924166 em0
12:46
мне вручную это прорписывать?
12:47
ну вот опять
12:47
вручную лень - сделай скрипт
12:47
Зачем мне NOC, если у меня скрипт?
12:47
блин, ты как объекты в нок забивал то?
12:48
если 30 строчек тебе влом руками забить
12:48
более того - это делается 1 раз
12:48
Это только из одной сети адреса
12:48
потом только изменения добавляй
12:48
БЛЯ!!!
12:49
Какие изменения???
12:49
Это не мои устройства!
12:49
Я их только мониторю!!!
12:50
И о том, что на них произошли какие-то изменения узнаю, когда мне пару километров логов привалит, или пару гиг хуйни какой-то в IPAM !
12:50
если это не твои - то зачем тебе оттуда вообще что то
12:50
трапы настрой и все
12:50
Выше писал:
12:50
(15:09:04) Dmitry: Вот реальная ситуация. Приходит мне аларм "BGP Peer 10.110.0.53 session down"
12:50
(15:09:11) Dmitry: И что мне с ним делать?
12:50
(15:09:35) Dmitry: Где мне искать, что такое "10.110.0.53" ?
12:50
(15:11:10) Dmitry: Открываю IPAM и радуюсь: 10.110.0.53 - ip-10-110-0-53.example.com
12:51
а я тебе больше скажу
12:51
если ты полезешь в лог свитча - ты увидишь то же самое.
12:52
а ипам у тебя завязывается на непонятный адресный план, где свое\чужое в одном блоке болтается
12:53
у меня там все мое - и у всего прописан и хостнейм и адрес и объект
12:53
У каждого из этих устройств есть куча интерфейсов. Один для управления, другой для BGP, третий для OSPF+PIM, четвертый - для абонентов. Интерфейсов для абонентов может быть как один, так и десяток
12:53
В NOC'е прописан только интерфейс для управления
12:53
Остальные я хочу видеть хоть где-то
12:54
вот чтобы в ipam была привязка к железу, в ip address нужно указать ссылку на интерфейс
12:54
драсте. а что ж интерфейс-дискавери делает тогда
12:54
технически - это CHAR(24)
12:54
почему нет по сих пор
12:54
но жопа в том, что есть всякие VRRP
12:54
да
12:54
есть
12:54
у меня они есть
12:54
и интерфейсов с одним адресом может быть много на разных железках
12:54
anycast
12:54
машет ручкой
12:55
или второй вариант -- в subinterface сделать foreign key на ip address
12:55
_4ePTeHok: (15:11:10) Dmitry: Открываю IPAM и радуюсь: 10.110.0.53 - ip-10-110-0-53.example.com
12:55
тупо список ссылок
12:55
и проиндексировать его
12:56
тогда и список интерфейсов можно будет указать
12:56
страшно подумать, что будет для 127.0.0.1
12:56
:)
12:56
Можно сделать, чтобы IP в IPAM заносились по get_interfaces без включенного ip_discovery
12:56
для vrrp, hsrp, glbp, carp и прочим fhrp в ноке нет интерфейса, а стоило бы сделать им отдельную обработку
12:56
get_interfaces их поддерживает
12:56
А MAC в MAC_DB заносилось по get_interfaces без включенного mac_discovery
12:56
один цисковский?
12:57
или джуновский?
12:57
а
12:57
это не в основной ветки
12:58
блин, задобали уже)
12:58
наброски у меня были
12:58
второй день ругань одна
12:58
там нужно список из dict'ов еще добавить
12:58
нельзя без мата лазить по канату
12:58
виртуальные адреса
12:59
типа -- адрес, протокол
12:59
они должны быть и в ipv4_addresses
12:59
Короче я понял смысл: если у меня нету VRF, MPLS и тому подобной фигни, то у меня NOC работать не будет
12:59
если есть то теж не будет
12:59
Dmitry1, без настройки - да)
12:59
и в отдельном списке виртуальных адресов
12:59
Какой, блин настройки?
13:00
anycast как таковой никакой настройки не требует
13:00
тут кто-то пробегал с vrrp по всей сети
13:00
спросите как было бы удобней
13:00
а то у меня полтора инткрфейса таких
13:01
Я уже несколько раз предлагал автоматически выгребать BGP пиров с устройства и заносить их в Peer management. Но Дима не хочет, мотивируя это тем, что пиры могут быть в разных VRP
13:01
А мне это VRP и нафиг не впало! Почему я из-за того, что его у меня нету, дожен кучу ненужных дел делать
13:02
дим, сделай работающую реализацию
13:02
тогда и видно будет
13:03
тише тише
13:03
а то уже до истерики докатились
13:03
Вот: Нужно разгребать это. Там вся информация есть!
13:03
Neighbor V AS MsgRcvd MsgSent TblVer InQ OutQ Up/Down State/PfxRcd
13:03
10.110.0.52 4 65002 40241 39935 1008 0 0 4d17h 3
13:03
10.110.0.53 4 65015 40196 39884 1008 0 0 17:08:41 1
13:03
10.110.0.54 4 65018 40259 39939 1008 0 0 6d17h 1
13:03
10.110.0.55 4 65001 40257 39944 1008 0 0 6d17h 1
13:03
10.110.0.56 4 65003 40265 39940 1008 0 0 6d17h 1
13:03
10.110.0.57 4 65014 40249 39942 1008 0 0 4d17h 1
13:03
10.110.0.58 4 65005 40251 39944 1008 0 0 4d17h 2
13:03
10.110.0.59 4 65012 40221 39898 1008 0 0 19:21:12 1
13:03
10.110.0.60 4 65004 40267 39944 1008 0 0 4d17h 2
13:03
10.110.0.61 4 65010 40185 39938 1008 0 0 4d17h 1
13:03
10.110.0.62 4 65008 40262 40293 1008 0 0 21:14:03 4
13:04
10.111.0.230 4 65230 0 0 0 0 0 never Active
13:04
10.117.0.4 4 30779 567736 2395844 1008 0 0 4d17h 0
13:04
10.117.0.5 4 30779 610956 2395966 1008 0 0 4d17h 0
13:04
10.117.0.6 4 30779 537105 2395848 1008 0 0 4d17h 0
13:04
10.117.0.7 4 30779 575887 2395715 1008 0 0 4d17h 0
13:04
10.117.0.8 4 30779 541315 2395966 1008 0 0 4d17h 0
13:04
10.117.0.9 4 30779 569964 2395952 1008 0 0 4d17h 0
13:04
10.117.0.11 4 30779 538208 2396011 1008 0 0 4d17h 0
13:04
10.117.0.12 4 30779 539039 2395915 1008 0 0 4d17h 0
13:04
10.117.0.13 4 30779 540331 2395914 1008 0 0 4d17h 0
13:04
10.117.0.14 4 30779 536761 2395760 1008 0 0 4d17h 0
13:04
10.117.0.15 4 30779 568903 2395827 1008 0 0 4d17h 0
13:04
эээ
13:04
стоп
13:04
где у тебя local as там?
13:04
где afi, которые на пире подняты?
13:05
выше. не скопипастил
13:05
BGP router identifier 10.110.0.110, local AS number 65000
13:05
локальная может быть не одна
13:06
блин, вот умеет Дима закидать тонной выкладок по разным темам
13:06
что в итоге вообще уходим от темы
13:06
исходной
13:07
давайте поэтапно уже
13:07
а то и то не так и это не этак
13:07
Я про то, что я с этим сталкиваюсь ежедневно. NOC мне в этом никак не помогает, а в некоторых случаях даже мешает. А Дима собрался делать OFM
13:07
Тогда поэтапно
13:08
Вынести запуск джоба check_link в алармтриггер
13:08
Сделать возможность собирать IP адреса физических интерфесов с устройств в IPAM без включенного ip_discovery
13:09
Сделать возможность собирать MAC адреса физических интерфесов с устройств в MAC DB без включенного mac_discovery
13:10
Сделать возможность указывать переменную "max_scripts" прямо в SA профиле в файле __init__.py
13:12
может лучше профиль МО?
13:12
зачем в код то
13:12
нет
13:12
прямо в коде
13:13
зачем7
13:13
это неконфигурируемая вещь будет
13:13
потому что такие каличные железки, что на них нельзя заходить одновременно более одному пользователю
13:14
чем это мешает вынести в профиль железки?
13:14
где ей самое место
13:14
И об этом должен знать тот, кто поддерживает профиль этой железки, а не конечный пользователь NOC, у которого внезапно подвиснет железка и перестанут работать половина скриптов
13:15
Профиль - имеется ввиду файлик типа sa/profiles/DLink/DxS/__init__.py
13:15
И это реально нужная вещь!
13:16
Потому как на некоторых свичах нету аппаратного криптоакселератора и ssh ключ генерится при заходе на железку
13:16
Если одновременно пытаются зайти более одного пользователя - железка преаращается в кирпич
13:17
Это справедливо для DES-3526, DGS-3100 и еще кучи
13:17
Должна быть защита "от дурака"
13:18
это на самой железке. и это не исправить. у меня кютечи умирают от ключённого дискавери.
13:18
И это, по крайней мере для меня, реально востребованная вещь
13:18
поэтому с них только конфиги
13:21
скорее всего у тебя тоже в процессе дискавери пытаются выполниться одновременно несколько команд на железке
13:26
Ребят а как можно регулировать время закрытия алярмов?
14:06
RudW0lf: fm > setup > alarm class config
14:08
Dmitry1: это не в профиле должно быть
14:08
как ты там модель проверишь
14:08
вот в настройках MO и в MO Profile -- можно подумать
14:08
а никак. я не знаю, на каких моделях и на каких версиях прошивок может проявиться
Share this page
Share this page: