nocproject.org
03:39
ufir: именно
03:39
огрызок
03:40
с дерьмовым и слабым процом
03:40
и без резервирования
04:52
dvolodin: проблема вернулась сновая алярмы отстают на сутки
04:52
смотреть нужно, что у тебя в событиях
04:52
04:53
вот забавный патчик с защитой от взбесившихся железок
04:53
в евентах все хорошо в алярмах опять отставание на сутки
04:58
много их поднимает?
05:05
кстати, на поиграться
05:05
05:05
добрые люди прикрутили к монге индексы из tokudb
05:11
05:11
IRevent: алармов
05:12
раз в 5 минут по 2-3 но вчерашних
05:13
а в логах коррелятора что?
05:13
время синхронизировано?
05:14
в логах вроде ничего криминального время нормальное
05:16
2013-12-27 11:15:15,249 [fm.correlator] Removing job dispose(52bbbb4303bd2934f34bef94)
05:16
2013-12-27 11:15:15,277 Cannot dereference job dispose(52bbbb4703bd2934f34bef96). Removing
05:16
вот такое часто в логах
05:17
это нормально
05:18
а
05:18
Cannot dereference?
05:18
железки вытирал из базы?
05:19
нет
05:20
там просто куча логов с железок для которых МО нету валится
05:20
dvolodin, а что ты сломал? у меня обновление не проходит
05:20
Syncing inv.objectmodels
05:20
... updating Cisco | ME3400E | ME-3400E-24TS-M
05:20
... updating Cisco | ME3400E | ME-3400E-24TS-M
05:20
Error: Checksum mismatch for file 'inv/collections/objectmodels/Cisco/ME3400E/ME-3400E-24TS-M.json'
05:22
я обновлял ее вроде
05:23
или ты руками правил
05:23
хм
05:23
правил чтобы тебе дифф отправить
05:23
hg revert сделать?
05:24
а, ну да, у меня там фикс стоит, ты его еще не закоммитил
05:27
dvolodin,
NOC-1249 - сделай тогда, а то некрасиво получается
05:27
у меня трансиверы в дырки не вставляются
05:36
спасибо
05:37
dvolodin, а это
05:37
- "direction": "s",
05:37
+ "direction": "i",
05:38
да
05:38
dvolodin, первый коммент из того issue
05:38
дырка под sfp типа i всегда
05:38
или я не поправил?
05:39
ты не поправил, там по ошибке S стоит
05:39
и трансиверы не лезут
05:39
и ты комменты не прочитал
05:39
там еще один вендор
05:40
еще трансивер
05:40
и исправленый вариант Sumitomo етрансивера
05:40
я ему имя SFP LX вместо part_no сделал
05:49
чего-то в битбакете не вижу
05:51
dvolodin, да, спасибо, все приехало
05:54
заодно и проверили переименование
05:54
:)
06:39
lexus-omsk, это ведь ты хотел статью
06:39
06:40
да мне в принципе достаточно было того, что ты в тот раз скинул, а вот другим пригодится
06:41
и я думал там не периодик будет, есть же специальный интерфейс для классификации... если не ошибаюсь?
06:41
эмм
06:41
может и есть, я не знаю о нем
06:41
да и на что реагировать то?
06:42
периодик вполне работает
06:42
знаешь
06:42
за год
06:42
вот ни разу не имел проблемы что он периодик а не триггер
06:42
называется IInterfaceClassification
06:43
не, ну так-то да, разница не большая, будет оно сразу при создании интерфейса, или раз в сутки, скажем
06:43
zi_rus: там не триггеры. Там именно интерфейс. Пишешь пирулю с этим интерфейсом, она получает на входе от дискавери описание интерфейса и железку, задает ему класс на выходе.. Дискавери пишет в базу с этим классом
06:44
mikevlz, ну это и есть триггер, она получает на входе в какой момент? когда дискавери прошелся и скормил ей это
06:44
ну воспринимай как знаешь
06:45
это правило классификации указываается в конфигах
06:45
если это будут в нок встраивать, я всем мозг вынесу чтобы делали правильно, через этот интерфейс или еще как
06:45
а пока мне хватате того как оно работает
06:46
это костыль до того момента пока оно в апстрим не вольется
06:51
эх, как достало периодическое поглюкивание web-морды... это только в Опере бывает, когда перестают нормально закрываться и открываться вкладки?
06:51
и еще в хроме вроде бывает
06:52
06:52
а да, точно
06:52
было такое
06:53
i.profile=InterfaceProfile.objects.get(name="NNI").id
06:53
не стоит так в цикле дергать
06:53
сделай переменные nni_id = ....
06:53
lexus-omsk, это когда откраваешь новый таб а у него только заголовок появляется?
06:53
да можно так, не оптимизировал, работает не трогай, как говорится
06:54
скорее наоборот - не появляется самого таба сверху, только его содержимое, и то в маааленьком неюзабелном окошке
06:55
дадада
06:55
точно
06:55
тоже эта фигня творится
06:55
я думал всегда что это фича :)
06:57
dvolodin, в статье поправил по твоей рекомендации
06:57
там есть еще залипание, когда закрываешь таб, он остается. Закрывается со второго раза, только вот все что после него - несдвигается
06:58
mikevlz, короче глючит он
06:58
оно вместе приходит по-моему, сначала не закрывается, а потом и новые глючат
06:58
mikevlz: а про какой конфиг ты говорил, где указывается пируль?
06:59
lexus-omsk: то-ли основной Noc.conf, то-ли дискавери... не помню :)
07:00
основной, точно... я дискавери первым делом проверил
07:19
zi_rus: кстати, если по умолчанию распихивать порты на uni/nni
07:19
то можно реализовать это сразу в interface discovery
07:19
эмм, и как ты себе это представляешь?
07:20
смотри
07:20
если нашли линк -- проверяем с каждой стороны, если стоит дефолтный профиль - пишем NNI
07:21
а во время interface discovery -- если у нас уже есть интерфейс и у него есть линк и дефолтный профиль - ставить NNI
07:22
приветы.
07:22
Error: Checksum mismatch for file 'inv/collections/objectmodels/Avago/Transceiver/1G/SFP_T.json'
07:22
и нахрен это встраивать? лучше пример стандартной пирули сделать.
07:22
стандартная болезнь?
07:22
`kk: ага
07:22
поправлю
07:27
dvolodin, как тебе сказать, я тебе еще два года назад такое предлагал сделать, если есть линк значит порт сетевой, значит нужный профиль указать, но это слишком сильно прибивается гвоздями. пример, у меня с ноке есть cpe клиентские, так что лично у себя я в NN
07:27
I перевожу не просто все порты с линками, а с линками которые НЕ смотрят на СРЕ. Встроенный пируль более гибкое решение, его и отключить и поправить под свои нужды легче чем копать код нока, еще и сломаешь что-нибудь
07:32
у меня тоже кстати отставание на сутки.
07:32
07:33
откуда столько народу понабежало? почти 40 человек
08:29
e_zombie: ты патчик накати, со своим отставанием
08:39
попробую в ближайшее время. бумажная работа
09:08
zi_rus: очень сильно не хватает построчной коментариев кода.
09:21
dvolodin:
09:21
2013-12-27 13:19:46,763 REPORT: elapsed: 95.2849s, speed: 10.5ev/s, events: 1000, lag: 84945.763472s, failed: 0, deleted: 2, suppressed: 0, unknown: 324, classified: 271, disposed: 112, duplicated: 291, unk. duplicated: 0
09:21
2013-12-27 13:21:39,585 REPORT: elapsed: 112.8213s, speed: 8.9ev/s, events: 1000, lag: 85031.585354s, failed: 0, deleted: 0, suppressed: 0, unknown: 620, classified: 142, disposed: 106, duplicated: 132, unk. duplicated: 0
09:23
dvolodin: Не смержилась часть файлов
09:26
e_zombie, мне кажется там все очевидно. а что тебе непонятно?
09:27
вот когда тебе кажется что что то очевидно - это как раз и оказывается самым сложным для понимания другими.
09:27
я это ещё со школы выучил. когда готовился к олимпиадам по физике.
09:27
и в жизни это подтверждается не раз
09:28
слышал бы ты как я на съёмках с моделью общаюсь.
09:28
там вообще всё пошагово идёт всегда
09:29
zi_rus: по моим подсчетам у него вот тут unk. duplicated: 0 должно быть изрядно
09:29
ну там вроде все названия сделаны логичными, просто из названия должно быть понятно что происходит
09:32
e_zombie, ну ты тогда задай вопросы, потому что в коде где один цикл и if else, я даже не знаю что тут комментировать
09:37
dvolodin, ну без правил конечно таких полно будет
09:39
zi_rus: вот и напиши что где какая переменная означает
09:39
там одна переменная
09:39
i
09:39
это объеки
09:39
*объект
09:39
текущий интерфейс
09:41
цикл же по ней построен
09:46
кто в курсе чего у ростелекома в сторону европы умерло?
09:52
что-то большое
09:52
на Наге тоже жалуются.
09:58
добавил классификатору хитрую давилку unknown | syslog
09:58
которая гасит повторы
09:59
как защита от флудящих железок
10:03
dvolodin: а как быть с моими отстающими алярмами?
10:04
IRevent: жди. сейчас поправят кое что и возможно это полечит
10:05
IRevent: что у тебя REPORT в логе классификатора показывает?
10:06
2013-12-27 16:07:13,239 REPORT: elapsed: 0.2206s, speed: 22.7ev/s, events: 5, lag: 1.239098s, failed: 0, deleted: 0, suppressed: 0, unknown: 0, classified: 2, disposed: 3, duplicated: 0, unk. duplicated: 0
10:06
2013-12-27 13:58:37,715 REPORT: elapsed: 67.8842s, speed: 14.7ev/s, events: 1000, lag: 87073.715219s, failed: 0, deleted: 0, suppressed: 0, unknown: 119, classified: 205, disposed: 83, duplicated: 265, unk. duplicated: 328
10:06
2013-12-27 14:00:14,030 REPORT: elapsed: 96.3145s, speed: 10.4ev/s, events: 1000, lag: 87158.030456s, failed: 0, deleted: 0, suppressed: 0, unknown: 208, classified: 180, disposed: 135, duplicated: 140, unk. duplicated: 337
10:06
2013-12-27 14:01:47,887 REPORT: elapsed: 93.8562s, speed: 10.7ev/s, events: 1000, lag: 87246.887099s, failed: 0, deleted: 0, suppressed: 0, unknown: 244, classified: 110, disposed: 117, duplicated: 113, unk. duplicated: 416
10:06
2013-12-27 14:03:43,039 REPORT: elapsed: 115.1520s, speed: 8.7ev/s, events: 1000, lag: 87360.039769s, failed: 0, deleted: 0, suppressed: 0, unknown: 270, classified: 122, disposed: 162, duplicated: 115, unk. duplicated: 331
10:06
2013-12-27 14:06:05,497 REPORT: elapsed: 142.4574s, speed: 7.0ev/s, events: 1000, lag: 87501.497643s, failed: 0, deleted: 0, suppressed: 0, unknown: 296, classified: 38, disposed: 195, duplicated: 35, unk. duplicated: 436
10:06
2013-12-27 14:06:59,018 REPORT: elapsed: 53.5207s, speed: 18.7ev/s, events: 1000, lag: 87552.018884s, failed: 0, deleted: 0, suppressed: 0, unknown: 359, classified: 45, disposed: 57, duplicated: 40, unk. duplicated: 499
10:06
с самым последним патчем проверй
10:07
e_zombie: да, у тебя заработала давилка повторов
10:07
уже неплохо
10:07
но лаг то увеличивается
10:09
у меня не давит дубли
10:10
ты куда патч то залил в инвенотри поди?
10:10
давай к нам, у нас есть патчик
10:11
мне страшно
10:12
хотя нет я на инвентори как оказалось
10:41
если я себе в профиле добавил почту или изменил ее, когда оно применится?
10:43
или надо нок рестартить?
10:43
или как?
10:44
значит просто должно примениться?
10:45
хорошо
10:45
было бы неприятно узнать что почта не применилась и надо еще что-то сделать
10:46
а нотификация нужна сейчас
10:47
в фм вообще ничего нельзя добавить без рестарта
10:47
правило - рестарт
10:47
триггер -рестарт
10:48
и это правильно.
10:48
а то жиром заплывешь
10:49
это не помогает. позавчера медосмотр был, сказали уже заплываю
10:54
а мне постеснялись...
10:55
в тренажёрку вас всех
10:56
я ленюсь
10:56
надо просто меньше жрать
10:58
IRevent не дождался патча ;)
10:58
нашли причину оттупки классификатора
11:03
dvolodin, admin и oper status надо разделять и выводить в инвентори
11:03
oper в inventory нельзя
11:03
это динамифка
11:04
почему нельзя?
11:04
не, ты можешь засунуть его куда хочешь
11:04
но он должен быть в инвентори
11:04
у портов
11:04
точнее у интерфейсов
11:06
:)
11:06
наверное, нужно коллекцию наворотить
11:06
oper_status
11:07
с полями managed object id, interface name и oper_status
11:07
а может и admin status туда же
11:07
а у тебя интерфейсы в постгресе? может их тупо в монгу утащить полностью?
11:07
в монге
11:07
и коллекцию в монгу
11:08
так почему нельзя просто параметр добавить
11:08
или это плохо скажется на масштабируемости?
11:08
именно
11:09
постоянные апдейты статических данных - это не очень хорошо
11:09
там немного в другом дело
11:10
dvolodin: будешь пилить чекбокс в СА с включение\отключение классификации событий для объекта?
11:10
или будем обусждать?
11:10
e_zombie, по-моему ты чего-то курнул. зачем это надо
11:12
если у тебя есть в сети железка с битой сфпи которая шлёт 10 событий в сек - твоему классификатору "пиздарики фанарики"
11:12
e_zombie: уже нет
11:12
как видишь
11:12
а если 10 - то гарантированнл
11:13
и что быстрее - снять чекбокс или писать пирулю?
11:13
e_zombie, быстрее поменять sfp
11:13
за 100 км?
11:13
да ты супермэн я гляжу
11:14
e_zombie: сними trap source, и будет тебе счастье
11:14
да хоть за тысячу, у тебя на сети проблема, ее надо решать, брать новую сфп из зипа и ехать менять
11:14
а если серьезно -- то явно нужна простыня настроек
11:14
как минимум -- копия всего, что есть в managed object profile
11:15
конечно нужна, пингование конкретной железки отключить прямо не получается
11:15
zi_rus: это вам хорошо, у вас сухо и холодно
11:15
zi_rus: а в этот момент система управления сетью у тебя полегла. и ты думаешь это правильно?
11:15
а у них в саратове девки горячие, парней караулят
11:15
сунет монтажник еще SFP не туда, как доставать?
11:15
девки у нас нихуя не горячие.
11:16
тупые сучки через одну
11:16
e_zombie, я думаю что жизнь мониторинга это дело второе. и если поток событий смог его положить то надо решать почему это произошло
11:17
вот и я о том же. и причём это должен сделать обычный тупой сменный. а не ты в пьяном угаре 31 января
11:17
нет, это никто не должен делать
11:17
пьяный угар 31 января?
11:17
стоп
11:17
мониторинг должен выдерживать
11:18
хорош пить спирт для протирки оптических осей
11:18
dvolodin, 31 января это пятница, так что ок
11:18
zi_rus: это ты расскажи володину с его блокировками в монге :)
11:18
dvolodin, почему нок не выдерживает битые сфпшки?
11:18
:) ЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫ
11:19
не выдергивает?
11:19
в этом что-то есть
11:19
злой фолт с криком "заебала" гасит флудящий порт
11:19
:)
11:19
и карает ответсвенного
11:20
e_zombie, dvolodin говорит что сменному будет бить удар током в причинные места пока не поменяет сфп
11:21
ну у нас в 180 км один уже три месяца меняет
11:21
электрический стул для мониторинга
11:23
[root@orangebox remote]# grep "Dec 27 15:22" snet.log | wc -l
11:23
1945
11:23
это у меня так сеть сообщает о самочувствии
11:43
12:18
ну нет повода не выпить.
12:18
вроде работает теперь слассификатор нормально
12:18
в новый год с новым классификатором
12:22
простите нуба, а это что за подсистема?
12:22
cm? или sa?
12:23
[root@orangebox remote]# grep "Dec 27 15:22" snet.log | wc -l
12:23
1945
12:23
[root@orangebox remote]# ls -1 ./hosts/ | wc -l
12:23
4400
12:23
[root@orangebox remote]#
12:24
ну вот что бы знали до какого предела мы пока можем маштабироваться
12:34
а что за папка хостс ?
12:34
туда сислог валит логи с сети в файлы
12:35
я свой сислог сервер назвал orangebox по аналогии с чёрным ящиком на самолётах
12:35
Вова - выпей лучше вискаря
12:35
грамм 300
12:35
300 мало
12:35
лучше вина. 0.7э
12:36
да хз. я в вине не разбираюсь, которым баба моя поит - то и пью иногда
12:36
хорошее вино - это очень и очень неплохо
12:36
и голова не болит и праздник быстро не заканчивается
12:46
dvolodin: Дииим! Доделай мержинг. Не все изменения перенеслись!
12:48
e_zombie просто я люблю нефть
12:48
а еще я люблю маму, Родину и деньги
12:49
Dmitry11: что не донеслось?
12:50
12:51
перекдючись на development и увидишь различия
12:52
Это только то, на что мне указали
13:07
zi_rus: вот с последним коммитом можно будет и состояние линков отслеживать по event'ам
13:15
dvolodin: увидел разницу между ветками ?
13:27
походу и дискавери начало быстрее работать
15:32
приветствую всех
15:33
добрались таки руки для внедрения noc
15:33
с чего посоветуете начать? добавил несколько MO. конфиги собирает.
15:34
MO нескольких типов добавил - от отступа до роутеров
15:34
отступа = доступа)
15:39
mik0s: настрой их, чтобы слали логи и трапы
15:39
И смотри на FM
15:39
все на корпоративах чоль?
15:39
о
15:40
Dmitry11: спасибо. Это где хоть настраивается?
15:40
в самих железках сам настраивай
15:41
а кто подскажет, можно ли импортировать новые модели оборудования в ветку default ?
15:41
в смысле syslog в сторону noc засылать? и snmp trap туда же?
15:41
а в НОК - в МО достаточно прописаит Trap Source IP
15:41
mik0s: да
15:42
заодно, можешь импортировать вланы с железок в VC
15:42
Dmitry11: на железках syslog и trap в сторону noc + в МО указать Trap Source IP ?
15:43
Dmitry11: спасибо - сейчас тогда пока это сделаю
15:43
а вот с импортом в VC траблы. пробовал сделать, но вываливается окно заполненное пустыми строками
15:45
mik0s: обновляйся до текущих версий
15:45
скорее всего у тебя релиз 0.8
15:46
вроде скриптом ставился
15:46
ага, так и есть в эбаут 0.8
15:46
обновление с помощью /opt/noc# ./scripts/upgrade
15:46
?
15:47
или как-то еще?
15:51
обновился через скрипт /opt/noc# ./scripts/upgrade
15:51
0.8
15:51
и лучше сразу на ветку inventory потому что девелом и дефолт устаревшие очень сильно
15:51
правь конфиг upgrade.conf
15:51
15:53
активненько так)
15:53
ага, спасибо. сейчас проверим
15:53
сегодня полечили одну очень неприятную багу которую не видели гдето с год
15:54
у тебя есть на сколько устройств?
15:54
сеть на сколько устройств?
15:55
у меня в ноке 6500 железок
15:55
около 500 коммутаторов - малышка)
15:55
да. у тебя всё будет хорошо
15:56
помни что эксполрт импорт работает криво с тегами
15:56
тиы пока не знаешь зачем это - но помни об этом когда у тебя не поднимутся бакапы :)
15:56
просто пока даже не представляю куда дальше смотреть. много всего. по рассказам все очень вкусно, но что где - хз
15:56
ok )
15:57
добавь руками одну железку
15:57
потом сделай экспорт
15:57
и потом сделай csv файл для всх остальных лжелезок и загрузи в систему
15:58
это всё в Sistem activation \ menedgement objecy
15:58
ага, спасибо - как раз думал как остальной доступ туда впихивать
15:59
вот есть у меня все железки
15:59
конфиги собираются
15:59
потом в SA сходи в сетуп и сделай там MO profiles
15:59
и разбей их по группам типов железок
15:59
так будет удобнее отключить лишний опрос
16:00
вернее сд\перва это сделай а потом уж генери файл с железками
16:00
e_zombie: а какой функционал будет полезен первое время?
16:00
нужны модели сейчас - сиди на feature/inventory
16:01
сбор конфигов
16:01
потом карты
16:01
это работает почти правильно.
16:01
dvolodin: у меня при установке из ветки интвентори нету моделей, которые есть в дефолтной ветке
16:01
остальное через ёбтвоюмать
16:01
ни длинком ни зте
16:02
*длинков
16:02
e_zombie: по конфигам - вот есть они. на роутерах полезно, на аггрегации да, но доступ - там пол конфига динамические. можно как-то убирать не нужное или пусть складируются состояния?
16:05
h4wk: каких именно?
16:05
mik0s: лишнее из конфига тоже можно вырезать
16:06
да прибудет с новичками сила
16:06
пошёл я домой
16:06
e_zombie: а где искать логи железки которые завернул на noc?
16:07
e_zombie: спасибо за помощь
16:07
в СА \ мо \ сама железка сверху меню конфиш
16:07
там же скрипты и аварии
16:07
ну ещё фаулт менеджемент более менее. его сегодня как раз починили
16:08
всё. ушёл
16:09
хм - нету никакого меню
16:09
даже отредактировать MO не могу теперь)
16:09
e_zombie: давай, удачи)
16:10
dvolodin: это уже ручками в скриптах?
16:11
dvolodin: mik0s: лишнее из конфига тоже можно вырезать
16:11
аа, понятно. ну до этого еще далеко))
16:11
чего-то толи обновилось плохо, то ли еще что -- не вижу в SA MO меню никакого, только строка поиска
16:12
и даже всплывающая менюшка на железке не работает (
16:15
проблема в safary?
16:18
zi_rus: твое как-то так
16:18
16:19
safari нормально работает
16:19
лучше обновись до feature/inventory
16:19
dvolodin: как раз до него обновился
16:19
до этого работало)
16:20
тогда настройки nginx проверь
16:20
и кеши сбрось
16:20
и перегрузи страницу
16:20
попробую
16:20
да уж перегружал и страницу и сам noc
16:21
р
16:21
о
16:21
логаут/логин помог)
17:10
а киньте кто-нибудь JSON с классифицированных событий Link Up, Link Down и Err-Disable?
Share this page
Share this page: