nocproject.org
03:39
ufir: именно
03:39
огрызок
03:40
с дерьмовым и слабым процом
03:40
и без резервирования
 
04:52
dvolodin: проблема вернулась сновая алярмы отстают на сутки
 
04:52
смотреть нужно, что у тебя в событиях
04:52
04:53
вот забавный патчик с защитой от взбесившихся железок
 
04:53
в евентах все хорошо в алярмах опять отставание на сутки
 
04:58
много их поднимает?
05:05
кстати, на поиграться
05:05
05:05
добрые люди прикрутили к монге индексы из tokudb
 
05:11
05:11
IRevent: алармов
 
05:12
раз в 5 минут по 2-3 но вчерашних
 
05:13
а в логах коррелятора что?
05:13
время синхронизировано?
 
05:14
в логах вроде ничего криминального время нормальное
05:16
2013-12-27 11:15:15,249 [fm.correlator] Removing job dispose(52bbbb4303bd2934f34bef94)
05:16
2013-12-27 11:15:15,277 Cannot dereference job dispose(52bbbb4703bd2934f34bef96). Removing
05:16
вот такое часто в логах
 
05:17
это нормально
05:18
а
05:18
Cannot dereference?
05:18
железки вытирал из базы?
 
05:19
нет
05:20
там просто куча логов с железок для которых МО нету валится
 
05:20
dvolodin, а что ты сломал? у меня обновление не проходит
05:20
Syncing inv.objectmodels
05:20
    ... updating Cisco | ME3400E | ME-3400E-24TS-M
05:20
    ... updating Cisco | ME3400E | ME-3400E-24TS-M
05:20
Error: Checksum mismatch for file 'inv/collections/objectmodels/Cisco/ME3400E/ME-3400E-24TS-M.json'
 
05:22
я обновлял ее вроде
05:23
или ты руками правил
 
05:23
хм
05:23
правил чтобы тебе дифф отправить
05:23
hg revert сделать?
05:24
а, ну да, у меня там фикс стоит, ты его еще не закоммитил
 
05:27
dvolodin, 
NOC-1249 - сделай тогда, а то некрасиво получается
05:27
у меня трансиверы в дырки не вставляются
 
05:36
спасибо
05:37
dvolodin, а это
05:37
-            "direction": "s",
05:37
+            "direction": "i",
 
05:38
да
05:38
dvolodin, первый коммент из того issue
 
05:38
дырка под sfp типа i всегда
05:38
или я не поправил?
 
05:39
ты не поправил, там по ошибке S стоит
05:39
и трансиверы не лезут
05:39
и ты комменты не прочитал
 
05:39
там еще один вендор
05:40
еще трансивер
05:40
и исправленый вариант Sumitomo етрансивера
05:40
я ему имя SFP LX вместо part_no сделал
 
05:49
чего-то в битбакете не вижу
05:51
dvolodin, да, спасибо, все приехало
 
05:54
заодно и проверили переименование
05:54
:)
 
06:39
lexus-omsk, это ведь ты хотел статью
06:39
 
06:40
да мне в принципе достаточно было того, что ты в тот раз скинул, а вот другим пригодится
06:41
и я думал там не периодик будет, есть же специальный интерфейс для классификации... если не ошибаюсь?
 
06:41
эмм
06:41
может и есть, я не знаю о нем
06:41
да и на что реагировать то?
06:42
периодик вполне работает
06:42
знаешь
06:42
за год
06:42
вот ни разу не имел проблемы что он периодик а не триггер
 
06:42
называется IInterfaceClassification
06:43
не, ну так-то да, разница не большая, будет оно сразу при создании интерфейса, или раз в сутки, скажем
 
06:43
zi_rus: там не триггеры. Там именно интерфейс. Пишешь пирулю с этим интерфейсом, она получает на входе от дискавери описание интерфейса и железку, задает ему класс на выходе.. Дискавери пишет в базу с этим классом
 
06:44
mikevlz, ну это и есть триггер, она получает на входе в какой момент? когда дискавери прошелся и скормил ей это
 
06:44
ну воспринимай как знаешь
06:45
это правило классификации указываается в конфигах
 
06:45
если это будут в нок встраивать, я всем мозг вынесу чтобы делали правильно, через этот интерфейс или еще как
06:45
а пока мне хватате того как оно работает
06:46
это костыль до того момента пока оно в апстрим не вольется
 
06:51
эх, как достало периодическое поглюкивание web-морды... это только в Опере бывает, когда перестают нормально закрываться и открываться вкладки?
 
06:51
и еще в хроме вроде бывает
 
06:52
06:52
а да, точно
06:52
было такое
 
06:53
i.profile=InterfaceProfile.objects.get(name="NNI").id
06:53
не стоит так в цикле дергать
06:53
сделай переменные nni_id = ....
 
06:53
lexus-omsk, это когда откраваешь новый таб а у него только заголовок появляется?
 
06:53
да можно так, не оптимизировал, работает не трогай, как говорится
 
06:54
скорее наоборот - не появляется самого таба сверху, только его содержимое, и то в маааленьком неюзабелном окошке
 
06:55
дадада
06:55
точно
06:55
тоже эта фигня творится
 
06:55
я думал всегда что это фича :)
 
06:57
dvolodin, в статье поправил по твоей рекомендации
 
06:57
там есть еще залипание, когда закрываешь таб, он остается. Закрывается со второго раза, только вот все что после него - несдвигается
 
06:58
mikevlz, короче глючит он
 
06:58
оно вместе приходит по-моему, сначала не закрывается, а потом и новые глючат
06:58
mikevlz: а про какой конфиг ты говорил, где указывается пируль?
 
06:59
lexus-omsk: то-ли основной Noc.conf, то-ли дискавери... не помню :)
 
07:00
основной, точно... я дискавери первым делом проверил
 
07:19
zi_rus: кстати, если по умолчанию распихивать порты на uni/nni
07:19
то можно реализовать это сразу в interface discovery
 
07:19
эмм, и как ты себе это представляешь?
 
07:20
смотри
07:20
если нашли линк -- проверяем с каждой стороны, если стоит дефолтный профиль - пишем NNI
07:21
а во время interface discovery -- если у нас уже есть интерфейс и у него есть линк и дефолтный профиль - ставить NNI
 
07:22
приветы.
07:22
Error: Checksum mismatch for file 'inv/collections/objectmodels/Avago/Transceiver/1G/SFP_T.json'
 
07:22
и нахрен это встраивать? лучше пример стандартной пирули сделать.
 
07:22
стандартная болезнь?
 
07:22
`kk: ага
07:22
поправлю
 
07:27
dvolodin, как тебе сказать, я тебе еще два года назад такое предлагал сделать, если есть линк значит порт сетевой, значит нужный профиль указать, но это слишком сильно прибивается гвоздями. пример, у меня с ноке есть cpe клиентские, так что лично у себя я в NN
07:27
I перевожу не просто все порты с линками, а с линками которые НЕ смотрят на СРЕ. Встроенный пируль более гибкое решение, его и отключить и поправить под свои нужды легче чем копать код нока, еще и сломаешь что-нибудь
 
07:32
у меня тоже кстати отставание на сутки.
 
07:32
07:33
откуда столько народу понабежало? почти 40 человек
 
08:29
e_zombie: ты патчик накати, со своим отставанием
 
08:39
попробую в ближайшее время. бумажная работа
09:08
zi_rus: очень сильно не хватает построчной коментариев кода.
09:21
dvolodin:
09:21
2013-12-27 13:19:46,763 REPORT: elapsed: 95.2849s, speed: 10.5ev/s, events: 1000, lag: 84945.763472s, failed: 0, deleted: 2, suppressed: 0, unknown: 324, classified: 271, disposed: 112, duplicated: 291, unk. duplicated: 0
09:21
2013-12-27 13:21:39,585 REPORT: elapsed: 112.8213s, speed: 8.9ev/s, events: 1000, lag: 85031.585354s, failed: 0, deleted: 0, suppressed: 0, unknown: 620, classified: 142, disposed: 106, duplicated: 132, unk. duplicated: 0
 
09:23
dvolodin: Не смержилась часть файлов
 
09:26
e_zombie, мне кажется там все очевидно. а что тебе непонятно?
 
09:27
вот когда тебе кажется что что то очевидно - это как раз и оказывается самым сложным для понимания другими.
09:27
я это ещё со школы выучил. когда готовился к олимпиадам по физике.
09:27
и в жизни это подтверждается не раз
09:28
слышал бы ты как я на съёмках с моделью общаюсь.
09:28
там вообще всё пошагово идёт всегда
 
09:29
zi_rus: по моим подсчетам у него вот тут unk. duplicated: 0 должно быть изрядно
 
09:29
ну там вроде все названия сделаны логичными, просто из названия должно быть понятно что происходит
09:32
e_zombie, ну ты тогда задай вопросы, потому что в коде где один цикл и if else, я даже не знаю что тут комментировать
09:37
dvolodin, ну без правил конечно таких полно будет
 
09:39
zi_rus: вот и напиши что где какая переменная означает
 
09:39
там одна переменная
09:39
i
09:39
это объеки
09:39
*объект
09:39
текущий интерфейс
09:41
цикл же по ней построен
 
09:46
кто в курсе чего у ростелекома в сторону европы умерло?
 
09:52
что-то большое
09:52
на Наге тоже жалуются.
 
09:58
добавил классификатору хитрую давилку unknown | syslog
09:58
которая гасит повторы
 
09:59
как защита от флудящих железок
 
10:03
dvolodin: а как быть с моими отстающими алярмами?
 
10:04
IRevent: жди. сейчас поправят кое что и возможно это полечит
 
10:05
IRevent: что у тебя REPORT в логе классификатора показывает?
 
10:06
2013-12-27 16:07:13,239 REPORT: elapsed: 0.2206s, speed: 22.7ev/s, events: 5, lag: 1.239098s, failed: 0, deleted: 0, suppressed: 0, unknown: 0, classified: 2, disposed: 3, duplicated: 0, unk. duplicated: 0
 
10:06
2013-12-27 13:58:37,715 REPORT: elapsed: 67.8842s, speed: 14.7ev/s, events: 1000, lag: 87073.715219s, failed: 0, deleted: 0, suppressed: 0, unknown: 119, classified: 205, disposed: 83, duplicated: 265, unk. duplicated: 328
10:06
2013-12-27 14:00:14,030 REPORT: elapsed: 96.3145s, speed: 10.4ev/s, events: 1000, lag: 87158.030456s, failed: 0, deleted: 0, suppressed: 0, unknown: 208, classified: 180, disposed: 135, duplicated: 140, unk. duplicated: 337
10:06
2013-12-27 14:01:47,887 REPORT: elapsed: 93.8562s, speed: 10.7ev/s, events: 1000, lag: 87246.887099s, failed: 0, deleted: 0, suppressed: 0, unknown: 244, classified: 110, disposed: 117, duplicated: 113, unk. duplicated: 416
10:06
2013-12-27 14:03:43,039 REPORT: elapsed: 115.1520s, speed: 8.7ev/s, events: 1000, lag: 87360.039769s, failed: 0, deleted: 0, suppressed: 0, unknown: 270, classified: 122, disposed: 162, duplicated: 115, unk. duplicated: 331
10:06
2013-12-27 14:06:05,497 REPORT: elapsed: 142.4574s, speed: 7.0ev/s, events: 1000, lag: 87501.497643s, failed: 0, deleted: 0, suppressed: 0, unknown: 296, classified: 38, disposed: 195, duplicated: 35, unk. duplicated: 436
10:06
2013-12-27 14:06:59,018 REPORT: elapsed: 53.5207s, speed: 18.7ev/s, events: 1000, lag: 87552.018884s, failed: 0, deleted: 0, suppressed: 0, unknown: 359, classified: 45, disposed: 57, duplicated: 40, unk. duplicated: 499
 
10:06
с самым последним патчем проверй
10:07
e_zombie: да, у тебя заработала давилка повторов
10:07
уже неплохо
 
10:07
но лаг то увеличивается
 
10:09
у меня не давит дубли
10:10
ты куда патч то залил в инвенотри поди?
 
10:10
давай к нам, у нас есть патчик
 
10:11
мне страшно
10:12
хотя нет я на инвентори как оказалось
 
10:41
если я себе в профиле добавил почту или изменил ее, когда оно применится?
10:43
или надо нок рестартить?
10:43
или как?
 
10:44
значит просто должно примениться?
 
10:45
хорошо
10:45
было бы неприятно узнать что почта не применилась и надо еще что-то сделать
10:46
а нотификация нужна сейчас
10:47
в фм вообще ничего нельзя добавить без рестарта
10:47
правило - рестарт
10:47
триггер -рестарт
 
10:48
и это правильно.
10:48
а то жиром заплывешь
 
10:49
это не помогает. позавчера медосмотр был, сказали уже заплываю
 
10:54
а мне постеснялись...
 
10:55
в тренажёрку вас всех
 
10:56
я ленюсь
10:56
надо просто меньше жрать
 
10:58
IRevent не дождался патча ;)
10:58
нашли причину оттупки классификатора
 
11:03
dvolodin, admin и oper status надо разделять и выводить в инвентори
 
11:03
oper в inventory нельзя
11:03
это динамифка
 
11:04
почему нельзя?
11:04
не, ты можешь засунуть его куда хочешь
11:04
но он должен быть в инвентори
11:04
у портов
11:04
точнее у интерфейсов
 
11:06
:)
11:06
наверное, нужно коллекцию наворотить
11:06
oper_status
11:07
с полями managed object id, interface name и oper_status
11:07
а может и admin status туда же
 
11:07
а у тебя интерфейсы в постгресе? может их тупо в монгу утащить полностью?
 
11:07
в монге
11:07
и коллекцию в монгу
 
11:08
так почему нельзя просто параметр добавить
11:08
или это плохо скажется на масштабируемости?
 
11:08
именно
11:09
постоянные апдейты статических данных - это не очень хорошо
11:09
там немного в другом дело
 
11:10
dvolodin: будешь пилить чекбокс в СА с включение\отключение классификации событий для объекта?
11:10
или будем обусждать?
 
11:10
e_zombie, по-моему ты чего-то курнул. зачем это надо
 
11:12
если у тебя есть в сети железка с битой сфпи которая шлёт 10 событий в сек - твоему классификатору "пиздарики фанарики"
 
11:12
e_zombie: уже нет
11:12
как видишь
 
11:12
а если 10 - то гарантированнл
11:13
и что быстрее - снять чекбокс или писать пирулю?
 
11:13
e_zombie, быстрее поменять sfp
 
11:13
за 100 км?
11:13
да ты супермэн я гляжу
 
11:14
e_zombie: сними trap source, и будет тебе счастье
 
11:14
да хоть за тысячу, у тебя на сети проблема, ее надо решать, брать новую сфп из зипа и ехать менять
 
11:14
а если серьезно -- то явно нужна простыня настроек
11:14
как минимум -- копия всего, что есть в managed object profile
 
11:15
конечно нужна, пингование конкретной железки отключить прямо не получается
 
11:15
zi_rus: это вам хорошо, у вас сухо и холодно
 
11:15
zi_rus: а в этот момент система управления сетью у тебя полегла. и ты думаешь это правильно?
 
11:15
а у них в саратове девки горячие, парней караулят
11:15
сунет монтажник еще SFP не туда, как доставать?
 
11:15
девки  у нас нихуя не горячие.
11:16
тупые сучки через одну
 
11:16
e_zombie, я думаю что жизнь мониторинга это дело второе. и если поток событий смог его положить то надо решать почему это произошло
 
11:17
вот и я о том же. и причём это должен сделать обычный тупой сменный. а не ты в пьяном угаре 31 января
 
11:17
нет, это никто не должен делать
 
11:17
пьяный угар 31 января?
11:17
стоп
 
11:17
мониторинг должен выдерживать
 
11:18
хорош пить спирт для протирки оптических осей
 
11:18
dvolodin, 31 января это пятница, так что ок
 
11:18
zi_rus: это ты расскажи володину с его блокировками в монге :)
 
11:18
dvolodin, почему нок не выдерживает битые сфпшки?
 
11:18
:) ЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫЫ
 
11:19
не выдергивает?
11:19
в этом что-то есть
11:19
злой фолт с криком "заебала" гасит флудящий порт
11:19
:)
11:19
и карает ответсвенного
 
11:20
e_zombie, dvolodin говорит что сменному будет бить удар током в причинные места пока не поменяет сфп
 
11:21
ну у нас в 180 км один уже три месяца меняет
 
11:21
электрический стул для мониторинга
 
11:23
[root@orangebox remote]# grep "Dec 27 15:22"  snet.log | wc -l
11:23
1945
11:23
это у меня так сеть сообщает о самочувствии
11:43
12:18
ну нет повода не выпить.
12:18
вроде работает теперь слассификатор нормально
12:18
в новый год с новым классификатором
 
12:22
простите нуба, а это что за подсистема?
12:22
cm? или sa?
 
12:23
[root@orangebox remote]# grep "Dec 27 15:22"  snet.log | wc -l
12:23
1945
12:23
[root@orangebox remote]# ls -1 ./hosts/ | wc -l
12:23
4400
12:23
[root@orangebox remote]#
12:24
ну вот что бы знали до какого предела мы пока можем маштабироваться
 
12:34
а что за папка хостс ?
 
12:34
туда сислог валит логи с сети в файлы
12:35
я свой сислог сервер назвал orangebox по аналогии с чёрным ящиком на самолётах
 
12:35
Вова - выпей лучше вискаря
12:35
грамм 300
 
12:35
300 мало
12:35
лучше вина. 0.7э
 
12:36
да хз. я в вине не разбираюсь, которым баба моя поит - то и пью иногда
 
12:36
хорошее вино - это очень и очень неплохо
12:36
и голова не болит и праздник быстро не заканчивается
 
12:46
dvolodin: Дииим! Доделай мержинг. Не все изменения перенеслись!
 
12:48
e_zombie просто я люблю нефть
 
12:48
а еще я люблю маму, Родину и деньги
 
12:49
Dmitry11: что не донеслось?
 
12:50
12:51
перекдючись на development и увидишь различия
12:52
Это только то, на что мне указали
 
13:07
zi_rus: вот с последним коммитом можно будет и состояние линков отслеживать по event'ам
 
13:15
dvolodin: увидел разницу между ветками ?
 
13:27
походу и дискавери начало быстрее работать
 
15:32
приветствую всех
15:33
добрались таки руки для внедрения noc
15:33
с чего посоветуете начать? добавил несколько MO. конфиги собирает.
15:34
MO нескольких типов добавил - от отступа до роутеров
15:34
отступа = доступа)
 
15:39
mik0s: настрой их, чтобы слали логи и трапы
15:39
И смотри на FM
 
15:39
все на корпоративах чоль?
15:39
о
15:40
Dmitry11: спасибо. Это где хоть настраивается?
 
15:40
в самих железках сам настраивай
 
15:41
а кто подскажет, можно ли импортировать новые модели оборудования в ветку default ?
 
15:41
в смысле syslog в сторону noc засылать? и snmp trap туда же?
 
15:41
а в НОК - в МО достаточно прописаит Trap Source IP
15:41
mik0s: да
15:42
заодно, можешь импортировать вланы с железок в VC
 
15:42
Dmitry11: на железках syslog и trap в сторону noc + в МО указать Trap Source IP ?
 
15:43
Dmitry11: спасибо - сейчас тогда пока это сделаю
15:43
а вот с импортом в VC траблы. пробовал сделать, но вываливается окно заполненное пустыми строками
 
15:45
mik0s: обновляйся до текущих версий
15:45
скорее всего у тебя релиз 0.8
 
15:46
вроде скриптом ставился
15:46
ага, так и есть в эбаут 0.8
15:46
обновление с помощью /opt/noc# ./scripts/upgrade
15:46
?
15:47
или как-то еще?
15:51
обновился через скрипт /opt/noc# ./scripts/upgrade
15:51
0.8
 
15:51
и лучше сразу на ветку inventory потому что девелом и дефолт устаревшие очень сильно
15:51
правь конфиг upgrade.conf
15:51
 
15:53
активненько так)
15:53
ага, спасибо. сейчас проверим
 
15:53
сегодня полечили одну очень неприятную багу которую не видели гдето с год
15:54
у тебя есть на сколько устройств?
 
15:54
сеть на сколько устройств?
 
15:55
у меня в ноке 6500 железок
 
15:55
около 500 коммутаторов - малышка)
 
15:55
да. у тебя всё будет хорошо
 
15:56
помни что эксполрт импорт работает криво с тегами
15:56
тиы пока не знаешь зачем это - но помни об этом когда у тебя не поднимутся бакапы :)
 
15:56
просто пока даже не представляю куда дальше смотреть. много всего. по рассказам все очень вкусно, но что где - хз
15:56
ok )
 
15:57
добавь руками одну железку
15:57
потом сделай экспорт
15:57
и потом сделай csv файл для всх остальных лжелезок и загрузи в систему
15:58
это всё в Sistem activation  \ menedgement objecy
 
15:58
ага, спасибо - как раз думал как остальной доступ туда впихивать
15:59
вот есть у меня все железки
15:59
конфиги собираются
 
15:59
потом в SA сходи в сетуп и сделай там MO profiles
15:59
и разбей их по группам типов железок
15:59
так будет удобнее отключить лишний опрос
 
16:00
вернее сд\перва это сделай а потом уж генери файл с железками
 
16:00
e_zombie: а какой функционал будет полезен первое время?
 
16:00
нужны модели сейчас - сиди на feature/inventory
 
16:01
сбор конфигов
16:01
потом карты
16:01
это работает почти правильно.
 
16:01
dvolodin: у меня при установке из ветки интвентори нету моделей, которые есть в дефолтной ветке
 
16:01
остальное через ёбтвоюмать
 
16:01
ни длинком ни зте
16:02
*длинков
 
16:02
e_zombie: по конфигам - вот есть они. на роутерах полезно, на аггрегации да, но доступ - там пол конфига динамические. можно как-то убирать не нужное или пусть складируются состояния?
 
16:05
h4wk: каких именно?
16:05
mik0s: лишнее из конфига тоже можно вырезать
 
16:06
да прибудет с новичками сила
16:06
пошёл я домой
 
16:06
e_zombie: а где искать логи железки которые завернул на noc?
16:07
e_zombie: спасибо за помощь
 
16:07
в  СА  \ мо \ сама железка сверху меню конфиш
16:07
там же скрипты и аварии
16:07
ну ещё фаулт менеджемент более менее. его сегодня как раз починили
16:08
всё. ушёл
 
16:09
хм - нету никакого меню
16:09
даже отредактировать MO не могу теперь)
16:09
e_zombie: давай, удачи)
16:10
dvolodin: это уже ручками в скриптах?
 
16:11
dvolodin: mik0s: лишнее из конфига тоже можно вырезать
 
16:11
аа, понятно. ну до этого еще далеко))
16:11
чего-то толи обновилось плохо, то ли еще что -- не вижу в SA MO меню никакого, только строка поиска
16:12
и даже всплывающая менюшка на железке не работает (
16:15
проблема в safary?
 
16:18
zi_rus: твое как-то так
16:18
16:19
safari нормально работает
16:19
лучше обновись до feature/inventory
 
16:19
dvolodin: как раз до него обновился
16:19
до этого работало)
 
16:20
тогда настройки  nginx проверь
16:20
и кеши сбрось
16:20
и перегрузи страницу
 
16:20
попробую
16:20
да уж перегружал и страницу и сам noc
16:21
р
16:21
о
16:21
логаут/логин помог)
 
17:10
а киньте кто-нибудь JSON с классифицированных событий Link Up, Link Down и Err-Disable?
 
    Share this page
    Share this page: