About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 20.03.2013
Minimus #
05:05
граждане
05:05
как сделать порт нетранковым на сиське?
mikevlz #
05:30
switchport mode access
05:30
не?
05:31
ну или no switchport и он должен стать routed
zi_nnov #
05:41
Minimus, а как ты сделал порт транквым?
Minimus #
05:42
да уже норм всё, на той стороне косяк был, на моей хватило switcport pvid
zi_nnov #
05:42
mikevlz, вопрос по твоим изыканиям по ускорению
05:43
а чем это БД на отдетльном сервере будет лучше?
05:43
добавляется сетевая задержка
mikevlz #
05:43
1 - отдельный сервак, память вся может быть отдана базам
zi_nnov #
05:43
а если ресурсов для самой БД и для приложения хватает
mikevlz #
05:43
2 - процессор тоже у баз персональный
zi_nnov #
05:44
многоядерные CPU
mikevlz #
05:44
3 - винты используются только базами и ОС
freeseacher #
05:44
сетевая задержка это погрешность...
mikevlz #
05:44
больше простор для тюнинга самих БД
zi_nnov #
05:44
для БД где все данные в памяти винты не сильно влияют
05:45
freeseacher, на одном крупном запросе да, а на десятках мелких уже нет
mikevlz #
05:45
память-то копейки стоит, но ее надо иметь. А когда у тебя 8 гиг на все и базы по 16-20 гиг в монге - они не влезут
zi_nnov #
05:45
не влезут
05:46
значит в памяти будут только востребованные данные
05:46
с отдельным сервером, там будет крутиться не только нок, знаит БД будет много, они все равно не влезут все
freeseacher #
05:46
zi_nnov, сетевая задержка броадкастовой сети в пределах стойки стоит чуть дороже чем ошибка ATA драйвера
05:47
зато после переноса на другой сервер можно масштабировать.
05:48
особенно монгу :)
zi_nnov #
05:48
масштабирование это да
05:49
у меня руки чешутся, пару отдельных серверов под БД и на них завести нок, поднять powerdns вместо bind, и некоторые другие наши системы на них завести
05:49
но сервер только один на руках
05:50
а без избыточности в таком узловом месте я в продакшен не пойду
freeseacher #
05:55
дык.... vmware esx
05:56
начинаешь упироваться в какой то параметр в конкретной виртуалке вытаскиваешь на другой сервер... поямо мграцией
zi_nnov #
05:56
дороговато, я могу использовать программы которые стоят не дороже 0
05:57
а в esxi ограничения жесткие по памяти и процу
05:57
и мигрировать там нельзя по нориальному
05:57
и управлялка под винду
dvolodin #
06:44
mikevlz: и при чем тут монга?
06:47
ты на каждый слинкованный интерфейс делаешь два запроса к монге и два - к постгресу
zi_nnov #
07:00
Dmitry1, ты тут?
lexus-omsk #
07:00
dvolodin: в ноке же нету ещё штатного механизма уведомления подписчиков аварии о её закрытии?
07:00
А то я тут велосипед изобретаю :)
zi_nnov #
07:01
lexus-omsk, нету, сам давно жду
lexus-omsk #
07:01
я имел в виду, что может он есть внутри, но нет интерфейса просто...
07:03
сейчас напишу в блог тогда описание своего велосипеда... но там много не очень хороших вещей в том плане, что оно hardcoded получается
zi_nnov #
07:04
lexus-omsk, NOC-673
lexus-omsk #
07:05
в общем, для того и пишу, чтобы подсказали, как правильней сделать
dvolodin #
07:10
ну так прорабатывайте концепцию, сделаем
zi_nnov #
07:14
dvolodin, в аларм триггере ставишь галочку "присылать уведомление о закрытии"
dvolodin #
07:14
там, наверное, нужен общий механизм уведомления без триггеров
zi_nnov #
07:15
тогда для начала надо каждому классу привязать темплейт для уведомления или придумать формулу по которой рассчитывать его
07:16
тогда можно будет об общем механизме говорить
07:17
например общий теплейт сделать для уведомлений обо всех видох алармов
07:17
NOC - {{severity}} - {{mo.name}} - {{alarm.subj}}
07:19
а потом при желании пусть пользователь свои рисует
07:19
и привязывает
dvolodin #
07:22
Subject у него есть
07:22
тут нужен механизм такого рода
mikevlz #
07:22
dvolodin: там же написано, что львиную долю времени мы сидим в функциях работы с БД. Я там не только про монгу написал. А то, что она в топ вылазит - просто видно хорошо, постгрес в топе тоже есть, но там меньше 10%, а монга больше 100% процессора
dvolodin #
07:23
возник alarm --- кого уведомлять и кого назначать ответсвенным
07:23
правила эскалации
07:23
кого уведомнять при закрытии
zi_nnov #
07:23
не нравится мне идея с назначением ответственных и прочей уйней, это не задача нока
dvolodin #
07:24
это задача фолта
zi_nnov #
07:24
просто потому что ответственные это задача ytrjq trouble ticket management system
07:24
*некой
dvolodin #
07:24
или как вариант -- интеграция с TT
zi_nnov #
07:24
иначе в ноке надо создавать все подряд
dvolodin #
07:24
тогда NOC должен открывать трабл и в него писать
zi_nnov #
07:25
sdh, энергетики, радисты, etc
dvolodin #
07:25
ну да
07:25
TT пока делать не хочу
zi_nnov #
07:27
dvolodin, делай TTMS плагином
dvolodin #
07:28
кстати, кто и что использует?
07:28
RT, JIRA, OTRS
07:28
там интерфейс должен быть относительно несложный
07:29
создать tt, закрыть tt, добавить комментарий в tt
stevenm #
07:37
Hey, while I think the project is great... it seems to be lacking a few things we were hoping for (like support for Mikrotek), but clearly a project to keep watching. In the mean time, is there anything similar out there to this? (commercial or otherwise)
dvolodin #
07:47
создать tt, закрыть tt, добавить комментарий в tt
07:48
stevenm: Did your mention MikroTik?
stevenm #
07:48
yes that
dvolodin #
07:50
routeros has basic support
07:50
at least, enough for configuration management
07:50
though no get_interfaces still
zi_nnov #
08:02
Dmitry1, ты тут?
Dmitry1 #
08:02
да
zi_nnov #
08:03
Dmitry1, тогда NOC-263, NOC-264, NOC-265, NOC-830, NOC-967, NOC-968 - посмотри
Dmitry1 #
08:04
Ыыыы.... Времени нету :( Мучают тут меня...
08:04
Мне бы хоть день, когда меня по работе не будут дергать. :(
zi_nnov #
08:05
нахер такую работу
08:05
я вот с утра баш читаю
lexus-omsk #
08:06
http://kb.nocproject.org/pages/viewpage.action?pageId=7766341
08:06
довесок к башу почитать :)
zi_nnov #
08:10
lexus-omsk, я не понял про пируль
08:11
а нет
08:11
теперь догнал
08:12
кто-то этим реально пользуется?
08:12
всякие подписки, комментарии в авариях?
lexus-omsk #
08:14
ну вот подписками будут, когда автоматом назначать начнёт... а комменты - у нас - нет
08:18
как вариант - вместо подписок выдёргивать адресатов из Notification Group, но это как-то через класс аларма надо искать триггер и отуда уже брать группу и адреса её членов
08:19
и это учитывая, что в триггере класс идёт не ссылкой, а регуляркой
zi_nnov #
08:20
это вопрос уже самого нока а не костылей к нему
Minimus #
08:38
http://lenta.ru/news/2013/03/20/lotkova/
08:38
ой,не туда
lexus-omsk #
08:44
кстати добавил информацию в пост - NOC-961 нужен для того чтобы всё заработало
zi_nnov #
08:47
сколько всего, кто бы это закоммитил
freeseacher #
09:10
dvolodin, а тема про TTMS интересна. я так понимаю что у всех есть какое то наколенное решение :)
09:10
как в росах сделано ? есть эскалация ?
zi_nnov #
09:46
freeseacher, ты его напугал
freeseacher #
09:46
видать
zi_nnov #
09:57
Dmitry1, слушай, тут еще такой момент обнаружился
09:57
есть два сообщения
09:58
%POWER_SUPPLIES-3-PWR_FAIL: Power supply 2 is not functioning
09:58
%PLATFORM_ENV-1-DUAL_PWR: Faulty internal power supply 2 detected
09:58
нок их классифицирует как
09:58
Power Supply Unit Failed: Power supply 2
09:58
Power Supply Unit Failed: internal power supply 2
09:58
соответственно
09:58
но это одно и тоже событие
09:58
отключили питание на вводе
09:59
надо бы woraround
10:00
и соответственно 2 аларма поднялись
10:24
Dmitry1, тем более закрывающий приходит только один
10:24
%POWER_SUPPLIES-5-PWR_OK: Power supply 2 is functioning
Dmitry1 #
10:25
значит давить надо какой-то
zi_nnov #
10:26
второй
10:26
очевидно
10:26
только нет
10:26
не давить
10:26
не поднимать аларм
10:27
а ивент сохранять
Dmitry1 #
10:27
Оно так не умеет
zi_nnov #
10:27
как не умеет
10:27
просто не поднимай аларм по второму и всего делов
Dmitry1 #
10:27
Или придумать ему какойй-то класс, отличающийся от "Chassis | PSU | PSU Failed"
10:28
аларм поднимается в зависимости от класса
10:28
Я уже писал, что желательно бы сделать механизм, чтобы в самих ивентах я мог решать, поднимать аларм или нет
10:28
Но такого механизма пока нету
zi_nnov #
10:29
хм
10:29
а через root cause спрятать
10:29
а закрывать оба аларма одним событием
Dmitry1 #
10:29
root cause - это для класса
zi_nnov #
10:29
класс не может зависеть от себя?
Dmitry1 #
10:30
В принципе возможно закрыть оба аларма одним событием
zi_nnov #
10:30
Dmitry1, их не надо оба поднимать
10:30
только один
10:30
Dmitry1, а может так, оба классифицировать как одно и тоже событие
Dmitry1 #
10:31
Такого механизма в FM тоже нету, хотя я уже второй год прошу сделать
zi_nnov #
10:31
Dmitry1, но если у меня линк даун пришел, линк ап потерялся, а потом опять линк даун, то у меня будет 2 аларма в ФМ висеть?
Dmitry1 #
10:32
х.з.
10:32
там в аларме как-то управляется это через флаги. Я в них не очень разбирался
zi_nnov #
10:32
вот и повод чтобы разобраться
Dmitry1 #
10:33
Нужно dvolodin'а поспрашивать. А то мы работаем с NOC "наощупь" и в блогах делимся найденными решениями
zi_nnov #
10:36
где же его взять
10:36
помянешь черта
10:37
dvolodin, тут возник интимный вопрос, как по двум сислогам сгенерить один аларм
MindGames #
10:41
привет
10:42
не получается отфильтровать события Events по Managed Object.. Выбираю нужный, нажимаю фильтр и он доооолго-доооолго висит, думает, фон серым становится и ни какого результата.
10:42
понимаю, что событий просто дофига.. но как-то ведь это решается?
zi_nnov #
11:23
MindGames, может их просто нет
11:24
фильтрани по какому-нибудь который точно есть
MindGames #
11:24
zi_nnov, тогда выдало бы пустой экран.. а так просто висит.. и потом вытает сервер ошибку 503, кажетсяч.. тайм-аут.
zi_nnov #
11:24
MindGames, если так все плохо, то настраивай архивацию, у меня была раз в месяц, я перешел на раз в неделю
dvolodin #
11:24
индексы в монге проверь
MindGames #
11:24
просто не может перелопатить все логи
11:24
dvolodin, как это сделать?
Kostua #
12:00
_4ePTeHok: не подскажеш регэксп для edgecore ES3528M для ignored_interfaces c 1 по 24-й?
MindGames #
12:30
вернулся
12:45
dvolodin, как проверить индексы в монге? :)
zi_nnov #
12:48
Minimus, можешь mikevlz спросить, я разрешаю, он должен знать
Dmitry1 #
14:13
zi_nnov: hi
14:14
Смотри, что циска пишет у меня
14:14
3w6d: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/2, changed state to down
14:14
3w6d: %LINK-3-UPDOWN: Interface GigabitEthernet0/2, changed state to down
14:14
т.е. не получится для LINEPROTO-5-UPDOWN сделать root cause LINK-3-UPDOWN
zi_nnov #
14:23
Dmitry1, наоборот я тебе говорю
14:23
протокол зависит от линка, а не линк от протокола
14:24
Dmitry1, а нет, понял что ты пишешь
14:24
и почему нет?
14:24
сначала первый, потом второй
14:24
все ровно
mikevlz #
14:28
а я уже стал темной стороной Володина? :)
zi_nnov #
14:28
а что нет, спалился ты
mikevlz #
14:28
тьфу ты...
zi_nnov #
14:29
со своей трассировкой по топологии
mikevlz #
14:29
нет, чтоб код как книжку читать, там же английский и пробелы!
zi_nnov #
14:29
что читать?
mikevlz #
14:29
я еще ивенты от любого источника получать умею
14:29
код исходный
Dmitry1 #
14:34
zi_nnov: будем считать, что для %LINK-3-UPDOWN: root cause является %LINEPROTO-5-UPDOWN:
zi_nnov #
14:34
Dmitry1, ты бредишь
14:34
%LINK-3-UPDOWN - основной
14:35
если он есть то все из-=за него
Dmitry1 #
14:35
так раньше, чем %LINK-3-UPDOWN происходит %LINEPROTO-5-UPDOWN
zi_nnov #
14:35
lineproto падает когда например с одной стороны 10М а с другой 100М
14:35
при этом линк не падает
Dmitry1 #
14:36
но аларм поднять надо
zi_nnov #
14:36
%PLATFORM_ENV-6-FRU_PS_OIR: FRU Power Supply 2 removed - не классифицируется, надо бы правило
14:36
Dmitry1, конечно надо
14:36
а сейчас ты игноришь
Dmitry1 #
14:42
короче
14:42
надо сделать еще один вид аларма: Line Protocol Down
14:42
И плясать от него
Tweet
Share this page
Share this page: Tweet