About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 24.11.2014
zi_rus #
06:25
dvolodin, нок забекапил монгу со всеми данными забил к хренам место на диске
dvolodin #
06:26
это проблама нока?
zi_rus #
06:27
да
06:27
он бекапит безрасбору
06:27
*безразбора
06:33
dvolodin, а еще багтрекер поломалит
dvolodin #
06:34
рестартовал его
06:34
сейчас поднимется
06:35
доделываю проверку порогов - и сливаю ветки
zi_rus #
06:39
dvolodin, про пороги, смотри, я предлагал из фм писать данные, прилетающие в трапах, в РМ
06:39
как это может столкнуться с тем что ты пороги на пробе проверяешь
06:39
и еще
06:41
dvolodin, может все-таки положим в базу оиды для дом? в общую таблицу интерфейсов дополнительными полями или отдельной табличкой
dvolodin #
06:42
никак не столкнется
06:42
смотри
06:42
нужно просто графитовые данные залить в pmwriter
06:43
в lib/perf.py есть функция reporter
06:46
чего писать собрался?
e_zombie #
06:47
,,
zi_rus #
06:48
dvolodin, ну там циска дом данные шлет когда порог пересечен
06:48
Nov 11 08:39:00: %SFF8472-5-THRESHOLD_VIOLATION: Te1/30: Rx power low alarm; Operating value: -40.0 dBm, Threshold value: -18.4 dBm.
06:49
про цпу тоже сообщения есть
e_zombie #
07:41
кто у нас DLink DES-3200-10 эксплуатирует? дайте инфу как настроить сислог и снмп
EK|2 #
07:43
"доделываю проверку порогов - и сливаю ветки" покайтесь, ибо грядёт!
zi_rus #
07:44
e_zombie, пользуешься ноковским бекапом?
dvolodin #
07:44
каяться придется тем, кто использует синхронизацию DNS
buggy-funhouse #
07:44
и всё?)
07:45
есть кто-нибудь, у кого sce8000?
dvolodin #
07:45
вот-вот, кайтесь вместе :)
e_zombie #
07:45
zi_rus: да вроде работает.
07:45
хотя не проверял
zi_rus #
07:46
e_zombie, когда начнутся графики, нок данные в монгу пишет, а потом их же бекапит, у меня из-за этого место кончилось, пришлось бекап отключить
e_zombie #
07:46
и сколько у тебя получилось?
07:47
у меня бакапы кладутся на отдельный раздел в 1.5Тб.
07:47
а основная бд - около 100 гигов.
07:47
разделы.
07:47
я надеюсь графики по дефолту не строятся для всех железок. а то будет как у опеннмпс - включил дискавери - и пиздос винту
dvolodin #
07:48
zi_rus: собирай привязку к rocksdb
07:48
у тебя какой там рокс сейчас доступен в системе?
mikevlz|2 #
07:49
у меня есть SCE8k
zi_rus #
07:50
3.6.2
dvolodin #
07:53
zi_rus: ну и чудно
07:53
http://pyrocksdb.readthedocs.org/en/v0.2.1/installation.html#building-pyrocksdb
07:53
собирай его в virtualenv
07:53
./bin/pip install Cython
07:54
./bin/pip install git+git://github.com/stephan-hof/pyrocksdb.git@v0.2.1
07:54
тьфу
07:54
./bin/pip install git+git://github.com/stephan-hof/pyrocksdb.git
07:54
вот так
zi_rus #
07:56
а ты по-нормальному можешь его в зависимости добавить?
09:12
dvolodin, ты говоришь что пофиксил проблему с залипанием пробы, ты коммитил изменения? а то опять залипло
dvolodin #
09:16
ту - коммитил
09:16
лови симптоматику, на которой зависает
misak #
09:41
e_zombie: у нас их штук 400, а что именно интересно?
09:42
все точно так-же как и на других
e_zombie #
09:42
напиши как их сконфигурять слать сислог. и включить snmp на чтение для комьюнити
misak #
09:43
по CLI ?
e_zombie #
09:43
да.
09:43
снмп там вырублино
misak #
09:43
так я не делал
09:43
во морде только
09:44
enable snmp не катит?
e_zombie #
09:44
а можешь конфига дать .
misak #
09:44
ща поищу
Huko #
09:44
Подскажите, почему у меня время next run в дискавери более чем странное ? http://i7.minus.com/ibsszkiI4pAOIc.png
09:44
В профайле не вижу ничего криминального http://i2.minus.com/iHSffL0pO33d0.png
e_zombie #
09:44
подозреваю что стоит ждать релиза графита чтобы это исправилось :)
09:45
Huko https://bitbucket.org/nocproject/noc/commits/ac13b951cd69497b27de3dd6c3df2f64d92e2652
09:45
походу это гдето тут правилось.
Huko #
09:47
хмм.. печально..
e_zombie #
09:47
ну осталось немного :)
Huko #
09:48
причем это не на всех профайлах так
09:50
когда запускаешь руками пишет nex run нормальный, после того как зкончил делаешь рефрешь и nex run улетает лет на 100 вперед. я не доживу.
dvolodin #
09:50
в графите правилось
Huko #
09:51
он самый и стоит
09:51
в смысле feature/graphite
dvolodin #
09:54
проба худо-бедно threshold'ы определяет :)
misak #
09:56
e_zombie: для просто доступа по дефолтным коммунити public/privade enable snmp достаточно
e_zombie #
09:57
кхм.
09:57
не знал.
09:57
счас проверю
09:57
http://ixnfo.com/nastroyka-kommutatora-d-link-des-3200.html
09:58
шайтана .
09:58
спасибо.
10:36
держите котика https://pp.vk.me/c619823/v619823151/2201f/lL-QQLDxJCk.jpg
buggy-funhouse #
10:53
держим
TSergey #
11:07
e_zombie: "кто у нас DLink DES-3200-10 эксплуатирует? дайте инфу как настроить сислог и снмп"
11:07
snmp, в части только трапов
11:07
create snmp host <noc ip> v2c <noc community>
11:07
create snmp group <noc community> v2c read_view CommunityView notify_view CommunityView
11:07
create snmp community <noc community> view CommunityView read_only
zi_rus #
11:11
e_zombie, а ты свою автодискавери в виде пируля оформить не хочешь?
11:24
dvolodin, в дебаге ничего не могу увидеть, но закономерность такая, если я просто рестартую нок, то проблема не проявляется, а если обновляю, то пока нок поднимется, проходит много больше времени. отваливаются ен все пробы, некоторые продолжают работать
dvolodin #
13:20
event'ы на threshold'ы делаются
13:20
теперь классы лепим
13:20
завтра-послезавтра -- слияние веток
evyscr #
13:23
текущие патчи из develop не забудьте
dvolodin #
13:23
а они никуда не денутся
evyscr #
13:24
в pagerless что-то терялось, не?
dvolodin #
13:24
нет
13:24
а за графит колотите zi_rus, он подстрекатель
13:24
года три старался
evyscr #
13:24
ок, поколотим
zi_rus #
13:25
да вы на меня молиться должны, я тут столько оттестировать, а то получилибы второй pagerless
dvolodin #
13:25
и это правда
13:25
колотим, и молимся, колотим, и молимся
evyscr #
13:27
в конечном итоге всё одно - ебёмся и плачем...
13:29
будем надеяться, стараниями zi_rus в этот раз будет лучше
zi_rus #
13:39
dvolodin, я не могу в дебаге пробы увидеть чего ей не хватает, можешь попробовать у тебя воспроизвести?
e_zombie #
13:39
zi_rus: хочу. но это по времени много заёмет. а надо всё "вчера". у меня ваще 1 числа начинается опытная эксплуатация
13:39
а тут всё в раскоряк.
zi_rus #
13:41
e_zombie, жаль, я хотел у себя в виде пируля заюзать. мы добавили в нок базовые станции для пингования, а их ставят и меняют адреса без нашего ведома, автомат нужен чтобы автоматически изменения вносил
e_zombie #
13:41
ну я могу тебе дать свои наработкина баше. адаптируешь для своих - будет ок
13:41
во всяком случае новые хосты добавляются нормально
13:46
https://pp.vk.me/c622830/v622830384/b5fe/_x1MOTkM6r8.jpg
zi_rus #
13:57
e_zombie, это не совсем кошерно, если уж портировать то по-нормальному, ты юзаешь nmap, а так надо icmp из нока, и snmp оттуда же
e_zombie #
14:16
ну да нуда.
14:16
но это работает.
14:16
а теперь прикинь сколько мне времени понадобится чтобы ваще понять что такое питон и спраграммить аналог
zi_rus #
14:16
питон простой
14:16
и на будущее пригодится
14:17
я не знал вообще ни одного языка
e_zombie #
14:17
ключевое слово "вчера"
zi_rus #
14:17
вчера ты уже сделал
14:17
ты сегодня
14:17
и можешь думать про завтра
14:17
а не завтра про вчера
e_zombie #
14:17
я думаю.
14:18
и говорю что раньше чем через 2-3 недели ничего подобного я родить не смогу.
dvolodin #
14:18
покажите чудо-скрипт
zi_rus #
14:19
http://pastebin.com/8xgFKafm
_4ePTeHok #
14:22
однако
zi_rus #
14:23
dvolodin, в ноке можно как-то рекурсивно дернуть именно самые нижние префиксы? то есть смотри, nested_prefix_set дергает все, с верху и до низу иерархии, а я хочу увидеть только те что в самом низу. иначе говоря, есть сеть /19 побита по /24, которые разбиты по /30, я хочу п
14:23
ередать /19 на вход и получить сет из /30 на выходе
dvolodin #
14:24
ну а что мешает?
zi_rus #
14:24
я бы дернул каким-нибудь циклом
14:24
но глубина иерархии варьируется
14:24
dvolodin, ну а как?
dvolodin #
14:24
у них parent не нулевой и сами они в parent'ах не ходят
zi_rus #
14:25
хм
14:25
parent у всех ненулевой
dvolodin #
14:26
кроме 0.0.0.0/0
14:26
но тебе нужны префиксы из диапазона и такие, что они не светятся ни у кого parent'ом
zi_rus #
14:26
кроме 0/0
14:27
то есть нормальная тема это дергать nested_prefix_set кадого префикса
14:27
и если он ==0 то записывать в результат?
14:27
вроде нормальная тема
14:27
не хитровыдуманная
evyscr #
14:27
ужас же
zi_rus #
14:27
думаю реализуемо
14:28
evyscr, зажарится как-нибудь
14:28
у ВК такая уебанская внутренняя система ведения адресов
14:28
приходится наркоманить
dvolodin #
14:28
?
zi_rus #
14:29
и они захотели наши префиксы у себя видеть
evyscr #
14:30
бгг, NOC-247
dvolodin #
14:34
подумайте о плохом
14:34
когда-нибудь я доберусь до ipam
evyscr #
14:36
Брюллов-второй, "Последний день нока"
buggy-funhouse #
14:36
мва-ха-ха-ха
zi_rus #
14:38
dvolodin, нок так л2тп и не рисует
14:48
если бы по оиду ничего не было, капабилиты бы ен сработал, а если он есть но отдает ноль, то нок все равно должен создать метрику с нулевыми значениями
14:48
dvolodin, а еще, говорят в девелопе работает репорт ipam > report > history, а у меня в графите он трейсит
dvolodin #
14:49
ага, трейсит
14:49
поправлю
14:50
это audit trail переделаный
zi_rus #
14:50
http://pastebin.com/Z2dVpYB1
e_zombie #
14:50
SQLQUERY="SELECT address from sa_managedobject where name not like 'wiping-%' group by address having count (address) > 1 order by address;"
14:50
интересный запрос.
14:50
у меня после чистки БД от дубляжей пропали трейсы на отчётах.
zi_home #
19:33
dvolodin, заценил тему с порогами
19:33
не жилец
19:34
надо доделывать
19:34
серьезно
dvolodin #
19:34
?
zi_home #
19:35
dvolodin, тебе по пунктам?
dvolodin #
19:35
ну а как еще
zi_home #
19:35
смотри
19:36
1) ты генеришь ивент как?
19:36
сразу
19:36
это неправильно
19:36
так он будет алармить на каждый случайный всплеск
19:36
также в обратную сторону
19:39
если чуть просело, опять закроется аларм и поднимется обратно
dvolodin #
19:39
кто тебе сказал такое?
zi_home #
19:39
это то что я вижу
dvolodin #
19:40
event генерится только при смене состояния
19:40
а вот как себя будет вести alarm -- вполне себе настраивается
zi_home #
19:40
дык нет
19:40
я про это и говорю
19:41
ты генеришь ивент сразу
19:41
ивент это событие
dvolodin #
19:41
а почему бы ему не быть сразу
19:41
ты же ему пороги задал
zi_home #
19:41
то что произошел какой-то всплеск означает просто всплеск
19:41
а надо подождать
19:42
заметить что проблема действительно сохраняется
19:42
dvolodin, http://i66.fastpic.ru/big/2014/1124/12/b6cf63e18df3cedc2cbca894951ee912.png
19:42
;tknsq uhfabr
19:43
желтый график
19:43
я получил ивенты про то и про другое
19:43
это дискарды на порту
19:44
в плагине с трешолдами для кактуса эта тема учтена
19:44
дальше
19:44
2)
19:44
два трешолда подразумевает разных получателей уведомлений
19:45
фм этого не позволяет
dvolodin #
19:45
фм все позволяет
zi_home #
19:45
нет
19:45
у тебя одна настройка
dvolodin #
19:45
настройка чего?
zi_home #
19:46
alarm raised/alarm cleared
19:46
и селектор
19:46
и вдогонку
19:46
про фм
19:46
ты говорил что нок затрахает кого угодно
19:46
вот только проблема
dvolodin #
19:46
кстати, для борьбы с дребезгом можно еще один параметр ввести
19:46
количество повторов, необходимых для смены состояния
19:47
поставишь 2 или 3 -- перещелкнет состояние только если 2 или 3 раза проблема сохраняется
zi_home #
19:47
я не хочу чтобы нок трахал мне мозги, но хотел бы развернуть трахалку на того кто отвечает за конкретный вопрос
19:48
dvolodin, http://i66.fastpic.ru/big/2014/1124/80/25cfd537d83989c690ecdbc36dc61d80.png - вот сравни с кактусом, если не видел
19:49
Warning Breach Duration
19:49
The amount of time the data source must be in breach of the threshold for a warning to be raised.
19:49
Breach Duration
19:49
The amount of time the data source must be in breach of the threshold for an alert to be raised.
19:50
и про нотификацию
19:50
Warning Notification List
19:50
You may specify choose a Notification List to receive Warnings for this Data Source
19:50
Alert Notification List
19:50
You may specify choose a Notification List to receive Alerts for this Data Source
19:50
смотри
19:50
я управляю железом
19:50
но
19:51
я снимаю графики по портам
dvolodin #
19:51
ну они обозвали это breach duration
zi_home #
19:51
если где-то перегрузка, нотифицировать надо тех кто планирует сеть
19:51
а не эксплуатирует
19:51
а для температуры мне надо нотифицировать третьих лиц
dvolodin #
19:52
это не в threshold'ах делать нужно
19:52
а в эскалациях
zi_home #
19:52
да, я знаю
dvolodin #
19:52
и общим механизмом
zi_home #
19:52
это комплексная проблема
19:52
но у тебя этого нет
19:52
а как жить если такая фича из-за кривых уведомлений будет на приколе
dvolodin #
19:52
в кактусе тоже нет
zi_home #
19:53
там проще
dvolodin #
19:53
придумывать, как делать нормальные эскалации
zi_home #
19:53
у каждого трешолда
19:53
я просто указываю кого уведомлять
19:53
в самом трешолде или в шаблоне
19:53
там в принципе нет такой проблемы
19:53
там все хорошо
dvolodin #
19:55
застрелишься
19:55
чего там хорошего-то
zi_home #
19:56
то что там оно работает
19:56
ты не отвлекайся
dvolodin #
19:56
задача pm - тяфкнуть
zi_home #
19:56
если у тебя так шоколадно, рассказжи как это сделать
dvolodin #
19:56
задача fm -- укусить за жопу виновного
zi_home #
19:56
ты виновного определяешь селектором
19:56
за трафик виноват планировщик
19:57
за температуру - кондейщик
19:57
за питание - энергетик
19:57
и тд
19:57
но по селектору
19:57
нок будет кусать меня
19:57
нахера?
19:58
мы бы хотели знать если что аварийное случилось
19:58
но не хотим заниматься маршрутизацией траблов
dvolodin #
19:59
вопрос в механизме описания эскалаций
zi_home #
20:00
(кстати по брасам "./noc probeconfig --touch" помог, опять :( )
20:01
про нормальные нотификации тебе давно говорили
20:01
с этми и сейчас проблема
dvolodin #
20:01
а чего говорить-то
zi_home #
20:01
просто не так заметно
dvolodin #
20:02
говорите как они должны выглядеть, будем думать
zi_home #
20:02
фильтр нужен
20:02
по классам алармов
20:02
это сразу половину вопросов снимает
20:02
и по трешолдам разделется нормально
20:08
dvolodin, http://i68.fastpic.ru/big/2014/1124/b3/b908fe3d1816e29acf921956338f90b3.png - вот тебе пример дрожащей метрики, через период, то прилетает ивент аварии, то нормализации
20:16
еще кое-что по мнлочи хотел придраться
20:17
но пока эти нюансы разрулить надо
Tweet
Share this page
Share this page: Tweet