About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 11.03.2013
zi_rus #
05:31
что, сегодня никто не работает?
mikevlz #
05:59
я работаю. с 10 до 20
zi_rus #
06:03
без обеда и выходных :)
06:03
вопрос
06:03
как можно изменить статус объекта
06:03
у меня сейчас SAE помечен как недоступный
06:04
пинговать его запретили
06:04
и теперь он все время недоступный
06:04
хочу сделать чтобы он стал зеленым
mikevlz #
06:07
попингуй его
zi_rus #
06:19
в смысле?
mikevlz #
06:19
ну сделай так, чтоб попингуйка его пропинговала.
06:20
=)
06:20
Trap Source IP = 127.0.0.1
06:20
ну или через шелл...
zi_rus #
06:23
не сможет
mikevlz #
06:23
сделай, чтоб смог
zi_rus #
06:23
объекты с профилем SAE ей запрещено пинговать
mikevlz #
06:24
ну так разреши, как пропингует - запрети
zi_rus #
06:24
лучше бы сказали где можно нолик на единичку исправить
mikevlz #
06:24
поле status у ManagedObject есть в модели?
zi_rus #
06:25
есть такое
06:25
def set_status(self, status):
06:25
ObjectStatus.set_status(self, status)
mikevlz #
06:26
используй
06:26
status - в данном случае скорее всего True/False
zi_rus #
06:26
разрешаешь? :)
mikevlz #
06:26
я не против, сломаешь-то ты
zi_rus #
06:27
я скажу что ты виноват
mikevlz #
06:28
твое руководство оценит
06:28
:)
zi_rus #
06:30
сработало
06:30
>>> print mo.get_status()
06:30
False
06:30
>>> mo.set_status(True)
06:30
>>> print mo.get_status()
06:30
True
06:30
>>> mo.save()
06:36
интересно, а можно ли закрыть все алармы связанные с МО через консоль
mikevlz #
06:37
я не против
zi_rus #
06:38
а то есть железка на которой 755 алармов
06:38
все из них или инвалид мак или мак флап
mikevlz #
06:38
=)
zi_rus #
06:38
руками я затрахаюсь их закрывать
06:39
есть еще помельче
06:39
515
06:39
334
06:39
а вообще
06:39
alarms: 3696
06:40
из них 17 важных ping failed по железкам которые еще не были смонтированы
06:40
остальное мусор
06:41
почему флапы не закрываются хотя бы когда мак вернулся на старый порт
mikevlz #
06:46
потому что флап - это потенциально проблема в организации сети, петля или еще что
zi_rus #
06:49
да эта зараза флапы шлет даже когда на сети линк рвется и все переключается на другую ветку кольца
lexus-omsk #
06:57
Приветствую! Кстати про незакрывающиеся алармы вроде флапов - у самого то ip spoofing, то бесперебойники, которые почему-то не шлют закрывающий трап
06:57
так вот, по таким алармам - может их автоматом закрывать при отсутствии повторных событий в течение определённого времени?
06:57
типа периодического pyRule
06:59
пытался примерно накидать такую схемку перед праздниками, но запутался сочиняя алгоритм
zi_rus #
07:03
это не периодический пируль
07:03
это должен делать job
07:03
которые для этого и делали
07:04
но он кажется только линк статус запрашивает сейчас
07:04
нужны новые скрипты и джобы
07:04
а ноку нужна поддержка упсов
mikevlz #
07:05
есть APC AOS
zi_rus #
07:07
mikevlz, там один скрипт get_version
mikevlz #
07:08
=)
07:08
но ведь есть же
zi_rus #
07:09
нужно больше если уж на то пошло
mikevlz #
07:10
issue
zi_rus #
07:11
это не ко мне
07:12
под моим управлением нет упсов
mikevlz #
07:14
тогда не issue
lexus-omsk #
07:16
да по упсам есть правила для APC, для остальных не проблема тоже написать... дело именно в конкретных наших упсах, коорые не шлют трап о восстановлении питания, хотя должны
mikevlz #
07:17
посмотри джобы в fm/correlator
lexus-omsk #
07:17
но шлют периодически алармы, о том что питания нет уже N минут... вот я и подумал, что если не шлют в течение периода, то можно закрывать
07:17
если конечно он при этом совсем не сдох)
mikevlz #
07:17
там на проверку линка. Если сможешь аналогичный джоб написать, чтоб проверял питание - то будешь автоматом закрывать
07:18
в консоли ИБП пишет, откуда он сейчас нагрузку кормит?
zi_rus #
07:19
lexus-omsk, тебе надо написать скрипт для профиля который сможет запрашивать у упса статус по питанию
07:20
типа get_powerin_status
07:20
а потом сделать джоб которыйбудет вызывать этот скрипт при возникновении аларма по отсутствию питания
07:21
а периодические трапы нок должен подавлять
07:21
средствами ФМ
lexus-omsk #
07:21
хм.. ну кстати вариант, надо посмотреть, как это сделать... по аналогии с линком, я понял
07:22
но дело не только в упсах, ip spoofing, вызванный битыми портами, например ещё
07:22
т.е. битый порт нашли, загасили, абонента переключили в другой, а аларм висит...
mikevlz #
07:22
джоб дергает MRT. Если в качестве MAP указать commands с нужными коммандами, а в качестве Reduce отдать локальную функцию, которая прогонит regex match - то никаких нестандартных интерфейсов не надо для SA делать
zi_rus #
07:22
ну это другая тема которую стоит обдумать
lexus-omsk #
07:23
с флапами так же, наверное - т.е. если оно постоянно флапает - это плохо, а если один раз - может просто переключили
zi_rus #
07:23
mikevlz, это упс, там доступ только по snmp скорее всего, ну или веб еще на крайняк
lexus-omsk #
07:24
snmp и web точно, может и телнет есть... на APC точно есть, надо смотреть
zi_rus #
07:24
lexus-omsk, второй Дмитрий засветился, потыкай ему в разные места, может подскажет
mikevlz #
07:27
zi_rus: это не второй, он первый.
lexus-omsk #
07:27
карточки вроде от InsightPower - если вдруг кто сталкивался с такими... понакупили подешевле называется
mikevlz #
07:28
lexus-omsk: и куда вы их втыкаете?
lexus-omsk #
07:29
Delta Gaia на 3 квт - как-то так называются...
zi_rus #
07:30
mikevlz, я придерживаюсь нумерации согласно иерархии, первый здесь Володин
mikevlz #
07:30
zi_rus: у ИТ-шников счет начинается с нуля, так что иерархически тоже все правильно
zi_rus #
07:31
mikevlz, это у программеров с нуля, ip первого хоста у тебя какой будет? ведь не .0, а .1
mikevlz #
07:33
zi_rus: яд программизма пирулей тебя уже разъедает, скоро согласишься, что я прав :)
zi_rus #
07:33
я пирули не пишу, только пару сниппетов
mikevlz #
07:33
это пока
07:33
противоядиев нет
zi_rus #
07:34
когда я буду готов с тобой согласиться, я забуду вспомнить этот разговор
07:47
Dmitry1, ты с нами?
Dmitry1 #
07:48
уже да
zi_rus #
07:48
что скажешь?
Dmitry1 #
07:49
про UPS ?
zi_rus #
07:49
ну да и прочее
07:50
Dmitry1, кстати обработай уже BGPшные сислоги (NOC-399, NOC-401, NOC-752)
Dmitry1 #
07:51
У нас есть FM правила отдельно для UPS. Если dvolodin захочет, сожем сделать что-то вроде профиля Generic.UPS
zi_rus #
07:51
зачем генерик если есть отдельный профиль
07:54
наверное ноку нужна минимальная поддержка средств электропитания доступных по сети
07:54
различные ЭПУ и ИБП
Dmitry1 #
07:54
ну типа того. За электроэнергию не сиссадмин, а главный инженер обычно отвечает
zi_rus #
07:56
ну NOC - это эксплуатация сети, сетевое оборудование, как это ни парадоксально, работает от электричества, и знать о наличии проблем с питанием тоже надо
07:57
чтобы самое элементарное представлять что если железка отвалилась, это не оптику порвали, а свет отключили
07:59
есть еще вопросы кондиционирования, вот тут не так однозначно
Dmitry1 #
08:05
как бы есть такие FM ?
zi_rus #
08:07
Dmitry1, ?
Dmitry1 #
08:08
Смотри eventclassess Environment
08:08
Если есть предложения - добавим
08:08
Аналогично по твоим BGP классам
08:11
Придумай вменяемые классы для них, потому как существующие не подходят. И чтобы работало не только на циске, но и на остальных вендорах.
08:27
Народ, кто знает, как на цисках включить логирование событий DOM ?
08:27
Гадская железка молчит, как партизан.
lexus-omsk #
08:34
Dmitry1: аналогичная ситуация у меня с config changed на 7606 - вроде и трап включен соответствующий, а она молчит - ни snmp, ни syslog
Dmitry1 #
08:35
Да тут у нас вчера на оптической магистрали пожар был
08:36
А гадская циска кроме LINK-DOWN и LINEPROTO-DOWN ничего не пишет, хотя если смотреть по show interface transciever, то там и алармы, и все подряд
Kostua #
09:59
кто может подсказать: перестали обновлятся конфиги т.е. в статусе у всех стоит last pull 06.02.2013 next pull 07.02.2013 и статус ready. В shedules cm.config_pull последний статус failed, в логе вот что http://pastebin.com/xCfE8rGM
mikevlz #
10:03
а чо не весь трейс? из того что есть - отвалилось по таймауту
10:03
или не смогло зайти на железку, или не дождалось промпта
Kostua #
10:09
в трейсе всё оборудование подряд
10:10
если запускать руками в cm всё вытягивает
mikevlz #
10:10
странно
Kostua #
10:11
отож, в аудите глянул ничего не менялось в эти дни
mikevlz #
10:11
периодичность задачи сбора конфигов какая?
Kostua #
10:11
300
mikevlz #
10:12
хорошо...
zi_rus #
10:15
так в заголовке трейса какая ошибка
10:18
типа
10:18
argument must be an int, or have a fileno() method.
10:18
START OF TRACEBACK
lexus-omsk #
10:33
коллеги, в каком правиле можно посмотреть корректный пример supression rules?
10:38
сам и отвечу, например, fan failed
Kostua #
10:57
zi_rus: спасибо, надо было глянуть начало трейса
10:58
тупанул
zi_rus #
12:42
а как можно из нока выдернуть пинг ок за период?
mikevlz #
12:45
в смысле?
12:45
максимум - Availability report
zi_rus #
12:45
ну вот с нового года хочу узнать какие железки были в нок добавлены
12:46
и заработали
mikevlz #
12:46
мммм... вон ты о чем
12:46
а ты уверен, что у тебя в архиве будет больше чем за месяц?
zi_rus #
12:46
у меня архивируются за неделю
12:46
а то что в архиве лежит
12:46
там все есть
mikevlz #
12:47
хз даже, что сказать
zi_rus #
12:47
еще первые алармы когда я нок только настраивал
12:48
или хотя бы по дате добавления в нок
12:48
а я исключу недоступные, их не много
12:52
хотя так не получается
12:52
если я добавлял до НГ, а заработало после, то они не попадут
12:52
нужно только те по кому пинг ок был после НГ
12:52
хотя блин, тут аварии тоже исключить надо
mikevlz #
12:53
о, Дмитрий нулевой :)
zi_rus #
12:55
dvolodin, тут задачу поставили, надо получить список каталистов установленых после НГ, я думаю это можно получить по их первому Пинг ОК, это можно как-то из нока выдернуть?
12:57
или даже по первому аларму
12:57
смотрю у свича который добавили, нет ping ok, сразу идут падения линков и прочее
13:01
блин, тогда пинг fail будет как аларм
dvolodin #
13:04
ping ok трутся
13:04
смысл их хранить?
zi_rus #
13:05
да хз
dvolodin #
13:05
нужно сделать что-то типа first seen для каждой железки?
13:05
типа когда первый скрипт завершился на ней?
zi_rus #
13:06
это бы еще совместно с автодискавери
13:06
чтобы первый скрипт был не когда железку добавили, ведь могли и забыть
dvolodin #
13:07
да не, он в течении одного дня придет
13:07
ну а так -- можно по множеству критериев
mikevlz #
13:07
примерно можно оценить по конфигу. Выводить тдату первой версии конфига
dvolodin #
13:07
первый ping ok, первый скрипт
13:07
mikevlz: да, можно и так
zi_rus #
13:07
mikevlz, тоже вариант, но готового механизма я не нашел
mikevlz #
13:08
zi_rus: дык ты же почит программист. Напиши ;)
dvolodin #
13:09
from cm.models import config
13:09
for c in Config.objects.all():
13:09
print c.revisions[0]
mikevlz #
13:09
=)
dvolodin #
13:10
там есть морда к hg
zi_rus #
13:10
name 'Config' is not defined
13:11
mikevlz, я же еще только учусь
13:11
а тут такое да еще и нестандартное
dvolodin #
13:11
from noc.cm.models import Config
mikevlz #
13:11
я тоже еще учусь
13:12
кто-нить MLXe и NetIron ADX щупал?
dvolodin #
13:12
Надо конфиги железок тоже в GridVCS затянуть
zi_rus #
13:14
dvolodin, не такой метод не канает
dvolodin #
13:14
почему?
13:15
добавь if по дате
zi_rus #
13:15
ну он выводит все ревизии
13:15
без разбору
13:15
как сделать ИФ
13:15
чтобы это была первая версия для этой железки
dvolodin #
13:17
c.revisions[0]
13:17
или c.revisions[-1
13:17
[-1
13:17
[-1]
zi_rus #
13:19
а можно подсказку как дату указать?
13:19
if c.revisions[0].date>= ???
dvolodin #
13:19
да
13:20
import datetime
13:20
d = datetime.datetime(year=2013, month=1, day=1)
13:20
...
13:20
if c.revisions[0] >= d:
zi_rus #
13:21
c.revisions[0] или c.revisions[0].date
13:30
for c in cfg:
13:30
try:
13:30
if c.revisions[0].date>= d:
13:30
print c.revisions[0].repo_path
13:30
except:
13:30
pass
13:30
зависает
13:34
все понял, опять дурак
mikevlz #
13:36
в Config есть в качестве поля managed_object.id
13:36
=)
dvolodin #
13:41
с.managed_object.name
hiddenman_ #
13:47
привет всем
13:47
мой любимый вопрос: на тему cable plant ничего не появилось в модулях?
mikevlz #
13:51
нет
hiddenman_ #
13:53
эх, и все тот же ответ (
13:54
может самому все-таки попробовать. python умею, django знаю. по идее, для cable plant никакие источники данных не нужны, правильно? тупо руками всё вводится?
mikevlz #
13:54
вроде да
hiddenman_ #
13:55
самое сложное - структуру данных придумать для СКС
mikevlz #
13:55
угу
13:55
поделиться не забудь ;)
hiddenman_ #
13:56
да эт понятно. лень бы победить свою. был бы моложе на 10 лет :(
mikevlz #
13:56
я периодически побеждаю
hiddenman_ #
13:58
кстати, есть такая крутая система
13:58
https://portal.nordu.net/display/NI/NORDUnet+Network+Inventory от крупного провайдера европы
13:58
вся такая opensource и на модных технологиях
13:58
но у нас пока не завелась до конца че-то
13:58
там всё, что надо есть. и тоже вроде на джанге :)
Dmitry1 #
14:02
а скриншотов нету?
14:04
судя по их git, поддержка железок у них только циско, джуны и алькател
Tweet
Share this page
Share this page: Tweet