About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 19.09.2012
acid232_ #
05:59
утро
05:59
помогите, сломалось все после обновления http://pastebin.com/MApT9sCL
06:00
не может обновить mongoengine
dvolodin #
06:02
contrib/lib можно почистить
acid232_ #
06:03
чистил, удалил mongoengine
06:03
через easy_install или вручную не ставится тоже
06:09
поможет откат на код месячной давности? если да то как сделать?
dvolodin #
06:12
а он в системе стоял?
06:13
misak: поправил ip discovery, чтобы он учитывал address ranges
acid232_ #
06:16
dvolodin: нет, я снес системный давно при очередном апгрейде
06:16
в scripts/about показывает |mongoengine|0.6.1|
misak #
06:18
dvolodin: спасибо, тут еще один косяк, я вручную адреса вычистил, но они из зон не удаляются
06:18
сейчас обновлюсь посмотрю, может исправилось
dvolodin #
06:18
что ересь полная, так как в contrib лежит mongoengine 0.6.20
06:18
misak: он их просто игнорирует
06:19
если адрес попал в locked range, или range делает partial delegation или генерирует FQDN
misak #
06:20
dvolodin: ну я все реджи потер, потом потер адреса, по логике они из днс-а должны были стереться
06:21
а они есть
06:21
ренджи
acid232_ #
06:23
при попытке выполнить /opt/noc/contrib/src/mongoengine# python setup.py install - та же фигня
dvolodin #
06:25
./noc/sync-contrib
acid232_ #
06:26
ImportError: No module named mongoengine.django.sessions
06:27
хотя нет
06:27
та же фигня
06:27
RuntimeError: maximum recursion depth exceeded in cmp
dvolodin #
06:28
acid232_: система какая?
acid232_ #
06:28
входит в какой-то бесконечный цикл
06:28
дебиан 6
06:28
python 2.7.3
06:28
nocproject где-то месячной давности
dvolodin #
06:29
снеси contrib/lib и запусти sync-contrib
acid232_ #
06:31
чудо, проехало, dvolodin бог питона!
06:33
post-update спрашивает странное, The following content types are stale and need to be deleted: auth | message
06:33
удалить, yes/no
dvolodin #
06:35
удали
06:35
нефиг пользоваться левыми тулзами
06:35
;)
06:35
BTW, я дозрел до переделки contrib
06:36
точнее -- дистрибутивы надо убрать
acid232_ #
06:36
я если честно не понял, о чем это он спросил, поэтому ответил no, т.к. unsure
dvolodin #
06:36
просто приспособить какой-нибудь pip для того, чтобы он скачивал нужные версии софта и ставил их в contrib
06:37
я думаю, это не противоречит кошерным заветам всяких дистрибутивов
06:37
;)
acid232_ #
06:38
Huawei.VRP.get_interfaces снова сломан )
06:41
нельзя на свиче говорить display ospf interface all )
mikevlz|2 #
06:42
можно :)
06:42
а то что реакция может оказаться неожиданной - это да
06:43
с крыши 16-ти этажки тоже можно спрыгнуть, обычно не больше одного раза :)
acid232_ #
06:44
странно, в скрипте есть except self.CLISyntaxError:
06:44
но почему-то не ловит эксепш
lexus-omsk #
06:51
На Huawei (в частности на S9303 версия 5.70) был замечен баг: в выводе одной из команд встречается счётчик ошибок на портах вида Total Error: что совпадает с паттерном на отлов CLISyntaxError
06:51
и он вываливается по ошибке в самом неожиданном месте
06:52
NOC-669
06:53
как временное решение - закомментировал эту строчку в __init__.py
acid232_ #
06:54
2012-09-19 09:56:03,618 [script-172.25.19.150-Huawei.VRP.get_interfaces] Script returns with result: [{'interfaces': [], 'type': 'ip', 'forwarding_instance': 'default'}]
06:54
вот так вот )
lexus-omsk #
06:55
кстати, ещё, вроде там баг с дескрипшенами... порты без него не попадают в результат... по крайней мере у меня
dvolodin #
06:57
а в профиле его научили ловить ошибки синтаксиса?
lexus-omsk #
06:58
ну вот как раз и не работает этот способ, как его научили, а переучить ещё руки не дошли
acid232_ #
06:58
а что делает cached=True при вызове команды из cli
dvolodin #
06:58
запоминает результат
06:58
при повторном вызове в том же скрипте сразу выдает то, что запомнило
acid232_ #
07:04
а пейджер как запретить?
mikevlz|2 #
07:06
dvolodin: подскажи, как автор сего чуда: железка не создает vlan, если в него не засунуть порт. Как в новом интерфейсе указать, что в этом влане вообще есть порт железки? Add Interfaces требует set_switchport
07:06
это немного не то
acid232_ #
07:10
а еще и веб сломан - http://pastebin.com/fAGMvHky
07:12
'ValuesListQuerySet' object has no attribute '_prefetch_related_lookups'
dvolodin #
07:12
acid232_: это лечится
07:12
mongo noc
07:13
db.django_sessions.drop()
acid232_ #
07:18
не помогло, сказало false и та же картина
dvolodin #
07:18
django_session
07:19
без s
acid232_ #
07:20
во, уже лучше, картинок теперь не находит
07:21
404 на media/admin/img/icon-yes.gif
dvolodin #
07:44
конфиг http правь
zi_rus #
07:45
dvolodin, можешь что-нибудь подсказать по NOC-693
dvolodin #
07:55
загрузка системы высокая?
acid232_ #
08:00
чуть больше чем раньше
08:00
очень большая если крешится постоянно
08:01
2012-09-19 11:03:49,522 200 GET /sa/managedobject/ (127.0.0.1) 2990.95ms
08:01
LA в районе 1
08:04
а как в скрипте пейджер отключить?
08:11
добавляю в Huawei.VRP get_version снятие серийника, ломается get_interfaces, из-за пейджера
zi_rus #
08:21
dvolodin, нет - load averages: 0.55, 0.32, 0.15
_4ePTeHok #
08:39
dvolodin, так все же что по поводу ifindex?) Куда их надо отдавать - в сабы, как в http://dpaste.org/UKBwM/ , или в интерфейс?
dvolodin #
08:39
и туда и туда
_4ePTeHok #
08:39
о как.
dvolodin #
08:40
а, не
08:40
в сабы, да
08:40
в большинстве случаев на физике только один саб
_4ePTeHok #
08:40
дык не попадает в монго с саба
08:40
в inv.interfaces
dvolodin #
08:42
inv.subinterfaces
_4ePTeHok #
08:43
а коррелятор будет туда смотреть когда правило классифицировать будет?
08:44
или он ищет в inv.interfaces
08:52
у меня коррелятор не видит ifindex
08:52
из саба
dvolodin #
09:00
он и там и там ищет
09:01
посмотри сам
09:01
db.noc.subinterfaces.find({ifindex: ....})
_4ePTeHok #
09:02
в монго вижу в сабах ifindex
dvolodin #
09:02
ок
_4ePTeHok #
09:02
коррелятор чтобы верно отрабатывал невижу)
dvolodin #
09:03
./noc shell
_4ePTeHok #
09:03
он лепит интерфейсу default ghjabkm
dvolodin #
09:03
from noc.inv.models import *
_4ePTeHok #
09:03
профиль
dvolodin #
09:03
from noc.sa.models import *
09:03
o = ManagedObject.objects.get(name="<name>")
09:03
SubInterface.objects.filter(managed_object=o.id, ifindex=<ifindex>).first()
_4ePTeHok #
09:04
>>> SubInterface.objects.filter(managed_object=o.id, ifindex=14).first()
09:04
<SubInterface: ES3528-test Eth 1/14>
09:04
тут верно
dvolodin #
09:10
а ifindex="14"
_4ePTeHok #
09:11
мде, соврал я тебе, заработало оно. Видимо время надо чтобы все уложилось и подхватилось
dvolodin #
09:11
ну да
_4ePTeHok #
09:12
а можно так же резолвить по LBD правилам?
09:12
функция будет работать во всех правилах?
dvolodin #
09:14
да где хочешь, там и резолвь
09:14
__ifindex
_4ePTeHok #
09:14
понял, спасибо.
dvolodin #
09:14
оно не привязано к конкретному правилу
_4ePTeHok #
09:15
пошел делать правила и допиливать гетинтерфейсес с lldp)
09:15
dvolodin, а еще хотел спросить - в инвентори - интерфейсес маки берутся из БД? или реалтайм?)
dvolodin #
09:16
из базы
09:16
по данным get_interfaces
09:16
смысл их дергать?
_4ePTeHok #
09:16
погоди, так там маки только интерфейсов
dvolodin #
09:16
ну да
09:16
mac discovery я пока не делал
09:16
хотя инфраструктуру подготовил
_4ePTeHok #
09:16
нене, на табе switchports
dvolodin #
09:16
я не не зря демона пилил на части
_4ePTeHok #
09:16
по клику на иконке
09:17
там отдельное окошко с маками вылазит
09:17
по выводу - это маки на порту,
dvolodin #
09:17
а
09:17
да
09:17
это динамика
_4ePTeHok #
09:17
реалтайм это гуд..
dvolodin #
09:18
с запуском MRT
_4ePTeHok #
09:18
вот бы еще статус порта так показывать)
dvolodin #
09:18
ну а что тебе мешает
09:18
смотри inv/apps/interface/views.py
_4ePTeHok #
09:18
слабость в extjs)
dvolodin #
09:18
mrt_config
09:18
там то, что можно запускать
09:19
и там же в js -- MACForm.js -- форма
_4ePTeHok #
09:19
понял, попробую
dvolodin #
09:20
и L2Panel.js
09:20
из L2Panel оно запускается
09:20
NOC.mrt -- запуск задачи
09:20
url: "/inv/interface/mrt/get_mac/",
09:20
get_mac -- это то, что прописано в mrt_config во views
09:21
там, в общем-то, очень прямолинейный код
_4ePTeHok #
09:22
покопаю)
09:22
правила поделаю и долезу
09:24
там кстати NOC-679 висит с 7 сентября, закоммитьте кто нибудь)
09:36
dvolodin, а проясни как с джобами от fm работать? Вот скажем ping failed прилетел. Нужно сформировать джоб на повторную проверку через минуту, если лежит - то через 2, если лежит то через 5. Если подняли - закрываем алярм.
dvolodin #
09:37
fm/correlator/jobs/check_link.py
_4ePTeHok #
09:37
шедулер fm.ping_any у меня - раз в 15 минут.
09:37
ага, вижу.
dvolodin #
09:38
если нужны навороты с расписаниями, то смотри lib/scheduler/intervaljob.py
09:38
get_schedule запускается после каждого завершения job
09:38
если он выдает None - задача снимается
09:39
в противном случае он должен выдать время, когда запускать задачу в следующий раз
_4ePTeHok #
09:39
понял
dvolodin #
09:40
а там -- на сколько хватит фантазии
09:40
хоть по фазам луны ранжируй
_4ePTeHok #
09:41
=))
09:42
мечта пока еще - root cause)
dvolodin #
09:42
могу сделать MoonPhaseJob
_4ePTeHok #
09:42
чтобы из топологии брать информацию что на том порту висело
09:42
что упал..)
09:43
и собирать alarm в красивый разворачивающийся список - вверху root cause, щелкнул - развернулось - увидел что упало из за нее.
dvolodin #
09:49
affected services нужно показывать, да
09:49
но это каталог сервисов должен быть заполнен
_4ePTeHok #
09:49
да не только сервисы
09:49
а сопустствующие алярмы
dvolodin #
09:49
тогда получишь сразу список договоров, которые висели на этом линке
_4ePTeHok #
09:50
порт упал - линк в инвентори есть, значит пинг-фейлед того девайса уже в affected
09:50
с сервисами еще думать надо как их впендюрить
09:50
а по affected alarms - почти все уже есть
dvolodin #
09:51
ну дерево алармов, да
_4ePTeHok #
09:51
логику обращения в инвентори из фм только нужно подумать
dvolodin #
09:51
думать вообще полезно ;)
_4ePTeHok #
09:51
или это коррелятор делать будет
09:51
или еще кто то
09:52
хотя, джобы же есть
09:52
чего мудрить - пусть они и выясняют что есть affected
dvolodin #
09:53
коррелятор
_4ePTeHok #
09:53
порт упал - лезем в инвентори смотрим что было подключено, ищем alarms с этим объектом
09:53
почему не джобы?
09:53
динамику бы получили с адаптивным интервалом запуска
09:57
главное не завалить нок и сеть если крупная авария случится) а то пойдет выяснять что и как и сам упадет)
dvolodin #
10:10
или добъет уцелевшее
_4ePTeHok #
10:13
чтобы значил такой вывод pr=CF,~}
10:13
должен быть мак по идее)
10:14
ох эти китаезы.
dvolodin #
10:14
нет
10:14
все нормально
10:14
^(?P<mac__bin_to_mac>.+)
10:15
а вообще - да
10:15
надо было нормально TC в MIB указывать
10:15
NOC преобразует в текст, если в MIB'ах есть данные
10:15
короче
10:15
в fm/classifier
10:16
ищи функции fixup_
_4ePTeHok #
10:16
да я знаю про функции конвертации
dvolodin #
10:16
fixup_<name> можно использовать в правилах, обзывая группу в регулярных выражениях (?P<var__<name>>.....)
10:17
конвертер из бинарных маков в текст есть
_4ePTeHok #
10:17
гг, а в другом трапе - =00=12=CF=F5=A8o
dvolodin #
10:18
это нормально
10:18
это NOC бинарные данные в quoted-printable перевел
acid232_ #
10:19
гляньте NOC-702
_4ePTeHok #
10:25
какая ж ляпота все таки с __ifindex :)
dvolodin #
10:25
ага
10:26
и description'ы с портов показывает :)
_4ePTeHok #
10:27
в линк-апах/даунах да
10:27
а вот скажем в mac learning/aging - нет)
10:32
snmp TRAP_EVENT_TrapLog switch to default.
10:32
куда бы это запихать...
`kk #
10:43
NOC-703
misak #
10:52
dvolodin: все-таки я не очень понимаю, правильно ли генерит нок реверсы
10:52
для адреса 31.47.196.10 получается синейм 10.10/32.196.47.31.in-addr.arpa.
10:53
должно вроде бы быть 10.196/32.47.31.in-addr.arpa.
10:55
кто в ДНС силен ?
10:56
вроде я путаю ...
10:57
сорри, я путаю
11:00
просто файл зоны надо понять какой соответсвующий нарисовать на делегируемом сервере
acid232_ #
11:09
а что сделали уже маппинг между ifindex и ifalias ?
dvolodin #
11:11
ээ
11:11
чушь какая-то?
mikevlz|2 #
11:14
misak: [thm
11:14
херь
11:14
in-addr.arpa не может содержать /
_4ePTeHok #
11:19
acid232_, между ifindex и name в инвентори.
11:20
т е если есть в инвентори ifindex и name - в FM будет классифицироваться SNMP - верные имена портов. Ну в случае если правила подправят)
11:21
а чой та у нас Chassis | CPU | CPU Usage Above Threshold не поднимает алярм?)
11:23
надо подправить чтоли
acid232_ #
11:24
а пример правила есть для link up link down?
_4ePTeHok #
11:26
acid232_, сейчас выложу.
11:27
acid232_, http://dpaste.org/n2hEX/
11:27
тебе последние два правила важны
misak #
11:31
mikevlz|2: в случае делегирования - должен, по другому никак
acid232_ #
11:32
ок понял
_4ePTeHok #
11:33
acid232_, собственно все snmp правила где ловится ifindex надо по хорошему забубенить так
lexus-omsk #
11:33
dvolodin: похоже на правду? http://dpaste.org/8jwVj/
_4ePTeHok #
11:35
lexus-omsk, 'is_bridge': True, зачем)
11:35
если есть 'enabled_afi': ['BRIDGE'],
lexus-omsk #
11:36
как в примерах ) я думал об этом тоже... наверное, для обратной совместимости
dvolodin #
11:36
lexus-omsk: да, похоже
11:36
is_bridge пока надо тоже устанавливать
11:36
пока все скрипты не переведем
_4ePTeHok #
11:36
епт.)
misak #
11:36
dvolodin: вроде не работает фикс, опять адреса в рендже отдискаверились и в ДНС прописались :(
dvolodin #
11:36
вот как все скрипты перейдут на новый интерфейс, то можно будет вымарать старое
_4ePTeHok #
11:37
а я уже убрал))
11:37
ну да ладно, вернуть не проблема.
lexus-omsk #
11:42
ну вот, тогда надо сейчас озадачится заготовлением тушёнки... того гляди опять багов навылавливаю в процессе... и дискавери включить у себя, посмотреть, как это всё в базу ляжет
11:42
кстати, длинк не работает ещё дискавери?
_4ePTeHok #
11:43
работает в тесте
11:43
может быть не на всем
lexus-omsk #
11:45
последнее, что я помню - отлавливали баг с дескрипшеном - оно тупило на этом месте сильно... да и трейсы валились постоянно... ну ладно, попробую вернуть скрипт завтра, посмотрим
11:46
и ещё вопрос: помнится были где-то на сайте отчёты по покрытию кода тестами...не могу найти или убрали их совсем?
11:47
туплю, это ж локально хтмлки генерились =)
_4ePTeHok #
11:50
еще у кого то есть проблемы с дискавери в логах Job ip_discovery(leningr-3-1-es3526-3-1.line-r.ru) is failed - а на деле работает?)
11:50
или я один такой
`kk #
11:53
у меняя ок
_4ePTeHok #
11:54
теряюсь в догадках где и что искать
11:54
оно же отрабатывает, но в лог пишет failed)
`kk #
11:55
lexus-omsk: дискавери на длинке работает. тестили на л2 свичах. если есть л3 - тести =)
lexus-omsk #
12:00
есть dgs-3627g :)
misak #
12:30
dvolodin: кстати, в дискавери fqdn_template очень было бы полезно иметь переменную административного домена
_4ePTeHok #
12:32
мать мать мать.
12:32
опять в новой прошивке ежика поломали трапы
dvolodin #
12:40
кактусы плакали, кололись, но продолжали лизать ежиков
_4ePTeHok #
12:44
они там стали вообще слать трап которого в мибе нет
12:45
т е переехало окончание
12:45
со 138 на 115
12:45
последнего вообще нет в мибах)
12:48
кабы можно было делать правила только по мибу..
12:48
давнобы все было)
12:51
http://www.juniper.net/uk/en/products-services/routing/acx-series/acx2100/ хыхы. домашний роутер)
12:56
а у нас есть класс для PortSecurity?
12:56
ага нашел.
misak #
13:01
рендж нельзя разблокировать на время, что потереть адреса, надо его стирать, тереть адреса и потом опять создавать
_4ePTeHok #
13:06
чюдеса на виражах. ежик в лог про портсекурити пишет мак в виде 001517-8FBD5B )
dvolodin #
13:11
прокурвы или хуавей?
13:11
:)
_4ePTeHok #
13:11
ежик же
13:12
нок поймет?
zi_rus #
13:16
как только не извращаются
_4ePTeHok #
13:18
ага, понимает..
13:18
zi_rus, да не говори.
13:18
мне страшно, наделаю правил - а на других прошивках не будут работать.
zi_rus #
13:21
_4ePTeHok, шей свое оборудование в одну прошивку и не парься
_4ePTeHok #
13:21
да я то прошил уже
13:21
у других как будет)
13:22
еще и модели разные в одном профиле - тоже по разному шлют на разных прошивках))
zi_rus #
13:22
а другие будут думать, работает ли их железо с этим профилем
13:23
может сами патч сделают, может прошивку твою же выберут
_4ePTeHok #
13:23
а вот вопрос - кто ставит фильтры на броадкаст на доступе
13:23
какие цифиры ставят на срабатывание?
13:23
какой уровень бродкаста считать нормой, какой нет
13:24
на ежах Alarm Fire Threshold(Kpps): 128 Alarm Clear Threshold(Kpps):128 по дефолтк
zi_rus #
13:24
1мбит по-моему уже ненормален
_4ePTeHok #
13:24
тут в пакетах
zi_rus #
13:25
подели на размер пакета, например arp
13:25
будет тебе ппс
_4ePTeHok #
13:26
кольцанул два порта, по идее бродкаст же должен посыпатся?)
zi_rus #
13:27
вообще не обязательно, но да, обычно это будет броадкаст
_4ePTeHok #
13:29
не сработало..
13:29
чем бы погенерить бродкаст
zi_rus #
13:29
арп
13:30
ping на левый ip
_4ePTeHok #
13:30
ну это мелко
13:30
надо же много и сразу)
zi_rus #
13:30
в кольце размножится
`kk #
13:30
_4ePTeHok: на длинках 64 в сек бывает много...
_4ePTeHok #
13:31
ну я на тест вообще 10/30 выставил
`kk #
13:31
а вообще acl'ями зарезать бродкаст
zi_rus #
13:31
стп тоьлок отключи
_4ePTeHok #
13:31
`kk, да не, я правила для ежика пишу в ФМ, мне нужно сгенерить для теста
13:31
чтобы сработал алярм
`kk #
13:32
так минимум -)
13:32
если для теста только
misak #
13:32
кто резал трафик на длинках ?
13:32
там при как просчитать правильные цифры ?
_4ePTeHok #
13:33
пишут ping -b -f броадкаст попробовать)
misak #
13:33
ну тоесть когда я ставлю резать 10 Мбит режется наверное 5-6
_4ePTeHok #
13:33
misak, да не будет оно верно резать
`kk #
13:33
не надо на них резать
misak #
13:34
а если очень нада ? я сейчас просто в 2 раза больше ставлю
`kk #
13:34
в FAQ на сайте у них было
13:35
режь лучше выше длинка
_4ePTeHok #
13:37
10 мбит вообще портом лучше порезать)
`kk #
13:37
хех. это точно _)
misak #
13:38
ну 10 это просто пример
13:38
пойду к ним на сайт
13:38
на форум наверное ?
`kk #
13:43
http://dlink.ru/ru/faq/
13:44
тут было
13:44
ну и на форуме можно спросить.
_4ePTeHok #
13:58
чото нихрена ежик не реагирует)
13:58
ну да и хрен с ним.
14:00
вот кстати предложение. Можно по щелчку на порту в инвентори-интерфейсес(или иконку впиндюрить) - показывать историю всех алярмов/ивентов которые имеются в FM на его счет.
14:01
get_interface_counters бы сделать.
14:02
и уже графики можно рисовать в реалтайме.
14:02
тык на порт в инвентори - и график прям при тебе рисуется
14:03
dvolodin, сделай интерфейс?)
14:03
а скрипты напилим и морду допишем в инвентори.
14:07
ну и ошибки на порту там же можно будет глянуть
Tweet
Share this page
Share this page: Tweet