About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 21.08.2015
bee26 #
05:11
наконец пришло - 1. While parsing config of device Str16p3p with IP 10.10.10.12 we have found some errors:
05:21
алярмов нет. евентов тоже
05:23
dvolodin: пришло мыло - 1. While parsing config of device Str16p3p with IP 10.10.10.12 we have found some errors:
05:23
и больше ничего нет
dvolodin #
05:25
это не сообщение NOC'а
05:25
железка какая и какие проверки?
bee26 #
05:28
тема письма - Configration policy violation at мо
05:30
не нок разве?
05:33
на валидатор нока похоже
dvolodin #
05:34
это его, да
05:34
профиль железки какой?
bee26 #
05:34
еж
05:35
в логах нотифера нока - subject=Configration policy violation at мо
dvolodin #
05:43
а что за проверка?
bee26 #
06:07
х. знает. на мо нет валидатора, на профайлах тоже нет
06:07
ии у нока появился!
dvolodin #
07:05
вряд ли
filonov #
07:34
dvolodin: а как мне выбрать объекты у которых Network Segment пустой?
dvolodin #
07:35
select'ом
07:35
segment is null
filonov #
07:35
segment в какой таблице? в sa_managedobject такого нет
dvolodin #
07:37
поле есть
07:37
segment | character(24) |
filonov #
07:39
а,угу. в экран не влезло - не заметил
07:41
а имена сегментов - только в монго?
dvolodin #
07:46
да
filonov #
07:51
ок. разобрался так)
07:51
но таки хотелось бы иметь возможность в MO выбирать фильтр с пустым значением
07:52
А то приходится заводить специальный сегмент перед отдачей в ручную сортировку
dvolodin #
07:54
сегменты вообще обязательны к заполнению
filonov #
07:55
импорт csv замечательно проходит без них
07:57
dvolodin: а на глюки скроллера в MO уже жаловались, кстати?
07:58
после фильтрации или релоада - окно пустое. И надо прокрутить вниз, чтоб что-то появилось
ufir #
07:58
да, есть такое
07:58
все забили, как я понял
dvolodin #
07:58
да я видел, но не могу найти
07:58
где-то в потрохах extjs
filonov #
07:59
dvolodin: появилось где-то в последний месяц. ТОчно не скажу - я в отпуске был. Раньше все было ок
TSergey #
08:00
filonov: сто лет этой проблеме
08:00
к тому что ошибаешься, что в последний месяц
filonov #
08:01
TSergey: возможно оно просто вылезает после какого-то количества объектов
dvolodin #
08:02
хуже другое, в safari оно не вылезает
TSergey #
08:02
ну нужно как минимум что было две-три страницы
08:02
стабильно ловится если ставить чекбокс и дождаться обновления
bee26 #
08:13
на 1 мо так тоже бывает. фильтр включаешь и пусто. вниз мотанешь - вроде есть что-то
evyscr #
08:13
get_interface_status из fm постоянно вызывается для девайса с is_managed == false
bee26 #
08:14
это давно так - все забили
evyscr #
08:15
get_interface_status_ex регулярно вылетает в трейсбек с характеристикой вида "Attribute 'admin_status' is required"
filonov #
08:15
bee26: а сколько у тебя всего объектов?
abyrvalg #
08:16
evyscr: У меня тоже, прчем давно. Я писал тут. То на админ статус ругается, то на опер_статус.
bee26 #
08:17
6k
08:18
или выключенных? выключенных 2-3
filonov #
08:18
всего
08:18
тестовая инсталляция с 4мя объектами работает как часы. На больших - проблемы, да
dvolodin #
08:18
если ругается, значит железка не отдала их по snmp
08:19
ну, или, как вариант - не успели обработать
abyrvalg #
08:22
Как узнать? Например, впендюрить куда-нить кусок кода, чтоб оно логировало то, что получено с железки.
evyscr #
08:22
в любом случае, проблема нока это обработать
08:23
я вот не зря говорил про инт вместо була
TSergey #
08:23
"То на админ статус ругается, то на опер_статус" у меня тоже так, периодически
abyrvalg #
08:24
На разных железках, на разных интерфейсах. Понять бы причину.
evyscr #
08:25
Причина - а оно не обязано всё тебе отдавать.
TSergey #
08:25
у меня чаще всего замечено на DES-3028, я подумывал что их персональная проблема
abyrvalg #
08:25
У меня только циски.
08:25
evyscr: Почему?
evyscr #
08:26
Например, если cpu загружен
abyrvalg #
08:26
Но там-же бульк-запрос, не?
evyscr #
08:26
И что?
dvolodin #
08:26
tcpdump'ом подебажить
evyscr #
08:26
Там, кстати, несколько запросов
abyrvalg #
08:26
Ну, я фантазирую, что такие запросы должны обрабатываться транзакционно.
dvolodin #
08:26
но там что угодно может быть
08:27
во-первых в capabilities надо проверить, стоит ли там bulk
08:27
без bulk'а тоскливо будет
TSergey #
08:27
dvolodin: и вопрос почему нотификейшн не шлет письма по фэйлед скрипт
08:27
комрады, у кого-то шлет?
evyscr #
08:27
ну стоит
dvolodin #
08:27
TSergey: я вот не уверен, что стоит это делать вообще
08:27
завалит
abyrvalg #
08:27
Ну микротики у меня без булька, т.к. в бульк они не умеют.
dvolodin #
08:28
сказки
08:28
не далее как вчера дергал с них bulk'ом во время теста
08:28
:)
TSergey #
08:28
dvolodin: так рабочий это блок или нет?
dvolodin #
08:28
TSergey: какой?
TSergey #
08:29
нотификешн
abyrvalg #
08:30
dvolodin: Ну, эм, это конкретная проблема совместимости забикса и микротика. Мне лень писать внешнюю проверку для этих тоскливых микротиков, или тюнить размер
08:30
бульк-запроса. Проще бульк отключить.
TSergey #
08:30
dvolodin: SA\Setup\Object Notification
08:31
dvolodin: кроме конфигов что-то еще сообщается?
evyscr #
08:31
алярмы
TSergey #
08:32
evyscr: шлет письма про алярмы?
evyscr #
08:32
да
08:33
и Version inventory changes
dvolodin #
08:34
abyrvalg: в заббиксе или на микротике? :)
abyrvalg #
08:35
На микротике. У него маленький размер бульк-запроса, заббикс этого не понимает.
08:35
А, а тюнить - на заббиксе. Где-то был пример, как его научить самостоятельно подстраиваться под нужный размер.
xetle #
08:35
У кого есть Eltex OLT LTE-NX говорят нок дозрел до того чтобы PON интерфейсы в базу уложить. На профиле Eltex.PON можно поексперементировать...
filonov #
08:36
xetle: какие именно интерфейсы?
xetle #
08:36
PON
08:38
надо посмотреть и продумать как расширить igetinterfaces чтобы все PON устройства поддерживались.
08:39
то есть ПРАВИЛЬНО написать get_interfaces для профиля Eltex.PON
dvolodin #
08:39
xetle: немного не так
filonov #
08:39
xetle: я бы все таки клиентские железки вынес в отдельный интерфейс
dvolodin #
08:39
расширить igetinterfaces
filonov #
08:39
igetinterface недостаточен там. И будет избыточен для всех остальных
dvolodin #
08:39
а потом уже скрипт под него
08:40
filonov: они такие же железки
filonov #
08:40
не совсем
xetle #
08:40
Я его год назад в руках крутил и какието наброски сделал по PON но потерял... Надо поновой вспомнить.
dvolodin #
08:41
Я вот учу ansible ставить NOC
08:41
скоро все эти bootstrap'ы уйдут
xetle #
08:41
filonov: Речь о станционных PON, а не клиентских: http://eltex.nsk.ru/catalog/olt_tgepon/
dvolodin #
08:43
pip'ом или из RPM будет ставиться тулза
filonov #
08:43
xetle: а я как раз про клиентские интерфейсы станционных
dvolodin #
08:43
которая умеет разворачивать NOC на серверах и настраивать сервисы
abyrvalg #
08:44
Когда?
08:44
Я все снесу нахер и с нуля поставлю.
ufir #
08:44
почему некоторые МО на карте серые ?
dvolodin #
08:44
зачем сносить, если уже поставил?
08:44
ufir: их не пинговали никогда
xetle #
08:45
dvolodin: по поводу установки, надо помнить что Unix разные и с разными пакетами.
dvolodin #
08:45
xetle: :)
08:45
я немного в курсе
xetle #
08:45
*пакетными менеджерами
dvolodin #
08:45
оно через ansible ставит
ufir #
08:46
dvolodin э... а как включить, чтобы пинговали ?
xetle #
08:46
Да ansible хорош.
iZverg #
08:46
dvolodin: кстати давно хотел спросить, вот жёстко заданные версии по зависимостям - они насколько оправданы?
dvolodin #
08:46
iZverg: абсолютно оправданы
abyrvalg #
08:46
dvolodin: Сносить - потому, что NOC-1652, например.
xetle #
08:46
Но гдето он будет выполнять apt-get, а в другом месте emerge, ....
iZverg #
08:46
dvolodin: это чисто питоновская особенность?
dvolodin #
08:47
да нет, RPM hell никто не отменял
iZverg #
08:47
dvolodin: а если нет RPM и hell-а их тоже нет :)
dvolodin #
08:48
abyrvalg: я сейчас на дебиановской виртуалке раскрутку проверяю
08:48
потом попробую подцепить вторую ноду на ubuntu
xetle #
08:48
iZverg: в новых версиях, даже минорных бывает меняют АПИ.. а нок на АПИ заваяза сильно.
dvolodin #
08:48
если кто хочет поиграться, я могу закоммитить
abyrvalg #
08:48
Вот да. Народ говорил. что в дебиане вроде все норм, в отлдичие от убунты.
dvolodin #
08:48
playbook'и
filonov #
08:49
я на убунте особых проблем не заметил. c FreeBSD возни заметно больше
dvolodin #
08:49
но эта штука жестко привязана к microservices
08:49
по части конфигурирования
abyrvalg #
08:50
microservices - часто вижу это слово в етам чятиге.
08:50
Где почитать, что оно такое?
08:50
В гугле?
dvolodin #
08:51
abyrvalg: да нечего особо читать
08:51
develop запускает процессы через noc-launcher
08:52
процессы дружатся между собой кто как умеет
08:52
microservises - дальнейшее развитие
08:52
процессы, точнее сервисы, запускаются через supervisord
08:52
у них есть общий механизм для взаимодействия через NSQ
08:53
ну и всякие полезные механизмы для failover и балансировки нагрузки
08:53
там и настройки попроще
08:53
есть концепция пула
08:53
многи сервисы могут работать в пулах
08:54
в MO вместо настроек активаторов и коллекторов просто указывается пул
08:54
из активаторов вынес в отдельные сервисы попингуйки и коллекторы
08:54
и активаторы похудели
08:55
классификатор теперь не один на всех, а один на пул
08:55
к пулам же пробы привязаны, их теперь вообще в pm > setup не надо настраивать
08:55
и всякие storage тоже
08:56
ну а так как процессов стало побольше и они могут крутиться на большом количестве нод - есть отдельная внешняя тулза
08:57
которая позволяет быстро развертывать новые ноды, централизовано переконфигурировать процессы
08:57
указать, на каких нодах что запущено
abyrvalg #
08:57
Это все любопытно.
dvolodin #
08:57
и она же позволяет окучивать несколько инсталляций NOC
abyrvalg #
08:57
Я бы попробовал. С нуля поставить microservices на убунту. И посмотреть чо да как.
filonov #
08:57
dvolodin: а как быть с тем что текущая попингуйка требует запуска от рута?
dvolodin #
08:58
сервис ping от рута придется запускать
08:58
активатор - больше нет
filonov #
08:58
а нафига ему рут на самом то деле?
evyscr #
08:59
таму що fping?
dvolodin #
08:59
коллекторы -- я постараюсь в playbook'ах разрешать процессам цепляться к портам
08:59
filonov: ping тоже suid root :)
08:59
raw socket только рутом создается
evyscr #
09:00
suid root - это провокация
09:00
нет его
dvolodin #
09:01
ну не suid, то как-то отдельно откручивается
09:01
в моем os x уже не suid, да
evyscr #
09:02
поставь в свой os x браузер, отличный от сафари
09:03
энивей
dvolodin #
09:03
root@n01:~# getcap /bin/ping
evyscr #
09:03
повторяю: get_interface_status из fm постоянно вызывается для девайса с is_managed == false
dvolodin #
09:04
вот такое /bin/ping = cap_net_raw+ep
evyscr #
09:04
failed scripts замусорен
TSergey #
09:17
неожиданно DGS-3120 стал отправлять трапы со второго интерфейса, никто не сталкивался?
09:17
вроде нигде это не прописывается
ufir #
09:26
да что такое.. одинаково настроены МО, один серый, другой зеленый. что за хрень
evyscr #
09:28
trap source ip?
09:28
ну и пинг в дискавери
ufir #
09:32
evyscr а пинг в дискавери - это где смотреть ?
TSergey #
09:33
evyscr: как dgs пнуть что-бы он с системного айпишника трап слал?
evyscr #
09:35
ufir: в mo, вестимо.
09:35
TSergey: ай донт кнов
TSergey #
09:36
главное не ожидал я от него такого
filonov #
09:36
TSergey: config trap source_ipif не катит?
xetle #
09:36
по raw сокетам, прошлой осенью чтото в Линукс ядре допиливали, что рута не надо уже...
TSergey #
09:37
filonov: спасиб тебе, добрый человек
09:37
не сталкивался я с таким
filonov #
09:38
Он вообще должен слать стого интерфейса, с которого смотрит роутинг
xetle #
10:51
Сдесь много кто пользуются профилем Eltex.PON. Хочу для него igetinterfaces расширить и скрипт get_interfaces написать. Владельцы Eltex OLT LTE-NX отзывайтесь...
filonov #
10:55
xetle: я бы все же под пон сделал отдельный интерфейс
dvolodin #
10:57
filonov: зачем?
10:57
DSL же кладется
10:57
я думаю, там просто сабы нужно нарезать
xetle #
10:58
filonov: get_interfaces в NOC собирает все физические и виртуальные порты с оборудования. ВСЕ значит и PON тоже должен собирать.
10:59
Для пон всего то надо пару новых типов интерфейсов прописать.
11:00
Да PON это не Ethernet, там разница большая и кроме расширения igetinterfaces придётся добавлять вообще новые интерфейсы...
filonov #
11:12
ну я о том и говорю
dvolodin #
11:13
одно другому не мешает
11:13
для инвентаризации -- да, отдельный интерфейс
11:13
мб и уровни сигнала пусть он извлекает
filonov #
11:14
я показывал примеры с Dasan-а. Там это совсем разные вещи.
dvolodin #
11:14
ты только список olt показал
Dmitry1 #
11:14
Аллилуя ! Дима наконец-то дошел до того, что с интерфейсов нужно снимать счетчики !
dvolodin #
11:15
Dmitry1: а я когда-то оказывался?
filonov #
11:15
Dmitry1: счетчики и так снимаются
Dmitry1 #
11:15
лет пять отказываешься
dvolodin #
11:15
я только требую отделять сбор информации по конфигурации от сбора статистики
11:15
счетчики в get_interfaces нафиг не нужны
11:15
кроме того, сбор счетчиков -- это уже PM
Dmitry1 #
11:16
нафиг PM
filonov #
11:17
Dmitry1: если "нафиг PM" то нафига тебе счетчики?
Dmitry1 #
11:17
зачастую интересует динамика изменений, допустим раз в месяц
filonov #
11:18
интерфейсные счетчики раз месяц можно снимать с любого ГСЧ - это будет проще и столь же информативно
Dmitry1 #
11:18
кроме того, этот же PM абсолютно бесполезен техподдержке
dvolodin #
11:19
я предлагал придумать интерфейс :)
Dmitry1 #
11:19
это я предлагал
11:19
на форуме еще
dvolodin #
11:19
вот на затравку -- придумай интерфейс для сбора информации по порту
11:19
предлагал
11:19
но не придумал :)
Dmitry1 #
11:19
я придумывал
dvolodin #
11:20
ты текущие корежил
11:20
:)
11:20
короче -- на входе интерфейс
11:20
на выходе -- все. что может тп понадобиться
Dmitry1 #
11:20
но тебе такие вещи, как MDI/MDIX, Flow Control, Duplex/Half-Duplex оказались совершенно не интересны
11:21
у тебя линков, меньше 10G не существует, судя по всему
xetle #
11:21
оно в FM есть, если оборудование соизволит сообщить.
Dmitry1 #
11:21
Причем здесь FM ?
filonov #
11:22
dvolodin: onu status от дасана я тоже показывал
dvolodin #
11:22
filonov: я его сохранил
Dmitry1 #
11:22
Мне нужно, чтобы выдавало предупреждение, если два гигабитных порта поднялись на сто мегабит
dvolodin #
11:22
он мне нравится за основу
11:22
Dmitry1: это не задача интерфейса, предупреждения выдавать
Dmitry1 #
11:22
или при наличии двух дырок под SFP модули, связь между коммутаторами по меди
dvolodin #
11:22
filonov: нужно аналогичные вывод с других девайсов других вендоров
11:23
понять общую часть
11:23
Dmitry1: это топологическая валидация
11:23
не задача интерфейса
xetle #
11:23
get_copper_tdr_diag и get_dom_status вытягивает дополнительную инфу...
dvolodin #
11:23
это как раз валидаторы в CM
Dmitry1 #
11:23
да, но интерфейс должен сообщить такое:
filonov #
11:23
dvolodin: ну других пока нет. Если элтех родит терминалы совместимые с дасаном - могут появиться элтексы но потом
Dmitry1 #
11:24
Port : 23(C)
11:24
--------------------
11:24
Auto Negotiation : Enabled
11:24
Config Status : Complete
11:24
Capability Bits : 10M_Half,10M_Full,100M_Half,100M_Full,1000M_Full
11:24
Capbility Advertised Bits : 10M_Half,10M_Full,100M_Half,100M_Full,1000M_Full
11:24
Capbility Received Bits : 10M_Half,10M_Full,100M_Half,100M_Full,1000M_Full
xetle #
11:24
" Мне нужно, чтобы выдавало предупреждение, если два гигабитных порта поднялись на сто мегабит" рисуй тригеры в FM
Dmitry1 #
11:24
Port : 23
11:24
--------------------
11:24
Port Status : Link Up
11:24
Description :
11:24
HardWare Type : Gigabits Ethernet
11:24
MAC Address : 84-C9-B2-1C-6B-16
11:24
Bandwidth : 1000000Kbit
11:24
Auto-Negotiation : Enabled
11:24
Duplex Mode : Full Duplex
11:24
Flow Control : Disabled
11:24
MDI : Cross
11:24
Address Learning : Enabled
11:25
Last Clear of Counter : 9160 hours 42 mins ago
11:25
BPDU Hardware Filtering Mode: Disabled
11:25
Queuing Strategy : FIFO
11:25
TX Counter
11:25
Excessive Deferrals : 0 Late Collisions : 0
11:25
Excess Collision : 0 Single Collision : 0
11:25
Collision : 0
11:25
RX Counter
11:25
Broadcast : 2240499 Multicast : 1992237
11:25
CRC Errors : 0 Dropped Packets : 4208420
11:25
Undersizes : 0 Oversizes : 0
11:25
Fragments : 0 Jabber : 0
filonov #
11:26
use pastebin, Luke!
Dmitry1 #
11:26
зачастую, броадкаста и мультикаста пробегают единицы пакетов в секунду
11:27
ошибок тоже
11:27
поэтому динамику изменения нужно смотреть раз в день, неделю, месяц
filonov #
11:30
раз в месяц легко не увидеть переполнение
Dmitry1 #
11:32
я образно
filonov #
11:32
для этого консоль есть. и скрипты
Dmitry1 #
11:32
а я думал, что скрипты у нас в sa/profiles находятся
filonov #
11:32
да
Dmitry1 #
11:33
зачем консоль тогда ?
filonov #
11:33
эээ, посмотреть на счетчики
Dmitry1 #
11:33
У нас в SA -> MO есть вкладка "Interfaces"
filonov #
11:33
и чо?
Dmitry1 #
11:33
IMHO - счетчики должны там отображаться
filonov #
11:34
Т.е. для того чтобы раз в месяц посмотреть пару цифр, мне надо собирать и хранить примерно 500К счетчиков?
Dmitry1 #
11:34
filonov: у тебя 50K оборудования ?
11:36
смотри как умно D-Link придумал:
filonov #
11:36
у меня 10К оборудования. пусть 20 интерфейсов в среднем. Это уже 200К интерфейсов.
Dmitry1 #
11:36
GS-1100-10/ME:5# show cpu port
11:36
Command: show cpu port
11:36
Type Total Diff
11:36
------------------- ---------- -----------
11:36
ARP 15191 +15191
11:36
DHCP 0
11:36
DHCPv6 0
11:36
GVRP 0
11:36
ICMP 25943 +25943
11:36
ICMPv6 0
11:36
IGMP 380472 +380472
filonov #
11:36
а счетчиков более одного на интерфейс
Dmitry1 #
11:36
LACP 1754206 +1754206
11:36
и сразу видно, где идет паразитный трафик
zi_rus #
11:38
filonov: и да и нет, у тебя не 100% заполняемость, есть и свободные порты
11:38
по ним не надо снимать счетчики
Dmitry1 #
11:38
не правильно
filonov #
11:38
zi_rus: поэтому 500К а не 3М
zi_rus #
11:38
да
Dmitry1 #
11:39
если порт убит грозой, то он может сам по себе генерировать трафик
11:39
кроме того, у меня был случай, когда я вычислил повреждение кабеля по косвенным признакам
11:40
через физический порт шло в два раза трафика, чем через vlan на нем
11:41
опять же
dvolodin #
11:42
ТП не будет смотреть на страшные цифры
zi_rus #
11:42
такие системы стоят олимпиарде нерублей
Dmitry1 #
11:42
как я в PM смогу задать счетчики устройств, которые могут включаться на железке, а могут и выключаться ?
dvolodin #
11:42
им минимально необходимый набор нужен
11:42
zi_rus: NOC умеет проводить валидацию :)
11:42
но ты прав, тут дело даже не в цене, а в планировании
zi_rus #
11:42
но не имеет документацию чтобы найчить это настраивать
dvolodin #
11:43
нужно понимать, что хочешь
11:43
zi_rus: ну не без этого, да
zi_rus #
11:43
вот это и надо решать
dvolodin #
11:44
я нанимаю документалиста, ты - оплачиваешь
Dmitry1 #
11:45
dvolodin: я согласен на что угодно, но сначала сделай отключаемые хандлеры, и возможность запуска джобов только вручную
zi_rus #
11:45
договорились
11:45
но у меня нет денег
11:45
Dmitry1: он делает, ты оплачиваешь :)
dvolodin #
11:46
Dmitry1: придумай настройки
11:46
завта ты потребуешь отключать отдельные команды в байткоде питона
11:46
потому как они процессор грузят
11:46
:)
Dmitry1 #
11:47
не смешно
zi_rus #
11:48
"зато правда" :)
Dmitry1 #
11:48
я же уже объяснил, что поведение NOC, когда он ходит на оборудование по неконтролируемому КОНЕЧНЫМ пользователем алгоритму - неприемлемо
11:49
конечный пользователь - это не программист на питоне
11:49
и не системный администратор
evyscr #
11:50
тащемта у текущего нока конечный пользователь - именно программист на питоне
Dmitry1 #
11:50
ну извините, в нашей фирме нету программистов на питоне
zi_rus #
11:51
а ты на что
filonov #
11:51
Dmitry1: в нашей тоже нету. И что?
Dmitry1 #
11:51
то, что поведение NOC должно быть "прозрачно" для конечного пользователя
evyscr #
11:51
do it
filonov #
11:52
Dmitry1: чтобы было так - нужен погромист.
11:52
иначе - никак
abyrvalg #
11:52
Dmitry1 прав в том, что для нормальной эксплуатации нока нужен прогер на питоне. Это НЕ нормально.
filonov #
11:53
abyrvalg: для эффективной эксплуатации любой сложной системы нужен прогер. Так правильнее
zi_rus #
11:53
ну и кто это будет исправлять
abyrvalg #
11:53
filonov: Отнюдь.
evyscr #
11:53
abyrvalg: ты уже не первый месяц на канале. ещё не осознал?-)
abyrvalg #
11:54
evyscr: Я осознал. Но нормальным оно от этого не стало.
zi_rus #
11:54
filonov: прогер нужен чтобы допиливать под себя, есть 100500 стандартных задач которые из коробки должны просто выпрыгивать
abyrvalg #
11:54
zi_rus: this!
evyscr #
11:54
zi_rus: ты сам всё знаешь про слово "должны"
filonov #
11:54
zi_rus: эффективное использование заведомо подразумевает решение нестандартных задач, или стандартных - нестандартными методами
Dmitry1 #
11:55
filonov: на эти 100500 задач должы быть 100500 настроек и 100500 примеров
evyscr #
11:55
вот давайте, поднимите руки те, кто сейчас тестирует microservices
zi_rus #
11:55
большинство мелких контор требуют автоматизации стандартных задач, остальное на столько мало что делается руками дешевле чем нанимать программера
abyrvalg #
11:55
evyscr: Я только собираюсь. :)
zi_rus #
11:55
для крупных это не так
Dmitry1 #
11:55
в половине таблиц по умолчанию вообще пусто, а в другой половине одна запись "default"
dvolodin #
11:55
и заодно поднимите те, кто будет верещать, когда microservices уйдут в develop
11:55
:)
Dmitry1 #
11:56
я не буду
evyscr #
11:56
я буду верещать
zi_rus #
11:56
я буду хуями в три раза активней обкладывать
evyscr #
11:56
++
abyrvalg #
11:56
Там все сломали?
zi_rus #
11:56
да
11:56
там всегда все ломают
Dmitry1 #
11:56
для меня ничего не изменится от появления микросервисов. как не работали FM, IPAM, PM, так и не будут работать
zi_rus #
11:56
только чинить не торопятся
filonov #
11:56
Dmitry1: 10005000 настроек - это неуправляемый и неконтролируемый монстрик
evyscr #
11:57
filonov: а они всё одно потребуются
11:57
в смысле, подобное количество
zi_rus #
11:57
filonov: а писать код это так просто и понятно, а главное уравляемо
Dmitry1 #
11:57
filonov: настрой таймаут дискавери в шедулере, запускаемом в FM
11:58
тебе подсказать, где он находится ?
evyscr #
11:58
Dmitry1: поправь json-)
Dmitry1 #
11:58
# NOC modules
11:58
from noc.inv.discovery.scheduler import DiscoveryScheduler
11:58
DELAY = 600
11:58
discovery_scheduler = DiscoveryScheduler()
11:58
def schedule_discovery(event):
evyscr #
11:59
Dmitry1: я только не пойму, сейчас ты чего конкретно добиваешься?
Dmitry1 #
11:59
filonov: как тебе такая настройка в файле fm/handlers/event/discovery.py
filonov #
11:59
zi_rus: без написания кода ничего не будет.
evyscr #
11:59
признания, что всё плохо? так это и так известно
Dmitry1 #
12:00
evyscr: прежде, чем внедрять очередной скрипт, который будет (лезть на свич, грузить процессор, писать 100500 записей в базу в секунду), нужно придумать, как им управлять
evyscr #
12:00
Dmitry1: ты мне лучше скажи, почему создаётся постоянно работающий джоб check_link для объекта без is_managed?
Dmitry1 #
12:01
evyscr: это Диму спросить нужно. Я вообще против этого джоба
12:01
для конечного пользователя он никакой помощи не дает
evyscr #
12:01
спорно
Dmitry1 #
12:01
только засырает логи свича
zi_rus #
12:02
evyscr: факт
evyscr #
12:02
что факт?
zi_rus #
12:02
на самом деле с check link все сложно
12:02
теоретически он нужен
12:02
теоретически
12:02
но я бы его у себя отключил
Dmitry1 #
12:03
evyscr: если у тебя упал оптический линк, какую информацию пользователю лучше выдать ?
12:03
get_dom_status, или стопиццот раз запустить chack_link ?
evyscr #
12:03
какому пользователю?
Dmitry1 #
12:03
который за web мордой сидит
12:03
и получил сообщение FM
evyscr #
12:03
it depends
zi_rus #
12:03
дом на медном порту?
Dmitry1 #
12:04
я выше писал, что линк оптический
evyscr #
12:04
_некоторые_ линки нужно вот так вот смотреть
zi_rus #
12:04
я только за прогрессивную шкалу еще хочу сказать
12:04
линк который лежит полгода нет смысла опрашивать раз в 15 минут
evyscr #
12:04
раз в минуту
zi_rus #
12:05
да похер
evyscr #
12:05
(по дефолту, ай мин)
Dmitry1 #
12:05
линк вообще не имеет смысл опрашивать в автоматическом режиме
zi_rus #
12:05
имеет
evyscr #
12:05
тебе - возможно
12:05
за всех решать не надо
zi_rus #
12:06
это должно решаться настройками
12:06
не текстовыми
Dmitry1 #
12:06
правильно - не текстовыми
12:06
конечный пользователь в конфиг не полезет
evyscr #
12:07
пиши уж Конечный Пользователь (ТМ)
Dmitry1 #
12:07
конечный пользователь - это 10 девочек/мальчиков, которые сидят в техподдержке.
12:08
у них нету доступ на сервер, чтобы менят конфиги
12:08
они не знают питона
12:08
они не умеют ничено набирать в консоли
12:08
они не понимают нифига в технической информации
12:09
им тупо должно показать, где произошла ошибка, и в чем проблема
12:09
пример:
evyscr #
12:09
Извини, но ты ни хрена не знаешь, какой где конечный пользователь
Dmitry1 #
12:09
да пофиг
12:09
смотри пример
12:10
вывод скрипта get_copper_tdr_diag
12:10
вывел, что одна пара 50 метров, а другая 70
12:11
почему нельзя скрипт, заточенный под конкретную платформу, выдать заодно и ошибку ??? !!!!!
evyscr #
12:11
Почему нельзя обойтись одним вопросительным знаком?
dvolodin #
12:12
потому что платформ много
evyscr #
12:12
В рамках DxS, боюсь, не каждый свич диагностику выдаст
dvolodin #
12:12
и не дело скрипта думать, хорошо это или плохо
Dmitry1 #
12:12
каких платформ ?
dvolodin #
12:12
а завтра поставят свичи другого вендора
12:12
и там все по-другому будет
12:12
нафиг такое?
evyscr #
12:13
эээ
Dmitry1 #
12:13
dvolodin: решать, выдавать ошибку или нет должен скрипт, например sa/profiles/Cisco/IOS/get_copper_tdr_diag.py
abyrvalg #
12:13
Нужно больше уровней абстракции. Нужно больше MVC.
evyscr #
12:13
тащемта, интерфейс вида igetcopperlength может быть
Dmitry1 #
12:13
другой пример
12:14
6509_core_switch#show interfaces transceiver
12:14
Transceiver monitoring is disabled for all interfaces.
12:14
If device is externally calibrated, only calibrated values are printed.
12:14
++ : high alarm, + : high warning, - : low warning, -- : low alarm.
evyscr #
12:14
abyrvalg: иди читай апдейт extjs c 4 на 5
dvolodin #
12:14
скрипт должен выдавать информацию, а не думать
Dmitry1 #
12:14
нам подсказывают, что значение, у которого впереди стоит +, ++, -, -- - это warning или error
abyrvalg #
12:14
"уж послала - так послала" (C)
evyscr #
12:15
abyrvalg: ты сам сказал MVC
dvolodin #
12:15
а что с ней делать - пусть думает та система, которые показывает цифирки оператору
evyscr #
12:16
Dmitry1: иногда я вот это вспоминаю - http://bash.altlinux.org/601
Dmitry1 #
12:16
dvolodin:http://i.imgur.com/WzRuquB.png
12:17
расскажи мне, где нормальные значения, а где критичные ?
evyscr #
12:17
dvolodin: а введение трешхолдов в pm - оно вписывается?
Dmitry1 #
12:17
какую информацию может получить конечный пользователь от вывода этого скрипта ?
evyscr #
12:18
конечному пользователю (тм) скрипты не нужны
Dmitry1 #
12:18
а что ему нужно ?
12:18
голый питон ?
evyscr #
12:18
и интерфейс обновляющийся не нужен - см отчёт e_zombie
Dmitry1 #
12:18
и консоль ?
dvolodin #
12:18
конечному юзеру там делать нечего
Dmitry1 #
12:19
Дим, я выше привел вывод скрипта get_dom_status
evyscr #
12:19
13:24 < e_zombie> кратко резуюмирую " ебала я в рот тебя, твой нок, постоянно обновляющиеся страницы"
Dmitry1 #
12:20
Вопрос: зачем такой скрипт вообще существует, если из его вывода невозможно узнать, что у нас проблема с уровнем сигнала ?
dvolodin #
12:20
как кирпичик для построения системы, которая проанализирует и покажет эти данные
12:20
и не факт, что это NOC будет
Dmitry1 #
12:21
dvolodin: какая система и что должна проанализировать ? Ты издеваешься ? А ничего, что дла каждого типа трансиверов свои пограничные значения ?
12:21
Циска УЖЕ выдает, если значения критичные ? Тебе этого мало ?
12:21
Или сверху еще нужно какую-то систему писать ?
dvolodin #
12:22
ты мне про уровни сигнала не рассказывай
12:22
пиши
12:22
систему которая твои операторам покажет то, что ты считаешь нужным
Dmitry1 #
12:22
Я на форуме писал
12:22
года два-три назад
dvolodin #
12:23
морда NOC-web не предназначена для техподдержки
12:23
от слова совсем
12:23
ТП нужно три кнопки
Dmitry1 #
12:23
а для кого ?
dvolodin #
12:23
а в идеале -- IFRAME
Dmitry1 #
12:23
Для кого предназначен NOC ?
dvolodin #
12:24
для тех, кто отвечает за эксплуатацию сети
misak #
12:25
а зачем вообще монитрить уровень сигнала, когда при его ненормальных значениях генерируетя трап?
Dmitry1 #
12:25
кто это такие ? у нас за эксплуатацию сети отвечают монтажники,
misak #
12:25
на джунах так по моему
dvolodin #
12:25
ну да
12:25
и NOC его отрабатывает
12:25
dom out of threshold есть событие
misak #
12:25
а зачем тогда скрипт?
Dmitry1 #
12:26
зачем тогда скрипт ?
misak #
12:26
или я с половины встрял?
12:26
можно графики наверное рисовать
12:26
но такое лучше по снмп в заббиксе
Dmitry1 #
12:26
или в cacti
dvolodin #
12:27
у тебя ТП сидит в shell'е и запускает разные скрипты на все случаи жизни?
12:27
дома из кирпичиков строятся
Dmitry1 #
12:27
yt gjyzk djghjcf
12:27
не понял вопроса
evyscr #
12:28
кстати, была ТП, которая именно запускала разные скрипты
dvolodin #
12:28
а ты требуешь от кирпичика балкоин и прогноз погоды
Dmitry1 #
12:28
ТП вообще не знает, что такое шелл
evyscr #
12:28
где как
12:29
dvolodin: NOC-1674
Dmitry1 #
12:29
dvolodin: ты действительно не понимаешь, о чем я говорю, или прикалываешься ?
filonov #
12:31
Dmitry1: проблема в том, что ты сам не очень понимаешь что ты говоришь
Dmitry1 #
12:32
у нас есть главный инженер, который занимается оптическими линками
evyscr #
12:32
dvolodin: альзо, если ты в списке проектов нажимаешь кнопку Preview для конкретного проекта, что тебе показывается по нажатию Close?
12:33
в хроме будет или новый проект с пустыми полями, или последний то ли добавленный, то ли редактировавшийся
danholm_ #
12:33
лол
Dmitry1 #
12:33
По мысли Димы, у него должен быть справочник по каждому типу трансиверов, чтобы посмотрев на вывод скрипта get_dom_status он смог сказать, где проблема
danholm_ #
12:34
у меня как день сурка, опять володин и Dmitry1 обсуждают
evyscr #
12:34
danholm_: это дисциплина спец. олимпиады
danholm_ #
12:34
кстати, я тоже дмитрий, можете загадать желание
Dmitry1 #
12:34
Я обсуждаю то. о чем говорил несколько лет тому назад
12:35
за это время успело появится и умереть GIS, Project Management, Workflow, Perfomance Management
danholm_ #
12:35
чуваки, у меня нубовопрос
Dmitry1 #
12:35
А проблемы как были, так и остались
danholm_ #
12:35
как из ACL удалить 1 строчку?
evyscr #
12:35
они не умерли, они просто так пахнут
Dmitry1 #
12:37
куча сил и времени, потраченных зря, а как не умел NOC делать бызовые вещи, так и не умеет
12:38
в каталоге solutionы уже 100500 afqkjd jn rjynhb,enjhjd
12:38
в каталоге solutionы уже 100500 файлов от контрибуторов
12:39
народ полным ходом пишет новые джобы и хандлеры
12:39
pm/Probes просто распухло от файлов
dvolodin #
12:41
зачем ему пухнуть?
zi_rus #
12:42
dvolodin: я могу накидать прямо сейчас с десяток локальных правил для ФМ потому что их было просто сделать
12:42
и всем будет хорошо
dvolodin #
12:42
давай :)
zi_rus #
12:43
все отсальные твои поделки невероятно сложны и непонятны
12:43
и дело даже не в докуметнации
danholm_ #
12:43
дело в ее отсутсвии :)
fumufu86 #
12:43
Есть странная проблема. Нок ломится на коммутатор каждыйе 10 секунд. В дискавери полследнее установленное задание было 3 дня назад.
12:45
2015-08-21 15:19:37,553 [noc.sa.activator.activator] [DLink.DxS.get_interfaces(10.11.4.5, 10.11.4.5)] Stopping. Completed [0/10 threads] (31632ms)
12:45
2015-08-21 15:19:38,317 [noc.sa.activator.activator] [DLink.DxS.get_interfaces(10.11.4.5, 10.11.4.5)] Running. Timeout 300 [1/10 threads]
zi_rus #
12:45
дело в неадекватности подхода
fumufu86 #
12:45
вот что в логах появляется
zi_rus #
12:45
и отсутствии дизайна
abyrvalg #
12:46
Это все слово на букву А
Dmitry1 #
12:47
fumufu86: смирись. Я решил эту проблему просто - снял галочку "Is managed" со всех коммутаторов D-Link
danholm_ #
12:49
чуваки, а про мой вопрос никто не знает или это настолько донный вопрос как вопрос про vrf над которым все посмеялись с linkmeup
fumufu86 #
12:49
такое решение край отчаяния и безысходности
Dmitry1 #
12:50
fumufu86: я несколько месяцев пытался узнать у Димы, как можно остановить эти джобы. Ответ - "никак".
dvolodin #
12:51
в логах noc-discovery посмотри
12:51
ну и в настройках
12:51
может там задача крашится
12:52
и как failed перезапускается
fumufu86 #
12:52
2015-08-21 15:32:52,132 [noc.lib.scheduler.job] [inv.discovery][interface_discovery][10.11.4.5] Running job
12:52
2015-08-21 15:32:52,133 [noc.lib.scheduler.job] [inv.discovery][interface_discovery][10.11.4.5] Running script get_interfaces
Dmitry1 #
12:52
dvolodin: когда меня будут увольнять с работы, я буду очень рад, что там "может там задача крашится и как failed перезапускается"
fumufu86 #
12:53
по этой задаче был fail 3 дня назад
12:53
с того времени ни одна другая задача тоже выполнена не была
12:53
почему эта не выполнена тоже не понятно
evyscr #
12:54
fumufu86: ты в Failed scripts посмотрел и ничего не увидел?
dvolodin #
12:55
там может не в самом скрипте, а в interface discovert
12:55
трейс смотри если есть
fumufu86 #
12:55
по этому коммутатору нет
dvolodin #
12:55
оттуда любое говно прилететь может
Dmitry1 #
12:56
evyscr: когда обрывают телефон, что у них каждые пять минут выкидывает абонентов из сети - самое время смотреть "Failed scripts"
12:57
Или когда пишешь объяснительную, зачем я поставил такую чудо-прогу, которая каждые пять минут делала загрузку CPU коммутатора 100%
fumufu86 #
12:59
вот выполнение вручную
12:59
http://pastebin.com/u5M8eedd
dvolodin #
13:00
fumufu86: лучше тушенку пришли
13:00
попробую job'у скормить
fumufu86 #
13:01
Что прислать?
dvolodin #
13:05
тушенку с этим скриптом
13:05
и посмотри min interval в настройках discovery
13:05
в профиле объекта
fumufu86 #
13:06
600
dvolodin #
13:11
get_interfaces там не бросает config_changed?
13:13
Dmitry1: вот взял бы и разобрался, почему там 100% загрузка и почему оно так часто ходит
Dmitry1 #
13:14
свичи длинка не умеют показывать спичок процессов :(
fumufu86 #
13:14
nушенка это выполненый дебаг?
13:17
http://paste.ubuntu.com/10799870/plain/
dvolodin #
13:17
Dmitry1: и потому разбираться не будем а будем отключать все подряд?
fumufu86 #
13:17
это то что нужно?
Dmitry1 #
13:18
зачем отключать ? сделать возможность запуска "только вручную"
13:18
это то, о чем я прошу с момента появления джобов и хандлеров
13:18
или сделать расписание, как в ивенттриггерах
13:19
чтобы только ночью с 3-х до 4-х мог запуститься конкретный джоб
fumufu86 #
13:23
dvolodin: это то что нужно?
Dmitry1 #
13:36
я уже не прошу привязку к таймсерияс
13:37
я уже не прошу привязку к селекторам
13:37
я уже не прошу привязку хоть к чему-либо
13:37
пусть хотя бы можно просто выключить
13:37
просто выключить
dvolodin #
13:38
fumufu86: меня не пускает туда
13:38
нужно ./noc debug-script ... -o /tmp/beef.json
Dmitry1 #
13:39
сейчас единственный способ отключить джобы - это "/usr/local/etc/rc.d/noc stop"
13:40
я уже жду больше года
13:40
потом будет другой способ: "rm -rf /usr/local/noc"
fumufu86 #
13:40
dvolodin: отправил файл
dvolodin #
13:42
fumufu86: не тот
13:42
пусти debug-script с ключем -o /tmp/beef.json
13:42
и отправь мне этот json
filonov #
13:44
dvolodin: а сильно сложно будет добавить в Sa->tasks->Run commands простенькие макросы? хотя бы IP железки подставлять?
dvolodin #
13:44
это в сниппетах есть
13:44
и в actions
filonov #
13:44
для одноразовой команды делать сниппет - лень
dvolodin #
13:47
fumufu86: ok, посмотрю попозже
13:47
у тебя interface discovery долбится?
fumufu86 #
13:47
насколько я понял да
13:47
в этот раз да
13:47
в прошлый раз это был влан дискавери
dvolodin #
13:53
при этом ошибок нет нигде?
fumufu86 #
13:54
нет
13:55
иногда помогает выпонить раз вручную или стереть и внести заново пароль
danholm_ #
14:04
господа, а чем нок может логи с кисок забирать и может ли воообще?
PavelGloba #
14:04
syslog настрой на киске
zi_rus #
14:04
может
PavelGloba #
14:05
я думаю, что для цысок у него даже есть все регулярки, чтобы эти логи разбирать
danholm_ #
14:06
ну сислог я-то настрою, а нок?
PavelGloba #
14:06
и нок настрой)
14:07
noc-activator.conf:syslog_host = noc-activator.conf:listen_syslog = 0.0.0.0:514
14:08
и в мо https://i.gyazo.com/23723b07991b2bac7b9fbb5403e17bac.png
14:09
для каждого мо надо указывать с какого ip полетит
14:09
вроде всё
danholm_ #
14:09
а где у мо указывать?
PavelGloba #
14:09
по ссылке надо перейти
14:09
там скриншот
14:10
либо можно трапы вместо сислога настроить, если весь лог не нужен, но у меня не получилось почему-то
danholm_ #
14:25
а, вкурил
14:26
так этоже snmp trap
14:27
типа надо обязательно поднять снмп чтобы оно забирало сислог?
PavelGloba #
14:28
да не надо ничего
14:29
просто trap source ip он для трапов и для сислога
danholm_ #
14:30
а почему он в секции снмп -_-
PavelGloba #
14:30
короче в активаторе прописываешь, на цыске настраиваешь, в мо указываешь ip цыски и смотришь в fm прилетело ли что-нибудь
14:30
это уже не у меня надо спрашивать
danholm_ #
14:31
окей, а где его смотреть-то потом, в фолт менеджемнт?
PavelGloba #
14:32
ещё после изменения noc-activator.conf надо перезапустить нок
Dmitry1 #
14:34
пятничная хохма
danholm_ #
14:34
достаточно перезапустить нок?
14:35
в прошлый раз мне пришлось перезагружать сервер
zi_rus #
14:35
а еще нок пингует именно этот адрес
Dmitry1 #
14:35
есть скрипт на перле, который использует DBI-MySQL
14:35
$sth = $dbh->prepare("SELECT * FROM `base` WHERE `user`=? AND `password`=?");
14:35
$sth->execute($login, $password);
zi_rus #
14:35
так что даже если не собираешь трапы и сислоги его также надо указывать
14:35
нок такой нок
danholm_ #
14:36
zi_rus,
14:36
про пинги это ахуенное уточнение, спасибо
PavelGloba #
14:36
а я не знал этого)
zi_rus #
14:36
и никто не знает
14:36
это секрет
Dmitry1 #
14:36
догадайтесь, чему будет равно $sth->rows, если в переменных будут русские буква
zi_rus #
14:36
Dmitry1: fix it
danholm_ #
15:25
господа
15:25
у меня серьезный вопрос
15:27
если зайти в sa\get now
15:27
там у конфигов подсвечивается синтаксис
15:28
если зайти через мо в конфиг, то не подсвечивается синтаксис
15:46
собственно баг или ФИЧА?
16:51
чуваки а как Timed out выставить на get config?
Ultra4 #
17:30
Всем привет!
17:31
Товарищи, в прошлый раз когда я пытался понять как мне в интерфейсе видеть топ-левелом проекты и распределение сетей внутри них мне посоветовали использовать селекторы, я почитал документацию и ничего не понял. Может кто-нибудь обьяснить подроблн
17:31
ее?
ufir #
23:18
>я почитал документацию и ничего не понял
23:19
как бы хотелось сказать человеку, что он не оди нок.
Tweet
Share this page
Share this page: Tweet