About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 21.05.2014
zi_rus #
05:42
dvolodin, у меня аларм у которого 15к ивентов, я теперь этот аларм открыть не могу ни чтобы почистить, ни чтобы root cause ему указать
dvolodin #
05:42
ух, красота
zi_rus #
05:42
да
dvolodin #
05:42
что за alarm?
zi_rus #
05:42
циска DOM аларм каждые 30 секунд шлет (или около того)
05:43
Duration уже 110 дней
05:43
там много набежало
dvolodin #
05:43
именно события?
zi_rus #
05:43
да
dvolodin #
05:43
класс какой?
05:43
им давилку повторов накрутить надо
zi_rus #
05:43
.Mar 29 21:53:58: %SFF8472-5-THRESHOLD_VIOLATION: Te1/29: Rx power low alarm; Operating value: -40.0 dBm, Threshold value: -18.4 dBm.
05:43
.Mar 29 22:03:58: %SFF8472-5-THRESHOLD_VIOLATION: Te1/29: Rx power low alarm; Operating value: -33.9 dBm, Threshold value: -18.4 dBm.
05:43
.Mar 29 22:13:59: %SFF8472-5-THRESHOLD_VIOLATION: Te1/29: Rx power low alarm; Operating value: -40.0 dBm, Threshold value: -18.4 dBm.
05:43
не 30 сек
05:43
10 минут
05:44
но сути не меняет
05:44
dvolodin, класс ивента Network | Link | DOM | Alarm: Out of Threshold
dvolodin #
05:44
он раз в 30 секунд шлет?
zi_rus #
05:44
10 минут
dvolodin #
05:46
то есть ему давилку надо где-то на 15 минут
zi_rus #
05:46
наверное
05:46
11 минут тоже хватило бы
dvolodin #
06:06
ладно, посмотрю на досуге
06:08
такое нужно давить нафиг как повторы
lexus-omsk #
06:54
та же проблема с DOM - вроде клиенты работают, поэтому никто не едет чинить, а события-то летят... хорошо хоть алармы не поднимает, а подшивает в один
_4ePTeHok #
07:01
ну, что шлет - вопрос настройки трешхолда
07:01
если вам нормально работать и с низкими значениями - выставь треш чтоб не слало до границы ниже
lexus-omsk #
07:05
ну кстати вариант
zi_rus #
07:07
_4ePTeHok, разве это настраивается? кажется эти значения прошиты в трансиверы
_4ePTeHok #
07:07
эм.
07:10
да, ты прав
07:10
The threshold table itself can not be modified
07:10
show interface transceiver threshold-table
zi_rus #
07:12
ну это просто логично, это ТТХ модуля
07:12
как бы такие значения не настраиваются
_4ePTeHok #
07:12
хотя по старой памяти, на каких то железках я крутил...там из прошивки можно было перекрыть трешхолд для отправки сообщения
07:13
т е на трасивер то это не влияло
07:13
а вот уведомлениями срать переставало
zi_rus #
07:13
ну это просто настройка уведомлений
_4ePTeHok #
07:13
что за железо я уж не вспомню
zi_rus #
07:13
no snmp-server enable traps transceiver all
_4ePTeHok #
07:13
не
07:13
там именно трешхолд задавался
07:14
блин, толи ето фаундрик был
07:14
толи еще чото
e_zombie #
07:52
.
zi_rus #
08:23
dvolodin, а можно все-таки связать базу маков с ip адресами? хотя бы самым примитивным способом, чтобы по маку можно было быстро узнать какой ip за портом висит, а то руками это геморно бывает
_4ePTeHok #
08:28
а там особо прямой связи нет
08:28
маки дерет get_mac, ip -адреса откуда попало
08:29
конечная железка вообще может не иметь arp записей
zi_rus #
08:29
в смысле
_4ePTeHok #
08:29
в прямом
08:29
л2
08:29
на акцессе
zi_rus #
08:29
есть мак
_4ePTeHok #
08:29
ну есть мак-порт-железка связка
zi_rus #
08:29
в самом простом случае считем его уникальным по всей сети
08:30
независимо от vc domain
08:30
и прочего
_4ePTeHok #
08:30
ip то тут откуда
zi_rus #
08:30
ip из arp
08:30
на тех железках
08:30
где л3 терминируется
_4ePTeHok #
08:30
еще раз - с той же железки его не всегда можно выдрать.
08:30
а с другой - это надо джоб делать
zi_rus #
08:30
я и не говрю с той
_4ePTeHok #
08:30
и знать где оно терминируется(самое главное)
zi_rus #
08:30
с любой
08:30
не надо
_4ePTeHok #
08:31
навесив терминаторы кстати можно сделать
zi_rus #
08:31
если считаем что мак уникальный
08:31
то привязать можно тупо
08:31
по арп
08:31
вот засветился он
08:31
и все
08:31
если есть secondary то будет несколько адресов
08:32
show ip arp сказал увидел привязку ip к маку на конкретной железке
08:32
и этим макам привязываешь ip в базе маков
08:33
это самая тупая логика, но она сработает в большинстве случаев
_4ePTeHok #
08:33
а если там дальше роутер
zi_rus #
08:33
и что?
_4ePTeHok #
08:33
который адрес сроутит, а мак перепишет)
zi_rus #
08:33
там будет мак роутера и ip роутера
08:33
адрес тут ни о чем
_4ePTeHok #
08:33
стоп, стоп
08:34
айпишник останется клиентский
zi_rus #
08:34
с хера ли
_4ePTeHok #
08:34
драсти. это же не нат
zi_rus #
08:34
ииии
_4ePTeHok #
08:35
ну да. чото туплю седня.
e_zombie #
08:42
2014-05-20 14:43:01,784 [inv.discovery: asset_discovery(asw-54-eng)] Unknown vendor 'FINISAR CORP.' for S/N PKS2LBC (unsupported)
08:44
в модели линейной карты надо указывать её высоту и через какой параметр?
zi_rus #
08:46
нет
08:46
высота в вершках только у шасек
dvolodin #
08:47
ты про двойные карты?
08:47
пока никак
e_zombie #
08:47
я в общем
zi_rus #
08:47
да хоть тройных
08:47
зачем высоту плат мерить?
08:47
типа два слота может занимать?
e_zombie #
08:48
я счас профили делаю для своего железа и пока не понятно какие параметры надо добивать кропе партнамбера.
dvolodin #
08:48
да
08:48
есть платы, которые занимают 2 слота
08:48
причем я знаю две комбинации
08:48
либо они занимают два соседних слота
08:49
либо по вертикали
08:49
скажем на блейдовых шасси HP BLc7000
e_zombie #
08:49
вот вот.
dvolodin #
08:49
слоты идут в два ряда по вертикали
08:49
и есть лезвия одинарной и двойной высоты
e_zombie #
08:49
кстати как будет развиваться ситуация когда профили что я сделал окажутся в общей базе и приедут с обновлениями?
dvolodin #
08:50
e_zombie: нормально должно быть, если ты их с uuid'ами положил
e_zombie #
08:50
и ещё. если я счас запущу обновления они затрутся или нет?
_4ePTeHok #
08:51
нет
08:51
пока такого же уида не прилетит
08:51
вендор финисар же кстати есть
zi_rus #
08:52
финисар есть
e_zombie #
08:52
может он нашёл их но к плате не приделаны. вот и ругается
zi_rus #
08:52
а финисар корп - нет
_4ePTeHok #
08:53
FINISAR CORPORATION
08:54
там надо сделать либо преобразование в скрипте, либо список в вендорах чтобы можно было забивать
e_zombie #
08:54
Unknown vendor 'FINISAR CORP.' for S/N FNSRMY07320270 (1000BaseT Transceiver)
08:54
2014-05-20 14:56:28,849 [inv.discovery: asset_discovery(br-sar)] Unknown vendor 'AGILENT' for S/N AGS10255BKB (1000BaseSX Transceiver)
_4ePTeHok #
08:54
агилента нету, да
e_zombie #
08:57
/log/noc-discovery.log.6:2014-05-20 14:05:04,006 [inv.discovery: asset_discovery(10.64.73.75)] Unknown vendor 'None' for S/N None (Present Transceiver)
08:57
./log/noc-discovery.log.6:2014-05-20 14:05:04,008 [inv.discovery: asset_discovery(10.64.73.75)] Unknown vendor 'None' for S/N None (Present Transceiver)
Heretiqu3_ #
09:02
привет, не могу найти как железки импортить в девелоп версии
lexus-omsk #
09:03
а если вендор прилетает как "Cisco-Finisar" его отдельным заводить?
e_zombie #
09:03
маин. сетуп. импорт-экспорт
Heretiqu3_ #
09:04
ну и запрятали
lexus-omsk #
09:04
раньше вообще только консолью можно было
_4ePTeHok #
09:05
эlexus-omsk, обрезаем циску
09:05
оставляем финисар
09:05
в скрипте
09:05
циска - только чистая Cisco\Cisco-systems
lexus-omsk #
09:13
и в каком скрипте это делать? нужно таскать с собой список, какие вендоры мы так обрезаем... кривовато как-то... хотя предложений лучше у меня нет
_4ePTeHok #
09:13
в гет инвентори оно
09:14
списка не надо
09:14
распознаем что вендор CISCO-? и ? != SYSTEMS = обрезаем 6 букв сначала
TSergey #
09:35
расскажите, плс, захожу
09:35
https://bitbucket.org/nocproject/noc/diff/sa/profiles/DLink/DxS/__init__.py?diff2=427439d0dfb8&at=default
09:36
жму 'diff'
09:37
показывает сравнение с коммитом '427439d yesterday'
09:38
но это коммит scripts/check-postgis.py
09:38
что это за кривизна?
Heretiqu3_ #
10:00
я могу экспортировать сразу несколько обьектов в SA?
10:00
какой вид csv должен быть, не понимаю. name;
10:01
name;description;etc
10:01
говорит Invalid field
TSergey #
10:01
заведи один объект, выгрузи его в csv, все будет видно
Heretiqu3_ #
10:02
точняк :)
lexus-omsk #
10:03
TSergey по-моему, недавние коммиты были в default ветку
Heretiqu3_ #
10:03
подправили бы, что через запятую поля
TSergey #
10:04
lexus-omsk: так я и смотрю дефаулт ветку
lexus-omsk #
10:04
не develop?
TSergey #
10:04
погоди
10:08
например:
10:08
https://bitbucket.org/nocproject/noc/src/343991ad105d83c35556ade310c226f6dc35d01b/sa/profiles/DLink/DxS/get_interfaces.py?at=develop
10:08
кнопка " 343991a yesterday"
10:08
diff: Diff from "af01b0a 2014-04-24"to "343991a yesterday"
10:08
Dmitry Volodin committed 343991a yesterday
10:08
./scripts/check-postgis.py: Try to fix broken NOC 0.8 PostGIS installations
10:09
lexus-omsk: т.е. в "noc / sa / profiles / DLink / DxS / get_interfaces.py", в "develop"
10:09
lexus-omsk: кнопка " 343991a yesterday"
10:09
а коммит этот и вовсе не к этому скрипту
10:09
так?
lexus-omsk #
10:11
ну да
10:12
видимо, он тебе показывает разницу между последним изменением этого скрипта и вчерашним коммитом
TSergey #
10:13
нет, говорю же
10:13
посмотри сам
10:13
кнопка с коммитом левая, не к этому скрипту
10:13
а диф показывает сравнение не с ним, а с правильным последним коммитом, совсем не вчерашним
10:15
в последнем моем примере --- "d522c07 2014-05-06"
10:16
зайди в любой скрипт, кнопка над скриптом покажет не последний комит к указанному скрипту, а левизну
10:18
и если жахнешь на кнопку, то в списке того коммита, который был на ней написан, ты не найдешь
10:21
(если только ты не выбрал ранее из этого списка, в этом скрипте и не зашел в него повторно --- то на кнопке будет последний выбранный тобою)
e_zombie #
11:05
http://bt.nocproject.org/browse/INV-25?filter=-2
MindGames #
11:22
Dmitry11, ты тут? привет!
Dmitry11 #
11:22
привет
MindGames #
11:24
Dmitry11, подскажи по DES-3200-10. мне надо скорость на порту ограничить до 100 мб/с. причем, на оптическом. смотрю команду config bandwidth_control 1 rx_rate ... а там максимальное значение только 1024000 :((
Dmitry11 #
11:24
там значение в килобитах
MindGames #
11:25
ааа... вон оно что! т.е. это максимальное значение и есть гигабит.. спасибо ;) сейчас попробую
Dmitry11 #
11:25
не забудь включить flow control
11:26
иначе будут теряться пакеты
MindGames #
11:26
без него не заработает?
Dmitry11 #
11:26
заработает, но будут теряться пакеты
MindGames #
11:27
Dmitry11, имеет смысл тогда на всех портах его включить?
Dmitry11 #
11:27
нет
MindGames #
11:28
ок. включу только на том порту, где поставил ограничение скорости ;)
Dmitry11 #
11:28
только если используешь bandwith control
MindGames #
11:28
спасибо, ты очень помог!!
Dmitry11 #
11:28
а зачем ограничивать скорость на оптическом порту?
MindGames #
11:30
там перемычка между зданиями. по оптике. на оптический порт зажаем коммутатор клиента. и ему отдаем канал второго уровня 100 мб/с
Dmitry11 #
11:30
кто мешает выставить там скорость 100_full ?
11:31
config ports 10 medium_type fiber speed 100_full
MindGames #
11:31
разве на гигабит можно скорость 100 поставить?! :)
11:31
я раньше пробовал - был болт
11:32
на этом коммутаторе, правда, не пробовал
Dmitry11 #
11:33
некоторые коммутаторы умеют оптический порт на 100 мегабит переключать
11:33
и даже поддерживают 100M SFP
Heretiqu3_ #
11:34
А после импорта свитчей, ран дискавери сделается автоматически?
e_zombie #
11:34
типа того
TSergey #
11:34
если в дефолтном проставлено и в конфиге прописано
Heretiqu3_ #
11:36
пошел, отлично, спасибо
e_zombie #
12:03
это самое. кому верить. какая ревизия то
12:03
"vendor": "CISCO",
12:03
"description": "7600-ES+20G3C 20 ports 7600 ES+ Rev. 1.1",
12:03
"part_no": [
12:03
"7600-ES+20G3C"
12:03
],
12:03
"number": "3",
12:03
"builtin": false,
12:03
"serial": "JAE1347ORU1",
12:03
"type": "MOTHERBOARD",
12:03
"revision": "V02"
zi_rus #
12:24
e_zombie, обогнал, у меня только 129
12:25
из них 44 - соточные трансиверы NoName | Transceiver | 100M | SFP LXFE
12:25
и 14 - сумитомо которые он не должен был найти если бы _4ePTeHok поправил скрипт как я говорил
12:26
как вам такой ПИД у трансивера
12:26
cDSJ^W&
12:26
или так - Unspecif
12:26
и вот так - UnspFNS0944M2RY
e_zombie #
12:33
ёбта.
12:33
у меня в среднем по 15 девайсов одного типа нераспозданных. так что ещё модельки рисовать и рисовать.
Dmitry11 #
12:35
Мучайте Диму, чтобы он сделал мои хотелки, и тогда я присоединюсь к набивке инвентори
12:35
Потому как я сейчас поотключал все, что можно у своего NOC
zi_rus #
12:44
включай все обратно, страдай вместе со всеми
Dmitry11 #
12:44
у меня сеть загибается
12:45
особенно из-за ip_discovery и mac_discovery
12:45
когда оно пытается вытащить несколько тысяч записей со свича
_4ePTeHok #
12:55
забастовка
12:55
стачка
12:55
ривалюцейя
12:55
:)
12:55
zi_rus, я тебе много разных кривых пидов могу показать. И шестнадцатеричных и даже чайнизсимплифи
e_zombie #
12:56
description": "7600-ES+3C 7600 ES+ DFC LITE Rev. 1.1",
12:56
делаю профиль для ДФС нашлёпки.
_4ePTeHok #
12:56
что выводит ы ры штм
12:56
sh inv lkz ytt
e_zombie #
12:56
какие ей директионе и гендер прописывать?
_4ePTeHok #
12:56
бля.
12:57
там были дфц
12:57
Cisco | 7600 | WS-F6700-DFC3C
12:57
посмотри пример
12:58
ревизию оно берет из вывода sh inv, поле REV
12:58
а не с дескрипшена
13:00
zi_rus, по тому багу
13:01
смотри. У меня есть железка той же серии
13:01
она вообще не выводит в sh inv трансиверы
13:01
т е изначально нок не видит есть там трансиверы или нет
13:02
там жестко прибито сдернуть после всего idprom
13:02
надо проверку какую то воткнуть туда
13:02
типа если трансиверы уже есть - то только если нераспознанный пид дергать идпром
13:03
а если нет- то сразу идпром
13:03
если пид из sh inv нормальный - ничо не дергаем
e_zombie #
13:13
кхм. добавли дфс два вида - осталось 292
_4ePTeHok #
13:14
+)
e_zombie #
13:22
только меня терзают сомнения что вся это байда переехала в лост енд фаунд
zi_rus #
13:25
_4ePTeHok, помнишь ты делал для 6500, если порт оптический И трансивер стоит И show inv не отдал инфу о трансивере, ТО лезем в idprom. это надо распространить на все железки вот и все
_4ePTeHok #
13:26
это лишняя дергатня железки
13:26
питоновскую переменную проверить на трансивер проще
13:27
там кстати не так немного
13:27
там именно что модули указаны
13:28
которые не отдают инфу
13:28
и оно сейчас так именно и работает
13:28
т е отдельно указана модель не отдающая (у меня) и одновременно отдающая у тебя)
13:29
в этом и проблема. В общем проверку напише
13:29
у*
zi_rus #
13:30
_4ePTeHok, ты я понимаю скрипт будешь переписывать
13:30
NoName | Transceiver | 100M | SFP LXFE - учти тоже
_4ePTeHok #
13:30
а что оно сейчас отдает?
zi_rus #
13:30
оно это и отдает
_4ePTeHok #
13:30
а должно?
zi_rus #
13:30
FE удалить кажется
13:30
что там в базе лежит
13:30
надо посмотреть
_4ePTeHok #
13:31
там надо много чего предусмотреть
13:31
у меня есть SFP CWDM1410 например
zi_rus #
13:32
в базе вообще нет нонеймовских соточных трансиверов, еще модель для них сделать
13:32
NoName | Transceiver | 100M | SFP LX
13:32
как везде
13:33
скорость и тип
13:34
_4ePTeHok, по твоей логике есть проблема в том что оно будет работать только для двух моделей про которые ты знаешь, а еще 100500 про которые не знаешь будут с косяками и будешь в скипте костыли ставить под каждую
13:35
я описываю универсальную логику
13:35
делаешь show int status
13:35
видишь порты где есть трансиверы
13:35
делаешь show inventory
13:35
видишь то что он ьебе вернул
13:36
если пида нет или вообще нет записи
13:36
то шаримся в idprom
13:36
это универсально и не зависит ни от чего
_4ePTeHok #
13:36
ой не зарекайся
13:37
Gi3/7 V-Nevsk-11-cc3550 connected trunk full 1000 1000BaseLH
13:37
Gi3/8 V-Nevsk-11-cc3550 connected trunk full 1000 CWDM-1470
13:37
какой там дескрипшен прописан у трансивера - хуй знает.
13:38
Gi0/22 cwdm-radion-e38 connected trunk a-full a-1000 unsupported
13:38
и такого дохера
13:38
тут ты не определишь чотам за дырка вообще
zi_rus #
13:40
_4ePTeHok, проще исключить медные дырки
13:40
10/100/1000BaseTX
13:40
и всего делов
13:40
остальное значит с трансиверами
13:42
и 10/100BaseTX
_4ePTeHok #
13:42
а трансиверы 1000T?
13:42
connected 3 full 1000 1000BaseT
13:42
это трансивер
13:42
а вот ето - нет
13:42
Gi4/1 test3528M notconnect 1 full auto 10/100/1000BaseT
zi_rus #
13:43
ну и найди 10 отличий
_4ePTeHok #
13:43
но там плата которая держит 10\100\1000
13:43
а будет только 1000?
zi_rus #
13:44
_4ePTeHok, не будет, они все универсальные, вероятность -> 0
_4ePTeHok #
13:44
хз в общем
13:44
я тоже так думал, когда начинал писать
13:44
а по ходу костылять пришлось только в путь
zi_rus #
13:45
_4ePTeHok, и кстати и что что она будет только 1000
13:45
это лишь значит что нок стукнется в idprom несуществующих трансиверов
13:45
неприятно
13:45
но не смертельно
_4ePTeHok #
13:54
dvolodin, Дим, ты тут? Чота я с постгисом немойму
13:54
diff -r 427439d0dfb8 scripts/check-postgis.py
13:54
- POSTGIS_VERSIONS = ["2.1", "2.0", "1.5"]
13:54
+ POSTGIS_VERSIONS = ["2.1"]
13:54
а он мне все равно талдычит
13:54
PostGIS is not installed. Trying to install ...
13:54
Failed to install PostGIS: Not found: /usr/pgsql-9.3/share/contrib/postgis-1.5
13:54
откуда там 1.5 то?
13:55
больше цифир там не нашел
dvolodin #
13:57
посмотри, что pg_config --sharedir выдает
_4ePTeHok #
13:58
/usr/pgsql-9.3/share
dvolodin #
13:58
а постгис где?
_4ePTeHok #
13:58
ls /usr/pgsql-9.3/share/contrib/
13:58
postgis-2.1
14:02
так то вроде все верно
Dmitry11 #
14:09
Блядь
14:09
Нахуй выключил этот NOC
14:09
даже снятие галочки "is managed" нифига не дает
14:09
Оно тупо ловится на свич и срет и срет в логи
14:10
У нас порезали 48 воловкон
14:10
Пытаемся что-то сделать
14:10
А оно постоянно в консоль кидает
_4ePTeHok #
14:38
ну нок не виновен в срезе волокн)
Dmitry11 #
14:39
Человек пытается что-то сделать на консоли свича, а ему туда постоянно сыпятся бесконечные login/logout
14:39
и мешают настраивать свич
_4ePTeHok #
14:40
блин, ну это нок виноват, что длинк в подключенную консоль вываливает лог?
14:41
циска же не выводит в телнет-сессию ничего
Dmitry11 #
14:42
нок виноват в том, что я никак не могу отключить постоянное долбление его
dvolodin #
17:30
Dmitry11: и ведь рецепт тебе выдали, как отключить
zi_home #
18:04
dvolodin, знаешь на наге есть такой клоун сааб, который везде толкает микротики и на любые проблемы говорит что косяк конфигурации, а микротик идеален, сферичен и в вакууме. с такими заявлениями ты на него походишь. с check_link job есть очевидные пр
18:04
облемы в конфигурировании и работе этой штуки, но...
dvolodin #
18:06
zi_home: есть рецепт как отключить job не дожидаясь, пока у меня руки дойдут
18:07
это лучше, чем сидеть и ждать этого светлого момента
18:08
только светлый момент Диме не сильно поможет, так как он не хочет красить железо и порты
zi_home #
18:09
там есть проблемы с дискавери
dvolodin #
18:10
?
18:11
_4ePTeHok: а попробуй clean install с последними коммитами
zi_home #
18:11
линки между цисками и длинками нельзя найти ни одним существующим методом
dvolodin #
18:12
это почему это?
18:12
stp там нет?
zi_home #
18:12
видимо нет, ему виднее
18:12
может там L3
18:14
dvolodin, так что с синхронизацией префикс-листов делать
dvolodin #
18:15
zi_home: блин, да их и руками можно забить, если надо
18:16
насчет синхронизации пока не думал
zi_home #
18:16
один раз да
18:16
так и сделано последние 15 лет
18:16
но хотелось по кошерному, как у больших дядей
dvolodin #
18:17
zi_home: я про линки
18:17
с префикс-листами думать надо
zi_home #
18:18
говорят их много, руками затрахаешься и они часто переезжают
dvolodin #
18:19
zi_home: опять же, разумного решения для конфигурированися job'а кроме того, что я предлагал, пока нет
zi_home #
18:20
но даже своего предложения ты не реализовал
18:20
я бы тоже поправил
dvolodin #
18:20
делать конструктор из кубиков, триггеров и мышевозства я не хочу
18:20
ну поправь
18:20
обсуждение пока открыто
18:21
последняя идея была -- выделить 3 интервала и периодичность job'а в каждом
zi_home #
18:21
105d 10h - вот продолжительность лежания одного из линков. как думаешь, мне не нужно проверять его каждые пять минут четвертый месяц подряд
dvolodin #
18:21
zi_home: вспомни мою идею
18:21
в дальнем интервале вообще хоть раз в день проверяй
zi_home #
18:23
dvolodin, я не помню твою идею потому что не понял ее. но мое предложение такое. 1. минимальный интервал перед первой проверкой 2. максимальный интервал 3. некий коэффициент или функция как быстро приближаться к максимуму
dvolodin #
18:24
мое предложение такое было
18:24
2 точки времени, которые разбивают на 3 интервала
18:25
ближний, средний, дальний
18:25
ближний -- сразу после аварии
18:25
средний -- когда мы поняли, что быстро оно не восстановится
18:25
дальний -- когда мы поняли, что все плохо и всем уже пофиг
18:25
и, соответсвенно, 3 интервала повторения -- на ближнюю, средюю и дальнюю зону
18:26
условно говоря t0 -- 10 минут
18:26
t1 - 24 часа
18:27
интервалы -- минута, пять минут, один час
zi_home #
18:28
в общем мысль в том же направлении, с течением времени увеличивать период
18:28
можно и так сделать
dvolodin #
18:29
так хоть объяснить можно, в каком случае какой интервал опроса
zi_home #
18:29
эти детали не сильно важны, check_link это фича последней надежды, если трап потерлся
18:30
так что если твой метод тебе кажется логичней, просто сделай
18:30
никто против не будет
18:31
в 99% случаев, сообщения все доходят
18:31
есть только маленький шанс что что-то потеряется
18:32
у мен вот наоборот
18:32
чаще теряется link down
18:32
и потом я получаю link up с конца откуда даун не пришел
dvolodin #
18:47
с одного из концов все равно получишь down
zi_home #
18:50
да
18:50
в принципе достаточно
18:50
просто факт
dvolodin #
18:53
по поводу твоего dom'а
18:54
там простая давилка повторов не подойдет
zi_home #
18:55
мне бы еще этот дом под link down прятать
18:55
а еще круче, link down под admin down c другого конца линка
dvolodin #
18:59
эээ
18:59
погоди
18:59
это link down нужно под dom прятать
zi_home #
19:00
не уверен
dvolodin #
19:01
точно говорю
zi_home #
19:01
-40dbm это отсутствие сигнала в принципе, обрыв
dvolodin #
19:01
именно
zi_home #
19:01
сообщения о ДОМ вообще не должно быть
19:01
link down должен быть
dvolodin #
19:01
если у тебя аларм - слабый сигнал и сразу же упал линк, то второе - следствие первого
19:02
и его нужно подшить к упавшему линку
zi_home #
19:02
ну link down подразумевает аварию обрыва
dvolodin #
19:02
не обязательно
19:03
общая идея у меня вот такая
19:03
в disposition rule для event'а добавить признак уникальности
zi_home #
19:03
ну только в теоретических ситуациях когда сигнал на уровне границы чувствительности трансивера
dvolodin #
19:06
и если у alarm'а уже есть event такого класса, для того же объекта и с такими же переменными, то не подшивать event к alarm, а регистрировать его как повтор имеющегося
zi_home #
19:07
если параметры меняются то неплохо бы их обновлять
19:07
тот же дом
19:08
если мощность или температура трансивера меняется
19:08
то актуальное значение правильно держать в аларме
dvolodin #
19:09
в целом тогда нужно сделать дискриминатор для eventclass
19:10
а в disposition rule добавить поле - действие при совпадении: подшивать, регистрировать повтор, регистрировать, обновлять
19:10
тфу
19:10
регистрировать повтор, давить и обновлять
19:11
причем обновление нужно достаточно хитрое -- не трогать первый event
19:11
а перебивать параметры второму
19:11
чтобы видно было, с чего начинали
19:12
последнее - спорно
19:13
я думаю более правильно -- сделать плагинчик для event'а и alarm'а
19:13
который будет показывать текущее значение
19:13
дергая скрипт
19:14
так, наверное, правильнее всего
zi_home #
19:15
опять дерганье скриптов
19:15
кто-то будет против
dvolodin #
19:17
это руками
19:17
а если еще более глобально и правильно, то делается так
19:17
добавляются настройки диагностических скриптов
19:18
если они указаны, то в просмотре alarm'а или event'а появляется таб Diagnostics
19:18
с соотвествующими кнопочками
19:18
нажимаешь - запускается скрипт
zi_home #
19:18
кажется уже была такая идея
dvolodin #
19:18
а результат выводит в скриптовый плагин из managedobject
19:19
да она давно витает
zi_home #
19:19
но никому это не надо
19:19
лучше более актуальным заниматься
dvolodin #
19:19
ну почему
19:19
как раз для техподдержки
19:19
увидел аларм -- провел диагностику
zi_home #
19:19
тут постоянно реквесты летают
19:20
этого никто не вспоминал уже года два
dvolodin #
19:21
ну почему же
zi_home #
19:21
можешь заложить возможность развития в ту сторону
19:21
но браться реализовывать не вижу большого смысла
dvolodin #
19:21
там, по ровному счету, даже не возможность, а просто настройки сделать
zi_home #
19:23
вот графикиии.... :(
dvolodin #
19:23
%%
19:23
$$
19:23
:)
19:25
кстати, если на то пошло
19:25
таб консоль в просмотре event'а или alarm'а
19:25
:)
zi_home #
19:26
мне больше понравилось как в одной системе тоже типа события разворачиваются прям в грде
19:26
*гриде
19:27
и можно посмотреть детали не теряя из вида другие алармы
dvolodin #
19:27
скриншоты кинь
19:27
или там в гриде дерево?
zi_home #
19:28
dvolodin, https://lh6.googleusercontent.com/-tEykRE47HZ4/UPbLFkUNtFI/AAAAAAAAEWk/AXn0y74V90c/s1077/Suricata_detect.png
dvolodin #
19:29
а
19:29
стоит ли так?
19:29
мне кажется, неудобно
zi_home #
19:30
vt;le bdtynfvb gtht[jlbnm elj,yj
19:30
между ивентами переходить удобно
19:30
а сейчас открываешь, закрываешь
19:30
лишние клики
dvolodin #
19:31
там тоже
zi_home #
19:31
почему
dvolodin #
19:31
потому что в event'е информации много
zi_home #
19:31
кликаешь на другом ивенте и видишь его детали, а у тебя надо по close выйти обратно в грид
19:32
найти другой ивент
dvolodin #
19:32
если на то пошло, то можно tooltip сделать с краткой выжимкой
19:32
или просто subject/body
19:32
мышку навел, подержал, оно и выскочило
zi_home #
19:32
держание мышки не уверен
19:32
бесит больше всего
19:33
dvolodin, хотя в cacti есть weathermap, подводишь мышь к линку и появляется график загрузки линка, но фишка в том что появляется сразу, мгновенно. держание мышки выбешивает
dvolodin #
19:34
в extjs можно задержк ууказать
19:34
или просто по клику на иконке сделать
zi_home #
19:34
клик лучше
19:34
не по иконке а по строке как вариант
19:35
на самом деле если бы эта штука как на скрине разворачивалась и там были основные кнопки
19:36
реклассификация, json и остальное
19:36
и для аларма
19:36
было бы удобно
dvolodin #
19:36
это уже куда-то совсем далеко
zi_home #
19:36
и PUSH в интерфейсе
19:37
почему далеко
dvolodin #
19:38
с графиками основная проблема -- конфигурировать весь ворох
19:38
единственный осмысленный выход для меня - привязать их к ресурсам OFM и создавать и убирать по изменению статуса ресурса
19:39
тогда и обоснование есть
zi_home #
19:39
dvolodin, я всеми силами пытаюсь подвести тебя к идее чтобы минимизировать количество кликов и переходов между окнами, это упрощает и ускоряет работу
dvolodin #
19:39
если ресурс требует мониторинга -- он сразу поднимается
zi_home #
19:39
усложняешь
19:40
профили интерфейсов достаточно
dvolodin #
19:40
неа
19:43
ты не учтешь, какие заняты, а какие нет
zi_home #
19:43
в смысле
19:43
я учитываю
19:43
а ты нет?
19:43
у меня по дескрипшену все рулится
dvolodin #
19:44
ну а кто-то просто сразу красит транки и клиентские
zi_home #
19:44
ну да, так и красится, тем и рулится
19:46
я вот думал только что будет с графиком, если одно состояние говорит что график надо делать, а потом переходим к тому что график не нужен
dvolodin #
19:52
если ресурс разобрали, то вряд ли нужна его история
zi_home #
19:55
наверное, но для истории хотя бы на ближайшее прошлое
_4ePTeHok #
19:59
вот у вас тут дискусии на ночь глядя
dvolodin #
20:00
угу
_4ePTeHok #
20:00
dvolodin, чистую - сразу в девелоп? или дефолт
dvolodin #
20:00
кажется, я починил коллекции
20:00
с default на develop проапгрейдилось
20:00
чистые колелкции тоже создаются вроде
_4ePTeHok #
20:01
ето замечательно, завтра проверю)
20:01
а то я уже отчаялся побороть check-postgis
20:01
и откуда он засранец берет полторашный постгис, когда я ему 2.1 прибил руками
20:02
кстате у меня тут идейка возникла по поводу офм и прочего
dvolodin #
20:02
для начала посмотри, он у тебя self.pg_config правильно выставляет?
_4ePTeHok #
20:02
ну на путь то он не ругается
20:03
до шары и до конфига
20:03
по идее - будет время - попробую набросать рест-приложение на телефон\планшет
20:04
собсно для пользования механизмами нока - скажем протянул монтажник провод к клиенту, ткнул смену статуса ресурса
20:04
а там нок запустил промер кабеля например
20:05
ну придумать много чего можно
dvolodin #
20:05
for pv in self.POSTGIS_VERSIONS:
20:05
for p in paths:
20:05
f = os.path.basename(p)
20:05
if f.endswith(pv):
20:05
return pv, p
20:05
вот это посмотри
_4ePTeHok #
20:05
но смысл - рулить офм из костмаса)
dvolodin #
20:05
что оно в f отдает
20:05
может там слеш шальной какой
20:06
print f там добавь
_4ePTeHok #
20:06
ты не поверишь кстати - в девелопе оно работает)
20:06
при всем том же (посгрес\постгис0
dvolodin #
20:07
и как оно отличается?
_4ePTeHok #
20:07
у меня виртуалка на работе - только завтра
dvolodin #
20:07
ты на default только накати апдейты
_4ePTeHok #
20:07
сделаю дифф, видно будет)
20:07
да оно ж при апгрейде тянет само
20:08
там не вытянув не выйдет
dvolodin #
20:08
не
20:08
там на default сначала надо сделать hg pull -u
20:08
а потом пускать апгрейд
20:09
сам скрипт апгрейда нужно проапгрейдить :)
_4ePTeHok #
20:09
епта.
dvolodin #
20:09
иначе pip запорет сам себя
_4ePTeHok #
20:09
ну и засады у вас там)
dvolodin #
20:09
я чего-то не подумал, что при переключении бранчей и при обновлении нужно проверять, не обновился ли скрипт upgrade
20:10
и если обновился -- запускать заново обновленную версию
_4ePTeHok #
20:10
да, это выход
20:10
Дима сегодня совсем обиделся на нок)
20:11
сказал, что даже анменеджед объекты долбит
dvolodin #
20:11
Это плохо
20:11
проверять надо
20:11
и фиксить
_4ePTeHok #
20:11
может там джобы самодеятельничают
dvolodin #
20:11
можно, конечно, сразу в SAE отшибать
20:12
да пофиг на job'ы
20:12
там где-то проверка могла не пройти
_4ePTeHok #
20:12
дык в сае глобалку впилить
20:12
проще чем в каждую свистелку
dvolodin #
20:12
но SAE принудительно должен отшибать такие потуги
20:12
угу
20:12
причем с отдельным кодом -- типа object is not managed
20:12
и сразу
_4ePTeHok #
20:13
сирену с мигалкой)
20:13
табличка на пол экрана - "ВЕРНИ ГАЛКУ НА МЕСТО")
dvolodin #
20:14
и анимашку с дятлом в работе :)
20:15
for mt in MapTask.objects.filter(
20:15
status="W",
20:15
next_try__lte=t,
20:15
managed_object__activator__shard__is_active=True,
20:15
managed_object__activator__shard__name__in=self.shards
20:15
).select_related().select_for_update():
20:15
ага
20:15
шард проверяем, объект - нет
20:15
:)
_4ePTeHok #
20:15
вот вот)
20:16
там пинги кстати тоже надо наверно
20:16
хотя, спорный вопрос
dvolodin #
20:24
закоммитил патчик на SAE
20:25
радикальный, как гильотина
_4ePTeHok #
20:31
завтра Дима будет чуточку добрее)
Tweet
Share this page
Share this page: Tweet