nocproject.org
03:47
dvolodin: обновился, проверил, вроде работает get_ivnetory на zyxel, только один момент вылез: таблички там иногда кривоватые получаются и парсятся соответственно
03:47
Index      Vendor                                PN                                SN
03:47
-----  ----------  --------------------------------  --------------------------------
03:47
1  AODevices                         AODM-PG131-LN                     G0511295
03:48
т.е. часть PN улетает в серийник
03:49
'part_no': ['AODM-PG131'],   'serial': 'N                     G0511295'
 
04:57
да, железки с оптикой оно потрошит
05:04
а насчет таблички думать нужно
 
05:09
можно регекспом опять сделать, как было, тогда легко разделяет по пробелам
 
05:37
dvolodin, а что ты на linkmeup на сайте ссылок не повесишь, ты там нормально так рассказал как работает нок, для intro сойдет, чтобы народ понимал вообще во что он впрыгивает
 
05:39
повешу
05:39
раздел сделать про NOC в интернете?
 
05:41
если так то и топик на наге туда же запихнуть
05:41
а вообще я хз
05:41
это не технический вопрос
05:41
скорее маркетологический
 
05:42
мракобесный, говоришь
05:42
:)
 
05:52
Приветствую!
05:52
Кто то реализовывал сбор конфига через хттп?
 
05:52
да
05:53
смотри ALcatel.7324
05:53
но это не я
 
05:54
да, видел. но тут немного другая ситуация. тут пост и кидать железке нужно xml
 
06:01
lexus-omsk: а GS2200 у тебя есть?
06:01
B_M: для Mediant2000 так
06:01
ssh у них виснет
 
06:03
dvolodin: там тоже гет, насколько я вижу.
06:04
тут вопрос в другом, у метода пост, params какого типа должно быть?
06:04
self.http.post(params=)
 
06:11
dvolodin: у меня только ES-2108-G, ES-2024A и GS-4012F в наличии
 
06:37
продолжу вчерашний вопрос по поводу pubkey authentication, ключ из id_rsa.pub скопировал на циску .. теперь в логах вываливает ошибка
06:37
%SSH-3-BUFF_GET_FAIL: Tried to get more bytes than in SSH Buffer. кто нибудь сталкивался с такой ?
06:39
вроде в инете пишут что нужно перепроверить ключ, пробелы и др. спец символы
06:39
скопировал всю строку вида ssh-rsa {key} noc@noc1 в блокнот и оттуда всю строку на циску
06:40
все равно ничего не работает
 
07:31
dvolodin:
07:31
2013-12-26 11:26:57,599 REPORT: elapsed: 23.7969s, speed: 42.0ev/s, events: 1000, failed: 0, deleted: 3, suppressed: 0, unknown: 278, classified: 526, disposed: 47, duplicated: 146
07:31
2013-12-26 11:27:34,878 REPORT: elapsed: 37.2789s, speed: 26.8ev/s, events: 1000, failed: 0, deleted: 2, suppressed: 0, unknown: 424, classified: 285, disposed: 82, duplicated: 207
07:31
2013-12-26 11:28:14,415 Failed to process event 52bbc604989fcf0923827f04
07:31
2013-12-26 11:28:23,801 Failed to process event 52bbc604989fcf0923827f0b
07:31
2013-12-26 11:31:00,696 Failed to process event 52bbc608989fcf0923827ff1
07:31
2013-12-26 11:31:00,711 Failed to process event 52bbc608989fcf0923827ff2
07:31
2013-12-26 11:31:05,703 REPORT: elapsed: 210.8246s, speed: 4.7ev/s,
07:31
походу производительности не хватает на серьёзное количество эвентов со стороны сети.
07:32
или какая  то бага
 
07:32
e_zombie,  unknown: 424 - это проблема
07:32
чем меньше таких тем быстрее
 
07:33
удолбаемся писать правила.
 
07:33
оборудование у всех разное
 
07:34
илть в нок сообщения о которых он ничего не знает это бесполезное занятие, он их не сохранит и не обработает
 
07:34
и не обязательно до нуля снижать, хотя бы понизить это число
 
07:35
а анализ как ты собрался делать инцедента?
 
07:35
при архивации нок все подропает
 
07:35
ты делаешь выборку по времени и смотришь что там происходило
07:35
если это не пихать в бд то фиг ты разберёшься в проблеме
07:36
надо будет лезть на сислог сервер и смотреть сырой лог
 
07:36
я тебе говорю
07:36
пиши правила
 
07:36
тогда возникает вопрос - нахрена нужен нок если для расследования надо парсить голый текст на сислог сервере
07:36
тут вопрос концепции
 
07:37
без правил он весь unknown будет дропать
 
07:37
если у тебя система встаёт раком на незнакомом железе - надо менять систему а не делать костыли
07:37
я уже проходил такое дело. закончилось тем что фирма разарилась нахрен изза подхода - делаем костыли.
 
07:37
Dmitry11, слышишь че говорят
 
07:39
да
07:40
Поэтому кидайте сислоги с разных железок. А то у нас 80% занимают cisco+dlink
 
07:40
тебе сколько гигабайт?
 
07:41
желательно в формате JSON
 
07:41
e_zombie: Сильно экзотическое железо?
 
07:42
нет. стандартные хуавеи кютечи эйджкоры на доступе
07:42
ну счас ещё джунипера
07:42
мх80 пошли
 
07:45
а хз
07:45
# grep "Dec 26 11:45"  snet.log | wc -l
07:45
736
 
07:46
e_zombie, ./noc events -c "Unknown | Syslog"
 
07:46
Надо додавить dvolodin'а, чтобы ветки слил, потому как я в develop уже понакидал кучу правил
 
07:48
Dmitry11, не поможет, ты же только длинки и циски туда писал, а пользователи других вендоров слишком гордые чтобы присылать неизвестные сообщения или сами написать правила
 
07:49
e_zombie: для начала посмотри, что именно у тебя в unclassified валится
07:49
там отчеты есть
07:49
unknown trap oids
 
07:49
dvolodin: слей ветки, плиз
 
07:52
слил
07:53
e_zombie: я думаю, у тебя link up/link down там валятся
 
07:53
с этого и начни
07:54
производительность на нормальном железе должна быть на порядок выше
 
07:54
16 ядерный сервак и8 гигаме оперативы?
07:54
плохой?
 
07:55
смотри монгу
07:55
mongostat
07:55
и загрузку проца классификатором
 
07:55
да, тухленько
07:55
2013-12-26 11:55:52,707 REPORT: elapsed: 10.9959s, speed: 90.9ev/s, events: 1000, failed: 0, deleted: 0, suppressed: 0, unknown: 1000, classified: 0, disposed: 0, duplicated: 0
 
07:56
insert  query update delete getmore command flushes mapped  vsize    res faults  locked db idx miss %     qr|qw   ar|aw  netIn netOut  conn       time
07:56
    55    496     42     29       1    98|0       0  5.53g  11.8g  1.25g     10   noc:6.7%          0       0|0     2|0   130k   253k    28   11:56:10
07:56
    48    383     *0     *0       1    49|0       0  5.53g  11.8g  1.31g      2   noc:3.4%          0       0|0     1|0    86k   329k    28   11:56:11
07:56
    46    442      1      1       0    48|0       0  5.53g  11.8g  1.28g      1   noc:4.8%          0       0|0     1|0    90k   163k    28   11:56:12
07:56
    38    411      2      2       0    42|0       0  5.53g  11.8g  1.29g      1   noc:2.7%          0       2|0     0|1    80k   147k    28   11:56:13
07:56
    30     14     *0     *0       0    31|0       0  5.53g  11.8g  1.25g      0  noc:21.2%          0       2|0     1|0    14k     6k    28   11:56:14
07:56
    28     26      1      1       0    30|0       0  5.53g  11.8g  1.28g      2  noc:22.5%          0       2|0     0|1    14k     9k    28   11:56:15
07:56
    24     37      7      3       0    33|0       0  5.53g  11.8g  1.24g      0  noc:40.6%          0       2|0     1|0    15k    13k    28   11:56:16
 
08:05
Всем здрасьте. А подскажите пожалуйста такую вещь. Завел в ipam новый адрес, прописал fqdn, поставил галку "автообновление mac". Однако мак не обновляется, поле остается пустым, хотя роутер регулярно опрашивается, ошибок нет. нужная запись в arp-таблице ро
 
08:07
Night_Snake, main > setup > schedules > ip.sync_macs
 
08:12
такс. инвентори слили с деволопом?
 
08:12
zi_rus, включена, успешна
 
08:12
теперь в апдейте конф надо ставить девелом?
 
08:13
e_zombie, наоборот сливалось
 
08:13
Night_Snake, тогда хз, я не пользуюсь ей, попробуй логи посмотреть
 
08:21
zi_rus в том и дело, что в логах чисто :(
 
08:31
день добрый
08:33
никак не могу настроить, чтобы игнорировать падение некоторых видов интерфейсов
08:33
кто делал ?
 
08:33
только вчера обсуждали
08:33
посмотри в логе
 
08:35
а есть какие-нибудь параметры у ./noc generate-ssh-keys чтобы сгенерить ключ 2048 бит ?
 
08:36
cvjnhb juи от вчерашнего дня. этk
 
08:38
у нас снова наплыв с хабра?)
 
08:38
а там что случилось?
 
08:38
вторую часть подкаста выложили вчера
 
08:39
вчера должны были наплыть
 
08:39
это как в стиме сегодня начали раздавать l4d2 бесплатно - всё и полегло
08:39
админы читают новости по утрам
 
08:39
ну кто играет..
08:39
по вечерам бузают)
08:40
есть у кого то в экасплуатации esxi с distributed vswitch?
 
08:48
zi_rus: там вроде другое обсуждали
 
08:49
мне надо игнорить евенты в FM для МПЛС интерфейсов
 
08:49
как странно
08:49
а я наоборот делаю
08:49
но это ничего не меняет
 
08:50
а мплс интерфейсу можно профиль присобачить?
 
08:50
он есть отдельно в inventory - interfaces - physical
08:50
?
 
08:50
они динамические в случае джунов и создаются/дохнут пачками
 
08:51
ну значит механизм профиля не сработает
 
08:51
если только(тадаааам!) - взять и дефолт поставить в игнор. Но сработает ли это для логических - вопрос
 
08:51
надо игнор евент рул писать
08:52
а я его не умею, нигде не написано как
 
08:53
лабуда какая-то, получилось настроить автоматический заход по rsa ключу из putty , делаю все тоже самое только для нока и ошибки вываливаются
 
08:53
пробовал так - Left RE : ^IF-MIB::ifName.+$ Right RE: Link down: lsi.+ не работает
 
08:54
только в путти ключ 2048 бит, а в ноке 1024
 
08:54
dvolodin: помогите дяденька ^ :)
08:56
e_zombie: l4d2 тоже с утра качаю :)
 
09:21
причем ведь странное дело. Если удалить запись и снова обновить - то адрес в ipam появляется с правильным маком.
09:21
т.е. это похоже на фичу, а не баг
 
09:28
Night_Snake: если интересно покопаться: /opt/noc/ip/periodics/sync_macs.py
 
09:32
dvolodin: Некоторые файлы не смержились. В частности noc/fm/collections/eventclassificationrules/Cisco/IOSXR/Security/Audit.json
09:33
09:33
и
09:33
 
09:46
есть большой опыт работы с DSLAM Zhone/Paradyne через telnet/ssh и очень небольшой через snmp (хотя необходимые OIDs знаю). Наставьте на путь истинный, как писать шаблоны?
 
09:48
открываешь любой существующий и правишь под свои нужды или пишешь с нуля опираясь на существующий
 
09:50
оки, я думал м.б. дока есть
 
09:51
MinskSNV, раз ты с дсламами общался, может сможешь на пальцах объяснить сообщения которые они в сислог кидают, их есть 3 типа, loss of ... signal/power/frame. про power я знаю, это dying-gasp, а вот чем отличается frame от signal не понимаю
 
09:52
а о каких DSLAMах ы говоришь?
09:53
а о каких DSLAMах ты говоришь?
 
09:53
у меня Алкатель 7324
09:53
но это не важно
09:53
это стандартные сообщения описанные в rfc
 
09:54
хм, сча свои посмотрю
 
09:55
MinskSNV, вот тут вся история проблемы 
NOC-1193
 
09:59
zi_rus: пощелкал счетчики на портах клиентов. У меня LOS = LOF
 
10:00
а у меня не всегда так
10:01
MinskSNV, а ты вообще в курсе что это значит? я просто думаю, у циски есть такая авария, как line protocol down, можно ли приравнять его к lof
10:02
а link down к los
 
10:05
по логике LOF должен прилетать раньше
10:06
и в принципе наверное его можно сравнить с link protocol down
10:07
а LOS уже как следствиеговорит о том что пропада связь совсем
 
10:07
ну да, у меня они так и прилетают
 
10:07
хотя если честно никогда даже не задумывался чем они отличаются... потеря связи и всё тут
 
10:15
просто если дслам готов предоставить градацию уровней проблемы то пусть будет
 
10:19
делай хорошо, плохо оно само получится (с) не помню
 
10:20
на сколько я помню Е1 los lof не совсем еквивалентны
10:20
лоф кажется потеря синхронизации
10:20
и при потере сигнала она тоже происходит
 
10:24
но мы про адсл говорим
10:24
хм
 
10:25
кстати а есть у кого-нибудь такая проблема, что если в MO profile сделать профиль с ipam sync, а потом завести какую-то железку с таким профилем, то вывалится трейсбэк?
 
10:32
трейс на пастебин выложи
 
10:38
h4wk:h4wk: я Е1 потоками не занимаюсь, но в Е1 и фреймов помоему нет. Таймслоты и сигнализация
10:42
хотя википедия меня обломала
 
10:42
я уже тоже им не занимаюсь. Но тем не менее, есть там фреймы, есть 2 варианта потока фреймед и анфреймед
 
10:47
кста, хорошая идея. Надо попробовать детектить фрод ноком.
 
10:53
Night_Snake, если я правильно понял, ты вбил dns имя вмсето ip. не надо так
 
10:56
zi_rus... странно... и правда, прошло. Хоть бы написали где про это :)
 
10:57
ну там русским по белому написано адрес, а днс это имя
 
10:57
не согласен :) адрес может быть как симольный (dns) так и ip
 
10:58
это философский вопрос
 
10:59
надо там проверку на формат заебенить.
10:59
тем более я ее делал уже там где то
 
11:03
давно пора, не первый раз уже такое происходит
 
11:05
я давно уже делал, когда только массово на экст переписывали приложения. Только вот ушел тот коммит в текущую ветку - надо проверитью.
 
11:16
у кого нибудь работает аутентификация по ключу с asr1k ? у меня закончились идеи почему не работает
11:19
если копирую содержимое id_rsa.pub (все три поля, или только ключ) на циску , то циска ругается Pubkey Authentication failed for user
 
11:19
misak: left re  сделай .+
11:24
коллеги, у меня возникла уникальная по тупости и дурацкистости идея
 
11:24
сделать табличку ObjectLevel
 
11:25
не убедил
11:25
не делай
 
11:25
эээээ не оценил левел упоротости
 
11:25
с записями вроде - уровень доступа, уровень аггрегации, ядро
11:25
и навесить соотвествующее поле на managed object
 
11:25
для разграничения доступа по железкам.
 
11:25
хотя, может и в профиль пихнуть
11:25
не
11:25
не только
 
11:25
давно такого надо дслетаь
 
11:26
там можно приоретет железок держать
11:26
и alarm severity при падении
 
11:26
приоритет надо по топологии высчитывать
 
11:26
ну в целом да. тогда пойдёт.
 
11:27
а руками установленные уровни имеют свойство терять актуальность
 
11:28
это слишком абсрактно и сложно
 
11:28
или включить приоритет и  alarm severity прямо в ObjectProfile
 
11:28
а еще на иные свичи, которым надо давать уровень access, у меня приходит больше чем не аггрегаторы
11:28
severity уже в профиле
11:28
ты научись по топологии приоритет считать
11:29
остальное это дело десятое
 
11:39
а, down severity в профиле есть, в fm только игнорируется
11:40
правила FM тоже нужно на новую схему синхронизации переводить :-/
 
11:40
правила надо в отдельное репо
11:40
чтобы не приходилось обновлять все чтобы достать правила
 
11:51
хыхы, я сделал get_inventory для edgecore)))
11:51
по сути - get_ver)))
 
11:54
_4ePTeHok: давай с модельками
 
11:54
погоди, трансиверы надо
11:54
там сам понимаешь - китайское веселье на всю катушку)
 
11:58
я вот тоже никак не доберусь сделать для алкателевких дсламов
11:58
там тоже просто
11:59
только regexp налабать
 
12:03
e_zombie: noc-classifier насколько проц у тебя грузит?
 
12:06
  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
12:06
 2350 noc       20   0  351m  78m 4940 S 22.6  1.4 326:29.52 /opt/noc/bin/python ./scripts/noc-classifier.py launch -c etc/noc-classifier.conf -i 0
12:06
  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
12:06
 2351 noc       20   0  411m 140m 5000 R 77.5  2.5 959:23.19 /opt/noc/bin/python ./scripts/noc-correlator.py launch -c etc/noc-correlator.conf -i 0
 
12:08
dvolodin, а как отдифференцировать такое - "Port Type:              1000Base SFP"  ?
12:08
т е стандарт неясен LX или чото другое
12:09
unknown | 1G | SFP?
 
12:09
если только сделать модель-затычку
 
12:13
e_zombie: а в логах коррелятора что?
12:13
просто поток alarm'ов?
 
12:13
2013-12-26 16:14:12,765 [fm.correlator] Scheduling job check_link(52bc1d85989fcf092f68c9e2) id=52bc1d94989fcf092f68c9e3 at 2013-12-26 16:15:12.407474
12:13
2013-12-26 16:14:12,787 [fm.correlator] Job dispose(52bae51b989fcf092369bac6) is completed successfully (15.319778sec)
12:13
2013-12-26 16:14:12,788 [fm.correlator] Removing job dispose(52bae51b989fcf092369bac6)
12:13
2013-12-26 16:14:13,240 [fm.correlator] Running job dispose(52bae51b989fcf092369bac7)
12:13
2013-12-26 16:14:13,283 [fm.correlator] Job dispose(52bae51b989fcf092369bac7) is completed successfully (0.042166sec)
12:13
2013-12-26 16:14:13,283 [fm.correlator] Removing job dispose(52bae51b989fcf092369bac7)
12:13
2013-12-26 16:14:13,434 [fm.correlator] Running job dispose(52bae51c989fcf092369bad4)
12:13
2013-12-26 16:14:29,532 [fm.correlator] Scheduling job check_link(52bc1d95989fcf092f68c9e4) id=52bc1da5989fcf092f68c9e5 at 2013-12-26 16:15:29.285767
12:13
2013-12-26 16:14:29,543 [fm.correlator] Job dispose(52bae51c989fcf092369bad4) is completed successfully (16.108138sec)
12:13
2013-12-26 16:14:29,544 [fm.correlator] Removing job dispose(52bae51c989fcf092369bad4)
12:13
2013-12-26 16:14:30,099 [fm.correlator] Running job dispose(52bae51c989fcf092369bad7)
12:13
2013-12-26 16:14:30,150 [fm.correlator] Job dispose(52bae51c989fcf092369bad7) is completed successfully (0.049854sec)
12:13
2013-12-26 16:14:30,150 [fm.correlator] Removing job dispose(52bae51c989fcf092369bad7)
12:13
2013-12-26 16:14:30,408 [fm.correlator] Running job dispose(52bae51c989fcf092369bad8)
12:17
ну и тд
 
12:21
Temperature         : 123.67 degree C  ыыы
12:21
оно там похоже плавится на морозе
12:23
Eth Compliance Codes  : 1000BASE-SX, 1000BASE-T, 100BASE-FX, BASE-BX10
12:23
это в sh int transc
 
12:32
_4ePTeHok, а что не так
 
12:32
объясните, плз, что за...
12:32
script upgrade-user падает на
12:32
Upgrading inv.objectmodels
12:32
со словами
12:32
cjson.DecodeError: cannot parse JSON description
12:32
upgrade-user: 56: collection --sync failed
 
12:34
zi_rus, откуда в sfp трансивере 1000base-t?
 
12:35
у меня по-циски таких трансиверов
12:35
пол-циски
 
12:35
h4wk:   сотри все файлы в local/collections/*
 
12:35
нене
12:35
это вполне конкретный трансивер
12:35
по маркировке на нем - 1000BASE LX
12:36
зачем мне железка пишет все подряд про конкретный трансивер мне непонять
 
12:37
то есть медь тебя смутила, а bx10 нет?
 
12:37
e_zombie: не помогло....
 
12:39
e_zombie: алармов у тебя изрядно прет
 
12:39
это ещё херня. у меня пол сети не шлёт сислоги ваще
 
12:39
отфильтровывай link events с абонентских портов
 
12:40
тоесть ты ставишь крест на маштабируемости нока?
12:40
менее чем 500 эвентов в минуту
12:42
bash: OB: команда не найдена
12:42
[root@orangebox remote]# grep "Dec 26 16:40"  snet.log | wc -l
12:42
2014
 
12:42
алармов
12:42
покажи мне хоть одну сеть, в которой более 500 алармов в минуту?
12:43
2013-12-26 16:14:29,543 [fm.correlator] Job dispose(52bae51c989fcf092369bad4) is completed successfully (16.108138sec)
12:43
вот это жопа полная
 
12:43
dvolodin, у него 500алармов в минуту
12:43
:)
12:44
на самом деле нельзя просто так игнорить клиентские алармы
12:44
вернее
 
12:44
алармы надо игнорить
12:44
а ивенты нужны
12:44
по ивентам надо соответвсвующую реакцию делать
12:44
да, по link up/down надо в инвентори проставлять сооветствующий опер статус
 
12:46
так там не игнор
12:46
а аларм не поднимается
 
12:46
2013-12-26 16:45:51,666 [fm.correlator] Job dispose(52bae558989fcf092369c454) is completed successfully (0.059189sec)
12:46
2013-12-26 16:45:52,317 [fm.correlator] Job dispose(52bae558989fcf092369c464) is completed successfully (0.046326sec)
12:46
2013-12-26 16:45:53,086 [fm.correlator] Job dispose(52bae559989fcf092369c477) is completed successfully (0.089878sec)
12:46
2013-12-26 16:46:12,139 [fm.correlator] Job dispose(52bae559989fcf092369c485) is completed successfully (18.207047sec)
12:46
2013-12-26 16:46:12,611 [fm.correlator] Job dispose(52bae559989fcf092369c489) is completed successfully (0.052334sec)
12:46
2013-12-26 16:46:32,588 [fm.correlator] Job dispose(52bae559989fcf092369c48a) is completed successfully (19.646789sec)
12:46
2013-12-26 16:46:34,269 [fm.correlator] Job dispose(52bae55a989fcf092369c491) is completed successfully (0.114546sec)
12:46
2013-12-26 16:46:52,729 [fm.correlator] Job dispose(52bae55a989fcf092369c49e) is completed successfully (15.909512sec)
12:46
2013-12-26 16:47:09,527 [fm.correlator] Job dispose(52bae55a989fcf092369c4a1) is completed successfully (16.397043sec)
12:46
2013-12-26 16:47:25,086 [fm.correlator] Job dispose(52bae55b989fcf092369c4b6) is completed successfully (15.245768sec)
12:47
это идёт наплывами
12:47
точно так же как и локеддб в монге
12:47
от 7 процентов до 60-80%
12:47
insert  query update delete getmore command flushes mapped  vsize    res faults  locked db idx miss %     qr|qw   ar|aw  netIn netOut  conn       time
12:47
    56    420     42     21       0    99|0       0  7.53g  15.8g  1.48g      0   noc:7.7%          0       0|0     0|0   118k   154k    28   16:47:54
12:47
    51    397     56     28       0   108|0       0  7.53g  15.8g  1.48g      1   noc:7.6%          0       0|0     1|0   120k   141k    28   16:47:55
12:47
    11    385     15      7       0    24|0       0  7.53g  15.8g  1.48g      0   noc:0.6%          0       0|0     0|3    81k   156k    28   16:47:56
12:47
    34    347     39     20       0    77|0       0  7.53g  15.8g  1.48g      0   noc:8.4%          0       0|0     0|0    97k   128k    28   16:47:57
12:47
    82    514     57     28       0   139|0       0  7.53g  15.8g  1.49g      0  noc:11.0%          0       0|0     0|1   154k   188k    28   16:47:58
12:47
    50    480     46     25       0    99|0       0  7.53g  15.8g  1.47g      0  noc:20.1%          0       2|0     1|0   129k   193k    28   16:47:59
12:47
    38    444     11     20       0    64|0       0  7.53g  15.8g  1.48g      0  noc:47.9%          0       0|0     1|0   101k   181k    28   16:48:00
12:47
    16    138     13     11       0    31|0       0  7.53g  15.8g  1.48g      0  noc:45.1%          0       3|0     0|3    37k    57k    28   16:48:01
12:47
    19     31     28     20       0    56|0       1  7.53g  15.8g  1.49g      0 noc:186.8%          0       1|0     1|0    47k    13k    28   16:48:02
12:47
    37     63     40     23       0    84|0       0  7.53g  15.8g  1.49g      4  noc:80.0%          0       2|0     1|0    46k    54k    28   16:48:03
12:47
insert  query update delete getmore command flushes mapped  vsize    res faults  locked db idx miss %     qr|qw   ar|aw  netIn netOut  conn       time
12:48
у меня складывается предположение что изза постоянных локов бд оно и вытормаживает.
12:48
и это как я понимаю не лечится.
12:48
на уровне ОС WA нулевой.
12:49
файловый ОИ тоже нулевой почти
 
12:50
ну да
12:50
а в логах ругани нет, что запрос выполняется слишком долго?
 
12:51
в логах корелятора?
12:51
в логах корелятора только руннинг ремове
 
12:52
12:52
попробуй такой патчик
12:52
и еще скажи, что показывает db.noc.events.new.count()
 
12:53
> db.noc.events.new.count()
12:53
1796806
 
12:54
ага
12:54
убей индекс на timestamp и проверь, что появился индекс на seq
 
12:55
накати патчик, перезапусти классификатор
 
12:55
накатил
12:56
> db.noc.events.new.dropIndex("Timestamp()");
12:56
{ "ok" : 0, "errmsg" : "index not found" }
12:56
,
12:56
так?
 
12:57
"timestamp"
12:57
db.noc.events.new.getIndexes()
 
12:58
> db.noc.events.new.getIndexes()
12:58
[
12:58
	{
12:58
		"v" : 1,
12:58
		"key" : {
12:58
			"_id" : 1
12:58
		},
12:58
		"ns" : "noc.noc.events.new",
12:58
		"name" : "_id_"
12:58
	},
12:58
	{
12:58
		"v" : 1,
12:58
		"key" : {
12:58
			"timestamp" : 1
12:59
		"v" : 1,
12:59
		"key" : {
12:59
			"timestamp" : 1
12:59
		},
12:59
		"ns" : "noc.noc.events.new",
12:59
		"name" : "timestamp_1",
12:59
		"sparse" : false
12:59
	}
12:59
]
 
13:00
(14:36:48) ibl: вот блин паразиты.  подключаем клиента.  по дороге кабеля ещё три фирмы.  так они за доступ в свои помещения запросили халявный инет!
13:00
(14:36:53) ibl: итого 1 клиент и 3 паразита…
13:00
(14:37:57) dmn_: они собственники?
13:00
(14:38:02) dmn_: (помещений)
13:00
(14:38:33) alx0: сделай им prob 0.5 deny
13:00
(14:43:49) ibl: я рассматриваю другое решение - радиомост через эти перекрытия :)
13:00
(14:44:13) ibl: пусть теперь посещают курсы кройки и шитья шапочек из фольги
13:00
(14:48:58) Maugly: ibl: можно выложить твою предыдущую фразу в мой твиттер (с указанием авторства, разумеется)?
 
13:00
и сделай индекс по seq
 
13:04
dvolodin, первая часть подкаста была убойная. А вот вторую как то на междусобойчик слили.
13:05
вроде как про реальную эксплуатацию интереснее было б услышать про автоматизацию, а про это - ни слова
13:05
дискавери тот же хотя бы
 
13:05
_4ePTeHok: все постепенно
13:05
:)
 
13:06
эт понятно, я просто делюсь впечатлениями
13:06
ты верно сделал в первой части, что выстроил точки опоры - на что обратить внимание
13:07
вот про баду я бы послушал например)
 
13:11
dvolodin: timestamp потом создават индекс?
 
13:11
timestamp грохни
13:11
и сделай индекс seq
 
13:11
сейчас
13:11
> use noc
13:11
switched to db noc
13:11
> db.noc.events.new.ensureIndex( {"seq": 1} );
13:11
> db.noc.events.new.ensureIndex( {"timestamp": 1} );
13:11
> db.noc.events.new.dropIndex( {"timestamp": 1} );
13:11
{ "nIndexesWas" : 3, "ok" : 1 }
13:11
>
 
13:16
и еще накати патчи
13:16
оно будет текущую задержку писать
 
13:17
ты забыл там запятую поствить
 
13:21
dvolodin: вот кстати да, про реальное боевое применение было бы интересно послушать. В том числе того же ФМ
13:22
dvolodin: а подскажите пожалуйста еще такую вещь. PaloAlto и Cisco IronPort планиуется добавить? или проще самому?
 
13:22
 ... updating Cisco | Transceiver | 10G | X2-10GB-ER
13:22
    ... updating Cisco | ASR9010 | PWR-2KW-DC
13:22
    ... updating Cisco | Transceiver | 100M | GLC-FE-100LX
13:22
    ... updating Cisco | ME3400E | ME-3400E-24TS-M
13:22
Error: Checksum mismatch for file 'inv/collections/objectmodels/Cisco/ME3400E/ME-3400E-24TS-M.json'
13:22
upgrade-user: 56: collection --sync failed
13:22
Terminating
13:22
upgrade complete
13:24
[root@nocproject noc]# tail -f ./log/noc-correlator.log | grep succes
13:24
2013-12-26 17:24:11,364 [fm.correlator] Job dispose(52bae573989fcf092369c7fe) is completed successfully (0.119643sec)
13:24
2013-12-26 17:24:47,550 [fm.correlator] Job dispose(52bae574989fcf092369c80f) is completed successfully (35.552615sec)
13:24
2013-12-26 17:24:48,622 [fm.correlator] Job dispose(52bae574989fcf092369c817) is completed successfully (0.116409sec)
13:24
2013-12-26 17:25:09,256 [fm.correlator] Job dispose(52bae574989fcf092369c829) is completed successfully (20.041213sec)
13:24
^C
13:25
> db.noc.events.new.getIndexes()
13:25
[
13:25
	{
13:25
		"v" : 1,
13:25
		"key" : {
13:25
			"_id" : 1
13:25
		},
13:25
		"ns" : "noc.noc.events.new",
13:25
		"name" : "_id_"
13:25
	},
13:25
	{
13:25
		"v" : 1,
13:25
	{
13:25
		"v" : 1,
13:25
		"key" : {
13:25
			"seq" : 1
13:25
		},
 
13:28
Night_Snake, их может добавить тот, у кого они есть в наличии..
13:29
без доступа к железу это большая проблема
 
13:30
Да нет там никакой проблемы
13:30
self.cli(blablabla, file="......")
 
13:30
dvolodin: лучше не стало
 
13:30
подпихиваешь что надо, делаешь тушенку и убираешь file
13:30
e_zombie: что сейчас там?
 
13:31
e_zombie: тот еррор и у меня был
 
13:31
_4ePTeHok: доступ к железу у меня есть
 
13:31
[root@nocproject noc]# tail -f ./log/noc-correlator.log | grep succes
13:31
2013-12-26 17:30:48,012 [fm.correlator] Job dispose(52bae582989fcf092369c99a) is completed successfully (21.521661sec)
13:31
2013-12-26 17:31:06,601 [fm.correlator] Job dispose(52bae582989fcf092369c99e) is completed successfully (17.733398sec)
13:31
2013-12-26 17:31:23,579 [fm.correlator] Job dispose(52bae582989fcf092369c9a2) is completed successfully (16.310853sec)
13:31
2013-12-26 17:31:42,109 [fm.correlator] Job dispose(52bae582989fcf092369c9b0) is completed successfully (17.628974sec)
13:31
2013-12-26 17:31:58,910 [fm.correlator] Job dispose(52bae582989fcf092369c9bf) is completed successfully (16.095627sec)
13:31
2013-12-26 17:31:59,521 [fm.correlator] Job dispose(52bae582989fcf092369c9c0) is completed successfully (0.041363sec)
 
13:31
так что видимо мне и придется
 
13:31
insert  query update delete getmore command flushes mapped  vsize    res faults  locked db idx miss %     qr|qw   ar|aw  netIn netOut  conn       time
13:31
    21    327     20     12       0    43|0       0  7.53g  15.6g   458m      1  noc:31.8%          0       2|0     1|0    76k   137k    31   17:31:02
13:31
    20    376     38     22       0    64|0       0  7.53g  15.6g   480m      1  noc:23.3%          0       0|0     2|0    97k   177k    31   17:31:03
13:31
    38    380     22     11       0    61|0       0  7.53g  15.6g   448m      1   noc:6.4%          0       0|0     1|0    96k   155k    31   17:31:04
13:31
    22    420     32     21       0    59|0       0  7.53g  15.6g   474m      1  noc:17.7%          0       0|0     1|0   104k   194k    31   17:31:05
13:31
    25    487     37     18       0    61|0       0  7.53g  15.6g   479m      1   noc:6.1%          0       1|0     0|1   118k   205k    31   17:31:06
13:31
    40     36      6      9       0    56|0       0  7.53g  15.6g   474m      3  noc:64.7%          0       0|0     1|0    25k    81k    31   17:31:07
13:31
    42    451     44     22       0    87|0       0  7.53g  15.6g   474m      0   noc:6.3%          0       0|0     1|0   125k   184k    31   17:31:08
13:31
    32    357     34     21       1    71|0       0  7.53g  15.6g   475m      0  noc:18.6%          0       0|0     1|0    98k   530k    31   17:31:09
 
13:31
Night_Snake, начни с get_version
 
13:31
 посмотри логи классификатора
13:32
performance report его
 
13:32
_4ePTeHok: а что вообще делать-то?
 
13:32
посмотри примеры в ./sa/profiles/Cisco/IOS
 
13:32
начни с __init__.py
13:32
потом get_version и get_config
 
13:32
get_version/get_config основа
13:32
оно и самое простое как правило
 
13:32
затем переходи к get_inventory и get_interfaces
 
13:32
вопросы здесь задавай - быстрее отклик будет
 
13:33
с get_interfaces все просто - либо ты его, либо он тебя
13:33
прямо в мозг
 
13:33
уж если я с нуля питон не зная писал get_interfaces..
 
13:33
2013-12-26 17:33:38,843 REPORT: elapsed: 56.7895s, speed: 17.6ev/s, events: 1000, lag: 18643.843427s, failed: 0, deleted: 0, suppressed: 0, unknown: 464, classified: 201, disposed: 95, duplicated: 240
13:33
2013-12-26
 
13:33
я вот тож не знаю :) перл разумею, а питон не очень
 
13:34
2013-12-26 17:34:38,572 REPORT: elapsed: 59.7289s, speed: 16.7ev/s, events: 1000, lag: 18701.572808s, failed: 0, deleted: 0, suppressed: 0, unknown: 496, classified: 199, disposed: 101, duplicated: 204
 
13:34
примеры смотри - там очень интересные решения есть
13:34
у меня вот уже желание появилось старые скрипты свои переписать, ибо стыдно за то что два года назад строчил)
 
13:35
чую будет чем заняться на новый год, ага
 
13:35
всего на 6 часов задержка
13:35
:)
 
13:35
для девушек это нормально
 
13:35
а для дальнего востока - так и вообще на час раньше.)
 
13:36
(17:23:42) e_zombie:     ... updating Cisco | Transceiver | 100M | GLC-FE-100LX
13:36
(17:23:42) e_zombie:     ... updating Cisco | ME3400E | ME-3400E-24TS-M
13:36
(17:23:42) e_zombie: Error: Checksum mismatch for file 'inv/collections/objectmodels/Cisco/ME3400E/ME-3400E-24TS-M.json'
13:36
(17:23:42) e_zombie: upgrade-user: 56: collection --sync failed
13:36
(17:23:42) e_zombie: Terminating
13:36
(17:23:42) e_zombie: upgrade complete
 
13:36
ну... камчатка дальше, якутск ближе
 
13:36
покажи мне ./noc events
 
13:36
кстати вот это уже у двоих. ктото накосепорил
 
13:36
+7 тока владик и хабар
 
13:36
с сотню записей на пасту
 
13:36
e_zombie, это походу с мерджем
13:36
сегодня ж сливали девелоп в инвентори
 
13:37
какие objectmodels на develop?
 
13:37
а , недоглядел)
13:37
думал фм)
 
13:38
e_zombie: вытаскивай фикс
13:38
покажи event'ы
 
13:38
смотри личку
13:40
прокатило. обновилось
 
13:47
52bbe694989fcf0923870627, 10.64.117.107, Unknown | Syslog, SYSLOG: Dec 26 11:19:32 10.64.117.107 chassism[907]:  AN_BYPASS : Port ge-0/0/1 Current 771535500 Saved time 771534490
13:47
вот это, вроде, совсем несмысловое
 
13:49
а чего тебе непонятно? :)
 
13:50
джунипер сохраняет время
 
14:02
 {'builtin': False,
14:02
  'description': 'SFP Transceiver',
14:02
  'number': '25',
14:02
  'part_no': ['\xbcMS'],
14:02
  'revision': '\xdc\xf5',
14:02
  'serial': '\xb8MS\x88\x87\xa4',
14:02
  'type': 'XCVR',
14:02
  'vendor': 'NONAME'},
14:02
превед кетаес
 
14:05
может это simplified chineese
14:05
а мы - глупые белые обезьяны, которые не могут прочитать то, что написано на трансивере?
 
14:05
ты лучше скажи чо с ним делать)
 
14:06
part_no гласит о том, что дядя Ляй сунул х. в чай
14:06
завтра все
 
14:06
по if "\x" in pid  отправлять в сторону "Unknown?"
14:48
ох бля.
14:48
я научился слать нахер юникод)
 
15:43
чет дешево как то за 60к властелина выписывают
15:43
ну и как всегда и швец и жнец и в попу ебец
 
15:44
ага. особенно мне понравилось: Так же приветствуется личное знакомство с Гомером Симпсоном, Владимиром Путиным, Дартом Вейдером ;)
 
15:46
думаю про второго они явно зря
 
15:47
а третий на канале #bsd-unix обитает :)
15:48
И поскольку я лично с ним знаком, то меня терзают смутные сомнения...
 
15:51
совпадение думаю
15:51
иначе не стали бы писать первых двух
15:51
ъотя кто их знает креативщиков этих
 
15:52
Ну, если пишут "знание Unix-систем ubuntu", то явно они от юниксов далекие
 
15:56
кто пишет то обычно)
15:57
опасно блин нок оставлять с включенным дискавери
15:57
на след день приходишь, а в unknown models 5 листов
16:00
как это все таки прекрасно
16:00
 Vendor PN             : ЮЗvxNSpл·
16:00
 Vendor Rev            :
16:00
 Vendor SN             : ЮЗvЛй·
16:00
дзен постигаешь
 
16:28
_4ePTeHok:  не будет так работать
18:33
18:33
навернул адский патч для классификатора
18:34
должен давить повторяющиеся события unknown | syslog
 
20:21
dvolodin я тебя ненавижу ;)
 
20:21
:)
20:22
по какому поводу?
 
20:25
ты поломал мои надежды на то, что жунипер - это кошерно, работает, и вообще OK
20:26
в результате - почти 400 км езды, ебля с mx80, с интегратором, и прочий ералаш
 
20:30
эээ
20:30
ты неправильно делаешь
20:30
нужно выебать интегратора, и пусть он едет за 400 км
20:30
а mx80 -- говно
 
20:43
да хз. складывается впечатление, что это какой-то обрезок нормального МХ
 
    Share this page
    Share this page: