nocproject.org
02:41
приветствую всех!
02:41
dvolodin: такой вопрос: у меня баг в get_vlans для zyxel - когда имя влана пустое (а такой случай возможен), то regexp матчит всякий мусор
02:41
и что-то я не соображу, как сделать, чтобы возвращался пустой результат, который бы я мог потом как-то обработать
03:20
"^\s*Name\s+:\s*(?P<name>.*?)$"
03:23
и вот такую вот штуку надо распарсить:
03:23
802.1Q VLAN ID : 2360
03:23
Name \t\t:Management
03:23
Status \t : Static
03:23
т.е. когда имя пустое, то матчится Status, несмотря на $ в regexp
03:26
главная засада в том, чтобы регексп в целом срабатывал, но при этом не получать ошибку типа нет такой группы в match.group...
03:36
нет, просто re.MULTILINE
03:42
может вместо \s* сделать [ \t]*
03:42
?
03:48
03:49
на старом форуме было несколько правил для zyxel
03:49
Портаните их что-ли
04:00
04:00
это тоже
04:00
по-моему, не в пробельных символах суть... может объясняю не так... проблема в том, что не может быть пустая группа, т.е. если она пустая, то вообще не срабатывает регэксп...
04:00
у меня вот идея сейчас появилась - два раза проматчить, если первый (без имени) сработал, то делать соответствующую обработку, иначе - другой регэксп, нормальный
04:03
Правила гляну. часть из них уже сделана. просто я добавляю их по мере появления сообщений в логах. Вчера вот специально включил слать логи на домовых свитчах, чтобы больше событий новых наловить
04:03
а если посли скобки группы поставить ?
04:04
тогда у меня вылетит на match.group("name") наверное
04:19
У меня нок вчера упал и немогу завести... В FM попало какоето сообщение и mongo не может его записать в базу..
04:20
Где бы очередь очистить?
04:20
gnu-linux: noc.events.new посмотри
04:20
или noc.events.failed
04:28
Какой командой в монго лесть кто знает?
04:29
гдето у нас здесь проскакивало, не могу найти как в ноковскую монгу залесть...
04:31
в shell`e пишем mongo
04:31
use noc
04:31
кто-то просил из бэкапа развернуться попробовать...вообщем не получается
04:32
по шагам: 1. ставим чистую систему 2. ставим нок. 3. берем бэкап базы. 4. пытаемся развернуть - получаем ERROR: invalid byte sequence for encoding "UTF8" в различных вариациях
04:33
беглое гугление дает вариант типа iconv -c -f UTF-8 -t UTF-8 -o noc.dump noc-db-2011-08-05-09-42.dump - тоже не помогает
04:34
gпоглядеть чего есть.. db.noc.events.new.find()
05:04
А как с монги удалить например 4e42422d7b051b15f4005980
05:06
db.noc.events.failed.find() страшные трейсы...
05:07
Как вообще почистить все события в FM
05:34
gnu-linux,root@noc /opt/noc# mongo
05:34
MongoDB shell version: 1.8.2
05:34
connecting to: test
05:34
> use noc
05:34
switched to db noc
05:34
> db.noc.alarms.active.remove()
05:34
> db.noc.events.active.remove()
05:34
> exit
05:34
bye
05:37
05:39
Чёто как обезьяна в монге подёргал (пока ничего не удалял) post-update но noc-classifier и noc-correlator валятся.. Хотя трейсов в sae уже нет..
05:40
Что делать? Хочется найти это сообщение которое так дико всё вешает...
05:41
gnu-linux, удалить все как я написал не подойдет?
05:42
Зачем удалять то что уже прокласифицировано и лягло в базу?
05:43
Логичнее удалить db.noc.new.remove() которые заклинело на класификации...
05:44
gnu-linux, это если не жалко, я вот просто все сношу, у меня пока нет важных аварий в алармах, если вам жалко, видимо надо искать правильную команду
05:45
tracebak в любом случае нужен
05:46
Вот, надо же найти сообщение которое так всё переклинело...
05:46
db.noc.events.failed.find() хватит?
05:47
Там, по ходу когда я просматривал трейсы то были две ошибки:
05:47
1 unicode ктото по русски в сыслог пишет..
05:48
2 монго материлась что объект с таким ИД в базе уже есть...
05:49
это ерунда - отложили событие в сторону и забыли
06:03
в чем причина, если ставлю галочку Per-Vlan MAC discovery в Topology Diskovery, то валится ошибка
http://pastie.org/2354246, а без нее не обнаруживает накаких связей между объектами
06:13
смотреть надо, в issue это
06:13
какие железки?
06:15
длинки все
06:21
на одном алкателе та же песня
06:21
get_topology_data с них что-нибудь возвращает?
06:23
проверил на одном, arp, mac, lldp - все что есть находит
06:25
PVST тут вообще ни при чем - валится в маке
06:27
там в traceback в конце можно развернуть стрелочку и посмотреть значения переменных
06:27
мне нужно то, что лежит в d
06:28
self
06:28
<noc.sa.apps.topologydiscovery.topology.mac.MACTopology object at 0x808382750>
06:28
object_addresses
06:28
{u'172.18.244.56': <ManagedObject: Aggr-ats77-test-1>}
06:28
d
06:28
[{'interfaces': ['CPU'],
06:28
'mac': '00:22:B0:2E:D9:21',
06:28
'type': 'S',
06:28
'vlan_id': 800}]
06:28
o
06:28
<ManagedObject: Aggr-ats77-test-1>
06:28
это?
06:30
2011-08-11 10:30:23,014 Daemon noc-correlator[#0] started as PID 10282
06:30
2011-08-11 10:30:25,017 noc-correlator[#0] daemon is terminated with status 10282
06:30
и так всю ночь
06:31
correlator запущен с дебагом
06:32
Loading RCA Rules | Loading rules | 76 rules are loaded. 0 combos| Loading triggers | 0 triggers has been loaded to 0 classes
06:32
и так по кругу
06:32
zi_rus: нашел, кажется
06:32
changeset: 4339:d77e70db1e0e
06:33
dvolodin, жду багфикса
06:33
`kk, у меня что-то подобное было из-за проблем с постгресом
06:36
2011-08-11 10:36:33 MSD LOG: could not receive data from client: Соединение сброшено другой стороной
06:36
2011-08-11 10:36:33 MSD LOG: unexpected EOF on client connection
06:37
`kk: если так его запустить: ./scripts/noc-correlator -f start
06:37
что будет?
06:40
r4341
06:41
`kk: это кто сбрасывает, монго или постгрес?
06:41
логи с постгреса
06:42
в монго нашёл Thu Aug 11 10:38:10 [conn158852] auth: couldn't find user noc, noc.system.users
06:42
ну понятно, процесс-то покрашился
06:45
это ерунда
06:46
dvolodin, r4341, дискавери прошел нормально но связей между объектами не нашел ни одной
06:46
надо смотреть, что ему dlink'и отдали
06:47
get_topology_data с любого dlink'а что отдаст?
06:51
маки он должен отдавать, как минимум
06:51
мне чего подкрутить?
06:55
коррелятор в дебаге пустить
06:57
у него и так loglevel = debug
06:58
ты руками пусти
06:59
zi_rus: шедеврально просто
06:59
что это за тупая скотина такая?
06:59
dlink?
07:00
./scripts/noc-correlator -f start так не дебаг? тогда как
07:01
`так и запускай
07:01
что перед смертью напишет
07:02
zi_rus: поправлю обработку remote_port_subtype для macAddress
07:03
lexus-omsk: ./noc sync-collections его не выправляет?
07:03
опа
07:03
сейчас буду разбираться
07:05
err-disable его убивает
07:08
07:08
трэйс перед смертью
07:09
Вот
07:09
r4342 должен помочь
07:09
А выводы из этого самые неприятные
07:09
07:09
вот так полнее
07:10
заливай фикс и делай sync-collection
07:11
косяк откровенный в mongoengine
07:12
сказано ему в embedded document, что поле обязательное
07:12
а ему плевать
07:14
угу
07:15
добрый прикол
07:16
теперь в алармах пусто
07:18
zu_rus: я топологию с DLink снимаю только по mac. Попробуй всё другоэ отключить! MAC-Port bindings включи.
07:19
хм. сами появились -)
07:20
mac-port bindings - это отчет
07:20
да я по нём привязку клиентов к портам коммутатора высканиваю.
07:21
Зато видно что DLink маки отдают..
07:21
маки отдает
07:21
но вылезает два косяка
07:21
эта тупая скотина не может определиться с именем интерфейса
07:22
то оно у него T1, то 25
07:24
не всегда класифицирует события от SAE. после рекласификации видно, что это "pm probe"
07:24
да, на pm probe я не делал класса пока
07:26
у меня тоже по классификации вопрос: там регистрозависимый поиск похоже? В разных прошивках шлёт то с заглавной буквы, то нет
07:26
соответсвенно, то работает правило, то нет
07:27
можно сделать конечно как-то так [Ss]ystem... или лучше как-то по-другому обойти?
07:28
IGNORECASE сделать?
07:28
как бы тормозить не начало с этого
07:29
ну вот я и спрашиваю, что может проще мне в правиле это учесть и всё
07:31
да, лучше в правиле
07:32
тем более пока единичный случай
07:32
zi_rus: что возвращает dlink на get_lldp_neighbors ?
07:34
07:36
в html форме в поле ремот_порт пишет мак
07:36
для 3627, а для 3200 пишет правильный порт
07:36
а для нока нет планов по функционалу адресной базы? чтобы можно было создавать улицы/здания и указывать их в качестве расположения объектов. или это в принципе расходится с архитектурой системы?
07:37
Ченжлог для DGS-3627 серии
07:37
2.84.B11 1. Fixed issue with LLDP.
07:37
Вопросы?
07:38
Dmitry1, Version 2.84.B15
07:38
Уже есть 2.84.B17
07:39
Кинь на pastie.org вывод команды show lldp remote-port для DGS-3627
07:39
Unbeerable: адрес можно прописать в описание объекта.. Я так и зделал.
07:39
А то что-то мутно с 13-м портом
07:39
gnu-linux, это не очень юзабельно. я бы хотел функционал с фильтрацией/поиску по улице/дому
07:40
Кстати, remote-port - это то, что отдает соседний коммутатор.
07:40
у нас была самописная база с таким функционалом, то в других вопросах она полный ад, в которых нокпроджект прекрасен
07:40
s/то/но/
07:40
Т.е. MAC адреса тебе скорее всего отдают DES-3200
07:41
Unbeerable: есть такие планы, да
07:41
Попробую в MO в поиск ввести улицу, дом,... У меня ищет, фильтрует...
07:42
gnu-linux, а если я захочу сделать экспорт всех адресов для "карты сети"?
07:45
Ну на моей карте оно адреса отображает, с описания.. Если все адреса в описании писать причёсаными: <город>, ул. <улица>, д. <дом>[, кв. <квартира>] то потом можно будет легко распарситьи экспортировать...
07:47
Ну тогда ждите карты сети с координатами и базой адресов...
07:47
Dmitry1: я не могу понять, почему у него мак не конвертируется в нормальный формат
07:47
Unbeerable, у меня так же адреса в описании. жить можно )
07:48
И не должен. По идее это должен быть Port ID. Почему туба китайцы впихнули MAC адрес - знают только они. :(
07:48
zi_rus: r4344 должен пофиксить проблему с записью маков
07:49
Dmitry1: да не в этом дело
07:49
они имеют полное право пихнуть туда и мак, коли указали ему subtype 3
07:49
dvolodin, какие-то предварительные запланированные сроки на это есть?
07:49
только почему он не сконвертировался
07:50
Понял. Сейчас буду копать в эту сторону.
07:50
zi_rus: я хочу тушенку с get_lldp_neighbor с этого свича
07:50
это уже мне копать
07:50
Unbeerable: зависит от бюджета мероприятия :)
07:51
давайте начнем формировать требования к базе адресов
07:51
dvolodin, что именно с ллдп
07:52
Unbeerable: готов формировать бюджет мероприятия? :)
07:52
dvolodin, :) я бы с требований начал
07:53
07:53
нужна тушенка
07:56
"message": "Aug 10 16:46:30 sw-name system: MAC temperature value 132 exceeds its limit temperature value",
07:56
хы
07:57
какие зухели умные - температуру маков определяют уже
08:12
видимо, они имели в виду температуру чипа с коммутационной матрицей :) там 3 температуры есть: mac, cpu и phy
08:13
и опять в сообщении recover не шлётся имя сенсора (как и с fan)
08:21
f
08:21
а
08:21
то есть там MAC, CPU и PHY может быть?
08:21
а в целом - просто имя сенсора?
08:23
wad_, по восстановлению из бэкапа - а консолька на сервере поди koi8?
08:24
там если с дампа разворачиваешь посгрес кодировка pg-client должна быть такой же как у восстанавливаемой БД, иначе возможны нехорошие ситуации
08:26
средняя температура маков по свитчу это да, круто)
08:28
_4ePTeHok не знаю не востанавливал
08:29
ой, пардон, перепутал
08:29
<inoyat_kayumov> это ему выше
08:39
dvolodin, развели же на хабре опять разговор про рисовалки) как будто в них счастье
08:40
dvolodin почему может валится noc-classifier в логах пишет только 2011-08-11 16:39:57,012 Loading rules
08:40
в который раз отмечаю что твои комментарии к статье читать еще интереснее статьи))
08:43
Я уже с базы решил удалить все FM:
08:43
> db.noc.events.new.find()
08:43
> db.noc.events.event.find()
08:43
> db.noc.events.archive.find()
08:43
> db.noc.events.alarm.find()
08:44
> db.noc.events.fault.find()
08:44
db.noc.events.new.find() появляются и никуда не исчезают (только я их иногда тру)
08:48
_4ePTeHok: консоль везде утф8
08:50
из new все должен уносить коррелятор?
08:51
inoyat_kayumov, а cat postgresql.conf| grep client_encoding чего показывает?
08:52
пока ничего :) решил вчистую еще раз переставиться - потому как сначала постгре был 8, а бэкап делался 9кой
08:53
_4ePTeHok: Да уж, просвещаям народ понемногу
08:53
корелятор работает, не валится, валится только noc-classifier. Куда из db.noc.events.new ивенты переносятся?
08:53
inoyat_kayumov, я в обратку переносил - с 8 на 9
08:59
inoyat_kayumov: в обратную сторону не перенесется
09:03
я снес 8, поставил 9 - все равно не пошло. сейчас пробую чистую инсталляцию у же 9м постгре
09:15
Выкопал ошибку что класификатор пишет:
09:15
mongoengine.base.ValidationError: Unable to dereference <class 'noc.fm.models.EventClass'>:4e3cd7bf7b051b58d6000002
09:34
Да я переименовывал:
09:35
Сей час вообще удалил всё что написал по SENSORS Вернуть всё назад?
09:38
можно просто вытереть события эти
09:38
db.noc.events.active.remove({"event_class": ObjectId("4e3cd7bf7b051b58d6000002")})
09:46
не помагает дальше тот же матюк
09:46
я даже db.noc.events.active.remove() вытерал всё
09:47
а оно в active?
09:47
или в archive?
09:47
Наверно я чёто с этой монги не вытер.. Она уже и так сильно покоцана.. Как с неё всё вытереть,
09:48
Дальше mongoengine.base.ValidationError: Unable to dereference <class 'noc.fm.models.EventClass'>:4e3cd7bf7b051b58d6000002
09:49
я вытерал:
09:49
> db.noc.events.new.remove()
09:49
> db.noc.events.archive.remove()
09:49
> db.noc.events.new.remove()
09:49
> db.noc.events.fault.remove()
09:49
Может ещё чё не до тёр?
09:56
может проще полностью грохнуть???
09:56
остановить сервак и стереть файлы
09:57
rm -rf /var/lib/mongodb/*
09:57
?
09:57
rm -rf /var/lib/mongodb/noc*
09:57
Я бекаплю только постгрис..
09:58
dvolodin_, как бы всётаки отучить корелятор жрать память. словил максимум у себя - 1,3гб
09:58
у меня тоже корелятор отжирает больше гига...
10:00
и ростет потихоньку?
10:00
у меня да
10:01
методично по чуть-чуть откушивает..
10:11
да
10:12
пару дне назад : <dvolodin> хорошо, я посмотрю, может он слишком аггресивно root cause в разных позах устанавливает
10:12
во -)
10:12
Наконец удалось запустьть NOC.
10:14
Остановил нок, монгу. Вытер ВСЁ с /var/lib/mongodb/ и создал пустой каталог с правами монги /var/lib/mongodb/journal/
10:15
стартанул монгу, post-update и старт нока........
10:15
проще было в монге дропнуть базу
10:17
dvolodin: надо эту "дропалку" базы в вебморде нока прикрутить, чтоб когда монга клинит проще было её "дропать"...
10:17
:)
10:17
да не
10:17
я просто проверки допишу, чтобы не давала тереть объекты просто так
10:23
Лучше на перспективу проэктировать базы так чтобы всё что нужно было в postgresql а не критичное пихать в mongo
10:24
тогда дропать монгу не жалко..
10:28
фм в любом случае в посгресе ненужен
10:28
не та архитектура
10:28
будет тормозить и грузить
10:31
раскаталось из бэкапа
10:31
а подскажите - иногда сталкиваюсь да спросить забываю..."All activators are busy" - лечится?
10:39
к памяти корелятор съел ещё и 60% кпу -(
10:40
`kk, повтори, сколько у тебя объектов
10:41
у меня на 64 объекта цпу по нулям, а памяти 120 мег ушло
10:44
Severity all на свичах
10:44
Какие идеи? Поддержку UPS в FM тоже хочется иметь...
10:45
`kk, такого я еше не делал, у меня только пинг фейлед
10:45
включи. посмотри -)
10:48
wad_: патчик твой смотрел
10:49
одна беда только - индекс по messageмне строить категорически не хочется
10:49
а перетряхивать миллион записей по запросу гоблина - не дело
10:49
кстати, что у нас в монго с full text search?
12:29
нормальная кодитровка. Бывает тут что длинные фразы кракозябрами вылазят
12:30
ufir, читаемо ?
12:31
ну ок
12:31
12:31
" причем в интерфейсе добавляется оборудование, но при попытке запустить скрипт - Processing: Script Cisco.IOS.get_topology_data в цикле"
12:31
`kk , видно?
12:33
это с длинными косяк такой, я хз из за чего
12:47
ufir, UTF-8 выставь в клиенте.
12:47
может у меня клиент как то автоматом переконвертирует
12:53
12:54
UTF-8 display -
12:56
ну чего, только я один его читаю чтоли)
12:57
по ходу да. Я только вопросительные знаки вижу
13:00
А я - умляуты
13:01
Народ, а у кого wifi есть в промышленных объемах
13:01
если верить тому, что я вижу с кисок, основные события будут
13:01
dot11 assotiated
13:02
dot11 disassotiated
13:02
и dot11 roamed
13:02
ufir: клиент какой? я утром поставил kvirc - видел все в вопросиках, пока принудительно утф8 не поставил. а от вас по-прежнему вижу вопросики
13:06
13:09
hi. подскажите, может кто-то с таким сталкивался. операционка свежеустановленная.
http://pastebin.com/eU8Q0XgP причем в интерфейсе добавляется оборудование, но при попытке запустить скрипт - Processing: Script Cisco.IOS.get_topology_data в цикле
13:10
в какую сторону копать - подскажите ?
13:18
test завалившийся - это не страшно
13:18
что в логах SAE и активатора
13:31
хм... в логах пусто. странно
13:37
а в логах и будет пусть - у вас собственно процессы нока запущены?
13:37
*пусто
13:45
2011-08-11 17:45:23,060 Running activator 'unknown'
13:45
2011-08-11 17:45:23,061 Loading profile classes
13:45
2011-08-11 17:45:23,351 Cannot find ssh keys. Generate one by 'python manage.py generate-ssh-keys' command
13:46
ага
13:46
оно честно сказало
13:46
с правами косячок
13:47
теперь постоянно:
13:47
2011-08-11 17:46:34,674 Protocol version negotiated
13:47
2011-08-11 17:46:34,674 In-bundle package. Skiping software updates
13:47
2011-08-11 17:46:34,677 Registering as 'unknown'
13:47
2011-08-11 17:46:34,680 Registration error: Unknown activator 'unknown'
13:47
соответственно лаунчер орёт:
13:47
2011-08-11 17:46:16,965 Launching noc-activator[#0]
13:47
2011-08-11 17:46:16,966 Daemon noc-activator[#0] started as PID 30513
13:47
2011-08-11 17:46:17,967 noc-activator[#0] daemon is terminated with status 30513
13:54
активатору надо имя в конфиге прописать и secret
13:54
и то же самое - в базе
13:59
понял
13:59
а в каком конфиге ?
14:02
все, понял - благодарю
14:11
заработало?
14:31
закоммитил классы для wifi
Share this page
Share this page: