About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 19.01.2012
zi_nnov #
05:48
dvolodin, я вижу баги которые уже 3 месяца висят в системе
dvolodin #
05:49
какие именно?
zi_nnov #
05:49
NOC-46
05:50
Bug NOC-52 NOC-53
05:50
по 52, я уже даже не помнюпо поводу чего он создавался
05:51
NOC-85 NOC-88
05:52
NOC-104 NOC-105
05:52
и это только за октябрь
dvolodin #
05:54
NOC-52 может и починился
05:54
NOC-53 - не баг, а фича
05:57
NOC-85 -- какая-то локальная ошибка
05:57
NOC-88 -- не воспроизводится
05:58
NOC-104 -- локальная ошибка
05:58
NOC-104 -- не баг, давно уже спорим на эту тему
zi_nnov #
05:59
dvolodin, по 88 - если я добавляю в скрипт часть с снмп, я должен вносить изменения в другие файлы, как мне сказали надо еще что-то в __init__.py делать?
dvolodin #
05:59
не надо, у нас полно работающих snmp скриптов
zi_nnov #
06:00
тогда почему, когда я добавлял в профиль длинк снмп часть, скрипт выполнял и снмп и кли. как так?
dvolodin #
06:02
если уж так -- в той же jira есть issue, которые висят по 5 лет
06:02
то же объединение issues
06:03
в bamboo - минимум пол-года висит тривиальный баг, из-за которого не работают mercurial subrepos
06:03
и мы, соответсвенно, не можем его использовать
zi_nnov #
06:04
дурной пример заразителен. зачем равняться на плохие качества?
dvolodin #
06:05
за последние 30 дней -- 63 issue created, 39 - resolved
zi_nnov #
06:08
решено чуть больше половины, отсалось 30 за этот месяц, еще 30 за предыдущий и тд
dvolodin #
06:12
из этого мораль - баги приоретизируются в зависимости от их критичности для проекта в целом
zi_nnov #
06:14
dvolodin, NOC-67 NOC-105 NOC-111 - major priority
06:14
все еще говорим про октябрь
dvolodin #
06:15
NOC-67 -- вообще-то фича
06:15
DIR-100 не поддерживается официально
06:16
NOC-111 -- решается настройкой HTTP-сервера
06:16
для апача пример положили, на остальных серверах, видимо, не сталкивались
06:17
найденный баг с присланным патчом коммитится быстрее ;)
zi_nnov #
06:21
NOC-111 - если баг решен, его бы закрыть, хотя бы для статистики, проблемы то больше нет
dvolodin #
06:21
проблема в том, что для закрытия это надо описать в документации
06:22
желательно, для apache/lighttpd/nginx
06:22
возьмешься?
zi_nnov #
06:22
а ввиду отсутсвия таковой это невозможно ;)
06:23
рискнил бы, если бы понимал эту проблему
06:25
не чусвую что у меня хватит сил с этим справиться
dvolodin #
06:29
http://kb.nocproject.org/display/DOC/Webserver+Setup
gnu-linux #
06:43
Есть вопрос знатокам Zabbix:
06:46
Вот пишу правильный конертор с забы в нок.. С распознаванием всего по максимуму... Но у меня в забе не все настройки вбиты, по этому мне трудно соотнести некоторые значения забы и нока.
06:46
Пока вот пробую такой селект:
06:46
SELECT hosts.ip, hosts_profiles.devicetype, hosts_profiles.location, items.authtype, items.password, items.privatekey, items.publickey, items.snmp_community, items.trapper_hosts, items.username FROM hosts, hosts_profiles, items WHERE hosts.hostid = hosts_profiles.hostid AND hosts.hostid = items.hostid AND hosts.status = 0;
06:48
items.password, items.privatekey, items.publickey,items.trapper_hosts, items.username - у меня пусты.. Как эти поля соотнести с полями нока.. Понятно только что items.trapper_hosts у нока свой..
dvolodin #
06:52
gnu-linux: вообще у меня есть крайне нехорошая идея - добавить в NOC отдельный сервис -- сопоставление идентификаторов в разных системах
06:52
для интеграции крайне важная вещь
zi_nnov #
07:05
как такое может быть, взял скрипт get_version для длинка, добавил туда снмп, убрал все что связано с КЛИ, а он зараза все равно в телнет лезет
lexus-omsk #
07:07
dvolodin: переписали что ли тестирование скриптов? раньше типа отчёта получалось - что выполнено, а что падает - а сейчас не вижу такого
07:07
по команде ./noc test --reuse-db ....
dvolodin #
07:08
и сейчас есть
07:08
он теперь умеет XML в формате JUnit выдавать
lexus-omsk #
07:13
просто раньше как-то интуитивно понятно было - какие скрипты есть вообще, какие валятся.. а тут всё в кучу... как-то так
roman_d #
07:13
раньше... а для новичков это сейчас трудно также разгрести)))
07:14
ладно, прорвемся по чуть-чуть)
dvolodin #
07:15
lexus-omsk: ты про ключик -v ?
lexus-omsk #
07:16
кстати раньше его на автомате ставил, как в доках -v2, сейчас уже посмотрел ./noc help test - оказывается вот оно как...
07:17
только разницы вроде не видно - что при 0, что при 2... всё равно весь прогон всех скриптов на экране
07:18
но в приниципе понтяно, главное итоговая строчка, а дальше уже можно по одному проблемные скрипты гонять
roman_d #
07:27
Дмитрий, мелочь, но мало ли...
07:27
можете исправить в IPAM секции - Widlcard 0.255.255.255
07:28
а разделе Assigned Address
dvolodin #
07:50
lexus-omsk: я сделал там отдельный result report, сейчас в XML, можно и текстовый сделать детальный
lexus-omsk #
07:53
coverage-xxx-out - это оно?
dvolodin #
07:54
нет
07:55
--junit-xml-out= ....
lexus-omsk #
07:57
ага, это вроде похоже на то, что было
dvolodin #
07:59
наверное, надо сделать и plain-text вариант
ss__ #
08:07
Люди подскажите как настроить faul manager
08:07
В FA - events сообщения есть
08:08
правила но они не класифицируюутся
08:08
правила есть но согласно им они не класифицируюутся
08:09
Managed Object: 33-machin15p3
08:09
Event Status: Failed
08:09
Time: 19.01.2012 12:08:15
08:09
Event has been reclassified
lexus-omsk #
08:20
dvolodin: ещё вопрос - если я с другой машины собираюсь коммитить - надо новый ключ сгенерить и выслать?
ss__ #
08:21
даже если проходит класификация что дальше делать?
08:23
4f17c90608b5412ed000417e 33-machin24p2 19.01.2012 11:40:54 Active Unknown | Syslog SYSLOG: Jan 19 07:41:00 33-Machin24p2 %%01IFNET/4/IF_STATE(l)[21648]:Interface Ethernet0/0/22 has turned into DOWN state.
08:23
такая запись
Dmitry1 #
08:24
если классифицировалось как Link DOWN, то должен подняться аларм
ss__ #
08:25
не класифицировался, в том то и соль
lexus-omsk #
08:25
ss__: правило "из коробки" или сами писали?
ss__ #
08:25
Event Class: Network | Link | Link Down
08:25
в фильтре = нет сообщений
08:25
сам писал
08:26
{
08:26
"name": "Huawei | VRP | Network | Link | Link Down (SYSLOG)",
08:26
"description": "Link Down",
08:26
"event_class__name": "Network | Link | Link Down",
08:26
"preference": 1000,
08:26
"patterns": [
08:26
{
08:26
"key_re": "^source$",
08:26
"value_re": "^syslog$"
08:26
},
08:26
{
08:26
"key_re": "^profile$",
08:26
"value_re": "^Huawei\\.VRP$"
lexus-omsk #
08:26
надо тестировать правило... вспомнить бы ещё где этот интерфейс - он наглядно показывает - что матчится, а что нет
ss__ #
08:26
},
08:26
{
08:26
"key_re": "^message$",
08:26
"value_re": "Interface Ethernet\\d/\\d\\/\\d(\\d) has turned into DOWN state"
08:26
}
08:26
]
08:26
}
08:26
]
08:26
Subject:
08:26
SYSLOG: Jan 19 07:41:00 33-Machin24p2 %%01IFNET/4/IF_STATE(l)[21648]:Interface Ethernet0/0/22 has turned into DOWN state.
08:26
noc-classifier is failed to find appropriative classification rule for following syslog message: Jan 19 07:41:00 33-Machin24p2 %%01IFNET/4/IF_STATE(l)[21648]:Interface Ethernet0/0/22 has turned into DOWN state.
08:26
матчится
08:26
наглядно
08:28
Test regular expression Interface Ethernet\d/\d\/\d(\d) has turned into DOWN state
lexus-omsk #
08:28
я бы вместо \d писал бы \d+... на всякий случай
ss__ #
08:28
SYSLOG: Jan 19 07:41:00 33-Machin24p2 %%01IFNET/4/IF_STATE(l)[21648]:Interface Ethernet0/0/22 has turned into DOWN state.
08:29
Yes Matched
08:29
lexus-omsk, чем отличается от \d(\d)
08:29
Vars
08:29
Name Type Required Description
08:29
interface interface_name Yes Affected interface
08:29
в конце правила
08:30
может быть надо как то имя интерфейса или номер отдавать в Event class
08:30
?
lexus-omsk #
08:30
кстати да, а где группа, обозначающая интерфейс?
08:30
посмотри примеры в других профилях
ss__ #
08:31
lexus-omsk, что за группа? Как писать? Примеров то нет(
lexus-omsk #
08:32
да любое другое правило...из встроенных - тоже взять Link Down от другого профиля
ss__ #
08:32
^message$ [Test RE] (?:INFO:|INFO\(6\)) Port (?P<interface>.+) link down$
08:32
вот с длинка
lexus-omsk #
08:32
да-да... интерфейс - вот что надо
ss__ #
08:33
можно на пальцах разобрать строчку (?:INFO:|INFO\(6\)) Port (?P<interface>.+) link down$
lexus-omsk #
08:35
будет что-то вроде "value_re": "Interface Ethernet(?P<interface>\d/\d/\d+) has turned into DOWN state"
Dmitry1 #
08:37
ss__: Обычный regex. (?P<>) - это расширение regex для питона
ss__ #
08:38
стало чуть понятнее, спасибо! После обеда начну пробовать.
dvolodin #
08:39
lexus-omsk: да, новый ключ надо, можно и два использовать одновременно
Dmitry1 #
08:39
(?:INFO:|INFO\(6\)) - сюда попадают значения INFO: и INFO(6)
ss__ #
08:39
а что это за значения?
Dmitry1 #
08:39
.+ осначает любую последовательность символов
dvolodin #
08:39
ss__: \d+ там
08:40
может быть несколько цифр
Dmitry1 #
08:40
dvolodin: не-не. Это загадочный D-Link 1 порт может быть как 1, 1/1, 1:1
08:41
ss__: Матчится, например следующие строки
08:42
INFO: Port 1 link down
08:42
и
08:42
INFO(6) Port 1 link down
lexus-omsk #
08:42
Dmitry1: я бы разбор начинал со слова Port, а насчёт INFO и прочего не стоит заморачиваться... оно в данном случае не несёт смысловой нагрузки
ss__ #
08:42
lexus-omsk, впринципе верно, инфо не нужно)
lexus-omsk #
08:42
насколько проще бы стали правила
ss__ #
08:43
еще б заставить huawei s2300 слать трапы... сколько мучаюсь все никак не выходит. Скоро снифером встану и буду смотреть что ж эта падла шлет
Dmitry1 #
08:44
ss__: http://docs.python.org/library/re.html
08:44
Там смотри описание (?: и (?P
lexus-omsk #
08:46
я тоже похоже в ближайшее время присоединюсь к обладателям железок на букву Ху... прислали s5303 и s9303
08:46
+
gnu-linux #
08:51
dvolodin идентификаторы это наверно черезмерно , IP вполне хватает чтобы установить связь между объектами разных систем..
dvolodin #
08:54
да не
08:54
надо соответствие устанавливать не только для железа
09:14
misak, roman_d, проверьте NOC-298
roman_d #
09:15
hg pull?
09:16
я хз какой у меня счас релиз нока)
09:16
вчерашний)))
dvolodin #
09:16
hg tip
09:16
или ./scripts/about | head -1
roman_d #
09:16
5544
dvolodin #
09:16
до 5550 обновись
09:19
У Juniper EX вывод немного отличается от M-ок
roman_d #
09:20
обновился
09:20
счас затестю
09:21
печалька, но трэйсбэк(
dvolodin #
09:21
./noc debug-script get_interfaces <имя железки>
roman_d #
09:21
так то он хавает сволота
09:21
а через веб в трэйсбэк падает
dvolodin #
09:21
рестартовать активатор надо
roman_d #
09:22
а /etc/init.d/noc-launcher stop & start этого не делает?
dvolodin #
09:23
делает
09:23
что в traceback
roman_d #
09:24
ща кину, сек
09:24
а что за имя железки?
09:24
как она у меня добавлена в MO
09:24
или как она от производителя обзывается?)
dvolodin #
09:24
имя MO
roman_d #
09:25
ок
09:25
выдрал всё
09:25
дебаг-скрипт
09:26
в НОК-298 вставил трэйс
09:28
сорри, переоформил коммент)
dvolodin #
10:05
уже лучше, дальше проскочили
ss__ #
10:18
4f17ed8c08b5412ed000a5f4 33-machin13p2 19.01.2012 14:16:44 Active Unknown | Syslog SYSLOG: Jan 19 10:16:51 33-Machin13p2 %%01IFNET/4/IF_STATE(l)[24655]:Interface Ethernet0/0/14 has turned into DOWN state.
10:19
Class - Unknown | Syslog что значит? не класифицировалось?
dvolodin #
10:22
да, fallback класс
10:25
по NOC-289
10:25
hex2bin
10:25
может быть, лучше возвращать список boolean?
ss__ #
10:39
dvolodin, fallback класс что означает? Не класифицированно? Как же заставить работать?
dvolodin #
10:40
подобрать регулярное выражение
10:40
при изменении правил классификатору нужно по башке SIGHUP'ом бить
ss__ #
10:42
http://pastebin.com/v8fJJ7T3
10:42
вот трайсбек
10:43
при попытке Event has been reclassified
Tweet
Share this page
Share this page: Tweet