nocproject.org
06:22
dvolodin: можно пнуть тебя на тему network map
06:23
есть потребность, чтобы оно таки пришло в нормальный вид
06:23
там вроде хотели движок менять
06:52
а совесть поменять?
06:56
да какая тут совесть
06:58
вот и я говорю - какая
06:59
как сказал один герой
06:59
страшные муки моей совести давно привели к ее смерти
07:14
zi_rus: карту если переделывать, то комплексно
07:14
сделать уровни в object profile для начала
07:14
убрать в карте селекторы вообще
07:14
и плясать от объекта
07:15
чтобы по ней шастать можно было
07:17
привет
07:18
только начал разбираться в НОК
07:18
подскажите пожалуйста, как реализовать автодисоквери топологии по макам
07:20
по макам чего?
07:20
нок может только роутеры в порты свичей по макам втыкать
07:21
сеть L2
07:21
L2+ управляемые свичи
07:21
DES-3526
07:22
пробуй другие протоколы
07:22
stp, lldp
07:22
lldp в процессе - вечером стенд соберу проверю. Просто видел в описании что может по макам, вот и решил проверить
07:49
evyscr: с патчем вроде справилось, и интерфейсы определились нормально
07:49
вон там Dmitry1 пришёл, ему скажи
07:51
Dmitry1: rev 10782 бажный
07:51
была проблема, на трех одинаковых коммутаторах, с одинаковой прошивкой возникали разные проблемы
07:51
freenetwork: по stp в длинках не умеет, длинк не отдает того, что нужно для линковки
07:51
на одном серийны не определился, на друом интерфейсы и тп
07:51
evyscr: ткни меня пальцем в коммит
07:53
10782:b2bf9e9affc9
07:53
reset_cli_queue(), подозреваю, нехорошее делает
07:54
lf
07:54
да
07:54
а что не так?
07:55
на ряде длинков в вечноцикл впадает
07:55
fumufu86: какие у тебя были?
07:56
я засёк на 1210-28/me/b2
07:56
костыль делался для DES-3226 и DES-3326
07:56
а ресет делается для всех
07:56
ок
07:56
сейчас попробую сделать другой мегакостыль
07:57
у fumufu86 вроде 3627
07:57
да
07:57
и не только
07:58
ну, здесь вопрос про тех, на ком get_interfaces перестал работать
07:58
на некоторых 3528 определяется только 6 портов
07:58
на некоторых 0
07:58
дайте костыль сделаю, а потом уже 3529 займусь
07:59
3526 та же проблема
08:09
пофиксил
08:09
fumufu86: доступ на 3528, на котором не определяются порты дашь?
08:36
"8[13:56] evyscr: а ресет делается для всех"
08:36
подтверждаю, gte_interface стали периодически крэшится, без стабильного повтора в дебаге
08:49
TSergey, у меня так же
08:49
тысячи их :)
08:50
а я не обновлялся :P
08:51
я правильно понял, что Дима выложил патч?
09:02
ребят помогите с автодискавери, настроил на двух свичах lldp, system_name соответствует названию свича в noc, через так получаю get_lldp_neigbors но в инветори не рисует линки
09:03
e_zombie: нок с зуавеями s9300 - Дружит? ты кажется issue создавал чтобы get_version дергал версию патча, его не реализовали?
09:03
через task в service activation получаю соседей
09:04
с патчами не порешали. поговорили как это хранить и забили.
09:05
ясно
09:05
придется самому дописывать
09:06
Илья, дружит. у меня их до фига.
09:06
а инвентори кто то делал, доделал ?
09:06
freenetwork: длинки?
09:06
да
09:07
задача построить топологию, карту. пришел на работу - так тут ни одной схемы, есть просто пинговалка, и база со свичами, думаю lldp включить на всех скриптом, и загнать в нок
09:07
у меня нок пустят в продакшен с первого апреля.
09:07
freenetwork: блин, кто там в Москве живет, дайте на тест Диме пару длинков
09:08
e_zombie: пробовал, не получается. отрубаюсь прежде, или жена разгоняет меня с кумом
09:09
не просто боль, а попаболь
09:09
freenetwork: спасибо, возникла тема про get_version + patch, Хочу нок заюзать, пусть железяки работают
09:10
ой, freeseacher имел ввиду
09:10
freeseacher: а там все работает? и get_interfaces и конфиг и вообще?
09:11
получится ли qtech прикрутить к noc? кто-нибудь пробывал?
09:11
у меня пара тысяч есть
09:11
2800 8200
09:11
Дима пилил профиль для 2800
09:11
если не ошибаюсь
09:11
профиль для низ qsw2800
09:12
а логи нелья просто грохнуть? чето нок после апгрейда не поднимается :)
09:15
а, монго не поднялась чего-то
09:21
09:25
я подарок всем сделал в последнем коммитк
09:26
ахцуеть
09:26
да ты сцпермен
09:40
Коллеги, напомните, где крутить таймауты для медленных команд, запускаемых в run commands?
09:43
TSergey: про поиск в 1562 что-то неясное. там вроде вообще js поиск работает
09:45
если находится не в первой строчке конфига, то поиск не вызывается
09:45
*ноходиться
09:45
о, нет
09:46
точнее если не "ткнуть в конфиг", то поиск не перехватывается
09:46
lexus-omsk: смотри конфиги активаторов
09:46
а не в скриптах или профилях (которые init.py)?
09:46
а не. нок конф. в конфе есть примеры
09:47
народ, кто разбирался с nginx ? почему в noc-web.log я вижу такие строчки:
09:47
Файл: noc.conf Строка 639 Позиция 18132 байт 99%
09:47
[script_timeout]
09:47
# Script timeouts, in seconds
09:47
# Default timeout
09:47
default = 120
09:47
# Custom timeouts in form:
09:47
# <script name> = <timeout>
09:47
Alcatel.7302.get_config = 1800
09:47
Alcatel.TIMOS.get_arp = 240
09:47
Alcatel.TIMOS.get_config = 850
09:47
2015-03-25 11:45:36,795 [tornado.access] 200 GET /sa/managedobject/js/InteractionsPanel.js?_dc=1427276350202 (127.0.0.1) 1.98ms
09:49
e_zombie: ок, попробую... мне для прошивки длинков, что-то он совсем уж долго льётся
09:49
шей через рун коммандс там можно сделать таймаут
09:49
/noc cli-commands -d --timeout=900 @all.cisco.76xx -i $BASEDIR/command.sar.cisco.txt > $BASEDIR/out.sar.cisco.76xx.txt
09:50
о, точно... а я через вебку пытаюсь... спасибо
09:51
сейчас в вебке адаптивный таймаут и там вроде всё ок сейчас
09:55
Dmitry1 а в чём странность?
09:56
lexus-omsk: как бы nginx должен js файлы обрабатывать
09:58
у меня тоже проскакивают иногда подобные
10:00
но nginx (у меня - apache) обрабатывает же только статику, нет?
10:18
Dmitry1: как нжинксу сказали - так и передаёт
10:19
я настраивал из мануала
10:19
вроде как только location /media/ и location /static/ же по рекомендации? или уже поменялось?
10:23
что-то новенькое, да
10:26
чойта я задумался, не надо ли там слеш в самом начале
10:27
типа location ^/(
10:39
поменял, у меня остался только /main/desktop/templates/About.js?_dc=1427279895311
10:39
(что логично)
10:39
если чо, поменял в location и rewrite
10:40
по идее это уменьшит нагрузку на noc-web?
10:40
ну да
10:41
для того же и апач за нжинкс содют
10:42
10:43
и увеличит на nginx
10:43
а где выхлоп
10:43
нжинкс не на питоне
10:44
и кеширует
10:44
не увеличит, конечно
10:44
всё и так через нжинкс идёт
10:45
сделай diff, чтобы было видно, где что поменялось
10:46
да, я как раз подумал что через nginx все и идет
10:46
evyscr: сделай diff
10:48
e_zombie: через web-ку по таймауту отваливается, Cancelled, попробую из cli, с явным указанием таймаута
10:49
Dmitry1: мой файл конфига для диффа не подойдёт
10:50
ванильного конфига у меня нет
10:50
10:50
"evyscr: если чо, поменял в location и rewrite" - я не телепат
10:52
лоль, там добавился слеш после ^
10:53
и перед скобкой
10:53
Dmitry1:
10:53
-location ~ ^([^/]+)/([^/]+)/(js|css|img)/(.+)$ {
10:53
+location ~ ^/([^/]+)/([^/]+)/(js|css|img)/(.+)$ {
10:53
-rewrite ^([^/]+)/([^/]+)/(js|css|img)/(.+)$
10:53
+rewrite ^/([^/]+)/([^/]+)/(js|css|img)/(.+)$
10:54
У меня IRC клиент не умеет diff'ы выделять синтаксисом
10:54
это не дифф :)
10:54
"^([" --> "^/(["
10:55
ну скажем я попытался тебе написать чего поменялось
10:55
скажем что неуспешно
10:57
я и так очки ношу, но попытка в IRC клиенте разбирать регекспы я вно мне не по силам :)
10:57
Dmitry1: ну это-то тебе помогло? "^([" --> "^/(["
12:21
кто может переименовать модельки в инвентори
12:21
для соответствия реальности
12:32
zi_rus: Попроси у Димы коммит бит и переименовывай сам
12:32
zi_rus, а ты выроде делал массовое закрытие алярмов
12:32
и вроде даже где то описывал
12:32
не помнишь где ?
12:36
#./noc shell
12:36
from noc.fm.models import *
12:36
alarms = ActiveAlarm.objects.filter(managed_object=ManagedObject.objects.get(name="pe-1-nov41").id)
12:36
for a in alarms: a.clear_alarm("close")
12:36
<ArchivedAlarm: 54d4b5e84a5e68fd2cb54e27>
12:36
12:36
freeseacher: а ты в каком контексте спрашиваешь?
12:37
у меня маленький скрипт есть который по классу может их позакрывать
12:37
но он не под рукой
12:37
или да
12:37
по ссылке, это мой скрипт
12:38
ну ты же мне давал недельку назад)
12:39
zi_rus: ты тестировал валидаторы?
12:39
если бы они были
12:39
ну я на этой ветке
12:39
ну правила для цисок
12:40
но dvolodin не говорит что тестить
12:40
e_zombie: давай что-то конкретное, проверю
12:40
я только shutdown проверял
12:42
evyscr: твой дифф для конфига нгинкса ломает джанговские приложения
12:43
evyscr: все, ипам например
12:44
у меня сейчас народ озаботился вопросами аудита на агрегатарах сети. это около 300 хуавеев кутечей .
12:44
и мне интересно насколько это вообще работоспособно.
12:45
не работоспособно
12:45
ни хрена еще не реализовано
12:45
я вообще не понимаю что dvolodin просил протестировать
12:45
да
12:45
ну дергает оно факты
12:46
ок. спасибо за инфу.
12:46
ну работают валидаторы
12:46
а выхлопа нет
12:47
zi_rus: ну так как воспроизвести нерабочесть?
12:47
открыл, что дальше?
12:47
evyscr: ctrl f5
12:50
evyscr: видишь?
12:50
а, так это не я сломал :]
12:51
как бы тебе сказать...
12:51
это же нок
12:52
можешь банально весь блок закомментить и вернуться к тому, что блыо
12:53
да я уже вернулся
12:53
я просто говорю о баге
13:04
но это надо не мне говорить
13:04
anyway,
13:04
location ~ ^/(?!(media))(?!(static))([^/]+)/([^/]+)/(js|css|img)/(.+)$ {
13:08
TSergey: я вижу, ты коммитить можешь уже ?
13:09
evyscr: это улучшенный регексп?
13:10
location ~ ^/(?!(media|static))([^/]+)/([^/]+)/(js|css|img)/(.+)$ {
13:10
вот улучшенный вроде как
13:12
и что там улучшено?
13:12
я просто документацию обновляю
13:18
а ты замем медиа и статик туда засунул
13:18
тогда уже полный вариант давай
13:31
в смысле, зачем?
13:32
та проблема - в обработке статики из предыдущих location.
13:36
13:38
вроде как по докам должно было хватить break; в предыдущих - но почему-то не хватило
13:39
народ, протестируйте
13:39
а я потом документацию обновлю
13:43
Dmitry1: вроде работает
13:44
т.е. документацию обновлять?
13:49
ты такие вопросы задаешь
13:49
evyscr: новый конфиг точно на что-то влияет? его вписывать в доку?
13:49
как минимум у меня он сработал
13:55
ну блин.
13:55
найдите спеца по нжинксу, спросите у него.
13:57
(но вообще у меня работает)
13:58
как было раньше: location не матчился никогда
13:59
как стало: location проверяется на не /media,/static и матчится на /js/ третьего уровня
14:02
вероятно, регэксп считается более длинным совпадением, нежели /media/, поэтому пришлось добавить исключение
14:03
ещё имеются /js/ четвёртого уровня, они в данный регэксп не попадают -> обрабатываются торнадой
14:14
обнаружил странность, когда открыл коммутатор в ноке с адресом 10.14.4.26, обнаружил в нём конфиги и интерфейсы от коммутатора 10.11.4.94
14:15
как такое могло пройзойти?
14:33
закешировалось в браузере
14:35
этот коммутатор не открывал с обновления системы
14:36
другие коммутаторы открываются правильно
14:37
эти конфиги в базе где нибудь к ID профиля MO привязываются?
14:40
ты дебажни, может он действительно это получает и все правильно
14:42
хм
14:42
дерьмо какое-то
14:43
something is rotten
14:44
интерфейс-дискавери запускается чуть ли не раз в полминуты
14:47
пиздец какой-то
14:47
так небось на разных железках
14:47
в файледах, разумеется, ни хера
14:47
хера, на одной
14:48
причём debug-script отрабатывает нормально
14:48
пиздец это вот
14:48
[inv.discovery] Job ip_discovery(SAE) is failed
14:50
а еще пиздец что на импортных железках не активировался version discovery пока я их не засейвил повторно
14:50
приче не на всех
14:50
а на половине
14:50
прям через однц
14:50
zi_rus:это коммутатор snr, во вкладке discovery у него interface_discovery fail. тем не менее у него конфиг и интерфейсы от хуавея
14:50
амы тут в сае нашли подозрение на пиздетц. у меня сау сожрал 510 метров оперативки
14:51
dvolodin: не пропускай представление, мы тут нок опять говном поливаем :)
14:51
Tasks: 1 total, 0 running, 1 sleeping, 0 stopped, 0 zombie
14:51
Cpu(s): 10.4%us, 3.6%sy, 0.0%ni, 83.5%id, 1.6%wa, 0.2%hi, 0.2%si, 0.5%st
14:51
Mem: 36139984k total, 13668396k used, 22471588k free, 560036k buffers
14:51
Swap: 1015804k total, 0k used, 1015804k free, 9686916k cached
14:51
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
14:51
9850 noc 20 0 526m 154m 12m S 0.0 0.4 13:33.17 /opt/noc/bin/python ./scripts/noc-sae.py launch -c etc/noc-sae.conf -i 0
14:51
обля
14:51
EXCEPTION: <type 'exceptions.UnicodeDecodeError'> 'utf8' codec can't decode byte 0x8f in position 45: invalid start byte
14:51
я ещё год назад предлагал чекелку на utf8 делать везде
14:51
от этой хуйни шедулер дохнет
14:52
хуй там год
14:52
уже 2 или три issue висит
14:53
нок - говнище
14:53
verified
14:54
а еще я запустил сегодня version inventory, а у меня доступны только несколько, а остальных пока нет, по ним пинг файлед висят, но нок все равно до таймаута на каждой из сотни повисел
14:54
dvolodin: реквестируем нахуй новые фичи, провести фиксинг багов
14:55
боян. я перед новым годом предлагал это
14:55
ну и что, никто ничего не пофиксил, вот теперь я предлагаю
14:56
нок таки лютое говнище, которое влёхкую убьёт ваши свичи
14:56
блять, стартовать каждые 15 секунд...
14:57
дезигн!
14:57
evyscr: сомневаюсь что даже если нок будет раз в 15 секнд выполнять пару команд, это что-то сделает свичу
14:57
сафети коде!
14:57
пару?
14:58
посмотри, блджад, DxS/get_interfaces
14:58
оказывается это не единичный случай, и у многих коммутаторов, левые интерфейсы и конфиги
14:59
evyscr: да, это пиздец, а не скрипт. но это ничего не меняет
14:59
нок же не заходит в 5 консолей и не ебашит эти команды параллельно
15:00
если память на железке не течет (у меня такое было), то ничего страшного
15:02
а знаете на чём эта хуйня падает? на записи лога в файл
15:02
0_0
15:02
ахуеть
15:02
не пиздишшь?
15:02
и, что характерно, падает вовсе даже не interface_discovery
15:03
а lldp_discovery от другого свича
15:03
какого хуя interface_discovery рестартится?
15:04
висит задача что порт упал
15:06
блять, это же такой зашквар...
15:08
но придёт dvolodin и всем расскажет про бездельников, энтерпрайз и т. п. и настанет щастье.
15:09
спаскуха. не отвлекай его от глючного сае. пусть дофиксит а потом уже философию
15:10
да тут не кран надо менять, а всю систему! (q)
15:11
падение одного джоба, получается, ведёт к рестарту всех запущенных в этот момент.
15:11
и даже не падение джоба ведь.
15:12
это ж пиздец
15:13
это уже не игра, это да пошли они нахуй (q)
15:13
сука
15:14
это уровень переполнения буфера же
15:14
лолд
15:14
давай завтора это обсудим
15:14
думаешь, подостынет?
15:14
у меня ксожалению емть только смтараю фотка по этому поводу
15:15
15:15
пизда всему (с)
15:16
я уш1ёл
15:35
я уже 100 раз говорил об этом. когда скрипт каждые 30 секунд ломится на свич
15:41
evyscr: там скорее всего другая проблема
15:42
не подходит согласование ключей или пароль ssh. оно пытается вывести traceback об этом. Но при выводе в traceback части ключа ssh встречает не ASCII символ, и вываливается в traceback из traceback'а
15:42
Кстати, об этом issue тоже есть
15:43
дык, нехуй всё подряд считать валидным юникодом
15:43
у меня, к примеру, народ любит описания портов на русском делать
15:44
и NOC на этом вываливается
15:44
к примеру: "синий SFP"
15:44
это достаточно, чтобы NOC в даун ушел
15:45
и бесконечно пытался долбиться с get_interfaces на свич
15:45
15:45
но я бы понял повтор данного джоба
15:46
но оно же ДРУГИЕ запущенные перезапускает
15:46
а что за скрипт так крешится ? длинк ?
15:46
да
15:46
нет
15:46
шедулер крешится, похоже
15:46
удаленный свич - dgs-3627g ?
15:46
нет
15:47
3420
15:47
скрипты не крешатся
15:47
обнови прошивку на dgs-3420
15:47
это не моё дело
15:47
и обновлять вряд ли будут
15:48
могу костыль попытаться сделать
15:48
нет смысла
15:48
тут надо сам принцип менять
15:49
хер с ним, пускай не находит
15:49
но, блджад, всё рестартить - это за гранью
15:54
да, трейсбек при записи трейсбека
15:55
и, сука, издевательское имя функции safe_rewrite
15:58
evyscr: ща костыль зафигачу
16:00
я уже сам пишу
16:01
но костылить надо демона, мать его
16:02
пробуй фикс
16:02
тупо не распарсился IP адрес
16:05
evyscr: покажи вывод debug-script теперь
16:08
короче жопа
16:08
смотри: 'l\x8f#{'
16:08
ха
16:08
remote_port_subtype = 3
16:08
считаем символы: l, \x8f, #, {
16:09
итого - 4
16:09
т.е. двух не хватает
16:09
должно вывалить traceback
16:09
и в выводе traceback натыкается на символ \x8f
16:10
и умииииииирает
16:12
вобщем есть куда копать
16:12
внутре должно быть .encode('escape-unicode')
16:13
вот поэтому я поотключал discovery на всех своих свичах
16:14
лично я не понимаю причину, по которой имя/описание порта/влана/MO нельзя задать русскими буквами
16:16
Я подозреваю, что не ascii символами нельзя задавать и профили MO
16:17
т.е. у нас не будет профилей "Эльбрус", "Байкал", "Кроникс", "Гранч" и т.п.
16:18
16:20
он не находил интерфейсы, потому что не пытался?
16:20
fumufu86: лечится нажатием кнопки "save" в MO
16:21
Dmitry1: почему на run discovery now не реагирует?
16:22
нажми кнопку "save"
16:22
почему так работает - не знаю
16:23
dvolodin принципиально баги не лечит, а только добавляет новые фичи
16:23
уже
16:26
не помогла
16:26
16:26
время следующего запуска, на секунду раньше текущего
16:39
хм
16:39
если я правильно понял - в job_log смесь string и unicode
17:04
бгг, выясняется, что ещё и питон говно.
17:05
и raw у него не чистые raw
17:06
"Paradoxically, a UnicodeDecodeError may happen when _encoding_."
17:43
на С значит пора переписывать
17:43
начинатьс с простого
Share this page
Share this page: