About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 24.03.2015
freeseacher #
04:57
TSergey, раскурил
TSergey #
04:57
выдыхай
04:57
т.е. рассказывай
freeseacher #
04:58
ну короче форк то в конечном счете он делает
TSergey #
04:58
ага, я тоже увидел, что несколько репо болтались
freeseacher #
04:58
но не может сделать именно пул реквест из за расчета дифа между develop и default
04:58
Володин ржет на эту тему :)
04:59
(17:24:30) Дмитрий Володин: hg diff -rdefault:tip | wc -l
04:59
326123
04:59
(17:24:31) Дмитрий Володин: :)
04:59
так вот после тогокак у тя получился форк и ты внес в него изменения надо тыкнуть кнопку пулреквест у себя в репе
04:59
и выбрать правильную целевую ветку нока
04:59
тоесть Develop
TSergey #
05:00
freeseacher: ты же видел, что у меня получился реквест? (ну т.е. у меня путь, который дает его сделать, описан)
freeseacher #
05:09
https://kb.nocproject.org/pages/viewpage.action?pageId=19169620
TSergey #
05:10
freeseacher: крут, спасибо
05:13
я себе еще пометил
05:13
Fork
05:13
Project management [x] Issue tracking
05:13
Commit
05:13
[ ] Create a pull request for this change (не ставим)
05:13
Create a pull request
05:13
Close branch [ ] (не ставим)
freeseacher #
05:14
у тя морда на английском да ?
TSergey #
05:14
ага
e_zombie #
07:28
..
fumufu86 #
07:54
при попытке upgrade стало выдавать http://pastebin.com/J74PQfLw
07:55
хотя выполняю sudo ./scripts/upgrade
07:56
права у рут стоят только чтение, у текущего пользователя чтение и запись
e_zombie #
07:57
ls -la ./noc/etc
fumufu86 #
07:59
http://pastebin.com/aijbWdQC
dvolodin #
08:03
ну и правильно ругаеся
08:03
как noc будет свои конфиги читать?
fumufu86 #
08:03
rw вроде должно означать (read/write)
dvolodin #
08:03
руту, да
fumufu86 #
08:04
я обновлялся в воскресенье вечером, неизвестно почему врдруг сейчас проблемы возникли
08:05
пользователю нок права на чтение дать?
08:05
или на чтение и запись?
e_zombie #
08:05
dvolodin: NOC-1555
TSergey #
08:05
fumufu86: а что если запустить апргрейд от рута?
dvolodin #
08:06
владельца на conf ему дай
fumufu86 #
08:06
root@ubuntu:/opt/noc# ./scripts/upgrade это разве не от рута?
dvolodin #
08:07
e_zombie: а посмотри, у тебя uuid в object models как лежат
08:07
строкой или в бинарном виде?
e_zombie #
08:07
ээээээ
TSergey #
08:07
fumufu86: "fumufu86: хотя выполняю sudo ./scripts/upgrade" так или не так?
dvolodin #
08:07
db.noc.objectmodels.find({}, {_id: 0, uuid: 1})
08:07
они либо строкой, либо Binary ....
08:08
BinData
e_zombie #
08:09
> it
08:09
{ "uuid" : "81e1867e-4297-4cd0-84f5-46931022868e" }
08:09
{ "uuid" : "d1ed4fcb-b38d-4d9b-9feb-6509314e4487" }
08:09
{ "uuid" : "be8387a2-f52f-4abf-a6b7-eb6657c2f063" }
08:09
что то типа такого
fumufu86 #
08:09
root@ubuntu:/opt/noc# sudo ./scripts/upgrade даже если так, результат тот же
e_zombie #
08:10
может это изза того что в своё время я удалил Root для инвентори и потом запускал
08:11
./noc migrate inv 0002
dvolodin #
08:16
нет
08:16
это из-за того, что старый mongoengine держал uuid'ы как строку
08:17
а более новый стал держать как бинарные данные
08:20
наверное фикс нужно будет доработать на перебивку старых id
zi_rus #
08:22
dvolodin: ну так что с валидацией конфигов? xnj tot ghjdthbnm&
08:22
*что еще проверить?
dvolodin #
08:22
да
08:22
там новый валидатор
08:22
проверяет наличие всех строк в конфиге
08:23
но при этом они не обязаны идти подряд и вообще могут быть вразнобой
e_zombie #
08:23
и что мне делать?
dvolodin #
08:24
терпеть
08:24
дойтут руки - поправлю
08:24
сейчас срочное накатило
e_zombie #
08:24
не могу терпеть. у меня дискавери не канает .
zi_rus #
08:24
не можешь, иди в туалет :D
e_zombie #
08:26
http://i67.fastpic.ru/big/2015/0324/72/854d1312d85957f015e0a0682ff5f072.png думаешь так можно жить с моим размером сети?
zi_rus #
08:29
ну у тебя еще прилично
08:29
файлед почти нет
08:29
на фоне успешных скриптов
e_zombie #
08:30
у меня сеть 11 000 хостов. а теперь прикинь сколько одновременно должно выполняться всяких задачь хотябы по сбору конфигов.
dvolodin #
08:30
если раз в день -- то одна будет :)
08:30
одновременнто
zi_rus #
08:31
хотя бы конфигов должно быть совсем мало если правильно настроить и железки умеют отсылать config changed
dvolodin #
08:31
e_zombie: таймаут пока
TSergey #
08:32
zi_rus: а что значит в этом смысле правильно? ты ставишь опрос конфигов реже чем раз в сутки?
zi_rus #
08:33
намного реже
08:33
раз в месяц я делал
08:33
все равно железка присылает конфил ченж
08:33
и свежий конфиг у меня через 10 минут
08:33
а если он не меняется
08:34
нехер дергать его раз в день
TSergey #
08:34
ну ты же про циски?
zi_rus #
08:34
ну я да
08:34
я и говорю что если железка посылает config changed
08:34
на самом деле там покрутить шары надо
TSergey #
08:35
длинк тоже шлеттакие сообщения, но на длинке можно внести изменения и не засейвить
zi_rus #
08:35
на config saved тоже можно привязаться, его посылают гораздо больше железок
e_zombie #
08:35
делайте доку.
zi_rus #
08:36
сначала надо порядок навести
e_zombie #
08:36
у меня сейв конфигов раз в сутки позволяет отлавливать косяки всяких пидорасов.
TSergey #
08:36
а, вот я не уверне что на длинке он понимает чэнджет без сэйва
zi_rus #
08:36
e_zombie: я срался со вторым Дмитрием по поводу этого
08:37
он на длинках конфиг сейв классифицирует как конфиг ченж
08:37
что бред
TSergey #
08:37
даже не так, уверен что не шлет без сэйва
zi_rus #
08:37
но типа зато джоб так реагирует
08:37
хотя надо классифицировать сообщения править
08:37
*правильно
08:37
просто триггер привязать на оба класса
08:38
но никто этого не сделал
08:38
а писать доку по наркомании не мой стиль
TSergey #
08:38
zi_rus: ты опять "вещаешь", повторяю, длинки не шлют сообщения о чэндже конфига, если его не засейвить (в части snmp трапа я это отслеживал)
zi_rus #
08:38
конфиги надо сейвить
08:39
не только на длинке
08:39
а если не сейвишь то собирай чаще
TSergey #
08:39
ну да, а экономика должна быть экономной
zi_rus #
08:39
кроилово ведет к попадалову
08:40
это тебе про экономику
08:40
поэтому и нужен контрольный забор конфига раз в месяц
08:40
если вы не сохранаете конфиги
TSergey #
08:40
zi_rus: что значит "не сэйвишь"? я как раз вынужден собирать чаще, чтобы поймать косяк других спецов, которые поправили что-то, но не засейвились
zi_rus #
08:40
я в общем
08:41
я говорю, что у вас не сейвят
TSergey #
08:41
а ты упертый
zi_rus #
08:41
как ты заметишь что они не засейвились?
TSergey #
08:41
повторяю: у нас сейвят
e_zombie #
08:41
брек
zi_rus #
08:41
если сейвят то что ты шумишь?
TSergey #
08:41
мне не нуно ловить "засэйвились или нет", я ловлю дифф
e_zombie #
08:41
нате вам фоточки и оставьте клавы на 10 минут https://pp.vk.me/c622321/v622321151/299e4/YPwYPB7xnR4.jpg
Intal1 #
08:41
Добрый. Если noc не осиливает собрать конфиг c какой либо из железок, где можно логи посмотреть?
e_zombie #
08:42
/noc debug-script Cisco.IOS.get_version asw2-72-eng/noc debug-script commands sx8-pu76 'commands=["show ver","show module","show int brief"]'
08:42
/noc debug-script Cisco.IOS.get_version asw2-72-eng
08:42
/noc debug-script commands sx8-pu76 'commands=["show ver","show module","show int brief"]'
zi_rus #
08:42
Intal1: sa > report > failed scripts
08:43
TSergey: ты понимаешь что на сети в 100к железок где конфиг за сутки меняется максимум на 1к, нок будет зря дергать 99к железок?
TSergey #
08:43
понимаю
zi_rus #
08:44
ну вот про это я и говорю
08:44
это геморой и ноку и железкам
e_zombie #
08:44
это конечно гуд. но у нас нет таких сетей
zi_rus #
08:44
поэтому правильно работать по триггерам
TSergey #
08:44
но необходимость увидеть изменения дороже этого дерганья
zi_rus #
08:44
совершенно нет
TSergey #
08:44
у тебя нет, у меня да
zi_rus #
08:45
нок это бекап на случай факапа
08:45
если конфиг не засейвили
08:45
и свич ребутнулся
08:45
это проблема того кто не сейвит конфиги
08:46
если ты при этом потеряешь связность с железкой, тебе дифф не поможет, от слова совсем
08:46
а если нет, то ничего страшного
08:46
зашли и поправили
TSergey #
08:46
я узнаю кто и что перенастроил
08:46
что и есть цель такого опроса
08:47
точнее одна из целей
zi_rus #
08:47
я тебе по секрету скажу, есть такая вещь как аудит/аккаунтинг, который запишет все команды которые выполнялись на железке, и не только те что изменяли конфиг
08:47
это правильный подход
08:48
а диффы ты используешь не по назначению
e_zombie #
08:48
где дока как настраивать?
zi_rus #
08:48
что?
TSergey #
08:48
zi_rus: не допускаешь что ты ошибаешься?
e_zombie #
08:49
у нас запретили на пе выводит лог команд в сислог
zi_rus #
08:49
TSergey: я рассуждаю с точки зрения правильной организации процесса, но допускаю что твое оборудование что-то из этого не умеет - только проблемы с оборудованием есть причина делать неправильно
08:49
e_zombie: а мотивация?
08:50
на цисках можно фильтрануть логирование
TSergey #
08:50
zi_rus: ну просто ты неправильно рассуждаешь, вот и все
e_zombie #
08:50
хз. пришло письмо из головы
zi_rus #
08:50
что в лог оно не будет попадать а в сислог отправится
08:50
TSergey: то есть у вас в очередной раз кончаются аргументы, а я логичен как всегда
TSergey #
08:51
ну какие тебе аргументы? я пишу что так смотрю что настройки коммутатра изменили, ты отвечаешь, что это нужно ловить логированием комманд --- это логика?
08:52
впрочем засим умолкаю, ты гуру и у тебя самое правильное представление о сети :)
Intal1 #
08:53
zi_rus: в ходе дебага выяснилось, что после обмена ключей SSH получаю Tick Resetting wait ticks
zi_rus #
08:53
ну вот и смотри, на твоей сети это работает, ибо разница не принципиальна, для маленьких сетей допустимы некоторые вольности, а когда оно подрастает до уровня e_zombie, то возникает боль, о чем он сейчас и пишет
e_zombie #
08:53
https://pp.vk.me/c622321/v622321151/29a1c/g5O-Nv-D1FY.jpg
TSergey #
08:54
zi_rus: и? возникнет боль, нужно решать проблему, а не исключать необходимый элемент контроля?
zi_rus #
08:54
Intal1: ты на пастебин куда-нибудь скинь что-нибудь
TSergey #
08:55
повторю, опрос конфига раз в сутки для меня менее затратная процедура, чем эвристический поиск в логируемых командах
08:55
а с учетом, того что лог замусоривается влет, то еще и теряю локальный лог, что иногда неприемлиемо
zi_rus #
08:56
TSergey: я тебе сказал, ты можешь привязать триггер на какие-то сообщения в сислоге и он будет забирать с адекватной частотой
TSergey #
08:56
и самое печальное, не вижу что тут неправильно в "организации сети"
zi_rus #
08:56
когда сеть подрастет, начинаешь проблемы испытывать о чем раньше не думал
TSergey #
08:56
zi_rus: вполне логично, а на какие сообщения?
zi_rus #
08:57
а какие у тебя железки7
08:57
я же не знаю
TSergey #
08:57
длинки, L2
zi_rus #
08:57
и не знаю что они шлют
08:57
да хоть юзер логин
08:57
и если юзер отлицен от нока
08:57
(или юзел логаут)
08:57
ведь кто-то зашел и что-то сделал
08:58
все равно на 90% железок никто не заходит большую часть времени
08:58
хоть пируль напиши
08:58
хоть что
TSergey #
08:58
техпод зашел, смотрел ошибки на порту клиента --- зачем мне дергать конфиг?
zi_rus #
08:58
это все локальный тюнинг
evyscr #
08:58
на некоторых хренях юзер только один
Intal1 #
08:58
http://pastebin.com/GmrY4c8W
zi_rus #
08:58
а зачем его дергать когда туда даже не заходил, даже техпод
08:59
Intal1: да, боль. что-то с ssh возможно. спроси dvolodin
TSergey #
08:59
ну не знаю, например поменяли его :)
zi_rus #
09:00
тогда сработает пинг файлед
09:00
он рестартует все дискавери
09:00
после оживления
09:00
с этим как раз норм
TSergey #
09:01
я не пользую пинг
zi_rus #
09:02
а виноват значит я
09:02
нок интергрированная сама в себя система
TSergey #
09:02
заметь, ты говоришь что я неправильно использую дифф и механизм сбора конфигов
zi_rus #
09:03
я не могу начать рисовать графики с портов пока не научу профиль для хууавея собирать ифиндексы
TSergey #
09:03
а мои брюзжание поверхностно-личные, и я ни разу (надеюсь) не говорил, что у тебя что-то неправильно настроено или используется
zi_rus #
09:03
TSergey: ты и нок неправильно используешь, пинг оптимизирует работу нока, он не пытается ломиться на железки которые лежат
09:04
:)
TSergey #
09:04
да, и нок неправильно и сеть плохого дизайна и оборудование кривое, ты тут прав
09:06
и неправильная организация процесса
zi_rus #
09:07
для разных сетевых протоколов есть куча настроек для оптимизации и тюнинга, большинство их не использует, ибо оно и так приемлемо работает, но когда условия изменятся, уверен и ты полезешь на железки исправлять
09:07
так же и с ноком
09:07
и со всем остальным
TSergey #
09:08
да, ты прав"
zi_rus #
09:09
я знаю что я прав
09:10
а ты считаешь что ты прав
TSergey #
09:10
э, а ты сейчас о чем?
zi_rus #
09:11
да я о всем
09:11
если бы у нас была одинаковая точка зрения, нам не о чем было бы спорить
09:12
но ты почему-то обжаешься когда не можешь защититься
TSergey #
09:12
мы не спорим, ты говоришь что мои решения неправильные
zi_rus #
09:12
конечно
09:12
по-моему, они неправильные
TSergey #
09:13
а альтернатива от тебя звучит как "правильный дизай + нормальное оборудование + правильная организация процесса"
zi_rus #
09:13
вернее, неправильных решений нет, я считаю их неоптимальными
09:13
нормальное оборудование сложно получить, все остальное зависит от тебя
TSergey #
09:13
а тут точно не соглашусь "ежедневнй конфиг + дифф + нотификэйшн", в текущих реалиях, наименее затратная штука
09:13
zi_rus: нет, увы и дизайн определяю не я
09:14
и правила работы на устройствах тоже нет
zi_rus #
09:14
ты можешь повлиять на тех кто определяет, если сможешь обосновать свои предложения
TSergey #
09:15
ну ты опять прав, и это же одна сторона медали, а с другой нужно технически поймать "надмозгов"
zi_rus #
09:15
наименее затратная с точки зрения первоначальной настройки, но в общем случае, дешевле будет оптимально настроить чем идти покупать более мощный сервер
evyscr #
09:15
сферический конь в вакууме
zi_rus #
09:15
отнюдь
09:15
вопрос статистики
TSergey #
09:15
дешевле настроить нок? да он если процентов на 30 работает, то хорошо
zi_rus #
09:16
статистически более вероятно решить проблемы настройкой, хотя возможны случаи когда это не поможет
evyscr #
09:16
zi_rus: ты таки рассуждаешь про сферического коня
TSergey #
09:16
я фм бросил после того, как с десяток раз попросил загрузить актуальные мибы для моего оборудования
zi_rus #
09:16
TSergey: я тоже с десяток раз просил, потом сам локально все загрузил
TSergey #
09:17
ок, а я не разобрался, увы
zi_rus #
09:17
evyscr: я вынужен, мы говорим про общий случай
TSergey #
09:17
я не говорю про общий случай
evyscr #
09:17
дволодин уже сказал, что общий случай - напильник
zi_rus #
09:18
нет
09:18
общий случай это нок
evyscr #
09:18
учите питон, жс и правьте
zi_rus #
09:18
а частный - напильник
09:18
ну да
09:18
пилите под себя
09:18
я так и делал
09:18
это геморно
TSergey #
09:18
я говорю про то, что с моими длинками схема сбора "ежеденвный конфиг + дифф + нотификейшн" является, для меня, сейчас оптимальной
zi_rus #
09:18
особенно одному
evyscr #
09:18
в общем случае нок неприменим без лютого напильника
09:19
хуже всего то, что его невозможно пилить под себя с какой-либо гарантией
zi_rus #
09:19
evyscr: вот нет, применим, но просто надо совместить свои требования с возможностями нока
evyscr #
09:19
потому что завтра все твои наработки похерятся из-за апстримных изменений
zi_rus #
09:19
а несовместимости не использовать или шлифовать напильником
TSergey #
09:19
zi_rus: а идея с запуском того или иного дискавери по событию очень хорошая, я ее применю
zi_rus #
09:20
evyscr: если не править основной код, нок можно и без этого расширить, то проблем не будет
TSergey #
09:20
там где можно вычислить однозначность
evyscr #
09:21
zi_rus: wut? спасибо, я уже наелся.
TSergey #
09:21
например lld_discovery после валидации конфига, где изменились настройки lldp
zi_rus #
09:21
ты наелся. а мои пирули и sa application работают и хлеба не просят
TSergey #
09:22
get_version только после презагрузки
zi_rus #
09:22
и код надо иногда в апстрим отдавать, тогда время жизни будет больше
09:23
TSergey: про get_version после перезагрузки я даже уже говорил кому надо, но не запилил
09:23
*не запилили
evyscr #
09:23
мантяины в дистрах делят апстримы на вменяемые и не очень. догадайся, к какой категории отнесётся нок по ряду признаков?
zi_rus #
09:25
это вообще отдельный разговор. можно сказать что похер почему так происходит, а можно сказать что dvolodin один крутится и поэтому так происходит
evyscr #
09:25
окай.жпг
zi_rus #
09:27
вот-вот
dvolodin #
09:30
причем под дистрами мы понимаем только альт :)
09:30
другие как-то не пытались учить жить
09:31
дистры тоже делятся на те, под которыми нормально работает серьезный софт
09:31
и те, которые считают, что oracle - не очень :)
TSergey #
09:41
dvolodin: скажи, как ты придумал, какая логика при доступе к МО при заполненности и Auth Profile и юзер + пассворд и комунити
dvolodin #
09:42
по профилю должно быть
09:42
там вобще при выборе профиля поля прятать надо
TSergey #
09:43
и как-то и коммунити
evyscr #
09:43
dvolodin: если чо, альт - ненормальный дистр
TSergey #
09:43
а предложение при невозможности зайти по профили пользовать остальные --- сильно неправильное?
09:45
dvolodin: и делается ли ивент со стороны нока, что не смогли зайти?
09:45
точнее правильно ли было бы иметь такой ивент в фм
evyscr #
09:46
dvolodin: и ели чо (2), нок очень похож на альт
TSergey #
09:47
evyscr: что такое альт?
evyscr #
09:52
русске православне линукс
09:52
на самом деле, несколько другое
TSergey #
09:55
ок, понял
10:00
zi_rus: как заценить количество запущенного дискавери? или более развернуто: есть гет_инвентори, есть желание оптимизировать его запуск на "по-реже", как будем сранивать "до --- после".
10:00
[cat noc-discovery.log | grep 2015-03-23 | grep -c get_inventory]
zi_rus #
10:00
хз
10:00
я не знаю как можно вообще такой отчет получить
TSergey #
10:00
предложенный мною --- "в лоб", количество запусков за сутки, пойдет как оценка?
zi_rus #
10:00
я бы смотрел по количеству работающих скриптов
10:01
единовременно
TSergey #
10:01
это наверное второй шаг, например у меня будет не сильно видно
zi_rus #
10:01
тогда может и не стоит оптимизировать
TSergey #
10:01
[cat noc-discovery.log | grep 2015-03-23 | grep -c get_inventory]
10:01
дает количество запусков в сутки
zi_rus #
10:02
ну пусть будет так
TSergey #
10:03
zi_rus: предположим, что мы не всегда получаем событие о перезагрузке, в силу разных причин, может же такое быть? значит период сбора в дискавери не должен быть очень большим, ну мало ли.
10:03
например месяц
zi_rus #
10:04
я так же делал
TSergey #
10:04
ок
zi_rus #
10:04
но не про перезагрузку
10:04
там все равно пинг файлед должен быть
TSergey #
10:05
теперь если в fm ловим событие презагрузки, назначаем версион дискавери через пару-тройку минут
evyscr #
10:05
может вообще аптаймы собирать?
TSergey #
10:05
zi_rus: пинг файлед что бы исключить сбор раз в месяц если отключен? или сейчас про дургое?
evyscr #
10:06
про старт дискавери, видимо
TSergey #
10:06
evyscr: а как сюда прикрутить аптаймы?
zi_rus #
10:06
чтобы исключить вообще обращение к железке если она лежит
10:06
ну и про это тоже
10:07
пропинговывать раз в 120 секунд все железки не сильно накладно, зато удобно
10:07
нок не висит на таймауте если железка лежит
TSergey #
10:07
мы пока про версион дисквери:
10:07
- сбор раз в месяц
10:07
- пинг файлед, для исключения опроса выключенной
10:07
- опрос после фм-события рестарт
evyscr #
10:07
TSergey: аптаймы сами по себе не самая плохая вещь
10:08
просто вспомнился нотификейшн про low uptime
TSergey #
10:08
мне нужно чуть развернутей :)
zi_rus #
10:08
бывало уже такое что нок долбится на железку и висит по таймауту, решедулит дискавери и продолжает висеть, скрипты копятся, активаторы валятся
10:08
evyscr: и как с аптаймом работать?
TSergey #
10:08
zi_rus: из того, что перечилсил, пока все?
zi_rus #
10:08
а если я софт обновил и штатно перезагрузил?
10:08
TSergey: да, так
TSergey #
10:09
ок, запишу себе и посмотрим как реализовать
evyscr #
10:09
zi_rus: ну перезагрузил и ладно
zi_rus #
10:09
а нотификация мне зачем про аптайм тогда
10:09
и сколько
10:10
раз в час будет в мозг писать пока аптайм не вырастет?
10:10
я как бы повлят на аптайм не могу, временем не управляю
evyscr #
10:10
ну предложи свою метрику для оценки наличия рестарта
TSergey #
10:10
расскажите, как мы с версий на аптайм свернули?
10:11
и чего хотим сейчас про него?
evyscr #
10:11
я про него вообще вспомнил
TSergey #
10:11
а, типа смотреть сколько аптайм и это тоже событие для сбора
10:11
?
evyscr #
10:11
йуп
zi_rus #
10:11
evyscr: я пингую, мы пинг базовых станций вообще выкрутили на 10 секунд, у нас даже мышь не проскочит
evyscr #
10:11
и что?
10:12
у всех базовые станции?
zi_rus #
10:12
все могут выкрутить пинговалку, чтобы мониторить железки
evyscr #
10:12
пинг однозначно связан именно с ребутом?
zi_rus #
10:12
а это не важно
10:12
пинг определяет доступность
evyscr #
10:12
тебе не важно
zi_rus #
10:12
это root cause
10:13
а остальное детали
TSergey #
10:13
комрады, тайм айт
10:13
*аут
zi_rus #
10:13
я не могу предложить решение не зная задачи
10:14
определять ребут это не задача
10:14
но ты всегда можешь сделать метрику для PM и собирать аптайм и даже задать threshold
TSergey #
10:14
аптайм --- доступность железки из нока или локальный аптайм?
evyscr #
10:15
локальный, конечено
TSergey #
10:15
а такое железка тоже шлет?
evyscr #
10:16
не уверен
TSergey #
10:16
как мы его узнаем-то?
evyscr #
10:16
по запросу
TSergey #
10:16
а, ну тогда это я пока к гет_версион не пишу
10:17
evyscr: такой запрос будет стоить столько-же сколько гет_версион
evyscr #
10:17
хм
10:17
один snmpget, думаю
TSergey #
10:26
хм, нет чтоли трапа про перезагрузку, эххх
Night_Snake #
10:53
А напомните плиз, NOC уже научился подсасывать в IPAM записи из DNS-серверов? Или только прописывать?
10:55
dvolodin, возможно из DNS-сервера загрузить в IPAM?
11:08
все, нашел. NOC-975
ufir #
11:16
одна из моих железяк слала логи и снмп трапы на нок - как мне можно вытащить эти события из базы ?
zi_rus #
11:35
fm > events
11:35
возможно придется перейти в archived
11:36
но там все печально если нок не смог распознать сообщения
11:36
или ты из скрипта хочешь
evyscr #
11:41
db.noc.events.active.find({"managed_object": <ID>})
11:42
db.noc.events.archive.find({"managed_object": <ID>})
ufir #
11:43
да мне всеравно как..
zi_rus #
11:45
ну через веб пробуй
11:45
там все фильтры есть
11:45
и по времени и по мо
evyscr #
11:45
через веб печально будет, имхо
11:45
особенно в случае archive
11:46
бгг: https://bugzilla.redhat.com/show_bug.cgi?id=1202858
freeseacher #
11:47
:))
ufir #
11:49
хм, через морду находит, а через db.noc.events/alarms.archive.find - фигу
dvolodin #
11:51
Night_Snake: да, там была парсер зон
Night_Snake #
11:52
это который import-zone? Я ж правильно ссылку нашел?
ufir #
11:52
н-да... на железке посылать все на нок настроили, а добавить объекты в нок забыли. такие алармы дропаются ?
evyscr #
11:52
в неклассифированные вроде валятся
dvolodin #
11:52
ufir поднимается -- unknown trap source
11:52
нет
11:53
они дропаются на коллекторе
11:53
но раз в минуту он отдает в FM адреса источников
11:53
которые подропал
evyscr #
11:54
ну у кого-то до сих пор активаторы.
zi_rus #
11:54
вот поэтому надо два места иметь
evyscr #
11:54
там тоже дропает?
zi_rus #
11:54
нок и сырое хранилище
evyscr #
11:54
ну да
Night_Snake #
12:00
dvolodin: дык я праивльно сцылку нашел?
ufir #
12:00
чудеса. даже у существующих железяк ничего не находит по db.noc.events.archive.find({"managed_object": "jnr01-vol-ltc"})
12:00
а вебморда показывает - но мееедленно
dvolodin #
12:00
активатор - тот же коллектор
12:01
ufir: вставь id
12:01
а не имя
ufir #
12:31
dvolodin а как его узнать-то ?
evyscr #
12:37
в managed object можно сказать поле показывать
12:37
альзо, в редактировании mo - в правом верхнем углу
zi_rus #
12:44
dvolodin: а дискавери лицензий не думал сделать?
12:49
вспоминается мне что думал
12:49
но почему-то забил
dvolodin #
12:50
zi_rus: есть оно
12:50
в caps discovery
zi_rus #
12:50
лицензии в caps discovery O_o
12:50
а почему я не в курсе
12:50
а какого хрена
dvolodin #
12:51
:)~
zi_rus #
12:51
а почему я не вижу чтобы где-то выполнялось show licenses
ufir #
12:57
evyscr все, нашел. спасибо
dvolodin #
13:31
zi_rus: смотри микротиковский get_capabilities_ex.py
zi_rus #
13:32
не микротиком единым
13:32
у меня их вообще нет
dvolodin #
13:32
готов закоммитить патч :)
13:32
или смержить pull request
13:32
;)
zi_rus #
13:33
так а что с капабилитисами? куда эти лицензии попадают? в инвентори или где?
dvolodin #
13:34
хранятся привязанными к объектам
13:34
можешь считать это inventory
13:35
кнопочка caps есть в sa.managedobjects
zi_rus #
13:35
мда
13:35
ну ладно хоть так
13:35
посмотрим как это использовать
13:36
dvolodin: а если у меня две лицензии на железке
13:36
и они к линейным картам привязаны
13:36
(сама привязка не принципиальна)
dvolodin #
13:36
ну и пожалуйста, я же не против
zi_rus #
13:36
а просто про количество
13:38
dvolodin: не, я про количество одинаковых. или их можно подряд выводить одинаковые?
dvolodin #
13:38
давай конкретнее
zi_rus #
13:39
на циске лицензии на ipvpn привязаны к линеным картам, если у меня 7 карт, на 4-х из них стоят лицензии. То как?
13:40
4 лицензии на мо
13:40
одинаковых
13:40
на конкретную фичу
dvolodin #
13:40
смотря что ты в них хочешь отобразить
zi_rus #
13:40
на хуавее судя по всему также
13:40
или похоже
dvolodin #
13:41
ты же и список можешь пихнуть в значение
zi_rus #
13:42
эмм
13:42
допустим
13:43
а на выходе я что получу если так сделаю
13:44
наверное в caps я хотел бы видеть все лицензии что там есть
13:44
списком
13:44
все 4
e_zombie #
13:47
а есть хуйня кототорой можно скормить мак а она скажет какому вендору принадлежит?
zi_rus #
13:48
да
e_zombie #
13:48
для консоли.
zi_rus #
13:48
https://www.wireshark.org/tools/oui-lookup.html
13:48
эмм
e_zombie #
13:48
а то я снял маки с железок и мне надо посчитать сколько у меня сраных длинков
13:48
grep -i -E "(^FC75-16|^0005-5D|^000D-88|^000F-3D|^0011-95|^0013-46|^0015-E9|^0017-9A|^0019-5B|^001B-11|^001C-F0|^001E-58|^0021-91|^0022-B0|^0024-01|^0026-5A|^0050-BA|^0080-C8|^14D6-4D|^1C7E-E5|^1CAF-F7|^1CBD-B9|^2810-7B|^3408-04|^5CD9-98|^7854-2E|^84C9-B2|^9094-E4|^9CD6-43|^ACF1-DF)" out.work.huawei.txt | awk '{print $1}' | sort | uniq | wc -l
ufir #
13:53
Володий, ты б отдохнул
e_zombie #
13:54
да я только что проснулся.
13:54
поспал полчасика. и меня отпустило.
13:54
сейчас насчитал 150 000 уникальных маков на хуавеях
ufir #
13:55
хм, посчитать чтоли свои..
e_zombie #
13:58
посчитай
13:59
может и надйшь гденибудь уйню какуюнибдуь
dvolodin #
13:59
e_zombie: проверяй фикс на фикс
e_zombie #
14:00
5 секс
14:02
начал херачить
14:03
Fix fm.eventclassificationrules UUID 71bf66a3-4e25-46fd-9e9c-ab9d3553a7c6
14:03
Fix fm.eventclassificationrules UUID b44b9b18-ac24-46b5-9bbe-2d9b9ee0fb52
14:03
Fix fm.eventclassificationrules UUID 1c690ede-ee9c-4184-a2e3-b32a54a843f6
14:03
Fix fm.eventclassificationrules UUID f339bc93-abfe-437e-9578-9f12d61d47d5
14:03
... done
14:03
Checking inventory Root
14:03
Checking inventory Lost&Found
14:03
Checking pm.MetricSettings
14:03
... done
14:03
Restarting wipe process: wiping-90965
14:03
Restarting wipe process: wiping-90989
14:03
Restarting wipe process: wiping-90990
14:03
Restarting wipe process: wiping-91001
14:03
Restarting wipe process: wiping-91002
14:04
DeprecationWarning
14:04
Checking collections UUID
14:04
... done
14:04
Checking inventory Root
14:04
Checking inventory Lost&Found
14:04
Checking pm.MetricSettings
14:04
... done
14:04
Restarting wipe process: wiping-91130
14:04
[root@nocproject noc]#
14:06
015-03-24 17:05:21,445 [noc-sae] script NOC.SAE.get_activator_info(SAE)
14:06
2015-03-24 17:05:21,457 [noc-sae] 1 script threads
14:06
2015-03-24 17:05:21,459 [noc-sae] SAE is overloaded by MRT scheduling (took 1.481162s)
14:06
2015-03-24 17:05:21,492 [noc-sae] Script NOC.SAE.get_activator_info(0.0.0.0) completed
14:06
2015-03-24 17:05:21,494 [noc-sae] 0 script threads left
14:06
2015-03-24 17:05:21,499 [noc-sae] Late answer for map task 70048924 is ignored
14:06
2015-03-24 17:05:21,703 [noc-sae] MRT task=68132157/70049131 object=SAE(0.0.0.0) script=NOC.SAE.get_activator_info status=completed
14:06
2015-03-24 17:05:23,997 [noc-sae] Late answer for map task 70048822 is ignored
14:06
2015-03-24 17:05:25,879 [noc-sae] Late answer for map task 70048870 is ignored
14:07
надо наблддла ть
14:08
хкм.
14:08
дискавери так же в дисаблед .
14:08
на хостах .
14:09
http://i60.fastpic.ru/big/2015/0324/cc/ef1c8d1888facd3581b6640ee8781ccc.png
14:09
а что мы делали в январе ?
t2me #
14:10
о ./noc fix починили)
e_zombie #
14:11
возрадуйся. у меня оно уфигачело экранов 10 точно
t2me #
14:11
у меня тоже )
14:13
теперь наверно alarms с wiping-* появляться перестанут
e_zombie #
14:13
алилуййййааааа
dvolodin #
14:14
?
14:15
что, неужто заработало все?
t2me #
14:17
о и чекбоксы сново можно клацать нормально)
14:19
а не починили unmanaged жалезки появлялись FM:alarms мол Ping Failed
14:20
когда "Is Managed?" галка снята
dvolodin #
14:21
e_zombie: оно у тебя в disabled перешло из-за постоянных ошибок
e_zombie #
14:21
на всей сети?
dvolodin #
14:22
2015-03-24 17:05:21,459 [noc-sae] SAE is overloaded by MRT scheduling (took 1.481162s)
evyscr #
14:22
e_zombie: hg log, hg blame
dvolodin #
14:23
вот это тебя не смущает?
14:23
попробуй для начала сделать VACUUM ANALYZE sa_maptask;
e_zombie #
14:23
кхм.
14:24
сделал
dvolodin #
14:24
у тебя запрос на выбор данных из sa_maptask идет полторы секунды
e_zombie #
14:24
а как их теперь снять ?
14:24
и что делать?
dvolodin #
14:26
SAE отпустило?
e_zombie #
14:26
2015-03-24 17:25:46,135 [noc-sae] SAE is overloaded by MRT scheduling (took 2.103157s)
14:26
2015-03-24 17:25:54,402 [noc-sae] SAE is overloaded by MRT scheduling (took 2.847918s)
dvolodin #
14:26
EXPLAIN ANALYZE SELECT * FROM sa_maptask;
e_zombie #
14:27
noc=# EXPLAIN ANALYZE SELECT * FROM sa_maptask;
14:27
QUERY PLAN
14:27
-------------------------------------------------------------------------------------------------------------
14:27
Seq Scan on sa_maptask (cost=0.00..171.28 rows=428 width=1060) (actual time=0.073..5.954 rows=426 loops=1)
14:27
Total runtime: 6.564 ms
14:27
(2 rows)
dvolodin #
14:27
ну и просто SELECT * FROM sa_maptask прогони
e_zombie #
14:28
там какой то адовый пиздет
dvolodin #
14:28
много?
14:29
и еще вот что
e_zombie #
14:29
http://pastebin.com/VwrCpMVB
dvolodin #
14:29
SAE у тебя работает сейчас и тупит?
e_zombie #
14:29
да
dvolodin #
14:30
REINDEX TABLE sa_maptask;
zi_rus #
14:30
что ты с ноком делаешь, несчастный???
dvolodin #
14:31
клизму
14:31
пучит его
e_zombie #
14:31
noc=# REINDEX TABLE sa_maptask;
14:31
REINDEX
14:31
noc=#
14:32
у меня конечно есть подозрения что после тюнинга так
14:32
[root@nocproject noc]#
14:32
[root@nocproject noc]# tail -f ./log/noc-sae.log | grep overload
14:32
2015-03-24 17:32:15,739 [noc-sae] SAE is overloaded by MRT scheduling (took 3.260747s)
dvolodin #
14:32
select relpages,reltuples from pg_class where relname='sa_maptask';
e_zombie #
14:33
noc=# select relpages,reltuples from pg_class where relname='sa_maptask';
14:33
relpages | reltuples
14:33
----------+-----------
14:33
167 | 430
14:33
(1 row)
dvolodin #
14:33
select relname,relpages,reltuples from pg_class where relname like 'sa_maptask%';
14:33
вот так даже
e_zombie #
14:33
noc=# select relname,relpages,reltuples from pg_class where relname like 'sa_maptask%';
14:33
relname | relpages | reltuples
14:33
------------------------------+----------+-----------
14:33
sa_maptask_id_seq | 1 | 1
14:33
sa_maptask | 167 | 430
14:33
sa_maptask_pkey | 4 | 430
14:33
sa_maptask_task_id | 5 | 430
14:33
sa_maptask_managed_object_id | 4 | 430
14:33
sa_maptask_next_try | 4 | 430
14:33
(6 rows)
dvolodin #
14:34
индексы ему, вроде, пролечились
e_zombie #
14:35
[root@nocproject noc]# tail -f ./log/noc-sae.log | grep overload
14:35
2015-03-24 17:35:26,074 [noc-sae] SAE is overloaded by MRT scheduling (took 2.37859s)
14:37
вопрос в том как с нять с тормозов все дискавери на хостах. ониж по факту с января и не работают. у меня конфиги неактуальные.
dvolodin #
14:37
снять-то проще простого
e_zombie #
14:37
добавь это в фикс.
dvolodin #
14:37
так
14:37
неа
14:37
нафига
14:37
оно по делу там
14:37
VACUUM FULL ANALYZE sa_maptask;
14:37
select relname,relpages,reltuples from pg_class where relname like 'sa_maptask%';
e_zombie #
14:38
сейчас всё равно мы делаем
14:38
это под минимальной нагрузкой.
14:39
чёто он задумался
zi_rus #
14:40
как бе это произошло, надо пофиксить чтобы больше не возникало
14:40
убивать старые таски?
e_zombie #
14:40
каждый раз лезть руками ?
14:40
доделал
14:41
noc=# select relname,relpages,reltuples from pg_class where relname like 'sa_maptask%';
14:41
relname | relpages | reltuples
14:41
------------------------------+----------+-----------
14:41
sa_maptask_id_seq | 1 | 1
14:41
sa_maptask | 67 | 531
14:41
sa_maptask_pkey | 5 | 531
14:41
sa_maptask_task_id | 7 | 531
14:41
sa_maptask_managed_object_id | 5 | 531
14:41
sa_maptask_next_try | 5 | 531
14:41
(6 строк)
dvolodin #
14:41
ну и еще раз reindex
14:41
и посмотри, отпустило ли SAE
e_zombie #
14:44
пока сообщения не появляются .
14:46
2015-03-24 17:46:24,681 [noc-sae] SAE is overloaded by MRT scheduling (took 1.943572s)
dvolodin #
14:48
разово - относительно нестрашно
14:48
главное, чтобы постоянно не перли
e_zombie #
14:48
2015-03-24 17:46:24,681 [noc-sae] SAE is overloaded by MRT scheduling (took 1.943572s)
14:48
2015-03-24 17:46:44,083 [noc-sae] SAE is overloaded by MRT scheduling (took 1.327035s)
14:48
2015-03-24 17:47:29,853 [noc-sae] SAE is overloaded by MRT scheduling (took 1.005115s)
14:48
2015-03-24 17:47:41,870 [noc-sae] SAE is overloaded by MRT scheduling (took 2.101498s)
dvolodin #
14:57
заметь как интересно
14:58
ритмичненько так
e_zombie #
14:59
http://pastebin.com/cq7q6iJj
15:04
ёбать.
15:05
http://pastebin.com/AqxeAbM6
15:09
015-03-24 17:42:19,031 [noc.lib.nbsocket.basesocket] [SAESocket] Unhandled exception when calling <bound method SAESocket.handle_read of <SAESocket(0x51ebc10, connected)>>
15:09
2015-03-24 17:42:19,032 [noc.lib.debug] PostgreSQL database error: deadlock detected
15:09
LINE 1: UPDATE "sa_maptask" SET "task_id" = 68136019, "managed_objec...
15:09
^
15:09
DETAIL: Process 27814 waits for RowExclusiveLock on relation 2561752 of database 2559713; blocked by process 31553.
15:09
Process 31553 waits for AccessExclusiveLock on relation 2561761 of database 2559713; blocked by process 27814.
15:09
HINT: See server log for query details.
15:09
2015-03-24 17:42:24,396 [noc.lib.perf] Stats are disabled
15:09
2015-03-24 17:42:24,397 [noc-sae] Serving shards: default
15:10
ну это походу был перезапуск
15:15
http://www.facepalm.su/wp-content/gallery/double-facepalm-1/quadruple_facepalm.jpg
15:23
неплохо. у меня 233950 маков на сети :)
fumufu86 #
15:23
Есть 3 коммутатора DLink DGS-3627G, пароль на них одинаковый, но почему на одном не выполняется interface-discovery? yf lheub[ xnj-yb,elm lheujt
e_zombie #
15:23
дебаж
fumufu86 #
15:23
*, на других что-нибудь другое
e_zombie #
15:23
/noc debug-script
15:24
возможно у тебя там приветствие не ловится.
fumufu86 #
15:24
то есть в итоге на трех коммутаторах, три разные проблемы, которые на двух других нет
e_zombie #
15:24
да легко
fumufu86 #
15:29
Error: Object not found:
15:29
вот что выдаёт
15:30
./noc debug-script interface-discovery "Bogatyreva_11a"
15:38
./noc debug-script Dlink.Dxs.get_interfaces "Bogatyreva_11a" выдаёт тоже самое
e_zombie #
15:43
русские английский буквы в именах
15:43
проверяй
fumufu86 #
15:43
я просто переименовал
15:43
сейчас пасту закину
15:43
она прошла
e_zombie #
15:43
ненене. я домой
fumufu86 #
15:45
http://pastebin.com/Jgs4vjzq
15:45
написало что скрипт не правильный, хотя на других коммутаторах сработало
evyscr #
15:49
./noc debug-script get_interfaces Bogatyreva_11a
fumufu86 #
15:51
gsnfkcz nj;t
15:52
пытался тоже
15:52
там очень много чего вылазит
15:52
сек
15:57
http://pastebin.com/w3iDmT3m
16:03
http://pastebin.com/Un9vY1kR
16:03
./noc debug-script get_interfaces 11
16:03
результат
evyscr #
16:23
пробуй вот с таким патчем: http://dpaste.com/1EPWMZ8
fumufu86 #
16:36
спасибо попробую
16:55
http://pastebin.com/QnkXmns6
16:56
http://pastebin.com/BdbcJwsR
16:57
вроде всё получает
16:57
не понятно почему в ноке не появилось.
16:57
и почему, на таких же коммутаторах, с такой же прошивкой таких проблем нет
`kk #
17:03
так вроде не show stp а show ports description глючит
17:03
сравни вывод
17:12
хз. походу надо в DLink/DxS/__init__.py rx_port править
Tweet
Share this page
Share this page: Tweet