nocproject.org
03:09
Добрый день. Здесь кто живой есть?
03:13
Люди подскажите, кто-нибудь карту в NOC загружал?
03:33
так она там есть, ты хочешь еще одну загрузить?
05:09
как есть? я не вижу GIS->MAP...
05:12
и в Inventory->Network Map пусто...(т.е. серая страница)...
05:20
так вопрос остается - после инсталляции NOC-a на Ubuntu карты нужно загружать или они уже загружены?
05:37
,,
05:37
гис выпилили же
05:43
карты строятся теперь по сегментам
05:59
e_zombie: то есть их грузить надо?
05:59
(08:38:10) e_zombie: гис выпилили же
06:00
в смысле он совсем не работает?
06:01
но каталог gis и скрипты остались...
06:05
гм. внезапно обнаружилось что пару дней назад discovery стал в позу и забил на работу. Пристрелил - заработал.
06:13
внезапно у меня такое постоянно.
06:14
и чо делать? стрелять по крону?
06:15
ну или искать причину и писать багрепорт. или сидеть и ждать микросервисы
06:16
ну причину то я поищу
06:17
смотри в сторону ситуации когда у тебя просиходит фэйл на активаторе и что то подвисает или не заканчивается.
06:18
была бага с транзакциями .
06:18
мне бы только ~20К уведомлений пережить :)
06:18
активаторы рестартовались точно
06:22
первое точно нет - у меня версия свежее. второе посмотрим
06:27
а вот бага с отвалом активатора точно есть
06:28
на ровном месте рвется коннект
06:31
root 1866 47.6 0.2 2366840 96276 ? Sl Aug24 460:07 /opt/noc/bin/python ./scripts/noc-activator.py launch -c etc/noc-activator.conf -i 3
06:31
S Interruptible sleep (waiting for an event to complete)
06:31
l is multi-threaded (using CLONE_THREAD, like NPTL pthreads do)
06:32
e_zombie: а он у тебя локальный или удаленный?
06:32
с локальным все ок
06:36
проблема с удаленным
06:36
ps | grep -e "-activa"
06:36
если у тебя траблы с удалёнными то смотри нетстат на предмет дропа пакетов ядром.
06:36
если у тебя там идёт поток тсп\юдп большой то могут быть всякого рода пиздецы
06:37
у меня на днсах дропались пакеты пока не оттюнил.
06:37
дроп пакетов ядром не создает attempt to write closed socket
06:37
а на дхцп ваще был ад
06:37
оно даже без нагрузки отваливалось, так шо врядли
06:37
аааа о у тебя как
06:37
ну тоды делай багу :)
06:38
багу "у меня в подвале раздается подземный стук" делать слегка малоперспективно
06:53
так может тебе подскажут как это задетектить
06:53
чуваки
06:53
а как таймаут увеличить?
06:53
у меня конфиг не забирается из-за больших пингов как я понимаю
06:54
смотри noc.conf там есть примеры настроек таймаутов в конце
06:54
по профилям
06:55
[script_timeout]
06:55
# Script timeouts, in seconds
06:55
# Default timeout
06:55
default = 120
06:55
# Custom timeouts in form:
06:59
07:05
пистато
07:05
я бы сказал прикольна
07:06
07:06
причем со стороны SAE - вроде как все ок
07:14
e_zombie: причем если верить tcpdump - sae реально режектит коннекты от активатора
07:15
ну это уже не просто стук - это трубой по рельсе.
07:16
делай багрепорт.
07:26
e_zombie: там не трубой по рельсе - там лопатой по башке. Я стектрейс отловил
07:26
07:27
что то подобное володин находил когда копался с моей конфигурацией.
07:27
и там были питонопроблемы. походу это и ты наступил.
07:27
Угу
07:29
версии питона с обоих сторон совпадают
07:41
invalid wire type я еще не наблюдал
07:43
n(cnoc.lib.mac\nMAC\np14\nc__builtin__\nstr
07:43
вот это как-то смущает
07:44
dvolodin: если подскажешь куда копать - попробую отловить детально
07:47
неисключено что дискавери умирает тоже из-за SAE
07:48
а Sa->Monitor радостно рапортует "Faile to get data"
07:48
07:48
для начала проверь вот этот патчик
07:48
там не SAE
07:48
точнее, SAE не может декодировать ответ от активатора
07:48
да и скрипт лажу вернул
07:49
патчить активатор или сае?
07:49
мне его на локалку есть смысл ставить?
07:49
нафиг мне System FF:FF:FF:FF:FF:FF
07:49
filonov: с двух сторон
07:49
патчить надо активатор
07:50
dvolodin: появляется переодически такая же проблема как и с прошлым коммутатором
07:52
dvolodin: пропатчил. посмотрим
07:53
скрипт работает после патча?
07:53
пока да. но оно не сразу вылезало
07:54
а кто разбирается в angilarjs?
07:54
отвалилось
07:54
dvolodin: а что интересует про angular?
07:54
отвалилось с тем же кодом?
07:55
да я морду к башне клепаю
07:55
extjs туда как-то совсем тяжеловесно тащить
07:56
dvolodin: с тем же
07:57
ангулар слабопригоден для больших объемов данных
07:57
ищу, кто может сделать несложную морду, пока я лабаю серверную логику
07:58
для больших объемов каких данных?
07:58
несложную морду под что?
07:58
dvolodin: ну табличка строк на 300-400 там чревата неожиданными лагами
07:58
там web-приложение, которое позволяет рулить динамическим inventory на ansible
07:58
для
07:58
там заводятся ноды, конфигурируются сервисы
07:59
а потом оно все деплоится через ansible
07:59
тулза, чтобы централизовано нодами хранить
07:59
рулить
07:59
я питона не знаю :)
07:59
он JS
08:00
там с серверной части tornado
08:00
сам inventory я сделал
08:00
cli для него - тоже
08:00
JSON-rpc скоро доделаю
08:00
а вот мордашку надо бы
08:00
просто на голом bootstrap клепать как-то не хочется
08:02
в общем продолжает падать. Лечится рестартом sae
08:02
на какое-то время
08:03
падает срого на одном скрипте, или на разных?
08:03
Я JS боюсь. Год назад неудачно попробывал обновить noc-pkg-openlayers до 3 версии.
08:04
dvolodin: сложно сказать. Там поток очень большой.
08:04
xetle: там совсем другой API
08:04
это как раз к вопросу про бездумные апдейты
08:05
За сколько времени надо написать?
08:07
08:08
filonov: попробуй такое
08:08
проблему оно не решит, но хоть крашиться не будет
08:08
xetle: да чем быстрее, тем лучше
08:09
собственно эта штука сейчас держит допилку playbook для ansible
08:09
ну и возможность тестирования microservices
08:09
в microservices, кстати, должен совсем уйти protobuf
08:10
и проблемы с sa_maptask
08:10
dvolodin: сдается мне оно валится на get_config с DLink-ов
08:11
твой трейс - на get_arp
08:13
приложил патчик. пока работает
08:14
хм. и монитор заработал
08:15
он будет ответы отбрасывать
08:18
включил опять get_config
08:18
а у кого-нить в парке снры есть или кутеки? вчера e_zombie в дебаг отправил, там при трассировке get_config - See bug
NOC-291:
NOC-291 выдает и Not implemented дальше проверка TFTP. тфтп где-то в конфигах жестко задается? или как происходит?
08:19
может там бинарные данные какие-то пролетают
08:19
циски и длинки, все из "коробки" нормально пашут
08:20
у меня кютеки
08:20
2800 8200
08:20
e_zombie допиливать пришлось, чтобы снимало нормально?
08:21
нет. я пользую qsw.2800 профиль и там всё ок вроде
08:21
для тебя походу старый профиль qsw
08:22
видимо. я обычный qsw выбрал
08:57
talyan: а как, кстати, вообще кутеки себя ведут на сети?
09:04
Привет всем.
09:04
Скажите плз где НОК 15 сохраняет конфиги ? Не нахожу в repo path
09:08
In-nick: в repo path и сохраняет
09:09
если в noc.conf repo пустое - то наверное нигде
09:11
[gridvcs]
09:11
# Mirror sa.managedobject.config to designated directory
09:11
# Do not mirror when empty
09:11
mirror.sa.managedobject.config = /var/noc/repo/config/
09:16
filonov пока все работает) уже пару месяцев. на пробу взяли 4 шт. синтаксис команд на любителя. документацию по крайне мере на 29 серию, не нашли полную. снр в этом плане больше нравятся
09:18
ну 4шт это не показатель
09:24
а если бы они все четыре сломались в два дня. что бы ты сказал? :)
09:26
09:26
приходится руками до железки дотягивать
09:27
вроде норм
09:27
никто maradns не ковырял?
09:27
zi_rus: тоже самое. Выборка маловата)
09:43
filonov: это лучше, чем просто застопориться
09:44
dvolodin: ну как-бы да
09:45
причину, я думаю, в корне перешибать будем
09:45
если активатор удаленный, попробуй отключить крипто
09:47
09:48
а как отключить крипто?
09:48
force_plaintext в noc-sae.conf
09:49
а формат там какой если более одной записи?
09:59
dvolodin: пока тихо. понаблюдаю
10:13
нет пока
10:15
правда сейчас и поток запросов снизился
10:15
version discovery прогнал - все ок
10:18
Кстати о discovery
10:19
dvolodin: есть какие-либо причины которые мешали бы version discovery заодно обновлять sa attributes?
10:19
да и другим скриптам запускаемым руками тоже
10:19
оно его и обновляет
10:19
не обновляет
10:20
у меня вчера утром было массовое обновление прошивок.
10:20
version discovery ничего не обновлял.
10:20
вот когда я сегодня утром обнаружил что noc-discovery слегка помер и пристрелил его - тогда все заверте...
11:00
а дискавери опять помер
11:03
11:13
dvolodin: т.е. commiting transaction отсутствует
11:18
ifindex'ы оно не получило
11:19
11:20
оно их регулярно не получает
11:21
$ grep -c 'Missed ifindexes' noc-discovery.log
11:21
18
11:22
оно запустило скрипт и подвисло
11:22
железка живая и отзывается.
11:27
dvolodin: добавил лог SAE за тот же период
11:27
по той же железке
11:27
"пристрелииииите меняяяя"
11:27
отклик dlink'а
11:27
:)
11:28
но откликается
11:31
гм. он не откликается на snmp
11:33
кстати посмотрите, может у него есть возможность достать ifindex из cli?
11:34
filonov у меня таких больше сотни
11:35
dvolodin: у него community другое)
11:35
но это не повод виснуть discovery
11:35
чуваки, а где в ноке выбирать по какому событию оповещать? в Change Object Notification нет тогго что нужно, я хочу если не получилось забрать конфиг с циски из-за авторизации чтобы он на почту срал
11:39
dvolodin: угу. Короче, если есть железка с которой не получилось забрать ifindexes по причине неответа на snmp - discovery умирает
11:39
а хотя нет. просралось
11:40
таймаут длинный там
11:40
ну не час же
11:44
dvolodin: и судя по всему force_plaintext решает проблемы с отвалом активаторов
12:14
если в пируле стоит mo.save() - мо сохраняет, а дискавери не запускает - это нормально?
12:15
dvolodin: через noc-shell все нормально
12:42
На некоторых вкладках получаю 500 error.
12:42
2015-08-25 15:41:05,759 [tornado.access] 200 POST /main/desktop/state/main.resourcestate-grid/ (127.0.0.1) 28.57ms
12:42
2015-08-25 15:41:06,273 [django.request] Internal Server Error: /main/refbookadmin/
12:42
Traceback (most recent call last):
12:42
File "/usr/local/noc/lib/python2.7/site-packages/django/core/handlers/base.py", line 134, in get_response
12:42
File "/usr/local/noc/lib/python2.7/site-packages/django/template/loader.py", line 138, in find_template
12:42
raise TemplateDoesNotExist(name)
12:42
TemplateDoesNotExist: admin/search_form.html
12:43
никто не встречал?
12:45
[root@nocproject noc]# grep -c 'Missed ifindexes' ./log/noc-discovery.log
12:45
767
12:46
e_zombie: дело не в missed как таковых. а в том, что следующий за этим запуск скрипта помер по таймауту
12:48
In-nick, у меня было после обновления
12:50
я перезагрузил сервер и все стало ок
12:58
danholm_: не помогло. ещё варианты?
13:00
zi_rus, ты оповещаешь себя по мылу о чем-то кроме того что указано в Object Notification ?
13:00
In-nick, логи смотреть :)
13:04
я себя уже ни о чем не оповещаю
13:19
Всё чисто кроме вот этого: File "/usr/local/noc/lib/python2.7/site-packages/django/template/loader.py", line 138, in find_template
13:19
raise TemplateDoesNotExist(name)
13:19
TemplateDoesNotExist: admin/search_form.html
13:20
In-nick: какая ОСь?
13:21
оу, что то новенькое, у меня такое на Ubuntu 14.04
13:21
13:28
Помогло.
13:29
Коммент Саши по тикету: добавить в /opt/noc/settings.py строку "/opt/noc/django/contrib/admin/templates"
13:36
Ребята, ещё такой вопрос..
13:36
В 15.05 версии разве не предусмотрена страница с конфигами (по примеру старой версии - Начало > Configuration Management > Configs)? Сейчас там только Prefix Lists и RPSL Objects. ?
13:39
Там есть... Уже там будут конфиги?
14:15
ну есть два пути
14:15
либо там
14:15
либо кликаешь а МО и кликаешь на кнопку конфиг
14:19
> Configuration Management > MO
14:45
либо ./noc gridvcs --mirror
Share this page
Share this page: