nocproject.org
05:46
ну что продолжим, новый раунд... Вчера zi_rus вел, может сегодня freeseacher поможет...
05:48
на чем в итоге закончили-то?
05:56
dvolodin: лично у меня, трафик на 2003 порту есть, в логах веба, торнадо что то делает, в профилях МО и Интрейфесов, метрики стоят, в монго есть коллекции и не знаю что еще рассказать
06:00
dvolodin аналогично. я грохнул pid-файл, данные начали проливаться
06:18
какие коллекции есть в монге?
06:20
noc.ts.metrics
06:20
noc.ts.p2015.p02.p11
06:20
noc.ts.p2015.p02.p12
06:20
noc.ts.p2015.p02.p13
06:21
в noc.ts.metrics записи есть?
06:22
noc.ts.p2015.p02.p12
06:22
"ns" : "noc.noc.ts.p2015.p02.p12", "count" : 77, "size" : 3408,
06:22
"ns" : "noc.noc.ts.metrics", "count" : 0, "size" : 0,
06:23
так, вопрос на засыпку
06:24
./scripts/about
06:24
./scripts/about | grep Mongo
06:24
кажется я понял, чего вы страдаете
06:25
у вас монга старее 2.4
06:25
:)
06:25
|MongoDB|2.0.6 (32bit)|
06:25
там оператор $setOnInsert при создании метрик используется
06:25
i_a: ну да, панки не моются
06:25
во-первых, у 32-битной монги ограничение на размер базы - 4G
06:25
Это я знаю
06:26
у меня пока тестовая сборка
06:26
|MongoDB|2.0.6 (64bit)|
06:26
ставьте монгу 2.6 и не парьте мозг
06:26
:)
06:26
а она в репах дебиана есть уже?
06:27
и явно не в stable =) backports цеплять?
06:32
да, в debian -- 2.0.6
06:32
06:35
попробую костыль сделать
06:40
а как лучше сделать? удалить старую? или сверху накатить?
06:42
лучше подключить репу с монгосайта и поставить ее
06:42
только думаю придется сделать бекап и развернуть его после переустановки
06:43
06:43
вот патчик для старых монг
06:44
но он не очень хороший
06:44
при большом количестве метрик после перезапуска pmwriter монге станет тяжко
06:45
наверное, я поправлю bootstrap для debian
06:45
пусть сразу ставит последнюю стабильную версию
06:46
так веселее?
06:46
ы. похоже бэкап таки надо было делать, бгг)
06:46
потому как failed to fetch
06:46
Night_Snake, на самом деле данные в целости
06:46
и в евентах и в метриках
06:47
но вот добратсья до них сейчас будет не просто
06:47
там конфиг файл поменялся
06:47
дык может дропнуть, чтоб он их пересоздал? Я ж так понимаю критически важного в монге нет ничего?
06:47
на наших объемах через бекап получается сильно дешевле обновляться по времени
06:48
зато сейчас ты разберешься в монге;)
06:48
звучит многообещающе
06:48
Night_Snake, ну как сказать....
06:48
там конфиги устройств
06:49
не, ну так-то у меня бэкап есть всей виртуалки
06:49
где то года полтора назад монгу можно было всю дропнуть.
06:49
щас уже нет...
06:50
можете для начала с моим патчем взлететь?
06:51
дык я монгу обновил ужо :) Не, я могу откатить машину на бэкап и накатить патч
06:51
и лучше на ты)
06:52
Night_Snake, вас же двое, или у тебя раздвоение личности? :)
06:52
либо нужен мануал как сейчас добраться до монги
06:53
точнее до данных в монге
06:54
открою секрет
06:54
mongodump умеет дампить из каталога
06:54
без сервера монги
06:55
найди старую базу, сдампью ее в оффлайне
06:55
и залей в новую
06:58
старая база, как я понимаю, только из бэкапа достается?
07:43
freeseacher, ты тут?
07:43
я почти уверен что ты сталкивался с такой проблемой
07:43
запускаю ран коммандс на дохера железок
07:43
он выполняет, выполняет выполняет
07:43
потом херак и останавливается
07:44
видимо таймаут кончился
07:44
в каком месте его поправить можно?
07:44
там видимо по фолту 60 сек стоит
07:51
TSergey, а ты случаем тоже самое не спрашивал не очень давно
07:52
неа, как раз хотел написать, что засылал на медленные железки, и отрабатывало
07:52
ну или спрашивал но давно
07:52
dvolodin, привет, не убегай
07:52
как можно таймаут в веб форме увеличить
07:53
чтобы когда я запускаю run commands на 10к железок он не останавливался на половине
08:00
,,
08:01
таймаут?
08:01
там обычно проблема в том что идёт краш сае и всё отваливается
08:01
во всяком случае у меня так было раньше
08:01
кстати смежный вопрос - как сделать так, чтобы сниппет, запущенный на сотню железок разом, не вываливался на половине по таймауту
08:04
e_zombie, не, там не крашится, просто примерно через минуту веб просто вываливает отчет о работе, не дожидаясь пока все железки отработаются
08:05
у меня обычно успевает обработать до 1000 штук.
08:05
в сниппете есть время выполнения скрипта (по умолчанию 60 сек)
08:05
а потом походу таймаут веба становится меньше времени скрипта и её расколбашивает
08:06
я ставлю 600 - все отрабатывает, если нок не сдохнет
08:12
e_zombie, везет, нашим шпдшникам поставили тупой радиус, и мне пришлось включить шейпер max-mrt-rate до 30 железок за раз, и он и 500 железок не успевает отработать за этот таймаут
08:12
bee26, но это не сниппет
08:12
странна. радиус может и больще обрабатывать.
08:12
это если правильно его настроить
08:14
запусти какую нить хрень которая будет крутиться круглосуточно и это приведёт к тому что радиус скукожится.
08:14
и сразу всё настроят
08:14
будь злым - твори добро
08:27
zi_rus: еще в настройках nginx я чего-то переделал
08:28
proxy_read_timeout 320;
08:28
proxy_connect_timeout 320;
08:33
а можно как-то поправить чтобы Link down: ge-1/1/7.356 (** Po03.sw-1-nov1 | 'Moscow Patriarxat') ' - в одинарную кавычку превратился?
08:48
hi
08:48
if anybody interesting about
08:48
09:03
dvolodin а дампить всю монгу?
09:10
кстати о птичках. после апдейта нок в монгу не может:
09:10
Failed to authenticate noc@noc with mechanism MONGODB-CR: AuthenticationFailed UserNotFound Could not find user noc@noc
09:11
после апдейта монги?
09:11
слетал пользователь, было такое
09:11
а как лечить? или дамп монги спасет?
09:12
просто сделай пользуна и все
09:15
> db.createuser(noc, noc) 2015-02-13T12:15:33.839+0300 ReferenceError: noc is not defined
09:16
> db.createUser("noc", "noc") 2015-02-13T12:16:05.809+0300 Error: couldn't add user: no such cmd: 0 at src/mongo/shell/db.js:1004
09:16
Night_Snake: mongo noc
09:17
Night_Snake: db.createUser('noc', 'noc')
09:17
человеки
09:17
кто нить сталкивался с продукцией ZELAX?
09:19
2015-02-13T12:18:53.545+0300 Error: couldn't add user: no such cmd: 0 at src/mongo/shell/db.js:1004
09:20
zi_rus, ну когда ковыряешь не сильно отличается
09:21
Night_Snake: mongo
09:21
Night_Snake: use noc
09:21
чего говорит?
09:23
2.6
09:23
из репов ихних
09:23
ну попробуй addUser('noc','noc')
09:29
(12:17:20) ss_: кто нить сталкивался с продукцией ZELAX?
09:29
(12:17:30) zi_rus: это презерватив?
09:29
(12:28:58) jeckill: рваный, да
09:29
e_zombie, вот
09:29
кто бы помог
09:32
TSergey пользователя я сделал. тока нок один хрен не стартует
09:33
а апгрейд чего говорит? :)
09:33
все по проверенной же схеме :)
09:34
ERROR: command SON([('authenticate', 1), ('user', u'noc'), ('nonce', u'e03a713afe4e300'), ('key', u'e6cf8fe152cf5a5fa6f2eef05c006108')]) failed: auth failed
09:35
смотри какой пароль ты назначил в монге
09:35
и какой в конфиге
09:35
не, это мой косяк
09:37
запустилось все кроме веба
09:38
а не все
09:38
вы пробовали выключить и снова включить? (с)
09:42
подскажите, пожалуйста, был объект в MO. Удалил из списка, но в fm по нему по-прежнему сыпятся ивенты и изменилось название. Как стереть полностью?
09:55
О
09:55
метрики появились
09:55
даже не пришлось из дампа восстанавливаться
09:55
урря!
10:10
Night_Snake: с моим патчем или на монге 2.6?
10:11
не, просто на монге. плюнул, дунул, перезавел пользователя
10:11
ok
10:11
ну напишем в требованиях -- минимальная версия монги - 2.4
10:12
осталось понять, почему events у меня показывает, а у соседа нет. хотя оба суперюзеры
10:16
i_a: у тебя метрики пролечились?
10:22
dvolodin: про форму в метрик конфигах
10:22
есть трабл
10:23
делаем новый конфиг, выбираем хэндлер mongo
10:24
затем меняем его на хэндлер постгрес
10:24
в предложенных метриках куча левого из монги
10:26
т.е. кусок "Metrics:" не обновился что-ли
10:33
а
10:33
вроде вчерашние патчи это правили
10:35
утром обновлялся
10:35
часть там поправилась
10:36
но при замене хэнлера не заменяется набор метрик
10:36
changeset: 10695:b2515e1d0128
10:36
branch: develop
10:36
tag: tip
10:36
user: Dmitry Volodin <dv@nocproject.org>
10:36
date: Thu Feb 12 10:39:42 2015 +0300
10:36
summary: Set uiStyle
10:40
dvolodin: ДА! Появились метрики. Спасибо за помощь!
10:41
монга 2.6
10:46
ну и чудно
10:46
похоже, у Dmitry1 та же проблема
10:47
dvolodin, подскажи пожалста
10:47
где таймаут поднять
10:48
чтобы ран коммандс не вываливался на половине железок
10:53
freeseacher, или ты знаешь?
10:54
кстати, а ты уверен, что хочешь это в web?
10:54
e_zombie вот CLI-тулзу освоил
10:54
./noc cli-commands
10:55
dvolodin, это опять про шпдшников, они в вебе, в кли я их не пущу
10:56
я и в вебе-то лишнего им дал
10:57
10:57
попробуй такой патчик
10:57
можно дернуть только noc-web
10:59
накатил
10:59
проверим
11:23
./noc cli-commands рулит .
11:23
задротства такие творить можно
11:24
там у нас вроде открытый вопрос с форматированием вывода был?
11:25
может просто принимать django'вкий шаблон в ключе --template="..."
11:25
и выдавай, что хочешь
11:54
dvolodin, не помогло, опять вываливается
11:54
там же был какой-то таймаут для веба
11:54
я помню
11:54
timeout = 60
11:54
делаешь 6000 и не паришься
11:55
только не знаю в каком файле исправлять
12:00
12:00
xnj 'nj b rfr 'nj gj,tlbnm&
12:01
что это и как это победить?
12:12
а на что апгрейдился?
12:14
выполнил команду ./scripts/upgrade
12:35
12:35
помогите люди добрые кто чем могёт
12:38
12:38
t2me: у меня такой же трейс
12:43
e_zombie: у себя через нок шелл удалял
12:43
from noc.sa.models import *
12:43
objs = ManagedObject.objects.filter(address__startswith="10.64.158.")
12:43
for o in objs:
12:43
o.tags=''
12:43
o.save()
12:44
тут вопрос в том чтобы найти все хосты с такими кривыти тегами
12:44
а не изменить их
12:44
я их обнулю но перед тем надо их найти
12:47
сам нашел
12:47
если кто будет искать
12:48
lib/app/saapplication.py: timeout = 60 # Reduce task timeout. None - for adaptive timeouts
12:48
пинаем володина чтобы это вынесли в конфиги
13:07
e_zombie: добавь if u'кака' in o.tags: и обнули
13:17
Други, постоянно фейлится ip_discovery на cisco asa. Как следствие - нет актуальных записей в IPAM, нет генерации обраток. Как подебажить? Как это запустить ручками?
13:17
13:17
настрой суппорт и зашли трейс
13:18
или в багзиллу
13:20
был бы трейс. loglevel - debug, в логах молчаливое
13:20
2015-02-13 16:14:18,959 [inv.discovery] Running job ip_discovery(sl-f4)
13:20
2015-02-13 16:14:18,974 [inv.discovery] Job ip_discovery(sl-f4) is failed
13:21
./noc debug-script Cisco.IOS.get_version asw2-72-eng
13:22
в логах сае или активаторов это всё будет.
13:22
у тебя девелом?
13:23
да, но не апдейтил с полгода.
13:23
оно раньше работало, в какой-то момент поломалось
13:23
ну ты зря.
13:23
погляди коммиты. цисковский профиль правили
13:23
у меня там были проблемы
13:24
как раз с дискавери
13:25
debug-script норм проходит, все данный собираются, интерфейсы и их адреса в инвентори видны
13:30
Только в ipam собранные интерфейсники не импортируются. Как можно ip_discovery дернуть руками? или где можно найти хоть какую-то инфу почему failed?
13:30
в сае у тебаг включен?
13:30
в папке логов лежат трейсы
13:49
обновился, не помогло.
13:49
про ip_discovery в логах sae ни слова о причинах фейла
13:52
get_discovery_id отдает пустоту, видимо отсутствует профиль для ASA. но не понятно как оно раньше работало..
14:20
А с чем может быть связано
14:20
EXCEPTION: <class 'mongoengine.errors.ValidationError'> Unable to dereference <class 'noc.fm.models.alarmclass.AlarmClass'>:522888964a5e68440f61a449
14:20
весь web.log такой хренью завален
14:20
и failed to fetch постоянно
14:21
дропнутые записи в монге
14:21
(15:47:55) zi_rus: сам нашел
14:21
(15:47:59) zi_rus: если кто будет искать
14:21
(15:48:00) zi_rus: lib/app/saapplication.py: timeout = 60 # Reduce task timeout. None - for adaptive timeouts
14:22
может вынесем в конфиг?
14:22
dvolodin Если это нормально, то почему events постоянно failed to fetch сыпет?
14:23
не нормально
14:24
e_zombie: можно и вынести, или None поставить
14:24
а как тогда исправить?)
14:24
zi_rus: у тебя же киски
14:24
попробуй в конфиге поставить таймаут
14:24
лучше вынести. у меня это счас проблема. не могу подсадить админов пользовать рун команд. у меня выборки сейчас по 1500 железок за рах
14:24
Cisco.IOS.commands = 1800
14:24
и будет у тебя все нормально
14:25
а в run commands сделаю адаптивный таймаут
14:25
будет просто аххуенно. я заёбся писать батники
14:26
а можно это сделать вывод в текстовик как для cli-commands ?
14:26
cd /opt/noc/ && ./noc cli-commands -d --timeout=900 @huawei.fttb.outdate -i $BASEDIR/command.txt > $BASEDIR/out.work.txt
14:26
а то обрабатывать вывод ну очень неудобно в экселе
14:27
мне то просто. я грепаю и всё такое.
14:27
а там народ убогий.
14:27
кроме экселя не знают ничего.
14:27
e_zombie: ты про что именно?
14:27
в конце как скрипт отработает сделать кнопочку - экспорт txt
14:28
и туда вывалить в подобном синтаксисе как у сликоммандс
14:28
тогда если у человека стоит греп на машине он будет сразу обрабатывать результаты.
14:28
можно вывод run commands прогонять через template
14:28
:)
14:29
и ему не надо будет давать ssh на сервак
14:29
он и так все сломает
14:29
Я пощупал mongodb 3.0.0rc8
14:29
wiredtiger интересен, да
14:30
база раза в 4 компактнее и памяти меньше жрет
14:30
может не надо пока нет сборок под центось в официальных репах?
14:30
у них есть архив под линукс
14:31
миграцию можно делать практически на ходу и одним перезапуском
14:32
текущую монгу запустить с дополнительным ключем --replSet=<имя replic set'а>
14:32
прописать этот replic set в noc.conf и дернуть noc
14:32
тогда вторую монгу можно будет подцепить в RS, база на нее смигрируется автоматом
14:33
ну а потом поменять мастера
14:34
интересный воркараунд
14:43
стандартный для монги
14:47
В принципе, трешка должна решить ряд проблем с прожорливостью монги до памяти и диска
14:47
и там document-level locking
14:47
в целом это позитивно. хотя у меня сейчас особых проблем не наблюдается
14:51
для PM, кстати, он тоже неплох
14:52
14:52
wiredtiger проигрывает роксу по размеру записи
14:52
но будет работать из коробки
14:52
и, опять же, может выбраться на репликации
16:05
dvolodin как чинить FM? =( хотел из нока сделать морду для логгера, но похоже не судьба, придется свою писать
Share this page
Share this page: