About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 28.10.2014
yeti1 #
05:36
в Events сыпяться NOC | Unknown Event Source
05:37
в какую связку смотреть?
TSergey #
05:37
SA\MO\Edit "Trap Source IP"
yeti1 #
05:38
верен
05:38
все трапы
TSergey #
05:39
а в ивентсе что пишет? айпишник?
yeti1 #
05:57
да
e_zombie #
06:11
да
06:11
я тут подумал и предлагаю сделать очередную хуйню
06:11
с инвентори простигосподе
dvolodin #
06:51
e_zombie: какую?
06:51
кто тут просил лицензии собирать?
e_zombie #
06:53
я к тому что бы в дискавери инвентори добавить формирование модели для всех типок коммутаторов по его platform даже если у него нету команд по выводу начинок.
06:54
типа если кютеч 8200 то в инвентори выкинуть шасси 1U и всё
06:54
это решит ещё одну проблему - краш сае-активаторов когда дискавери идёт по типу оборудования у которого нету таких комманд.
06:55
из плюсов так же можно будет заполнить инвентори шкафами с доступом. так как агрегация и доступ будет отрисовываться.
06:55
правда тогда из скрипта дискавери прийдётся дёргать версионинвентори
06:56
тоесть по умолчанию у нас для любой железки будет шасси в 1U высотой.
06:57
по мне это гораздо лучше чем падающие активаторы
dvolodin #
07:00
ну там такой вариант возможен
07:00
если железка не модульная, то тушку можно отдать по платформе
07:01
я на другую тему думал -- автоматом создавать тушку для таких железок по результатам работы get_inventory
e_zombie #
07:01
ну суть будет именно такой.
dvolodin #
07:01
ну да
07:01
всяк лучше, чем руками
e_zombie #
07:02
внутри надо отлавливать ошибку CLI при попытке запроса начинки. и если возвращается NULL то по простому case делать шасси на 1U
dvolodin #
07:02
это, наверное, уже вопрос к скриптам
e_zombie #
07:03
к сприпту дискавери
07:03
возмём например профиль для хуавея.
07:04
на говно агрегации он вернёт ошибку CLI
07:04
и дальше поставить if ...... then shassis = 1U case .....
07:04
ну и тд.
07:06
тогда на любом железе можно включать дискавери инвентори
dvolodin #
07:08
ну так скрипт хуавея просто нужно поправить
07:08
а для любого железа реально можно сделать тупую рыбо
07:08
рыбу
e_zombie #
07:08
вот это и есть гениальность этой идеи :)
dvolodin #
07:08
а можно и просто generic
e_zombie #
07:09
правда потом база инвентори каааааааак распуухнет нахер
dvolodin #
07:09
Generic.get_inventory
e_zombie #
07:09
ууу нет.
dvolodin #
07:09
нужно только чтобы где-то в профиле был mapping между платформой и моделью
e_zombie #
07:09
у меня такой профиль не используется.
dvolodin #
07:09
ты не понял
e_zombie #
07:09
аааа
07:09
ну вариант
dvolodin #
07:09
он для всех железок добавит скрипт .get_inventory
07:10
который будет тупо дергать get_version
07:10
и таблицу mapping'ов для данного профиля
07:10
и возвращать по ним
e_zombie #
07:10
вариант
dvolodin #
07:10
то есть всякие микротики и ubnt легко обойдутся не скриптом, а декларациями
e_zombie #
07:10
тут уж как это более красиво сделать на уровне кода я подсказать не могу
dvolodin #
07:10
gjtle
07:10
поеду
08:07
на уровне кода как раз получается вполне красиво и прямолинейно
yeti1 #
08:08
dvolodin: где можно увидеть логику работы коррелятора с syslog и обработка событий классификатором?
TSergey #
08:12
yeti1 йпишник-то существующий в Trap Source IP
yeti1 #
08:12
да
TSergey #
08:15
и продолжает сыпаться?
08:15
у меня первый не проходит, потом цепляются
yeti1 #
08:17
TSergey, работало раньше на одном активаторе, потом, когда активаторов стало четыре, подцепили на коллектор
08:17
и тут началось
zi_rus #
08:19
dvolodin, нока пытается снять графики с недоступных железок и начинает думать про missed oid. надо бы их из конфига выпиливать, как и link down
08:22
dvolodin, а еще у нока родовая травма в фм, он неадекватно работает с быстрыми алармами, линк дернулся на 0,01 секунды и все, нок не смог закрыть аларм, он почему-то путает порядок ивентов на коротком промежутке
Revenant #
08:35
Добрый день. Есть оборудование Eltex MES3124, добавил его в managed objects, выбрал соответсвующий профиль, установил доступ по ssh. Но есть небольшая проблема: NOC не может залогиниться на коммутатор (через telnet все в порядке). По всей видимости, это свя
e_zombie #
08:36
ключи
dvolodin #
08:43
zi_rus: а ты уверен, что это NOC путает, а не приходят они ему такие?
zi_rus #
08:43
как они могут ему такие приходить
08:44
LC/0/0/CPU0:Oct 28 04:54:54.882 : ifmgr[209]: %PKT_INFRA-LINK-3-UPDOWN : interface TenGigE0/0/2/1: Interface TenGigE0/0/2/1, changed state to Down
08:44
LC/0/0/CPU0:Oct 28 04:54:54.947 : ifmgr[209]: %PKT_INFRA-LINK-3-UPDOWN : interface TenGigE0/0/2/1: Interface TenGigE0/0/2/1, changed state to Up
dvolodin #
08:44
я к тому, что UDP может переставиться
zi_rus #
08:44
маршрут не менялся
08:44
балансировки нет
08:45
разница 0,06 секунды, это даже если через мск трафик пускать, столько не наберется
09:08
dvolodin, все проще, линк ап почему-то не классифицируется
09:09
мляяя
09:09
циска пидарасы
09:09
поменяли двоеточие на запятую
09:11
а, не только это
dvolodin #
09:13
не пидорасы,а креаклы
e_zombie #
09:14
забикс == попингуй + каксти ?
09:14
cacti
freeseacher #
09:15
нет
09:16
заббикс это попингуй + мртг
e_zombie #
09:16
ну как то так да.
zi_rus #
09:16
dvolodin, NOC-1339 - в комментарии есть дифф, закоммить его пожалуйста, а то Dmitry1 сделал только тот что в теле issue
09:17
e_zombie, а нок это просто пиздец какой-то
e_zombie #
09:18
неее. это ещё не пиздетц. тут исходники есть.
zi_rus #
09:18
и там есть
e_zombie #
09:18
вот "кодекс" который я счас пытаюсь отучить падать на каждый чих - вот это пиздетц.
dvolodin #
09:19
ну прям как барышни
09:19
zi_rus: вот заббикс не умеет так распидорашивать графики, как NOC :)
zi_rus #
09:20
осталось понять что хуже
09:20
уметь пидорасить графики или не уметь этого
09:20
dvolodin, закоммить дифф, а то боль
dvolodin #
09:21
там где link up?
zi_rus #
09:21
dvolodin, так точно
dvolodin #
09:22
в feature/graphite прямо лить?
zi_rus #
09:23
да
09:23
dvolodin, тут только у меня большие железки
09:23
остальным это нахер не надо
09:23
потом в девелоп войдет
dvolodin #
09:26
залил
09:26
hg diff | wc -l
09:26
1372
09:27
смотри во что вылился фикс скачущих счетчиков ;)
freeseacher #
09:29
йопт
09:29
уже можно ставить ?
zi_rus #
09:43
dvolodin, то есть ты пофиксил, можно наблюдать?
freeseacher #
09:43
dvolodin, как из рокса удалить данные ?
09:43
zi_rus, может тызнаешь ?
zi_rus #
09:43
может и нет
freeseacher #
09:44
тоесть шанс есть ?
zi_rus #
09:44
кто знает
09:44
какой вопрос?
09:44
удалить данные? не знаю
09:45
я не знаю, даже как начать писать туда данные
freeseacher #
09:46
писать данные просто капец
dvolodin #
10:01
рано еще, я разгребаю в каком порядке коммитить
10:01
данные из рокса удалить можно
10:02
там есть операция delete
10:04
рыба для ./noc ts у меня уже есть
10:05
будем развивать функционал
Dubridze #
10:35
коллеги, как в инвентори переташить оборудование из unknown model?
TSergey #
10:36
завести модель (насколько помню)
Dubridze #
10:41
вот что пишет CISCO RUMSKKALES001 WS-C3750G-12S-S WS-C3750G-12S
10:41
это в неизвестных моделях
TSergey #
10:42
ну да, нужно сделать такую модель, по аналогиии с другими
10:42
но есть печаль, если ее потом заведут в ноке, то будет гемор
Dubridze #
10:48
а что такое coverage?
evyscr #
11:05
WS-C3750G-12S-S есть у меня локально
11:05
хе-хе-хе
TSergey #
11:06
Dubridze: http://static.nocproject.org/irclog/2014.05.04.html
evyscr #
11:39
TSergey: см. ответный коммент в NOC-1463
TSergey #
11:40
evyscr: переписываемся? :)
11:42
evyscr: а почему так? NotSupportedError() не определен для DGS3100?
evyscr #
11:50
а хрен его знает, почему так
11:51
в ноке вообще хрен разберёшь, что и как работает
11:55
вообще - потому что get_portchannel вызывается не в блоке try-except
11:56
и потому что архитектура безжалостно бессистемна
_4ePTeHok #
11:57
дело не только в архитектуре
11:57
но и в реализации скрипта
11:57
а их все пишут как могут)
evyscr #
11:57
в реализации набора скриптов
11:57
там их минимум три
freeseacher #
11:57
эм.
11:57
как это связано с архитектурой тока не понятно
evyscr #
11:58
лол
freeseacher #
11:58
скрипты для активатора всегда будут куском г
11:58
по большей части
evyscr #
11:58
вывод: нок - говно
_4ePTeHok #
11:58
неверно
evyscr #
11:59
потому что всегда будет содержать говно
_4ePTeHok #
11:59
вывод: все говно.
evyscr #
11:59
это бесспорно
_4ePTeHok #
11:59
потому что все в какой то стерени содержит говно
freeseacher #
11:59
нок хорошо дистанцирцется от пользовательского говна.
evyscr #
11:59
дистиллированная вода
freeseacher #
11:59
и если конкретный скрипт кажется гавном -сделай хорошо
12:00
дистилированная вода была когда то гавно :)
evyscr #
12:00
враньё
freeseacher #
12:00
эм. как там. эффект памяти воды :)
evyscr #
12:00
тоже враньё
_4ePTeHok #
12:00
неверно
12:00
вода - одна из составляющих говна
evyscr #
12:01
а говнонок из-за говноскрипта легко помирает
freeseacher #
12:01
ы ?
_4ePTeHok #
12:01
поправь епте
evyscr #
12:01
кого, архитектуру нока?
freeseacher #
12:01
у тя падает веб от ошибки в скрипте активтора ?
_4ePTeHok #
12:01
try-except вставь
evyscr #
12:01
эту херню я объехал давно
12:02
у меня ноку пиздец начинается по cpu при получении paging там, где раньше не было
12:03
и этот идиот шедулер с упорством идиота продолжает и продолжает отъедать его ещё больше
12:04
про пиздец в вебе я молчу.
12:04
но запуск из него какого-либо проблемного скрипта убивает этот веб напрочь
12:05
до полного рестарта нока
e_zombie #
12:05
ода
evyscr #
12:05
yarlly
e_zombie #
12:09
процесс бакапа пишется в лог сае?
12:15
2014-10-28 15:06:46,127 main.backup: Dumping MongoDB database into /var/noc/backup/noc-mongo-2014-10-28-15-06
12:15
2014-10-28 15:15:27,055 main.backup: dump failed. Removing broken dump /var/noc/backup/noc-mongo-2014-10-28-15-06
12:15
2014-10-28 15:15:27,056 main.backup: Unlinking: /var/noc/backup/noc-mongo-2014-10-28-15-06
12:15
wtf ?
zi_rus #
12:17
dvolodin, http://pastebin.com/DJAAwiaV - трейс в логах лаунчера, я ничего не делал, а после трейса он остановил все пробы
12:17
2014-10-28 14:05:01,790 [noc-launcher] Stopping daemon: noc-probe (PID 733)
12:17
2014-10-28 14:05:01,791 [noc-launcher] Stopping daemon: noc-probe (PID 735)
12:17
2014-10-28 14:05:01,791 [noc-launcher] Stopping daemon: noc-probe (PID 737)
12:17
2014-10-28 14:05:01,791 [noc-launcher] Stopping daemon: noc-probe (PID 739)
e_zombie #
12:44
http://pastebin.com/FFRXNRn7
12:44
напрод проверьте что у вас работает бакап монги.
12:44
я вот невкуриваю что она падает .
freeseacher #
12:44
e_zombie, не работает
e_zombie #
12:44
всё вроде прописано
12:45
ясно что вот этого пути тупа нет у/mnt/backup/backup/noc-mongo-2014-10-28-15-46
zi_rus #
12:46
а у меня букапит
12:46
noc-mongo-2014-10-28-01-11.tar.gz │ 2109M│Oct 28 03:31
e_zombie #
12:49
backup.py чтото кусок бакапа монги тут меня напрягает.
12:51
2014-10-28 15:46:52,645 main.backup: Checking paths
12:51
2014-10-28 15:46:52,646 main.backup: /mnt/backup/backup/ is not writable
12:51
хотя это гавно выполняется из под рута.
_4ePTeHok #
12:51
chmod?
e_zombie #
12:51
а потом оно нахер сносит старые бакапы
12:51
2014-10-28 15:46:52,647 main.backup: Removing obsolete backup noc-etc-2014-07-27-19-12.tar.gz
12:51
2014-10-28 15:46:52,647 main.backup: Unlinking: /mnt/backup/backup/noc-etc-2014-07-27-19-12.tar.gz
12:51
2014-10-28 15:46:52,647 main.backup: Removing obsolete backup noc-etc-2014-09-29-17-02.tar.gz
12:51
2014-10-28 15:46:52,648 main.backup: Unlinking: /mnt/backup/backup/noc-etc-2014-09-29-17-02.tar.gz
12:51
2014-10-28 15:46:52,648 main.backup: Removing obsolete backup noc-repo-2014-07-06-18-06.tar.gz
12:51
2014-10-28 15:46:52,648 main.backup: Unlinking: /mnt/backup/backup/noc-repo-2014-07-06-18-06.tar.gz
12:51
2014-10-28 15:46:52,649 main.backup: Removing obsolete backup noc-repo-2014-07-27-19-03.tar.gz
12:51
2014-10-28 15:46:52,649 main.backup: Unlinking: /mnt/backup/backup/noc-repo-2014-07-27-19-03.tar.gz
12:51
2014-10-28 15:46:52,649 main.backup: Removing obsolete backup noc-mongo-2014-07-20-17-46.tar.gz
12:51
2014-10-28 15:46:52,650 main.backup: Unlinking: /mnt/backup/backup/noc-mongo-2014-07-20-17-46.tar.gz
12:51
2014-10-28 15:46:52,650 main.backup: Removing obsolete backup noc-repo-2014-07-13-17-51.tar.gz
12:51
ахуитительное поведение.
12:52
я бы сказал ахуенное
_4ePTeHok #
12:52
гг
12:52
ну ето, как бы насрал - ойкнул и пошел прибирать за собой)
e_zombie #
12:52
хотя по идее оно должно сносить только старые.
12:54
такс.
12:54
походу надо ввести проверку на доступность и прерывание скрипта если директория не позволяет писать в неё и создавать папки.
dvolodin #
13:19
e_zombie: старые оно и сносит
_4ePTeHok #
13:19
только не сделав новый
dvolodin #
13:19
это разные процессы
13:20
там в конфиге задается, какие именно хранить надо
evyscr #
13:20
ахаха
dvolodin #
13:21
ты на даты-то посмотри
ufir #
13:21
володий, ты зачем нафлудил-то так
dvolodin #
13:31
zi_rus: багу в updateclient пофиксил
13:31
погодите пока обновляться
13:31
там еще новый метод discovery приедет
zi_rus #
13:40
долго ждать?
13:41
dvolodin, а чего ты какие-то мокротики сделал, а для циско-джуниперов -нет?
13:41
лиценззи я имею ввиду
dvolodin_ #
13:46
сделай ;)
zi_rus #
13:55
ну, я так не играю
13:55
dvolodin, обновляться можно?
dvolodin #
13:56
нет еще
14:15
вот как-то так
14:15
для начала нужно прогнать caps_discovery
14:15
потом -- ./noc probeconfig --touch
14:16
в ./noc probeconfig --list будут видны 32 и 64-битные счетчики
zi_rus #
14:16
обновился
14:19
dvolodin, почему в sa > mo > discovery нет никаких капс дискавери?
dvolodin #
14:23
есть
zi_rus #
14:23
в мо профиле есть
14:23
а в самом мо - нету
14:24
там где run можно сделать
dvolodin #
14:24
http://i66.fastpic.ru/big/2014/1028/9e/b5eb1a45f0e427ffca3a3666526e289e.png
zi_rus #
14:26
а у меня нету
14:26
ctrl f5 и logout/login не помогают
14:27
ну и хер с ним
dvolodin #
14:27
noc-web перезапускал?
zi_rus #
14:27
все перезапускал
14:28
это же обновление
14:28
а вот это нормально?
14:28
CONFIG: inv.Interface ID: 5416e428f3b6827586ee4923 (eca8f158-5ac4-59ad-99cc-2225a268958f)
14:28
DELETED
14:28
CONFIG: inv.Interface ID: 5416e428f3b6827586ee4925 (0bdcc1f9-0658-5c09-9fc2-2a8af6c8f3d3)
14:28
DELETED
14:28
CONFIG: inv.Interface ID: 5416e428f3b6827586ee4927 (73995457-545e-58f8-9ef8-e92053be43b0)
14:28
DELETED
dvolodin #
14:29
а caps discovery у тебя прошло?
14:29
он же по нему SNMP смотрит
zi_rus #
14:29
да, чего-то прошло
14:29
2014-10-28 17:32:52,030 [noc.lib.scheduler.job] [inv.discovery][caps_disovery][68] Set capabilities: {'SNMP | IF-MIB': True, 'SNMP': True, 'SNMP | IF-MIB | HC': True}
dvolodin #
14:29
да
14:30
db.noc.sa.objectcapabilities.find()
14:30
посмотри, в базу легло?
zi_rus #
14:37
> db.noc.sa.objectcapabilities.find()
14:37
{ "_id" : ObjectId("544fa64af3b6824371756b7f"), "object" : 67, "caps" : [ ] }
14:37
{ "_id" : ObjectId("544fa6b6f3b6824371756b80"), "object" : 56, "caps" : [ ] }
14:37
{ "_id" : ObjectId("544fa6c8f3b6824371756b81"), "object" : 62, "caps" : [ ] }
14:37
...
dvolodin #
14:40
эээ
14:40
а для 68-го?
14:42
db.noc.sa.objectcapabilities.find({object: 68})
zi_rus #
14:46
{ "_id" : ObjectId("544fa914f3b6824371756b93"), "object" : 68, "caps" : [ ] }
dvolodin #
14:47
хм
14:47
лажа
zi_rus #
14:47
это не я, оно само глючит
dvolodin #
14:56
так, добрый человек
14:57
а ты коллекции накатил?
14:58
db.noc.inv.capabilities.find()
15:06
или по-быстрому мигрировал?
zi_home #
17:38
dvolodin, я стандартно обновился, что я должен был еще сделать?
dvolodin #
17:39
проверь коллекцию с capabilities
zi_home #
17:41
dvolodin,
17:41
> db.noc.inv.capabilities.find()
17:41
>
17:41
типа пусто
dvolodin #
17:45
у меня уложило
17:45
в логах что?
zi_home #
17:45
логах чего?
17:45
апдейтер должен был положить
dvolodin #
17:46
не положил?
zi_home #
17:47
ну видимо
17:47
сейчас еще прогоню
dvolodin #
17:47
обновись
17:47
опечатка была
zi_home #
17:48
обновляюсь
17:48
> db.noc.inv.capabilities.find()
17:48
>
17:48
все равно ничего
17:49
вроде не ругался
17:49
Synchronize collections
dvolodin #
17:50
положил?
zi_home #
17:50
нет
17:50
root@noc:/opt/noc/local/collections/inv # ll
17:50
total 128
17:50
-rw-r--r-- 1 noc noc 3065 Sep 12 18:27 connectionrules.csv
17:50
-rw-r--r-- 1 noc noc 30465 Sep 12 18:27 connectiontypes.csv
17:50
-rw-r--r-- 1 noc noc 2113 Sep 12 18:27 modelinterfaces.csv
17:50
-rw-r--r-- 1 noc noc 79293 Sep 12 18:27 objectmodels.csv
17:50
-rw-r--r-- 1 noc noc 1085 Sep 12 18:27 technologies.csv
17:51
-rw-r--r-- 1 noc noc 4019 Sep 12 18:27 vendors.csv
dvolodin #
17:51
inv/collections/capabilities у тебя есть?
zi_home #
17:51
есть
17:51
root@noc:/opt/noc/inv/collections # ll
17:51
total 28
17:51
drwxr-xr-x 4 noc noc 512 Oct 28 17:19 capabilities/
17:51
drwxr-xr-x 9 noc noc 512 Sep 12 18:23 connectionrules/
17:51
drwxr-xr-x 17 noc noc 512 Sep 12 18:23 connectiontypes/
17:51
drwxr-xr-x 2 noc noc 512 Sep 12 18:23 modelinterfaces/
17:52
drwxr-xr-x 30 noc noc 1024 Sep 12 18:23 objectmodels/
17:52
drwxr-xr-x 5 noc noc 512 Sep 12 18:23 technologies/
17:52
drwxr-xr-x 2 noc noc 1024 Sep 12 18:23 vendors/
dvolodin #
17:52
./noc collection --sync
zi_home #
17:53
хрен
17:53
root@noc:/opt/noc # ./noc collection --sync
17:53
root@noc:/opt/noc #
17:53
root@noc:/opt/noc # ll local/collections/inv/
17:53
total 128
17:53
-rw-r--r-- 1 noc noc 3065 Sep 12 18:27 connectionrules.csv
17:53
-rw-r--r-- 1 noc noc 30465 Sep 12 18:27 connectiontypes.csv
17:53
-rw-r--r-- 1 noc noc 2113 Sep 12 18:27 modelinterfaces.csv
17:54
-rw-r--r-- 1 noc noc 79293 Sep 12 18:27 objectmodels.csv
17:54
-rw-r--r-- 1 noc noc 1085 Sep 12 18:27 technologies.csv
17:54
-rw-r--r-- 1 noc noc 4019 Sep 12 18:27 vendors.csv
17:57
dvolodin, во, засинхрилось
17:57
еще один фикс твой недокачал
dvolodin #
17:58
а
17:59
запускай caps discovery
zi_home #
18:00
нету его
18:01
http://i66.fastpic.ru/big/2014/1028/8a/9c35c809209166fc65e7b593f805d78a.png
18:02
но нок сам чего-то надискаверил
18:02
{ "_id" : ObjectId("544fa64af3b6824371756b7f"), "object" : 67, "caps" : [ { "capability" : ObjectId("544fd9bbf3b68216554315dd"), "discovered_value" : true }, { "capability" : ObjectId("544fd9bbf3b68216554315db"), "discovered_value" : true }, { "capability" : ObjectId("544fd9bbf3b68216554315df"), "discovered_value" : true } ] }
18:02
{ "_id" : ObjectId("544faacef3b6824371756c29"), "object" : 72, "caps" : [ { "capability" : ObjectId("544fd9bbf3b68216554315dd"), "discovered_value" : true }, { "capability" : ObjectId("544fd9bbf3b68216554315db"), "discovered_value" : true }, { "capability" : ObjectId("544fd9bbf3b68216554315df"), "discovered_value" : true } ] }
18:13
делаю
18:13
./noc probeconfig --touch
18:13
и лист
18:13
./noc probeconfig --list
18:13
ничего не показывает
dvolodin #
18:35
вообще пусто?
18:35
а, ну да
18:35
открой и сохрани metric set
18:36
я еще доделываю перестроение проб при изменении managed object'а
18:38
и я, наверное, разберу эти initial submit'ы scheduler'а
18:39
проще сделать отдельный job, который будет включать и выключать discovery jobs
zi_home #
18:48
и проба какая-то неправильная
18:48
я давно уже все сломал, а она продолжает собирать данные
18:48
все конфиги 10 раз уже протухнуть должны
18:50
dvolodin, мля, опять у всех метрик коллектор кривой прописался line://127.0.0.1:2003
dvolodin #
18:51
у тебя storage один или несколько?
zi_home #
18:52
один
18:52
пробу вынес на отдельную машинку
18:53
ты лупбек захардкодил что ли где-то
dvolodin #
18:53
не должно бы
zi_home #
18:54
ну а какого художника 127,0,0,1 прописала если сторадж один и у него белый ip
18:55
сделал probeconfig -t
18:55
прописала правильный
18:59
dvolodin, это ты не поправил http://pastebin.com/z77zkmLE или у меня проба не обновилась?
dvolodin #
19:01
не обновилась проба
zi_home #
19:02
херня какая-то, обновление пробы вроде включено
19:04
dvolodin, я ведт правильно понимаю что обновление пробы это только
19:04
[update]
19:04
name = probe
19:04
enabled = true
19:05
лаунчер периодически дергает апдейты
19:05
2014-10-28 22:06:51,409 [noc.lib.updateclient] Requesting updates from http://noc.kis.ru/main/update/
dvolodin #
19:06
в ланчере
19:06
noc-web перезапускал?
zi_home #
19:07
при апдейте весь нок перезапускается
19:07
в лаунчере на пробе тоже все прописано
19:07
[update]
19:07
enabled = true
19:07
url = http://noc.kis.ru/
19:07
check_interval = 300
19:24
dvolodin, вот так он говорит
19:24
2014-10-28 22:27:02,678 [noc-launcher] Checking for updates
19:24
2014-10-28 22:27:02,688 [noc.lib.updateclient] Requesting updates from http://noc.kis.ru/main/update/
19:24
2014-10-28 22:27:02,730 [noc.lib.updateclient] Nothing to update
19:25
dvolodin, виноват, нок не все остановил, noc-web после остановки почему-то остался в процессах висеть
dvolodin #
19:26
ну да
zi_home #
19:32
один хрен, когда весь нок остановил
19:32
и перезапустил
19:32
проба не обновляется
dvolodin #
19:32
так
zi_home #
19:35
во
dvolodin #
19:37
накати апдейты
19:38
снеси коллекцию
19:38
db.noc.sa.objectcapabilities.drop()
19:38
и форсируй caps_discovery
19:38
вроде нормально должно разложиться теперь
zi_home #
19:40
накатил
19:40
дропнул
dvolodin #
19:40
поехало?
zi_home #
19:40
эмм
19:41
форсировал на одной железке caps_discovery, наконец-то появился пункт в разделе
19:41
а что должно поехать?
dvolodin #
19:41
в probeconfig --list посмотри
19:42
./noc probeconfig --list | grep get_interface_load
19:42
Handler : noc.pm.probes.generic.network.snmp_interface.SNMPInterfaceProbe.get_interface_load64
19:42
или load32
19:42
теперь оно переключаться будет строго по capability
19:42
а не от балды
zi_home #
19:42
Handler : noc.pm.probes.generic.network.snmp_interface.SNMPInterfaceProbe.get_interface_load64
dvolodin #
19:43
угу
19:43
срослось
19:43
ну теперь caps_discovery пройдет и все пропишет
zi_home #
19:43
и я все же по поводу привязки пробы к МО
19:43
смотри
19:43
почему политика различается
19:43
активаторы мы привязываем а пробы нет
19:43
это же и то и другое выносные агенты
19:44
и отношение к ним надо делать соответствующее
19:45
вот этот подход что конфиг делится на равные части и забирается пробами независимо мне тоже кажется неправильным
19:45
почему с активаторами поступили красиво
19:45
а пробы на тяп ляп
dvolodin #
19:48
активаторы тоже будем переносить на клонирование через репо
19:48
подели конфиг на одну часть и пусть он его забирает
19:48
:)
zi_home #
19:49
а две машинки уже не сделать
19:49
чтобы если одна отвалится, вторая подхватит
dvolodin #
19:50
я же говорю -- это немного по другому делается
19:50
теоретически можно сделать две пробы, heartbeat'ы и репликацию состояния метрик и расписаний
19:50
но пока есть более важные задачи
zi_home #
19:50
ну ты про классическую кластеризацию
19:51
два днс сервера и без такой порнографии живут
dvolodin #
19:51
autoconf задает базовый протокол
19:51
вытягивания ништяков
19:51
сейчас он работает для DNS и проб
zi_home #
19:51
два dhcp тоже, им только надо указать друг на друга
dvolodin #
19:51
если его разумно развивать, то будут появляться новые ништяки
zi_home #
19:53
чего-то у меня не все графики прдолжили рисоваться
dvolodin #
19:54
если придумать способ, при котором разные инстансы смогут выбирать правильные куски конфига -- то будет нормально
19:54
свойства смотри для этих железок
19:54
я еще вкладочку в sa.managedobject с текущими своиствами добавлю
zi_home #
19:56
dvolodin, а на что влияет poller? какой для линукса лучше?
dvolodin #
19:56
epoll
19:56
в графите тоже оптимизации есть для nbsocket
19:57
с уменьшеним задержи на запись
zi_home #
19:57
# * optimal - auto-detect best supported method
19:57
# * select - use select()
19:57
# * poll - use poll()
19:57
# * kevent - use kevent/kqueue
19:57
ты не даешь таокго на выбор
dvolodin #
20:00
optimal ставь
20:00
epoll там есть
zi_home #
20:02
значит надо дописать в дефолтовом конфиге подсказку
20:03
сделал оптимал
dvolodin #
20:06
а у тебя select был?
zi_home #
20:09
да
20:09
это плохо?
21:02
dvolodin, но это на выносе который я сделал, на центральном у меня freebsd и кошерный kevent
dvolodin #
21:03
а
21:03
ну select -- это как-то жестко
zi_home #
21:04
какой ты по дефолту поставил, такой и был
dvolodin #
21:11
не знаю, может быть и optimal по дефолту можно поставить
21:11
наверное уже не осталось платформ, на которых будет работать только select
zi_home #
21:13
те, кому это понадобится, сами смогут поправить, а по-дефолту надо думать о большинстве
dvolodin #
21:18
а для этого нужно убедиться, что optimal -- оптимален для большинства
21:19
на самом деле он прос
21:19
если есть epoll/kevent -- используем их
21:19
нет -- пробуем poll
21:19
не прокатило - select
21:20
пробы подтянулись?
21:20
capability устойчиво находит?
zi_home #
21:21
не знаю как проверить
21:21
job log не пишется
21:21
у меня некоторые графики перестали рисоваться
21:21
даже не некоторые а многие
21:23
я прогнал капабилити дискавери
dvolodin #
21:23
по общему количеству проб посмотри
zi_home #
21:23
но ничего не изменилось
21:24
dvolodin,
21:24
root@noc:/opt/noc # ./noc probeconfig --list | grep CONFIG | wc -l
21:24
19
21:24
типа нескольок мало
21:24
probeconfig -t???
dvolodin #
21:24
probeconfig --list
zi_home #
21:25
ye kbcn z e;t pfgecrfk
21:25
ну лист я уже запускал
21:25
там вообще все пробы только с одной железки
21:28
пересохранил еще раз метрик сеты
21:29
стали появляться конфиги проб
21:29
это несколько напрягает, ненадежность появления конфигов, хоят надеюсь это издержки состояния отладки
21:35
мля
21:35
все равно не все пробы создала
21:35
раньше было 7к
21:35
сейчас, после сохранения всех сетов только 1373
dvolodin #
21:51
вопрос еще в том, сколько из тех 7k реально собиралась
Tweet
Share this page
Share this page: Tweet