nocproject.org
03:21
dvolodin: привет
03:21
подскажи как сделать патч только для некоторых файлов
03:22
hg diff дает все изменения
03:23
hg diff <список файлов>
03:23
хм
03:23
с путями?
03:26
dvolodin: спасиб, запустил в папке профиля, это достаточно
03:27
*этого
03:27
03:27
честный SNMP с интерфейса микротика
04:24
freeseacher, это я все не по одному разу видел. а что такое?
04:26
Нам надо провести кастинг?
04:28
нет просто это наше ближайшее будущее
04:28
04:28
и понял что надо что то делать :)
04:29
ну кубизм уже в дереве. rickshaw тоже
04:30
04:31
да, мне nvd3 больше нравится
04:32
04:32
вроде норм
04:33
я сейчас больше всего беспокоюсь на счет нормальных подписей на осях
04:33
и текстовки которую туда можно вывести
04:35
как я понимаю, движок рисовалки поменять не сложно, так что думаю можно бюудет поэкспериментировать с разными
04:36
Здесь большую роль играет возможности API движка по настройки..
04:37
Если в настройках можно игратся с подписями осей, сетками, цветами, типами графиков..., то это очень хорошо!
04:37
и если к интерактиву на графике я отношусь равнодушно, то к подписям весьма трепетно
04:38
и что самое смешное большинство этих графиков не умеют такую простую штуку как title
04:38
Ну освежать график кнопкой, както прошлый век...
04:41
title можно в JS рисовать. а вот всё остальное должено настраиватся через API. Возможность увеличения - киллер фича! По осям и сетка тоже должна соотведственно увеличиватся и уменьшатся...
04:41
xetle, а тебе не приходится графики в письма вставлять ?
04:42
Интерактив или статическая картинка с возможностью сохранения и обновления нужно.
04:43
Для удобства сохранения и дальнейшей работы title должны быть на графике.. Иначе отдельно руками всё придётся подписывать..
04:49
dvolodin, Rickshaw тоже не умеет title
04:49
не ужели это такая сложная фича ?
04:49
title я и сам отрисую
04:49
не нравится мне их легенда, нужно свою делать
04:49
04:51
Flot хорошо кастомизуется API. Можно с разрабами связатся чтобы title добавили в саму картинку.
04:51
у флота на главной пожалуй самый симпатичный дефольтный граифк
04:51
но тоже оси бля...
04:57
в идеале, конечно, сделать несколько альтернативных рисовалок графиков и потестировать
05:00
а для начала, хотя бы одну
05:01
я сделал на rickshaw
05:05
он ajax гугла тащит.
05:06
Плохо это или нет сказать сложно.
05:08
В идеале надо 1. простое АПИ с возможностью кастомизации всего, 2 быстрота и легковестность пакета, 3 минимум зависимостей и хорошая поддержка и динамика развития.
05:08
сделал патч для DGS3100,
NOC-1429, обработка портчэналов, разворачивание конструкций "1:(1-2,5,7-9),ch(2,4-5)"
05:09
xetle: про идеалы говорить все готовы
05:09
меня больше реализация волнует
05:10
ничего он не тащит -- они jquery тянут
05:10
Выбираем простое кастомабельное API
05:10
причем jquery они тянут только для ajax request
05:10
а я в графиках использую Ext.Ajax.request для получения данных
05:28
freeseacher: посмотри
NOC-1429, может пригодится для твоих DGS3100
05:29
нее
05:29
только в мангалы.
05:29
так говорил, что пяток работает
05:30
а как из них мангалы?
05:30
только из-за человесеской лени
05:30
freeseacher, плюсую, получение графика картинкой, для вставки куда надо, очень важно и нужно
05:30
так вланы неправильно собирались на них
05:30
или тебе не критично?
05:32
раскурочиваешь, вытаскиваешь кусок бесполезной зеленой платы. а из жести 2-4 коммутаторов выпиливаешь запчасти для мангала
05:32
ну если только так :)
05:32
жесть хорошая, достаточно толстая
05:32
zi_rus: в чем печаль? /render умеет отдавать картинку
05:33
у меня в машине мангал купленный за 170 рублей, уже с десяток выездов жив
05:33
ага. но этот то будет `с душой`
05:34
dvolodin, ты там от себя хочешь чего-то добавлять, например Title и легенду, но они нужны не только в вебе, а во всех вариантах. ты прилепишь это для всех вариантов или только в вебе?
05:34
мангал от длинка? что-то я сомневаюсь в качестве
05:34
TSergey, это их основной бизнес, будь уверен
05:35
нее zi_rus они жесть не сами делают.
05:35
я вчера смотрел чего-то на предмет передачи на телек DLNA, оказывается есть и от DLinka, все те же приколы с настройкой, с прошивками
05:35
так что она нормальная
05:36
TSergey, XBMC на Cubox-i заебок
05:36
спасиб, гляну
05:38
freeseacher: ты такое используешь?
05:39
как сильно нужно заморочиться, чтобы это работало в режиме "включил плеер"?
05:40
души нудно вложить ровно столько скольхо хочешь получить результата. в дефолтном варианте когда коробочка будет только плеером - нисколько.
05:41
там какой то штатный дистрибутив есть. минут через 7 после закачки дистра ты уже рулишь XBMC с пульта
05:41
Xbian Кажется
05:42
а не. тот под расбери
05:42
05:43
их коробки - качает торренты и выводит xbmc на телек.
05:45
Приветствую. Может подскажете в чем проблема.
05:45
Пытаюсь импортировать VLAN-ы со свича (juniper), только окошко "Select VCs to import" открывается с пустыми строчками. Скрипт get_vlans отрабатывает успешно!
05:45
05:51
вроде откоммитил все
05:51
при импорте vlan-ов чтение с устройства производится по SNMP? или это не мне было?
05:51
dvolodin, куда откоммитил? слил ветки?
05:52
dvolodin, теперь можно?
05:52
а что тестировать?
05:52
как проверять?
05:57
05:57
посмотреть в настройки
05:57
да dvolodin на питоне написал. теперь надо написать мануал на русском :)
05:58
описание идеи у меня в evernote
05:58
Я сейчас делаю API router'а
05:59
только через solution -- жестко
05:59
а так рецепт простой
05:59
настройить хранилище, запустить pmwriter и noc-probe
05:59
сделать metric set с interface | load
05:59
и навесить его на профиль интерфейса
05:59
в принципе -- достаточно
06:00
с пробами нужно учитывать вот такой момент
06:00
данные должны собираться?
06:00
да, будут собираться
06:00
там шардинг из коробки
06:00
в PM > Setup > Probes указывается, сколько instance будет у пробы
06:00
несколько штук делаются в конфиге noc-launcher'а по аналогии с активаторами
06:01
так вот, раскладка сразу делается равномерно на все instance
06:01
и пробы получают только свой конфиг
06:01
то есть если в морде указать, что 4 instance, а реально их только два -- половина метрик не будут собираться
06:02
реквестирую появление techwriter в чатиге
06:04
freeseacher: позови
06:04
:)
06:04
в Metric Type добавил еще поле measure
06:04
на мой взгляд - полезно будет
06:04
для тех же легенд
06:06
dvolodin, зачем так сложно?
06:07
почему нельзя как с активаторами сделать
06:07
а если у меня пул из трех серверов и один упал, а пробы раскиданы по всем трем, треть метрик не будет собираться?
06:07
с активаторами у тебя динамическая балансировка
06:08
а тут наркомания какая-то
06:08
это лучше, чем упадет все от перегрузки
06:08
ахереть
06:08
а если я нормально прогнозирую нагрузку и у меня не будет перегрузки от падения одного сервера, то я лох?
06:08
ты сначала одну пробу попробуй перегрузить
06:09
ну а зачем тогда такие пошлые подходы?
06:09
ты сам себе противоречишь
06:09
то перегрузка будет
06:09
то не будет
06:10
нормальный подход
06:10
если нужно будет - перебалансируешь
06:10
сервер может упасть ночью, зачем это в ручной режим переводить
06:11
я про то, что не следует бездумно указывать произвольное значение количество instance в конфиге
06:11
freeseacher, я чего-то не понимаю, или он действительно предлагает все делать руками?
06:11
dvolodin, у активатора мы не указываем количество инстансов, сколько подцепилось столько их и есть
06:12
21 век на дворе
06:12
zi_rus: активаторы выполняют сотни скриптов в минуту, пробы - миллионы
06:12
разница есть?
06:12
короче -- не нравится, смотри реализацию
06:13
придумаешь, как сделать динамическую балансировку - скажи
06:13
zabbix динамически балансирует?
06:13
graphite, btw, вообще без автоконфигурации
06:14
там просто ручками прописываешь каждую метрику
06:14
dvolodin, на активатор у тебя есть шейпер, на пробу тоже можешь его навесить, почему нет
06:14
и ручками настраиваешь роутинг при помощи всяких load balancer'ов
06:15
zi_rus: он вместо мониторинга будет балансировкой нагрузки своей заниматься
06:15
ну нафиг
06:15
они уже есть, сделай свою киллер фичу чтобы остальные сосали, иначе зачем нужен нок, если есть заббикс
06:15
не буду, оно и так рабоатет
06:15
а сосать остальные будут за счет автоконфигурации
06:15
"зажарится как-нибудь"
06:16
если проба упала - ее поднимет ланчер
06:16
что еще?
06:16
если упал сервер, лаунчер его не поднимет
06:20
если упал сервер, то поднимет его VM Motion
06:20
физический?
06:21
и хард поменяет?
06:21
и БП?
06:21
RAID тоже в NOC сделать надо?
06:21
если хочешь перестраховаться от падения сервера -- ставь их несколько штук и крути vCenter, proxmox или что там еще
06:21
нет, надо рассчитывать что система раскидана по пулу ненадежных узлов
06:22
пока запускается упавшая виртуалка, тоже нужно время
06:22
посмотри live motion
06:22
у того же vmware он секундный
06:22
noc сисетма для бедных
06:23
а если по филиалам раскидать
06:23
везде кластера поднимать?
06:23
поставить пару машинок чисто под нок и вперед
06:23
тоже неверная установка, noc доступен даже бедным
06:24
нет денег на резервирование, значит нет
06:24
нет, в каждом филиале ставишь кластер виртуалок
06:24
но ты заведомо ухудшаешь параметры
06:24
селишь в них NOC и все остальное
06:24
кластер виртуалок, хранилище etc.
06:24
ничего я не ухудшаю, я добавляю масштабируемость
06:25
zi_rus: кластер виртуалок сегодня уже - стандарт
06:25
какая еще масштабируемость при ручной балансировке
06:25
нет там никакой ручной балансировки, блин
06:25
dvolodin, для новых инсталляций да
06:25
как нет когда есть
06:25
ручная балансировка это когда ты каждую пробу будешь руками разносить
06:26
пока не ошалеешь
06:26
ты это и предлагаешь
06:26
ровно это тебе заббикс и предлагает
06:26
zi_rus: где я такое предлагал?
06:26
чтобы сидела обезьянка, следила за серверами, проба упала, надо быстренько в конфиге поправить, что проб стало меньше
06:26
это же ебануться можно
06:27
я сказал, что параметр Instances в пробе должен строго соответсвовать количеству запускаемых instance данной пробы
06:27
да зчаем это надо
06:27
она что сама не видит сколько проб подключилось?
06:27
zi_rus: если ты посмотришь, как работает современный highload, ты потеряешь веру в человечество
06:28
у него нет постоянных коннектов для проб
06:28
кроме того, каждая проба может слать награбленное в свою региональную базу
06:28
то есть на город -- pmwriter и несколько проб
06:28
и свое хранилище
06:29
я умываю рукаи. кто-нибудь еще согласен что та нормально?
06:29
ты бухтишь, что нет функционала, который непонятно у кого вообще есть
06:30
при том, что раскладка метрик по пробам все-таки делается автоматом и нет необходимости прописывать всякие прокси руками, как в заббиксе
06:30
а в кактусе вообще все руками
06:30
dvolodin, непонятно кто уже используется другими и достаточно давно, ты пишешь свою систему сейчас, мог бы и добавить то чего нет у других, иначе зачем все это надо
06:32
посмотри как работает pm/apps/probe/views.py
06:32
и lib/daemon/autoconf.py
06:32
ровно тот же подход можно применить к синхронизации DNS/DHCP/RADIUS и прочего
06:33
зачем надо -- ответ простой
06:33
ты сам почему графики хочешь в NOC?
06:33
потому как хочется, чтобы ты раз политику написал, а оно само пробы добавляло
06:33
и за порогами смотрела
06:33
так?
06:34
все остальное - вторично
06:34
я, правда, хочу еще детектор аномалий
06:34
но это просто приложение
06:34
ну так вот, ровно вокруг автоконфигурирования я и пляшу
06:35
для прочих - да, а я еще эксплуатирую нок, и меня заебало каждый раз рестартовать классификатор потому что он залипает из-за бурь на Юпитере. теперь еще и за пробами следить
06:36
dvolodin: скажи, а в том виде, в котором нок у нас (develop), ты где-то в продакшене используешь?
06:39
кроме того, если уж пошла такая пьянка, то никто не мешает доработать noc-probe и добавить failover
06:40
тогда у каждого instance будет еще братец, который тоже тянет конфиг, но не запускает пробы сам, а получает состояние от соседа
06:40
и начинает работать только когда сосед отвалился
06:40
zi_rus: был такой, он неактуален уже, вроде
06:41
zi_rus: у меня тоже такой есть
06:45
cairo поставь
06:45
его графит хочет
06:45
еще понадобится libffi и libffi-dev
06:46
разве сейчас все не в виртуалэнве?
06:46
это системные либы
06:46
в virtualenv доставится все, что нужно
06:46
короче по твоей печали с пробами
06:47
нужно подружить их с heartbeatd
06:47
failover проба будет делать все то же, что и основная, только не будет запускать непосредственно сами пробы
06:47
то есть читать конфиг и гонять расписание она будет
06:48
если основная проба упадет, heartbeatd поставит ей флажок и она запустит сбор
06:48
когда поднимется основная проба -- failover опять перестанет собирать данные
06:48
вот тебе и шардинг и failover
06:48
и без промежуточных извратов с балансировкой
06:48
так ты доволен?
06:49
нет, ты все равно заставляешь конфигурить число инстансов, лишние параметры всегда плохо
06:50
получается какой-то линукс
06:50
ты можешь настроить все
06:50
и ты будешь настраивать ВСЁ
06:51
можно было бы проявить больше человеколюбия
06:51
нельзя, люди от этого портятся
06:52
а от садизма становятся лучше?
06:56
да
06:56
BDSM - наше все
06:56
хорош плакаться
06:57
посмотри, какие либы понадобятся твоему центосу, надо в bootstrap все прописать будет
06:57
у меня bsd
06:58
cairo записывайте
07:15
короче обновился я
07:15
это жесть
07:15
как стораж настраивать непонятно
07:15
что еще за стораж рули тоже непонятно
07:16
zi_rus, добро пожаловать в nocproject ;)
07:17
ага
07:17
Обязательно должен быть StorageRule default - дефолтовым rule там и не пахло
07:17
zi_rus, если я тебе все расскажу, запишешь в виде доки :) ?
07:17
не, я не умею доки писать
07:17
поплаукать это всегде пожалуйста
07:17
но такую доку могут не оценить :)
07:18
freeseacher, а ты когда будешь рассказывать можешь сам прямо начинать доку писать
07:18
зачем эти пересказы
07:20
воркфлоу
07:20
не парься им никто не пользуется
07:20
ресурсы жрет
07:20
надо убить тогда
07:21
в лаунчере выключить можно?
07:23
еще корелятор и класификатор сильно грузять проц
07:55
dvolodin, ну и как все это безобразие настраивать?
07:58
dvolodin, джоб чек_линк, почему он не закрывает алармы по упавшим линкам
08:28
Я тоже обновился до последней версии future/graphite
08:29
настроил и добавил всё что смог и как понял.
08:30
pmprobe -отвалился, пришлось коментить в ланчере.
08:31
pmprobe убирай совсем
08:32
там noc-probe должен пускаться
08:34
pmwriter запускается. probe в конфиге ланчера настроена, а по логам он даже не пытался её запустить.
08:36
xetle: попробуй такой патч
08:36
08:41
Да, он нужен. Проба запустилась, её логи появились.
08:43
08:45
Это в Access
08:46
В collectors возможен выбор только line, а netstat говорит о открытом 2003 tcp Его и указал.
08:47
Storage Rules сделал по аналогии со старым MRTG
08:48
xetle: URL web-морды NOC
08:49
в коллекторах - да. line/2003
08:50
Дефолтну пробу создал, узера выбрал noc instence = 1
08:52
Создал Metric Sets выбрал созданный рание Storage Rule и прописал границы для созданного Metric Tipe
08:53
instances в морде -- 1
08:53
в ланчере просто пускаешь демона
08:54
теперь топай в interface profile
08:54
и жми кнопочку metrics
08:56
там довешиваешь нужные metric sets
08:56
получилось?
09:02
Active дает отметить зелёной галочкой. А вот в Metric set ничего написать и выбрать нельзя..
09:03
Есть 1 штука писал выше.
09:05
Я выбрал только зелёную галочку и нажал save оно записало, потом нажал кнопку Metrics снова а там пусто. Жму Add даёт поставить зелёную галочку в metric sets ничего не даёт записать но уже при сохранении выдаёт ошибку.
09:07
да, вижу, где-то поломал
09:07
сейчас поправлю
09:09
поправил
09:19
зафиксил багу с неоткрывающимимя после закрытия вкладками
09:20
закоммитить, чтоли, из вредности ее в feature/graphite ;)
09:28
Также в графит с девелоп надо перенести фикс баги с кнопкой Close при отработки скрипта в SA - MO - Scripts ...
09:33
Да заработало. Но надо жать кнопку Add для добавления метрики
09:35
Add жать -- это стандартное поведение для Grid Field
09:36
ну а теперь топай в sa > managed object
09:36
там в объекте выбери кнопку Interfaces
09:36
если тыкнешь на физический интерфейс -- увидишь кнопку Metrics
09:36
там интересны вторая и третья вкладка
09:38
Да есть чёто там
09:41
Просто одни баги фиксятся в девелоп другие в графите.. Вот их объединят и баги исчезнут.
09:43
[13:44:49] <xetle> Просто одни баги делаются в девелоп другие в графите.. Вот их объединят и баги захватят мир.
09:43
я поправил, не благодари
09:45
В Metric Sets когда добавляете Metrics Type лучше наверно брать чтото агрегирующие, например сразу Interfaces
09:45
xetle: для того оно и сделано
09:46
имеет смысл работать на уровне Interface | Load, Interface | Errors
09:46
в Debug там смотри трейс
09:46
если не нашлась метрика
09:46
там подробно расписано, что именно ему не хватило
09:47
Тогда в SA - MO - Interfaces - Metrics - Metrics они всразу все скопом появятся
09:47
Один вопрос в поле Active там у всех красный крест.
10:01
xetle, а можешь рассказать как ты storage и storage rule настраивал
10:04
Да, раскажу.. Но графика пока не видел.
10:05
да, баг с повторным открытием пофикшен
10:05
Изменения с девелоп пошли в графите и кучу багов профиксилось.
10:08
Если я доку в блогах начну писать о PM другие смогут дополнять и редактировать?
10:08
даже грохнуть смогут
10:09
повторные октрытия в основной ветке пофиксили?
10:09
да
10:10
в девелоп, если ты ее называешь основной
10:10
збс, обновлюсь
10:10
сервак перегрузил
10:10
))) года два не делал этого
10:10
бэкап сделал перед обновлением?
10:10
сделал
10:10
уже все загрузилось
10:11
убунту 12.10 стоит до сих пор
10:46
теперь надо всем дружно починить get_intefaces чтобы snmp_ifindex нормально отдавал.
10:48
Без этого pm/probes/generic/network/snmp_interface.py hf,jnfnm yt ,eltn b uhfabrjd ytedblbv!
10:48
*работать не будет и графиков не увидим!
10:53
10:54
Чтобы хоть температуру рисовало.. И нет графиков!
10:54
А вообще где они должны быть?
10:57
все графики на скриншотах у Димы :)
11:06
гггг
11:06
мне наконец подогнали секретные мибы от сименсов
11:06
)
11:14
Как с доками если начну писать в блог статью о PM другие править, дополнять смогут?
11:18
может да, а может и нет, ты начни, а дальше по ситуации, скопировать в другое место всегда сможем
11:30
xetle, а почему ты такие oid для температуры выбрал, у меня другие
11:30
1.3.6.1.4.1.9.9.13.1.3.1.3.1005
11:31
а для ASR9k вообще целая ветка с кучей датчиков 1.3.6.1.4.1.9.9.91.1.1.1.1.4
11:31
У каждого устройства свои..
11:32
там тоже куча датчиков 1.3.6.1.4.1.40418.2.4.4.2.* но прицеплен один.
11:32
Надо володину сказать чтобы было как в старой версии..
11:33
придется профили делать для температуры
11:33
но ты под свои железки сделал
11:33
мне оно не поможет
11:34
датчики на инвентори сильно завязаны
11:34
может в эту сторону копнуть
11:34
Вот что надо в MO добавить кнопку типа Metrics
11:34
там можно делать общие
11:35
есть метрики с preference 100
11:35
они по идее должны учитывать даже версию по на циске
11:35
Там возможность выбирать настройки с PM всяких Metrics Set итп, а также:
11:36
нащёлкать необходимые OID для мониторинга..
11:36
Metrics Set - вялаешь какие душа желает.
11:37
xetle, а что дальше делать, куда метрик сет применять?
11:37
А потом в MO - Metrics выбираешь их и по кнопке Add добавляешь OID...
11:37
PREF_VERSION = 100 # Version-depended implementations
11:37
PREF_MODEL = 200 # Model-depended implementations
11:37
PREF_PLATFORM = 300 # Platform-depended implementations
11:37
PREF_VENDOR = 400 # Vendor-depended implementations
11:37
PREF_COMMON = 500 # Common fallback implementations
11:38
Ты Метрик сет уже создал у себя?
11:39
Inventory - Setup - interface Profiles
11:39
да, я тут
11:39
кнопку метрикс жму
11:40
жму адд
11:40
Там кнопка метрикс появилась
11:40
вот ставишь галку актив и добавляешь..
11:40
галочку поставил
11:40
а метрик сет ничего не выдает
11:40
просто поле
11:40
ни выпадающего списка
11:40
ничего
11:41
кликаю, бестолку
11:41
Также в SA - MO - Interfases - Metrics тоже жмёш адд ставишь галку и выбираешь метрик сет.
11:41
Обнови до последней версии графита и обнови страничку...
11:42
у меня 9970
11:43
Ещё раз говорю всем: надо фиксить get_interfaces параметр snmp_ifindex. Без него графиков небудет! )
11:43
а я говорил ему
11:44
а он сказал, у него супер заумный автоконфигуратор, он найдет оиды даже если их нет в базе
11:44
гет интерфайсес надо
11:44
zi_rus обновляйся, там появится список выбора твоих метрик сет.
11:46
freeseacher: вы физические порты берёте, а агрегация? может стоило брать switchport?
11:46
а хер знает :)
11:46
я пока сам не вкурсе
11:46
интервал 157680000 - 'nj d rfrb[ tlbybwf[&
11:46
это в каких единицах?
11:47
типа пять лет
11:48
freeseacher, на самом деле дописать не сложно, по стандартным iflias пробежался и по имени сравнил
11:49
Не сложно но это надо сделать для всего оборудования..
11:50
код копипастой во все профили раскидывается на раз два
11:50
мне не надо, у меня циски
11:50
они отдают индексы
11:50
ну тесты это дело такое
11:50
А индексы для портченелов?
11:51
если они есть, будут в том же списке
11:51
ладно
11:51
я применил метрику
11:51
а теперь куда смотреть?
11:54
на следующие две вкладки..
11:55
У меня на них в поле актив красный крест стоит. дволодин сказал искать трейсы в дебаге.
11:55
дебаг не включал в логах трейсов невидел.
11:56
ERRORS:
11:56
Deactivated by router
11:56
pmprobe можно вырубать как я понял?
11:58
Нужно! Пока в ланчерене прибил pmprobe нок у меня не работал..
11:59
etc/noc-probe.conf надо настроить, логин пароль в вебку нока дать..
11:59
ну и рестартнуть нок
12:00
эээ
12:00
ему надо логин отдельный от веб интерфейса?
12:01
а права какие давать?
12:01
суперюзер?
12:04
сделал
12:04
ничего не изменилось нигде
12:04
да.
12:04
с зелеными галочками проблема
12:07
а что такое нок коллектор
12:07
тоже появился
12:08
его вкючать?
12:08
там в настройках что-то про трапы и сислог
12:09
это удаленные коллекторы
12:09
я запутался, удаленные синхронизаторы, активаторы, пробы, теперь еще и коллекторы
12:10
что бы сислог не на активаторы принимать
12:10
еще будут классифкаторы
12:10
основная идея что бы нок можно было разнести по серверам
12:10
ресурсоемкие операции я имею ввиду
12:11
а в чем идея?
12:11
активаторы принимали принимали, а теперь не могут принимать?
12:11
вы еще сислог от снмп отделите
12:11
пусть тоже на разных серверах живут
12:13
по-моему это бардак
12:15
zi_rus, еще не так приходится извращаться если тебе надо обработать ~150к железяк
12:44
zi_rus, freeseacher: хоть ктото графики у себя уже увидел?
12:45
нет
12:45
мне пока не до этого
12:45
у меня крестики
12:45
ERRORS:
12:45
Deactivated by router
12:45
На красных крестиках и я остановился;)
12:45
что бы это ни значило
12:46
включи в probe & pmwriter дебаг и смотри логи, может найдёшь ответы...
12:48
роутером деактивировано может если хендлер не подходит
12:48
и вообще там вроде трейс делали
12:49
12:49
12:50
какие-то трейсы
12:50
это только у меня?
12:52
Завтра гляну.. Попробуй проверить
http://127.0.0.1:8000 в бровзере и дать суперпользователя в etc/noc-probe.conf Вддруг полегчает.
12:53
так, с этим разобрался
12:53
неправильное имя в autoconf укзала
12:53
*указал
12:54
2014-09-02 16:55:45,780 Config retrieved
12:54
все, теперь даже при дебаге ничего не пишет
12:58
вот что нашел
12:58
ERRORS:
12:58
No handler found
12:58
TRACE:
12:58
Checking noc.pm.probes.generic.network.snmp_interface.SNMPInterfaceProbe.get_interface_load
12:58
Cannot get required variable 'snmp__ro'
12:58
Giving up
12:59
ха
12:59
это уже в самой пробле
12:59
она не может взять комьюнити из профиля Мо
12:59
прописал в МО
12:59
галочки позеленели
13:00
но это в МО
13:00
а в интерфейс профиле все равно кресты
13:05
а вот это не знаю как понимать
13:05
TRACE:
13:05
Checking noc.pm.probes.generic.network.snmp_interface.SNMPInterfaceProbe.get_interface_load
13:05
Matched handler noc.pm.probes.generic.network.snmp_interface.SNMPInterfaceProbe.get_interface_load({'interface__ifindex': 13, 'snmp__ro': u'xxx', 'address': u'192.168.1.1'})
13:05
вроде все правильно
13:07
zi_rus, тоесть тя даже не смущает что проба требует для отдельного метода snmp__ro ?
13:08
freeseacher, не понял
13:09
что и в каком месте меня должно смущать
13:09
меня смущает что для Cisco.IOS свичей в базе почему-то нет ifindex
13:12
хотя скрипт их возвращает
13:21
меня еще смущает что хоть скрипт get_interfaces работает для Cisco.IOS, interface_discovery валится в трейс
13:22
13:22
вот так
13:22
причем началось это определенно сегодня
13:23
до обновления все работало
13:23
кстати
13:23
в Cisco.IOS параметр называется ifindex
13:23
а в Cisco.IOSXR - snmp_ifindex
13:24
причем я помню как мы с Володиным для IOSXR скрипт доделывали не очень давно
13:24
и еще получение конфига
13:24
13:24
а как он в интерфейсе называется ?
13:25
возвращает None
13:25
freeseacher, "snmp_ifindex": IntParameter(required=False),
13:25
значит не правильно возврщает
13:26
надо исправить
13:26
кто готов?
13:26
13:26
freeseacher, вот это вроде скрипт отработал
13:27
закоммитить не могу
13:27
и более еще проверить, пока дискавери поломан
13:27
верните Володина обратно
13:28
zi_rus, у тя есть событие DHCP Pool empty ?
13:31
zi_rus: точно. щас сделаю
13:32
Dmitry1 о, привет. А ты get_LLDP_neighbors на длинках с cisco_cli не смотрел?
13:32
на прошлой неделе тебе пасту кидали
13:32
Night_Snake: да не могу я подружить :(
13:33
а что там, все печально?
13:33
у меня на той циске, куда воткнуты длинки нету lldp
13:37
freeseacher, ты меня заинтриговал. что именно меня должно было смутить?
15:49
Ah, Hello, there. I've just taken over managing an elderly machine of ours with NocProject 0.6.2 on it, and I need some guidance for upgrading it to 0.8. I've looked all over for install directions for 0.6.3+, and all of them point to defunct web pages that no longer exist, and the current 0.8 install instructions fail miserably.
17:36
dvolodin, после обновления на графит, сломался interface_discovery
17:36
17:36
ошибки при сохранении?
17:37
zi_home: у тебя монга старая?
17:37
хз
17:37
эмм
17:38
dvolodin,
17:38
# mongod -version
17:38
db version v2.4.10
17:38
на 2.6 муторно обновиться?
17:39
щас гляну
17:39
если в портах есть, обновлюсь
17:39
в портах 2.6.4, попробую обновиться
17:39
попробуй
17:39
это в pymongo вылетает при пакетных операциях на старой монге
17:40
dvolodin, а еще заметил, если в свойствах МО не прописан комьюнити, то из профиля проба его не берет
17:40
Cannot get required variable 'snmp__ro'
17:40
из профиля объектов?
17:40
да
17:40
когда прописал в МО
17:40
я понял
17:41
на самом деле это даже не в профиле проблема, а в том, что get_probe_config для MO не определен еще
17:41
ну я не знаю, это из того что встретил
17:42
сейчас пропишу
17:42
это все равно делать
17:42
на самом деле сейчас галочки местами вроде зеленые, но ничего не собирается
17:42
пробы нашлись для них?
17:42
запусти пробу руками в дебаге
17:42
./scripts/noc-probe.py -f start
17:43
может она у тебя коллектор не видит
17:44
community в auth profile, если точнее
17:46
в дебаге все останавливается на 2014-09-02 17:04:09,201 [io] Running I/O thread
17:46
2014-09-02 17:04:09,201 Running socket factory (KEventPoller)
17:46
2014-09-02 17:04:19,183 Getting config
17:46
2014-09-02 17:04:19,391 Config retrieved
17:47
17:47
возвращается None
17:47
17:47
но это одно и тоже как я понимаю
17:50
zi_home: с snmp community зафиксил
17:50
ок
17:50
монга пока компилится
17:50
эээ
17:50
погоди
17:51
назови пробу default
17:51
там текущая реализация ее навешивает по умолчанию
17:52
я сейчас делаю конфигурируемые параметры
17:56
мы еще не поняли, какие права надо выдавать юзеру нока для доступа
18:03
?
18:03
pm.probe config
18:03
ну проба конфиг дергает из веба
18:04
ей нужна учетка
18:04
какие права ему давать
18:04
обычный юзер
18:04
давать на приложение pm.probe роль config
18:04
а права на доступ?
18:04
только конфиг?
18:06
да
18:07
ему больше не надо
18:55
ну вот, монга обновилась и протеряла пароль от юзера нока
18:56
пришлось восстанавливать
18:56
дискавери починился
18:56
но проба работать не начала
19:01
с дебагом ее пусти
19:01
по http конфиг она получает?
19:01
19:02
кстати, советую последние патчи из graphite поставить
19:02
лечат изрядную часть косяков
19:02
и появился нормальный поиск в пределах конфига по Ctrl+F
19:03
zi_home: и еще проверь, все ли сматчилось для интерфейсов
19:04
в принципе, можно посмотреть содержимое коллекции noc.pm.probeconfig
19:04
на конфиг ответ приходит 403
19:04
дал суперюзера и пошло
19:05
права на config не достаточно
19:05
dvolodin, что именно сматчиться должно? какие именно патчи на графит ставить? из нока? системное? о чем речь?
19:05
а попробуй config + launch
19:07
config + read прокатило
19:07
2014-09-02 23:10:10,467 [io] SNMP GET [195.98.32.79] {'Interface | Load | In': '1.3.6.1.2.1.2.2.1.10.3', 'Interface | Load | Out': '1.3.6.1.2.1.2.2.1.16.3'}
19:07
куда смотреть результат?
19:08
так, как минимум, SNMP GET оно у тебя сделало
19:08
посмотри tcpdump'ом
19:09
по умолчанию оно должно было сложить тебе все в local/whisper
19:09
есть там что-нибудь?
19:10
даже папки такой нет
19:11
root@noc:/opt/noc/local # ll
19:11
total 16
19:11
-rw-r--r-- 1 noc noc 0 2 сен 22:44 .pip
19:11
drwxr-xr-x 4 noc noc 512 10 апр 12:08 cache/
19:11
drwxr-xr-x 6 noc noc 512 2 сен 10:44 collections/
19:11
drwxr-xr-x 2 noc noc 1536 2 сен 22:47 index/
19:11
drwxr-xr-x 3 root noc 512 5 ноя 2013 repos/
19:11
проверяй настройки storage
19:12
в части collectors
19:12
адрес и порт правильные?
19:12
и запусти pmwriter в debug'е
19:12
посмотри, приходит ли на него что-нибудь
19:13
426 17.363939 195.98.35.2 -> 92.242.92.119 SNMP 110 get-request 1.3.6.1.2.1.2.2.1.10.10101 1.3.6.1.2.1.2.2.1.16.10101
19:13
реквест ужел
19:13
*ушел
19:14
ответа не вижу
19:16
dvolodin, ты так спрашиваешь будто я знаю правильные настройки
19:16
19:16
tcpdump -vvvv .....
19:16
community проверь
19:16
ну и ACL
19:17
комьюнити правильный, с сервера нока я нормально дернул оид
19:17
zi_home: добавь запись в collectors
19:17
line/active/ IP / port
19:17
мне объясняли это что-то для удаленных серверов
19:17
port там 2003 по умолчанию
19:18
у меня даже демон коллектор не запущен
19:18
не путай
19:18
это pmwriter
19:18
добавь там строчку, куда пробе кидать данные
19:19
19:19
или как он там у тебя
19:19
а 127,0,0,1 он не примет?
19:22
dvolodin, сделал так
19:22
19:22
если проба и писатель у тебя на одном сервере, то прокатит нормально
19:23
но в /opt/noc/local все равно ничего не появилось
19:23
дерни конфиг по http, покажи
19:28
19:28
почему-то по http конфиг не дергается
19:28
19:28
отдает 403 независимо от прав юзера
19:29
хотя может это фаерфокс мно мозги сношает
19:33
dvolodin, еще какие-то трейсы в логах пролетают
19:33
19:39
curl'ом дерни
19:39
или httpie
19:40
zi_home: этот трейс из-за кривых настроек коллектора
19:40
коллектора какого?
19:40
noc-coolector у меня не запущен
19:40
открой профиль интерфейсов, где ты навешивал метрики, и сохрани его
19:40
noc-pmwriter
19:45
dvolodin, вообще не хочет сохранять профиль, долго висит, а потом failed to save
19:45
но это сам профиль
19:45
а метрику дает добавить и сохранить
19:45
удалил ее
19:46
save
19:46
добавил обратно
19:46
save
19:46
сколько у тебя интерфейсов в профиле?
19:47
как грязи
19:47
но это еще не самый пышный профиль
19:48
dvolodin, но не важно, теперь побежало
19:48
и папка появилась
19:49
правда в этой папке лежат другие папки
19:49
а данных нет
19:49
тип базы какой?
19:49
whisper?
19:49
whisper
19:49
если ты об этом
19:51
find find local/whisper/ -name \*.wsp
19:53
root@noc:/opt/noc # find local/whisper/ -name \*.wsp
19:53
root@noc:/opt/noc #
19:54
и не нравится мне эта идея держать данные в папке с исполняемыми файлами
19:55
в /var/noc было бы самое место
19:55
ну так переложи, кто тебе мешает?
19:56
смотри в конфиге noc.conf, куда все класть
19:57
смотрю, не вижу
19:58
data_dir = local/whisper
19:58
как бы выбора ты не даешь
19:58
оно самое
19:58
это почему это не даю?
19:58
или полный путь тоже можно
19:58
прописывай куда нужно, и все
19:58
можно, конечно
20:00
ок, но данные пока не пишутся
20:01
нашел
20:02
014-09-03 00:02:00,359 [writer-3] Failed to create metric ....
20:02
Lower precision archives must cover larger time intervals than higher precision archives (archive0: 60 seconds, archive1: 0 seconds)
20:03
ну логично, да
20:03
:)
20:06
поправь storage rule
20:10
dvolodin, а что именно не так?
20:10
20:11
ты что-то странного хочешь
20:11
duration у тебя полностью лажевый
20:12
хранить одну минуту
20:12
:)
20:12
так вот что это значит
20:12
эмм
20:12
хммм
20:12
ээээ
20:12
precision/unit -- это период аггрегации
20:13
duration/unit -- сколько хранить с заданной периодичностью
20:13
precision - цена деления?
20:13
логично что-то вроде 1min/1week, 5min/1month, 15min/1y
20:13
ну да
20:13
аааа
20:13
а я думал это типа левел
20:14
то есть -- опрашивать раз в минуту и хранить неделю
20:14
затем скучить в пятиминутные интервалы -- и хранить еще месяц
20:14
потом еще раз скучить в 15 минутные -- и на год
20:14
precision должен увеличиваться
20:14
а duration быть больше следующего precision как минимум
20:17
логика абсолютно эквивалентна RRD
20:17
на самом деле, если так хочется, то можно заставить pmwriter и в RRD писать
20:17
а /render -- оттуда доставать
20:17
в pm/storage/ все
20:18
так, чего-то я опять поломал. ну ладно, до завтра
20:20
You must be a night owl, dvolodin. :D
20:20
JoiOwen: early night here
20:21
Yes. It's mid-afternoon here. I've just asked google for Moscow time, is all.
Share this page
Share this page: