nocproject.org
05:59
05:59
05:59
05:59
06:08
Фу, притомился release notes писать
06:37
напишите, что-ли, что-нибудь хвалебное
06:38
и новость на opennet не помешает
07:26
Щас попробую написать новость на opennet.
07:27
а у всех работает удаление management object'а?
07:27
доброе
07:28
dvolodin: добавь в release notes информацию об setup_session() и shutdown_session()
07:50
объект нормально удалился после зачистки всех таблиц эвентов
07:52
dvolodin, а можно расширить функционал ./noc events ... до дропа эвентов?
07:53
или может уже есть какой-то механизм фильтрации-архивирования-дропа
07:55
сейчас, я так понимаю, Action только show и reclassify
08:03
До релиза 0.7 FM будет значительно переработан.
08:33
Запостил статью на openet
08:33
08:33
Отпишитесь там, плиз.
08:35
Dmitry1, root cause analysis - хоть как-то работает, хоть какие 2 сислог или снмп трапа он может скоррелировать реально сейчас а не теоретически?
08:36
Смотри alarmclass Link Down
08:37
У него аж 4 root cause
08:37
Причем это только то, что сделали "на коленке"
08:37
zi_rus: RCA работает, он уже сейчас связывает падение BGP сессии и падение линка, например
08:37
Пока в FM идет тупо добавление ивентов и классов
08:38
dvolodin, просто бомбардировка меня по почте пингфайледами меня сильно смущает
08:38
не работает пока корреляция аварий с разных железок на основании топологии
08:39
а ты проверь количество файлов на процесс
08:39
и убедись, что у тебя ядро ICMP не ограничивает, как на фре
08:39
Когда их накопится достаточно много, будет проведена работа по корреляции, выставлению root cause, выставлению приоритетов (warning, critical, info и т.п.)
08:40
dvolodin, кстати по поводу ядра, я что-то последнее время не наблюдаю ложных аварий
08:40
пинг файледы последнее время реально не пингуются
08:40
В будущем, под корреляцией будет пониматься набор каких-либо действий, облегчающих определение причины аварии, и если возможно автоматическое ее устранение
08:40
ну так здорово ведь :)
08:41
проверь еще такую вещь
08:41
в noc-sae.conf есть параметр force_plaintext
08:41
убедись, что ты не криптуешь обмен между локальными SAE и активатором
08:42
force_plaintext = 127.0.0.1/32
08:42
Народ, отпишитесь на opennet.ru
08:42
с RCA следующая задача будет - на основании топологии свести ping failed'ы из цепочки свичей в топологии типа "сопля" к отвалу первого свича по пути
08:43
zi_rus: а активатор к какому адресу коннектится?
08:43
host = 127.0.0.1
08:46
dvolodin, в новости сделали справедливое замечание
08:46
кстати тут заметил, у многих проектов подобного рода есть тестовые серваки
08:46
где можно в живую попробовать поработать с системой
08:47
можно тоже что-то подобное реализовать
08:47
чтобы человек мог и IPAm оценить и SA и FM
08:53
скажите, а отсутствие обработки "raise PermissionDenied" - это баг, known bug или фича?
08:57
Это пока known bug :)
08:59
zi_rus: Так напиши ответ, что система интуитивно-понятная и бла-бла-бла, поэтому тестового сервака не надо
09:02
"The selected filter is not available to you, perhaps it has been deleted or had its permissions changed."
09:05
Это не Known Bugs, увы
09:06
+ create issue
09:06
:)
09:09
jira нормально отображает
09:09
могу сделать фильтр known bugs
09:10
Хм. Вот был бы человек, работающий в режиме полной занятости, былобы и это. А так делаем, что успеваем :)
09:10
у меня одного сегодня kb.nocproject.org целый день - то доступен, то совсем недоступен?
09:10
lexus-omsk: не только сегодня
09:11
и не только kb
09:11
ну я для примера kb сказал
09:11
понятно, что всё на одной виртуалке скорее всего
09:11
dvolodin: а в фильтр будет собираться по тэгу/кейворду или как?
09:12
09:12
можно и свои фильтры делать
09:12
Dmitry1, интуитивно-понятная - это ты пошутил? я тут с dvolodin общаюсь, напрямую с разработчиком, и то половины не понимаю, а ты тут "интуитивно-понятная"
09:13
zi_rus: это нормально для любой сложной системы
09:15
можно, как вариант, поставить что-нибудь коммерческое за пару лямов и обкуриться мануалов по 1000 страниц
09:15
или заплатить интегратору и курить сопроводительные записки по 100 листов и проводить по десять совещаний в неделю
09:15
все относительно
09:16
dvolodin, любую сложную систему можно использовать хотя бы по минимуму, просто тыкаясь, многие миллионы людей в мире пользуются Windows, не имея вообще никаких навыков общения с компьютером. NOC же у меня не получилось даже установить, пока до irc не добрался
09:17
Я тут биллинг пишу для своей конторы. На каждый "чих" делаю changelog, публикации на корпоративном сайте, опросы и т.п.
09:17
И все равно находятся идиоты, которые принципиально не хотят читать, слышать и т.п.
09:18
их будет все больше)
09:18
можно говорить про идиотов когда есть дока и ее никто не читает, но когда ее практически нет, то сложно к этому апелировать
09:18
ибо читать нынешние не умеют
09:18
ну вот по установке есть материалы на сайте
09:20
zi_rus: угу, потыкайся в SPECTRUM или NNM :)
09:20
или в SRC-PE/SDX, или в HP SA, или в Axiom
09:21
Не, мне больше нравятся цисковские конфигурации, когда, например опции dhcp сервера исключительнов цифровом виде.
09:21
В общем хоть FAQ пиши
09:22
Ну откуда обычный человек знает, какой цифровой код опции default-gateway ?
09:22
Если человек знает, что хочет, и готов искать, то он находит решение
09:22
в противном случае - хоть обпишись доков, результат будет нулевой
09:24
Dmitry1, это вы еще настройки генератора статистики(RDR) cisco SCE не копали..) там вообще все опции в виде 0xfac432)
09:25
Я видел Cisco генератор профайлов для DOCSIS, который стоит кучу зеленых. После того, как я его увидел - стал вручную в теустовом файле сам писать профайлы.
09:27
evyscr: не торопись пока :)
09:27
inventory мы не анонсировали еще
09:27
Инвентори обещает быть вкууусной :) Задумок - мильён.
09:28
Я просто положил имеющиеся задумки еще и на кабельную часть
09:28
результат получился неважнецкий
09:29
но возникло несколько идей по расширению имеющейся модели
09:29
если сейчас между объектами есть 3 вида связей
09:29
В частности, привязка "железных" портов и аппаратных частей (chassis, FAN, PSU) к FM, сбор данных для "бухгалтерии" и т.п.
09:29
то в новой модели типы связи между объектами тоже можно будет задавать
09:31
Плюс, как облегчение определения "узкого места" - сравнение физических характеристик линка с текущими.
09:31
то есть могут быть типы связи "УПРАВЛЯЕТ", "Находятся рядом"
09:32
Или связи "зависит от", типа когда выпадает целый каскад устройств
09:32
по ГИСу тоже подвижки пошли
09:33
это вычисляется
09:33
жизнь вообще суровая штука
09:33
Кстати, связи "зависит от" отлично подходят для схемы бесперебойник -> устройство
09:34
что есть "ГИС" в данном случае?
09:34
например есть у нас переход из канализации на фонарный столб
09:34
:)
09:35
кто до этого додумался и как физически реализовали - загадка, подозреваю, что сделали эротичную ленинградку из колодца на столб
09:35
вот понадобится такую гадость в inventory пихнуть, хоть лбом об стену бейся
09:35
:)
09:36
Это смотря какой инвентори
09:38
И это скорее всего тоже будет :)
09:39
Но почему все эти знания (о текущей работе над инвентори, о планах) являются скрытыми?
09:40
Наличие sacred knowledge является показателем какой-то неправильности в организации процесса
09:41
(по крайней мере, так меня убеждали)
09:43
09:43
Тут как-бы будут публиковаться новые планы
09:46
evyscr: почему sacred?
09:46
dvolodin: а потому что надо допытываться
09:47
будет реализация, будет что показывать широкой общественности
09:47
почему допытываться? спросил, получил ответ :)
09:48
приятного аппетита ;)
09:56
Может действительно завести какую нибудь страничку с перечнем будущих плюшек?
10:07
фотонные звездолеты писать?
10:07
Нет. Это дело далекого будущего, а народ интересуют планы на ближайшие пару лет.
10:08
Хотя в инвентори можно было бы и добавить, как пример.
10:13
dvolodin: Вопрос по repo :) Вернее по формированию repo_path.
10:14
Верно ли я понимаю, что у объектов RPSL, AS, DNS - repo_path формируется автоматом?
10:14
И только у объекта Config - берется из managed object?
10:15
у первых трех из имени
10:15
у config -- <prefix>/config/<repo path>
10:16
Значит правильно :)
10:17
Я тут хочу сделать - один репозиторий на один managed object. Чтобы номера ревизий были индивидуальными, а не общими...
10:17
И можно, навреное, будет несколько конфигов хранить....
10:18
Или я странного хочу? :)
10:19
Еще было бы здорово, если бы я мог создавать какой-нибудь шаблон для repo_path у MO
10:19
вообще для каждого свои ревизии это правильно да
10:19
я тоже так хочу
10:20
Давайте закончим FM, для начала :)
10:24
KTO-TO_: а какой смысл в отдельных ревизиях?
10:24
коммитятся строго изменения для одного объекта
10:24
если уж настолько сильно хочется отдельного интима, можно вообще сделать отдельный тип VCS
10:24
на каждый объект своя нумерация
10:25
dvolodin: Когда смотришь diff, то ревизии неподряд - напрягают. Как-будто что-то пропустил :)
10:25
который будет делать по репо на объект
10:25
у меня вообще есть нехорошее желание упрятать репо в GridFS
10:25
А чем это будет хорошо?
10:25
сильно много заморочек не надо
10:25
заипешься потом админить зоопарк
10:25
репликация прозрачная
10:26
и репо как отдельного класса вообще не будет
10:26
также как и сейчас
10:26
текущая версия лежит целиком
10:26
о
10:27
остальное - diff'ы от последующей
10:27
сейчас реализация хороха тем, что в /var/repo хряняться в текстовом виде конфиги, и я их напрямую могу в свич залить
10:27
кто мешает расшарить gridfs по webdav?
10:28
и делать copy сразу с http?
10:28
или смонтировать его в read only?
10:28
Смонтировать - где? через fuse?
10:28
а еще fusefs и т.п.?
10:28
бля
10:28
огород
10:28
костыли
10:28
зоопарк
10:28
хватит ерундой страдать то
10:28
ну не знаю, mac os нормально монтирует DAV и не жужжит
10:28
имхо не стоит увлекаться монгой :)
10:29
давайте еще и сислог в бинари складывать
10:29
как в федоре 17
10:29
он у нас и так в бинарях
10:29
на серваках еще и дав городить
10:29
да не надо его городить, то
10:29
[14:27:48] <dvolodin> кто мешает расшарить gridfs по webdav?
10:29
шикарно ага
10:29
нативный функционал NOC, блин
10:29
один костыль, второе подпорка
10:29
самое то вебдав пихать
10:29
если он REST умеет, то научить WEBDAV - дело одного часа
10:30
зато та же KB ляжет в виде файла
10:30
на DAV
10:30
да и pyRules можно будет туда же уложить
10:30
и редактировать нормальным редактором
10:30
совсем для отморозков есть nginx-gridfs :)
10:30
Только если оно будет перчитываться сразу, после редактирования
10:30
Для конфигов - нет. Обязательно нужно иметь где-то обычный текстовый файлик с конфигом.
10:31
+1
10:31
бывают совсем аварийные случаи, спасает тока флешка или ваще винт на другом компе
10:32
текстовик вернуть к жизни гораздо проще
10:32
Я так, например, вообще tftp доступ на папочку с repo открыл, чтобы свичи могли получать свои конфиги при загрузке через bootp
10:32
И мне не важно, запущена ли в это время mongodb, или нет
10:32
ну, например, сделаем фишку - зеркалирование актуальной версии в каталог
10:33
с возможностью одним кликом откатить файл в зеркале на любую ревизию
10:34
или другая проблема
10:34
Не-не. без клика, без nginx, без mongo. В любом случае должна быть какая-то рабочая версия конфига.
10:34
По закону подлости, конфиг нужен тогда, когда связи почти нет. И чем проще достать/посмотреть последнюю, предпоследнюю версию, там лучше
10:34
например, надо чтобы конфиги свичей каждого конкретного горада падали на сервер в этом городе
10:34
Dmitry1, вово, и я об том же
10:35
dvolodin, не увлекайся))
10:35
dvolodin: не надо над конфигами пока издеваться :)
10:35
НУжно, чтобы конфиги падали на FS, которую я потом смогу открыть где угодно, и носить где угодно, хоть на флешке.
10:35
а надо в другой город - hg pull/push via ssh :)
10:36
И, зачастую, коллекция флешек помогает гораздо лучше, чем супер-пупер система резервного восстановления
10:36
В частности - поднимать удаленный свич едет человек, у которого на руках ноутбук и флешка.
10:37
так какая ему разница, как он этот файл получил
10:37
download из NOC или выдрал из репо
10:37
с репо ему ее еще кто-то отдать должен
10:37
и как с разделением доступа быть?
10:38
А не надо REPO. Флешка воткнута в комп. На ней всегда свежие версии конфигов.
10:38
как-то они туда попадают?
10:40
Да пофиг как. Как пример - флешка смонтирована как /var/db/noc/repo. Самое главное, что даже если физически навернется комп с монгой, и меркуриал, то все конфиги есть на флешке.
10:41
Угу. Монга может быть на дргом компе :) и надо будет конфиг свича, который соединяет noc и монгу :)
10:43
Возможные улучшения CM я вижу в создании отдельного каталога, где будут храниться конфиги, или создание нескольких каталогов, где будут храниться их копии. зачастую народу нужен просто конфиг.
10:43
Как вполне штатная ситуация - сгорел свич, а на его место ставят другой.
10:46
что-то поменялось ? пытаюсь сделать hg pull - отлетает по атймауту
10:46
"abort: error: Connection timed out"
10:46
dvolodin: смотрю в vcs (видимо плохо:). Туда передается тольк repo и path. Как добравться до MO?
10:48
из path, наверное
10:49
VCS - абстрактный аналог файловой системы
10:49
В path у меня, то что забил в БД... Так? До самого МО объекта, я никак не доберусь. Так?
10:49
только по repo_path
10:49
он уникальный
10:51
Т.е. чтобы сделать как я хочу - надо класс Config мучать или что-то хитрое писать в repo_path при создании МО?
10:52
Например, с помошью pyrule и ДБ триггера... Или есть способ другой? :)
11:14
смотря что хочешь
11:14
заполнять repo_path по имени?
11:14
тогда db trigger
11:16
хочу - отдельный репо на каждый MO. Но поскольку, я из vcs не могу достучаться до MO, а переписать класс Config - нельзя, то остается только как-то автоматом заполнять repo_path...
11:17
KTO-TO_: уж коли мы отрелизились, посмотри
NOC-151
11:18
надо бы положить свежую extjs, вынести патч ext-bugfix.js
11:18
ну и потестировать, что оно не сломалось в целом
11:33
dvolodin: Что-то они там с ресайзом покрутили... В хроме не всегда ресайзится... А баг полечили, да :)
11:34
а раньше ресайзилось?
11:34
Да. Все нормально.
11:34
А сейчас переодически скролбар выскаивает...
11:35
А так - вроде все ок, остально.
11:38
а
11:38
со сроллбаром была проблема на Safari
11:38
с 4.0.2a
11:39
Угу. А теперь она на хроме появилась.
11:39
Косяк где-то с вычислением нового размера. Если перейти с вкладки на вкладку - то все ок.
12:01
а в чем дело - config pull делаю, пишет что все ок. а результат нулевой, в конфиге пусто ?
12:04
в том-то и дело - в логах чисто
12:04
2011-11-24 14:52:57,270 1 script threads (50 max)
12:04
2011-11-24 14:53:02,770 Script Cisco.IOS.get_config(10.200.200.56) is completed
12:04
2011-11-24 14:53:03,846 MRT task=8/8 object=7609-core-sw(10.200.200.56) script=Cisco.IOS.get_config status=completed
12:06
в шедулере тоже все хорошо? repo_path у объекта указан?
12:08
KTO-TO_: они в ExtJS как-то свой скроллер делают
12:09
KTO-TO_ да, все указано. самое забавное что из core-sw->Scripts->Cisco.IOS.get.interfaces отработал нормально
12:10
в логах scheduler'а глянь
12:11
хм... а в /var/repo/config - лежит рабочий конфиг !
12:11
именно с той железки
12:17
удалил-добавил железку, все сработало..
12:24
В большую сторону ресайзится нормально... А вот в меньшую :(
12:35
в сислог начал сыпать... Nov 24 07:30:54 localhost python: abrt: detected unhandled Python exception in ./scripts/noc-correlator.py
12:50
сморти в /var/log/noc, что там происходит
12:58
2011-11-24 15:50:18,445 noc-activator[#0]: Heartbeat lost. Restarting
12:58
2011-11-24 15:50:18,446 noc-activator[#0]: killing
12:58
2011-11-24 15:50:19,447 noc-activator[#0] daemon is terminated with status 0
12:58
это нормально ?
13:00
смотри noc-correlator.log
13:01
heartbeat'ы отключи активатору
13:02
или запусти несколько актиаторов
13:59
кстати, о демке и примере вообще. Используется ли noc (FM?) для {kb,bt}.nocproject.org ?
Share this page
Share this page: