nocproject.org
04:03
dvolodin_, по всей видимости надо db.repairDatabase()
04:26
размер базы растет.
04:26
жестко
04:26
а когда дорастает до размера больше чем свободного места сделать репаир уже нельзя
04:27
а репаир уменьшает базу.
04:27
не на всех версиях монги
04:27
нда ?
04:27
на каких не уменьшает ?
04:28
там вроде нечисто дело было, точно не помню
04:28
нее.
04:28
тока что сделал.
04:28
с 6 до 4.
04:29
заапдейтился на 2,2,0 :)
04:32
dvolodin_, по epoll пока нет новостей ?
04:32
а как можно посмотреть чейнжлог в hg, не стягивая обновления?
04:34
я не обновлялся с конца июня: changeset: 6498:3e3ae7a5d3c9, как узнать, к чему быть готовым?
04:36
Unbeerable, много писать. на канале. и спрашивать как починить то и то :)
04:36
hg in --patch
04:37
покажет чего там нового в дереве.
04:38
или code.nocproject.org
04:40
чего?
04:42
на code нагляднее
04:42
может нам имеет смысл bitbucket обжить?
04:42
ага. можно прям свалить туда.
04:42
или лучше на джитхаб :)
04:43
да я тролю :)
04:44
список в hg in подрывает мозг
04:45
Unbeerable, а с виду ничего вроде не меняется да ?
04:46
мне недавно начальнику пришлось показывать чего там меняется. он думал проект полужив :)
04:46
Unbeerable, на тестовой инсталяции сначала.
05:18
dvolodin_, видел твой коммит про расположение ns серверов в зоне, ты малясь промахнулся, они теперь всегда в самом низу ;)
05:19
05:19
zi_rus: ну поправь знак в cmp и давай патчик
05:20
насчет табстопов -- как-то ты больно радикально
05:20
откуда 28?
05:20
и почему оно не 32? :)
05:22
dvolodin_, потому что у обратной зоны для ipv6 только с 28 начинается отступ, при 24 его еще нет, на самом деле это не так страшно, на обычном мониторе, с разрешением 1280 по ширине, смотрится номально
05:27
может для разных типов зон разные отступы делать?
05:27
для forward 28 - перебор
05:27
на самом деле могу вообще переменные в конфиге сделать
05:28
и еще проблема -- если в левой части будет 28 символов, то добавился еще 28 пробелов
05:30
dvolodin_, ты представляешь себе запись в 28 символов?
05:31
а прямая запись может быть такой же длинной
05:31
bb-vl-12-2a03-8700-1-1-21e-58ff-feaa-89ce AAAA 2a03:8700:1:1:21e:58ff:feaa:89ce
05:33
это оно автоматом нагенерило дискавери
05:34
я думаю, надо 4 параметра tabstop сделать
05:34
для левой и правой части --- первый tabstop и последующие
05:34
и делать что-то вроде 28, 4 для первого и 8, 4 для второго
05:35
не понял, что такое первое, что второе
05:35
и вынести в конфиг
05:35
первый левый табстоп - 28, последующие - 4
05:35
первый правый табстоп - 8, последующие 4
05:36
поеду на работу
07:11
давайте лучше подумаем вот на какую тему
07:11
как нам лучше наладить процесс тестирования
07:11
по идее, перед закрытием issue должна быть стадия тестирования
07:11
и тестировать должен не разработчик
07:14
должны тестировать тот, кто подал заявку и тот, кому по барабану эта заявка, но важно, чтоб не поломалось все сотальное
07:14
;)
07:15
как это сделать?
07:17
процесс должен быть управляемым
07:17
собсвенно, нам нужен руководитель Q&A
07:18
без одобрения коротого issue не будет закрыт и фишка не попадет в релиз
07:18
про качество забывать не надо :)
07:24
dvolodin, ты на сайте нарисуй кого вам не хватает, там докописателя, дизайнера, qa
07:25
зашел на главную, не вижу
07:26
с трудом нашел эту кнопку
07:27
не ощущаю призыва, больше констатция печального факта, пустые списки
07:27
а где страсть, где эмоции
07:29
не знаю как для таких проектов ищутся разработчики
07:30
никак не ищуются
07:30
:)
07:32
$
07:33
"найдется всё"
07:33
инфа практически 100%
07:33
может в яндексе поискать :)
07:34
кто знает, кто знает
07:34
там, по слухам, облизываются, но по ряду причин не ставят :)
07:34
можно поймать молодого школьника и научить
07:40
добавьте в репозиторий для скрипта get_interface Huawei.VRP поддержку типа XGigabitEthernet, pls
07:41
сейчас я разгребу последний присланный патч
07:42
а хуавей у меня так и не работает
07:42
на доступе, на аггрегации и брасы тоже не работают
07:43
опа... а что ето abort: untracked file in working directory differs from file in requested revision: 'sa/profiles/Huawei/VRP/get_interfaces.py'
07:44
ufir: у меня discovery нормально отработал huawei
07:45
видать была своя реализация get_interfaces
07:45
я вчера вечером закоммитил то, что прислали
07:45
теперь оно в репо есть
07:45
щас обновлюсь, посмотрим..
07:49
кстати про Huawei - get_interfaces валится с CLISyntaxError на S9303, но в упор не вижу, где именно
07:49
5.70 версия
07:51
этим и объясняется? =)
07:51
ага. на 93-их спотыкается. подтверждаю
07:51
в омске свой синтаксис?
07:51
:)
07:51
да. на лурке есть статья, так и называется - омск
07:51
и "омская птица"
07:53
да задолбали уже, с Омском всего 3 ассоциации у людей: птица, газмяс и может Авангард (у тех, кто хоккей смотрит)
07:53
у меня только одна ассоциация - это где-то в сибири где холодно
07:54
2012-08-31 12:22:24,059 [TrapCollector(0x8ec972c)] Permission Denied
07:54
2012-08-31 12:22:24,060 [SyslogCollector(0x8ec97cc)] Permission Denied
07:54
раньше такого не было
07:55
и 7206 перестала работать... "2012-08-31 12:24:26,129 [crt02-yla-srv] get_interfaces failed: {'text': u'Cancelled', 'code': 20L}"
07:56
Дмитрий, что нужно для дальнейшего движения инвентаря?
08:04
так бы и сказал, только чудо
08:04
а что уже есть?
08:04
ну кроме интерфейсов
08:04
наброски модели есть
08:04
не той, что в репо
08:05
dvolodin, что тебя останавливает автоматически связывать интерфейсы в линки?
08:05
нужно задокументировать по максимуму и дополироваться
08:05
zi_rus: более приоритетные задачи :)
08:06
с точки зрения техники - все есть
08:06
вот мне бы, чтоб два раза не вставать, решить задачу с учетом оборудования. Для этого надо иметь контейнер "Помещение", в нем стойку,, в ней железки с их S/N, модулями и прочими радостями.
08:06
ежели вдруг найдется мордописец - это же не будет реализовано только мордописцем?
08:07
не только
08:07
но если я займусь сейчас мордой, то увязну в ней на месяц
08:08
морда нужна красивая, а то таблица за таблицей
08:08
человек устройство такое, ему картинки подавай
08:09
да ну, хотя бы таблицей...
08:20
dvolodin: подскажи в какаие хранилища discovery пишет результат?
08:24
во много разных
08:24
что именно надо?
08:34
он у меня продублировал некоторые записи... хочу руками почистить switchports и L3
08:38
inv/models/subinterface.py и там же interface.py
08:38
лучше через shell
08:38
а так -- если исправить ошибку в скрипте, он сам вытрет лишнее
08:53
а есть в модели инвентори поля под дату установки оборудования?
08:54
чтобы в отчете отразить можно было что когда сняли и поставили
08:54
очень не хватает, ну и площадок конечно же
08:55
но площадки хоть тегами сделать можно
08:55
acid232_: можно пока сделать custom field для sa_managedobject
10:08
dvolodin, а как себя поведет нок, если прилетит трап(snmp/syslog) о падении интерфейса, а в инвентори этого интерфейса нет(vlan блабла) - соотв. профиль ему не присвоить.
10:10
dvolodin: а как custom field сделать?
10:10
в редактировании Мо внизу поля
10:10
название поля - значение
10:11
не, это атрибуты
10:11
а кастом поля в main - setup - custom fields
10:12
_4ePTeHok: спокойно себя поведут
10:13
после того, как сделаешь все поля - перестартуй процессы NOC
10:13
dvolodin, ну он будет поднимать алярмы, или нет?) они попадут в профиль default?
10:14
попадут в профиль default
10:18
текст в форме слева от поля
10:18
название, которе
10:18
эх, вот бы в inv-interfaces в поля descr вбил описание, а нок бы прописал на железку)
10:18
_4ePTeHok: его ничего не держит
10:18
а в таблице sa_managedobject добавлять его?
10:18
кстати какой интерфейс для up/down порта
10:19
может сделаем интерфейс ISetDescription ?
10:19
я вот думаю - отдельный мелкий лучше, или один но SetInterface
10:19
отдельный мелкий сделать проще простого
10:19
он тривиальный
10:19
и скрипты быстро доделать можно
10:20
где будет descr/negotiation/characterisics и т д
10:20
и в форму я его влеплю быстро
10:20
ну смотри как удобней
10:20
setadminstatus тогда тоже.
10:21
что из него менять можно будет?
10:21
admin status
10:21
description
10:21
speed
10:21
duplex
10:21
что еще?
10:22
dvolodin, а в custom field регулсрка ведь не работает да ?
10:22
*регулярка
10:22
не добавляет что-то кастом филд
10:22
negotiation
10:24
а в итоге картинка железки будет в инвентори?) с моргающими портами)
10:25
может добавить в inv-interfaces port_status?
10:25
дискавери ходит по железкам все равно и тянет эту инфу
10:25
а менять динамически можно из FM
10:27
только логику пересечения надо продумать - что будет если статусы разъедутся - т е трап какой не прилетит.
10:28
dvolodin, можно даже цветом статус линка показывать.
10:28
чтобы поля лишние не вводить
10:29
acid232_: [14:14:39] <dvolodin> после того, как сделаешь все поля - перестартуй процессы NOC
10:29
делал, не показывает
10:30
я когда-то добавил vc_vc и все
10:30
может дело в типе
10:34
10:34
в комментах пишите предложения, будем править наживую
10:34
acid232_: чего пишет?
10:35
psql noc
10:35
\d sa_managedobject
10:35
ищи поле cust_date_installed
10:37
а где там комментить))
10:37
только Labels db;e
10:37
вижу
10:38
а сделать бы связь с площадкой
10:39
может в виде ссылки на другую табличку с site_id site_description
10:42
добавил пример
10:43
acid232_: площадок много?
10:43
можно сделать через enum groups
10:47
dvolodin, а в енумах как воспринимать key и value? я просто пишу и туда и туда одно и то же
10:47
key -- это то, что ляжет в таблицу
10:48
value - то, что в combo нарисует
10:48
например -- код площадки - key, название - value
10:49
пожелания по полям интерфейса пишите в комментах
10:49
он похож на isetswitchport
10:50
у меня чот не дает коммент написать. поля вообще нет для комментов.
11:02
да, вверху есть логин рядом с search
11:02
сейчас сделаю
11:03
а сейчас
11:07
единственное, права на редактирование твоей записи тоже появились)
11:08
по крайней мере открыло на редактирование, сохранять не пробовал.
11:10
ну да
11:10
это нормально
11:11
там разницу посмотреть и откатить всегда можно
11:11
так как идея по поводу inv-interfaces - добавить статус порта?
11:11
начнем с главного -- как называть интерфейс
11:11
:)
11:11
можно лишь цветом значка link
11:11
_4ePTeHok: статус да, но отдельным опросом через igetinterfacestatus
11:12
дак а дискавери ведь опрашивает
11:13
интересно ведь в процессе наблюдать
11:13
или нет?
11:13
в процессе может и по трапам ориентироваться
11:13
Смотрю так дружно взялись исправлять "Fix Version/s", наверно 0.7 уже скоро появится?
11:14
11:14
Guest77-ru: нет, просто снес лишнее
11:14
я настроил нормально новый greenhopper
11:15
11:16
dvolodin, ну у меня от стомпа нет логов уже пол дня, можешь закрыть, когда в работу стомп войдет можно новых пооткрывать
11:17
если проблемы будут
11:17
dvolodin: площадок много
11:17
это по какому?
11:17
прогони stomp-bench
11:17
сделать бы site_id как ссылку на другую табличку
11:18
пока такого функционала нет
11:19
dvolodin, напомни вторую екоманду
11:19
-c <file> --- consumer
11:19
-p 10000 -- producer
11:20
Performance: 10000 messages in 7.8960249424 secs (1266.46003185msg/sec) [KEventPoller, Synchronous]
11:20
Performance: 10000 messages in 1.83816409111 secs (5440.21072349msg/sec) [KEventPoller]
11:20
угу
11:20
в логах нормально?
11:21
ок
11:21
сейчас тест вообще прошел чисто, без приключений
11:21
dvolodin, пусть будет смешанный опрос. Первичное и регулярное заполнение поля статуса по get_interfaces от дискавери, изменение в процессе - FM trap's/get_int_status(можно сделать отключаемое).
11:21
и от нока все сработало
11:22
все равно в get_interfaces эти статусы снимаются
11:24
а то бывает, что трап по каким либо причинам не долетит, а порт поднялся и работает - и get_interfaces это снимет. И кстати было бы отлично - если он еще и в FM "настучит", чтобы закрылся алярм.
11:24
_4ePTeHok, как тебе сказать, вот у меня на каталистах порты которые admin down вообще в инвентори не попадают
11:25
_4ePTeHok, а это не надо
11:25
ФМ пусть сам проверяет
11:25
зачем городить кучу проверок, если дискавери и так ходит и снимает это же?
11:25
называется "завалим сеть проверками"
11:26
дискавери ходит и снимает данные крайне редко, если сообщение от него окажется полезным то это будет чистая случайность
11:27
Ок. Описанная ситуация - трап недолетел.
11:27
ФМ должен сам, независимо держать на контроле все алармы
11:27
алярм висит
11:27
каким образом алямр должен закрыться
11:27
в фм должна быть проверка
11:27
FM пойдет дергать get_int_status?
11:27
с какой периодикой?
11:29
ну и дергатнеей у нас вроде как SA занимается..
11:29
в момент возникновения аларма, с малой задержкой происходит первая проверка, потом по нарастающей, в реже и реже, когда достигается период например 10-30 минут таким и остается
11:29
периодически проверяя
11:29
контроль над alarm'ами будет
11:29
у коррелятора уже есть свой scheduler
11:30
надо теперь в него осмысленные задачи пихать
11:30
когда и что проверить
11:31
наверное, у alarm class должны быть дополнительные обработчики на python
11:31
при этом не надо забывать, что дергатня железяк должна быть осмысленной и не приводить к создаванию новых алярмов
11:31
скажем -- упал линк -- раз в минуту проверяем его
11:31
пока аларм не ушел и линк не встал
11:32
а завалив железку проверками скажем 52х портов мы никому лучше не сделаем
11:33
осообенно учитывая, что там может идти перестроение ospf, bgp и т д по причине упавших линков
11:34
в общем по инвентори я не вижу причин не взять статус из дискавери(хоть какой). А обновлять уже откуда хотите - FM, get_int_status или еще откуда
11:34
У павший линк должен поднятся трапом линкап, а проверять можно и раз в час, наслучай если трап пропал..
11:35
dvolodin, лучше мой вариант, если аларм быстро не ушел, зачит авария серьъезная и период надо увеличивать, нечего раз в минуту сношать железке мозги часами, а то и днями
11:36
потом, кстати можно будет сделать статистику по downtime порта и доступности сервиса соот-но.
11:37
Guest77-ru, если проверить только через час, аларм провесит лишний час, надо часто проверять, но интервал со временем увеличивать, чтобы не мучить железку
11:37
итого хочу сделать такую вещь
11:37
так и данные будут точнее и нагрузка меньше
11:37
по интервалу опроса согласен с zi_rus
11:38
У alarm'а будет список запущенных задач
11:38
в alarm class'е добавится список job'ов и их параметров, которые надо ставить scheduler'у коррелятора, если он зафиксировал аварию
11:39
если авария уходит -- все ее job'ы снимаются
11:39
у нас каждый job может выставлять время следующего запуска
11:39
то есть, например, делаем job проверки линка
11:39
по умолчанию -- раз в минуту
11:40
словили alarm link down, поставили его на выполнение
11:40
при каждом запуске он проверяет линк
11:40
если увидел, что линк в апе, то закрывает аварию
11:41
если пришел trap link up -> авария закроется сама и job снимется
11:43
У меня в сети с ~700 коммутаторов и фильтрациею алярмов линк довн только на аплинках, проблем с висящими авариями небыло, ну в неделю~5 штук закрывал руками.
11:43
dvolodin, ты понимаешь что раз в минуту это слишком часто если линк лежит 2 дня,
11:43
можно сделать адаптивным его
11:43
Guest77-ru, на длинках это постоянно происходит
11:44
да и 5 штук в неделю это перебор
11:44
Крометого если отсортировать алярмы по времени очень легко по пингфейлед отследить незакрившиеся алярмы линк довн.
11:45
Там в сети 700 длинков :)))
11:45
пусть железо работает, зачем себя напрягать
11:46
Если get_interface_status на работает по SNMP оно логами авторизации нок завалит..
11:46
Guest77-ru, у нас тут у fttb'шников по 100суток линки не чинятся, за это время аварии и набегают и уходят, отслеживать это руками нереально
11:47
я задолбался и просто снял их с мониторинга, собственно мне до лампочки их сеть, но такое вот происходит
11:50
Ну вот представлаешь сколько в логах нагадит если 100 суток каждую минуту get_interface_status через CLI дёргать. Надо адаптивно, увеличивать в два раза но максимально до час-два.
11:50
я про это и говорю
11:50
но первые несколько проверок должны пройти быстро
11:51
чтобы ошибочный аларм быстро закрыть
11:52
а еще я считаю, что после закрытия аларма, job'ы не надо сразу снимать, надо еще какое-то время мониторить состояние
11:52
ошибки на порту
11:53
и подобное
11:55
это уже детали реализации job'а
11:57
отнюдь, ты периодичность джобов упомянул без контекста ее изменяемости
11:58
а это принципиальный вопрос
11:59
у нас job сам решает, когда выполняться в следующий раз
14:13
блин..а как сортировку в inv-interfaces отключить?
14:14
отображалось все нормально по порядку
14:14
ткнул сортировку по имени - и стало сортироваться по 1/1 - 1/19 - 1/2
14:15
а,все, по макам нормально.
Share this page
Share this page: