About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 31.08.2012
freeseacher #
04:03
dvolodin_, по всей видимости надо db.repairDatabase()
dvolodin_ #
04:25
зачем?
freeseacher #
04:26
размер базы растет.
04:26
жестко
04:26
а когда дорастает до размера больше чем свободного места сделать репаир уже нельзя
04:27
а репаир уменьшает базу.
dvolodin_ #
04:27
не на всех версиях монги
freeseacher #
04:27
нда ?
04:27
на каких не уменьшает ?
dvolodin_ #
04:28
там вроде нечисто дело было, точно не помню
freeseacher #
04:28
нее.
04:28
тока что сделал.
04:28
с 6 до 4.
04:29
заапдейтился на 2,2,0 :)
04:32
dvolodin_, по epoll пока нет новостей ?
Unbeerable #
04:32
а как можно посмотреть чейнжлог в hg, не стягивая обновления?
04:34
я не обновлялся с конца июня: changeset: 6498:3e3ae7a5d3c9, как узнать, к чему быть готовым?
freeseacher #
04:36
Unbeerable, много писать. на канале. и спрашивать как починить то и то :)
04:36
hg in --patch
04:37
покажет чего там нового в дереве.
dvolodin_ #
04:38
или code.nocproject.org
Unbeerable #
04:40
ох...
dvolodin_ #
04:40
чего?
04:42
на code нагляднее
04:42
может нам имеет смысл bitbucket обжить?
freeseacher #
04:42
ага. можно прям свалить туда.
04:42
или лучше на джитхаб :)
04:43
да я тролю :)
Unbeerable #
04:44
список в hg in подрывает мозг
freeseacher #
04:45
Unbeerable, а с виду ничего вроде не меняется да ?
Unbeerable #
04:45
обновлять ссыкотно
freeseacher #
04:46
мне недавно начальнику пришлось показывать чего там меняется. он думал проект полужив :)
04:46
Unbeerable, на тестовой инсталяции сначала.
zi_rus #
05:18
dvolodin_, видел твой коммит про расположение ns серверов в зоне, ты малясь промахнулся, они теперь всегда в самом низу ;)
05:19
dvolodin_, а по отступам вот такой вариант нормально подходит http://pastebin.com/YxKhFRDG
dvolodin_ #
05:19
zi_rus: ну поправь знак в cmp и давай патчик
05:20
насчет табстопов -- как-то ты больно радикально
05:20
откуда 28?
05:20
и почему оно не 32? :)
zi_rus #
05:22
dvolodin_, потому что у обратной зоны для ipv6 только с 28 начинается отступ, при 24 его еще нет, на самом деле это не так страшно, на обычном мониторе, с разрешением 1280 по ширине, смотрится номально
dvolodin_ #
05:27
может для разных типов зон разные отступы делать?
05:27
для forward 28 - перебор
05:27
на самом деле могу вообще переменные в конфиге сделать
05:28
и еще проблема -- если в левой части будет 28 символов, то добавился еще 28 пробелов
zi_rus #
05:30
dvolodin_, ты представляешь себе запись в 28 символов?
dvolodin_ #
05:31
легпо
zi_rus #
05:31
а прямая запись может быть такой же длинной
05:31
bb-vl-12-2a03-8700-1-1-21e-58ff-feaa-89ce AAAA 2a03:8700:1:1:21e:58ff:feaa:89ce
dvolodin_ #
05:33
вот маньяк-то
zi_rus #
05:33
это оно автоматом нагенерило дискавери
dvolodin_ #
05:34
я думаю, надо 4 параметра tabstop сделать
05:34
для левой и правой части --- первый tabstop и последующие
05:34
и делать что-то вроде 28, 4 для первого и 8, 4 для второго
zi_rus #
05:35
не понял, что такое первое, что второе
dvolodin_ #
05:35
и вынести в конфиг
05:35
первый левый табстоп - 28, последующие - 4
05:35
первый правый табстоп - 8, последующие 4
05:36
поеду на работу
dvolodin #
07:11
давайте лучше подумаем вот на какую тему
07:11
как нам лучше наладить процесс тестирования
07:11
по идее, перед закрытием issue должна быть стадия тестирования
07:11
и тестировать должен не разработчик
mikevlz|3 #
07:14
должны тестировать тот, кто подал заявку и тот, кому по барабану эта заявка, но важно, чтоб не поломалось все сотальное
07:14
;)
dvolodin #
07:15
как это сделать?
07:17
процесс должен быть управляемым
07:17
собсвенно, нам нужен руководитель Q&A
07:18
без одобрения коротого issue не будет закрыт и фишка не попадет в релиз
07:18
про качество забывать не надо :)
zi_rus #
07:20
фишка или багфикс?
dvolodin #
07:21
и багфикс тоже
zi_rus #
07:24
dvolodin, ты на сайте нарисуй кого вам не хватает, там докописателя, дизайнера, qa
dvolodin #
07:24
написал уже
zi_rus #
07:25
зашел на главную, не вижу
dvolodin #
07:25
dev team
zi_rus #
07:26
с трудом нашел эту кнопку
07:27
не ощущаю призыва, больше констатция печального факта, пустые списки
07:27
а где страсть, где эмоции
07:29
не знаю как для таких проектов ищутся разработчики
dvolodin #
07:30
никак не ищуются
07:30
:)
ufir #
07:32
$
07:33
"найдется всё"
07:33
инфа практически 100%
zi_rus #
07:33
может в яндексе поискать :)
dvolodin #
07:34
кто знает, кто знает
07:34
там, по слухам, облизываются, но по ряду причин не ставят :)
ufir #
07:34
можно поймать молодого школьника и научить
veng #
07:40
добавьте в репозиторий для скрипта get_interface Huawei.VRP поддержку типа XGigabitEthernet, pls
dvolodin #
07:41
сейчас я разгребу последний присланный патч
ufir #
07:42
а хуавей у меня так и не работает
07:42
на доступе, на аггрегации и брасы тоже не работают
07:43
опа... а что ето abort: untracked file in working directory differs from file in requested revision: 'sa/profiles/Huawei/VRP/get_interfaces.py'
veng #
07:44
ufir: у меня discovery нормально отработал huawei
dvolodin #
07:45
видать была своя реализация get_interfaces
07:45
я вчера вечером закоммитил то, что прислали
07:45
теперь оно в репо есть
ufir #
07:45
щас обновлюсь, посмотрим..
lexus-omsk #
07:49
кстати про Huawei - get_interfaces валится с CLISyntaxError на S9303, но в упор не вижу, где именно
07:49
5.70 версия
ufir #
07:50
омск ;((
lexus-omsk #
07:51
этим и объясняется? =)
veng #
07:51
ага. на 93-их спотыкается. подтверждаю
dvolodin #
07:51
в омске свой синтаксис?
07:51
:)
ufir #
07:51
да. на лурке есть статья, так и называется - омск
07:51
и "омская птица"
lexus-omsk #
07:53
да задолбали уже, с Омском всего 3 ассоциации у людей: птица, газмяс и может Авангард (у тех, кто хоккей смотрит)
ufir #
07:53
у меня только одна ассоциация - это где-то в сибири где холодно
07:54
2012-08-31 12:22:24,059 [TrapCollector(0x8ec972c)] Permission Denied
07:54
2012-08-31 12:22:24,060 [SyslogCollector(0x8ec97cc)] Permission Denied
07:54
раньше такого не было
07:55
и 7206 перестала работать... "2012-08-31 12:24:26,129 [crt02-yla-srv] get_interfaces failed: {'text': u'Cancelled', 'code': 20L}"
mikevlz|3 #
07:56
Дмитрий, что нужно для дальнейшего движения инвентаря?
dvolodin #
07:59
мордописец и время
zi_rus #
08:04
так бы и сказал, только чудо
mikevlz|3 #
08:04
а что уже есть?
08:04
ну кроме интерфейсов
dvolodin #
08:04
наброски модели есть
08:04
не той, что в репо
zi_rus #
08:05
dvolodin, что тебя останавливает автоматически связывать интерфейсы в линки?
dvolodin #
08:05
нужно задокументировать по максимуму и дополироваться
08:05
zi_rus: более приоритетные задачи :)
08:06
с точки зрения техники - все есть
mikevlz|3 #
08:06
вот мне бы, чтоб два раза не вставать, решить задачу с учетом оборудования. Для этого надо иметь контейнер "Помещение", в нем стойку,, в ней железки с их S/N, модулями и прочими радостями.
08:06
ежели вдруг найдется мордописец - это же не будет реализовано только мордописцем?
dvolodin #
08:07
не только
08:07
но если я займусь сейчас мордой, то увязну в ней на месяц
zi_rus #
08:08
морда нужна красивая, а то таблица за таблицей
08:08
человек устройство такое, ему картинки подавай
mikevlz|3 #
08:09
да ну, хотя бы таблицей...
veng #
08:20
dvolodin: подскажи в какаие хранилища discovery пишет результат?
dvolodin #
08:24
во много разных
08:24
что именно надо?
veng #
08:34
он у меня продублировал некоторые записи... хочу руками почистить switchports и L3
dvolodin #
08:38
inv/models/subinterface.py и там же interface.py
08:38
лучше через shell
08:38
а так -- если исправить ошибку в скрипте, он сам вытрет лишнее
acid232_ #
08:53
а есть в модели инвентори поля под дату установки оборудования?
08:54
чтобы в отчете отразить можно было что когда сняли и поставили
08:54
очень не хватает, ну и площадок конечно же
08:55
но площадки хоть тегами сделать можно
dvolodin #
08:55
acid232_: можно пока сделать custom field для sa_managedobject
_4ePTeHok #
10:08
dvolodin, а как себя поведет нок, если прилетит трап(snmp/syslog) о падении интерфейса, а в инвентори этого интерфейса нет(vlan блабла) - соотв. профиль ему не присвоить.
acid232_ #
10:10
dvolodin: а как custom field сделать?
_4ePTeHok #
10:10
в редактировании Мо внизу поля
10:10
название поля - значение
acid232_ #
10:11
не, это атрибуты
10:11
а кастом поля в main - setup - custom fields
_4ePTeHok #
10:12
угу, перепутал)
dvolodin #
10:12
_4ePTeHok: спокойно себя поведут
10:13
после того, как сделаешь все поля - перестартуй процессы NOC
_4ePTeHok #
10:13
dvolodin, ну он будет поднимать алярмы, или нет?) они попадут в профиль default?
dvolodin #
10:14
попадут в профиль default
_4ePTeHok #
10:14
ага, ок.
acid232_ #
10:15
а что такое Label:
dvolodin #
10:18
текст в форме слева от поля
10:18
название, которе
_4ePTeHok #
10:18
эх, вот бы в inv-interfaces в поля descr вбил описание, а нок бы прописал на железку)
dvolodin #
10:18
_4ePTeHok: его ничего не держит
acid232_ #
10:18
а в таблице sa_managedobject добавлять его?
_4ePTeHok #
10:18
кстати какой интерфейс для up/down порта
dvolodin #
10:19
может сделаем интерфейс ISetDescription ?
_4ePTeHok #
10:19
я вот думаю - отдельный мелкий лучше, или один но SetInterface
dvolodin #
10:19
отдельный мелкий сделать проще простого
10:19
он тривиальный
10:19
и скрипты быстро доделать можно
_4ePTeHok #
10:20
где будет descr/negotiation/characterisics и т д
dvolodin #
10:20
и в форму я его влеплю быстро
_4ePTeHok #
10:20
ну смотри как удобней
10:20
setadminstatus тогда тоже.
dvolodin #
10:21
что из него менять можно будет?
10:21
admin status
10:21
description
10:21
speed
10:21
duplex
10:21
что еще?
_4ePTeHok #
10:22
media-type?
freeseacher #
10:22
dvolodin, а в custom field регулсрка ведь не работает да ?
10:22
*регулярка
acid232_ #
10:22
не добавляет что-то кастом филд
_4ePTeHok #
10:22
negotiation
10:24
а в итоге картинка железки будет в инвентори?) с моргающими портами)
10:25
может добавить в inv-interfaces port_status?
10:25
дискавери ходит по железкам все равно и тянет эту инфу
10:25
а менять динамически можно из FM
10:27
только логику пересечения надо продумать - что будет если статусы разъедутся - т е трап какой не прилетит.
acid232_ #
10:27
гляньте - правильно пишу? http://s45.radikal.ru/i107/1208/19/c5386c585f82.png
_4ePTeHok #
10:28
dvolodin, можно даже цветом статус линка показывать.
10:28
чтобы поля лишние не вводить
mikevlz|3 #
10:29
acid232_: [14:14:39] <dvolodin> после того, как сделаешь все поля - перестартуй процессы NOC
acid232_ #
10:29
делал, не показывает
10:30
я когда-то добавил vc_vc и все
10:30
может дело в типе
dvolodin #
10:34
http://kb.nocproject.org/display/DEV/ISetInterface
10:34
в комментах пишите предложения, будем править наживую
10:34
acid232_: чего пишет?
10:35
psql noc
10:35
\d sa_managedobject
10:35
ищи поле cust_date_installed
_4ePTeHok #
10:37
а где там комментить))
10:37
только Labels db;e
10:37
вижу
acid232_ #
10:38
а сделать бы связь с площадкой
10:39
может в виде ссылки на другую табличку с site_id site_description
dvolodin #
10:42
добавил пример
10:43
acid232_: площадок много?
10:43
можно сделать через enum groups
zi_rus #
10:47
dvolodin, а в енумах как воспринимать key и value? я просто пишу и туда и туда одно и то же
dvolodin #
10:47
key -- это то, что ляжет в таблицу
10:48
value - то, что в combo нарисует
10:48
например -- код площадки - key, название - value
10:49
пожелания по полям интерфейса пишите в комментах
10:49
он похож на isetswitchport
_4ePTeHok #
10:50
у меня чот не дает коммент написать. поля вообще нет для комментов.
dvolodin #
10:57
залогинился?
_4ePTeHok #
11:02
да, вверху есть логин рядом с search
dvolodin #
11:02
сейчас сделаю
11:03
а сейчас
_4ePTeHok #
11:05
да, теперь есть.
dvolodin #
11:05
ok
_4ePTeHok #
11:07
единственное, права на редактирование твоей записи тоже появились)
11:08
по крайней мере открыло на редактирование, сохранять не пробовал.
dvolodin #
11:10
ну да
11:10
это нормально
11:11
там разницу посмотреть и откатить всегда можно
_4ePTeHok #
11:11
так как идея по поводу inv-interfaces - добавить статус порта?
dvolodin #
11:11
начнем с главного -- как называть интерфейс
11:11
:)
_4ePTeHok #
11:11
можно лишь цветом значка link
dvolodin #
11:11
_4ePTeHok: статус да, но отдельным опросом через igetinterfacestatus
_4ePTeHok #
11:12
дак а дискавери ведь опрашивает
dvolodin #
11:13
интересно ведь в процессе наблюдать
11:13
или нет?
zi_rus #
11:13
в процессе может и по трапам ориентироваться
Guest77-ru #
11:13
Смотрю так дружно взялись исправлять "Fix Version/s", наверно 0.7 уже скоро появится?
dvolodin #
11:14
NOC-645 проявляется еще?
11:14
Guest77-ru: нет, просто снес лишнее
11:14
я настроил нормально новый greenhopper
11:15
и NOC-656
zi_rus #
11:16
dvolodin, ну у меня от стомпа нет логов уже пол дня, можешь закрыть, когда в работу стомп войдет можно новых пооткрывать
11:17
если проблемы будут
acid232_ #
11:17
dvolodin: площадок много
dvolodin #
11:17
это по какому?
11:17
прогони stomp-bench
acid232_ #
11:17
сделать бы site_id как ссылку на другую табличку
dvolodin #
11:18
пока такого функционала нет
zi_rus #
11:19
dvolodin, напомни вторую екоманду
dvolodin #
11:19
-c <file> --- consumer
zi_rus #
11:19
это первая
dvolodin #
11:19
-p 10000 -- producer
zi_rus #
11:20
Performance: 10000 messages in 7.8960249424 secs (1266.46003185msg/sec) [KEventPoller, Synchronous]
11:20
Performance: 10000 messages in 1.83816409111 secs (5440.21072349msg/sec) [KEventPoller]
dvolodin #
11:20
угу
11:20
в логах нормально?
zi_rus #
11:21
чисто
dvolodin #
11:21
NOC-645 закрываем?
zi_rus #
11:21
ок
11:21
сейчас тест вообще прошел чисто, без приключений
_4ePTeHok #
11:21
dvolodin, пусть будет смешанный опрос. Первичное и регулярное заполнение поля статуса по get_interfaces от дискавери, изменение в процессе - FM trap's/get_int_status(можно сделать отключаемое).
zi_rus #
11:21
и от нока все сработало
_4ePTeHok #
11:22
все равно в get_interfaces эти статусы снимаются
11:24
а то бывает, что трап по каким либо причинам не долетит, а порт поднялся и работает - и get_interfaces это снимет. И кстати было бы отлично - если он еще и в FM "настучит", чтобы закрылся алярм.
zi_rus #
11:24
_4ePTeHok, как тебе сказать, вот у меня на каталистах порты которые admin down вообще в инвентори не попадают
_4ePTeHok #
11:25
речь о oper_status
zi_rus #
11:25
_4ePTeHok, а это не надо
11:25
ФМ пусть сам проверяет
_4ePTeHok #
11:25
зачем городить кучу проверок, если дискавери и так ходит и снимает это же?
11:25
называется "завалим сеть проверками"
zi_rus #
11:26
дискавери ходит и снимает данные крайне редко, если сообщение от него окажется полезным то это будет чистая случайность
_4ePTeHok #
11:27
Ок. Описанная ситуация - трап недолетел.
zi_rus #
11:27
ФМ должен сам, независимо держать на контроле все алармы
_4ePTeHok #
11:27
алярм висит
11:27
каким образом алямр должен закрыться
zi_rus #
11:27
в фм должна быть проверка
_4ePTeHok #
11:27
FM пойдет дергать get_int_status?
zi_rus #
11:27
да
_4ePTeHok #
11:27
с какой периодикой?
zi_rus #
11:27
я предполагал так:
_4ePTeHok #
11:29
ну и дергатнеей у нас вроде как SA занимается..
zi_rus #
11:29
в момент возникновения аларма, с малой задержкой происходит первая проверка, потом по нарастающей, в реже и реже, когда достигается период например 10-30 минут таким и остается
11:29
периодически проверяя
dvolodin #
11:29
контроль над alarm'ами будет
11:29
у коррелятора уже есть свой scheduler
11:30
надо теперь в него осмысленные задачи пихать
11:30
когда и что проверить
11:31
наверное, у alarm class должны быть дополнительные обработчики на python
_4ePTeHok #
11:31
при этом не надо забывать, что дергатня железяк должна быть осмысленной и не приводить к создаванию новых алярмов
dvolodin #
11:31
скажем -- упал линк -- раз в минуту проверяем его
11:31
пока аларм не ушел и линк не встал
_4ePTeHok #
11:32
а завалив железку проверками скажем 52х портов мы никому лучше не сделаем
11:33
осообенно учитывая, что там может идти перестроение ospf, bgp и т д по причине упавших линков
11:34
в общем по инвентори я не вижу причин не взять статус из дискавери(хоть какой). А обновлять уже откуда хотите - FM, get_int_status или еще откуда
Guest77-ru #
11:34
У павший линк должен поднятся трапом линкап, а проверять можно и раз в час, наслучай если трап пропал..
zi_rus #
11:35
dvolodin, лучше мой вариант, если аларм быстро не ушел, зачит авария серьъезная и период надо увеличивать, нечего раз в минуту сношать железке мозги часами, а то и днями
_4ePTeHok #
11:36
потом, кстати можно будет сделать статистику по downtime порта и доступности сервиса соот-но.
zi_rus #
11:37
Guest77-ru, если проверить только через час, аларм провесит лишний час, надо часто проверять, но интервал со временем увеличивать, чтобы не мучить железку
dvolodin #
11:37
итого хочу сделать такую вещь
zi_rus #
11:37
так и данные будут точнее и нагрузка меньше
_4ePTeHok #
11:37
по интервалу опроса согласен с zi_rus
dvolodin #
11:38
У alarm'а будет список запущенных задач
zi_rus #
11:38
*провисит
dvolodin #
11:38
в alarm class'е добавится список job'ов и их параметров, которые надо ставить scheduler'у коррелятора, если он зафиксировал аварию
11:39
если авария уходит -- все ее job'ы снимаются
11:39
у нас каждый job может выставлять время следующего запуска
11:39
то есть, например, делаем job проверки линка
11:39
по умолчанию -- раз в минуту
11:40
словили alarm link down, поставили его на выполнение
11:40
при каждом запуске он проверяет линк
11:40
если увидел, что линк в апе, то закрывает аварию
11:41
если пришел trap link up -> авария закроется сама и job снимется
Guest77-ru #
11:43
У меня в сети с ~700 коммутаторов и фильтрациею алярмов линк довн только на аплинках, проблем с висящими авариями небыло, ну в неделю~5 штук закрывал руками.
zi_rus #
11:43
dvolodin, ты понимаешь что раз в минуту это слишком часто если линк лежит 2 дня,
dvolodin #
11:43
можно сделать адаптивным его
zi_rus #
11:43
Guest77-ru, на длинках это постоянно происходит
11:44
да и 5 штук в неделю это перебор
Guest77-ru #
11:44
Крометого если отсортировать алярмы по времени очень легко по пингфейлед отследить незакрившиеся алярмы линк довн.
11:45
Там в сети 700 длинков :)))
zi_rus #
11:45
пусть железо работает, зачем себя напрягать
Guest77-ru #
11:46
Если get_interface_status на работает по SNMP оно логами авторизации нок завалит..
zi_rus #
11:46
Guest77-ru, у нас тут у fttb'шников по 100суток линки не чинятся, за это время аварии и набегают и уходят, отслеживать это руками нереально
11:47
я задолбался и просто снял их с мониторинга, собственно мне до лампочки их сеть, но такое вот происходит
Guest77-ru #
11:50
Ну вот представлаешь сколько в логах нагадит если 100 суток каждую минуту get_interface_status через CLI дёргать. Надо адаптивно, увеличивать в два раза но максимально до час-два.
zi_rus #
11:50
я про это и говорю
11:50
но первые несколько проверок должны пройти быстро
11:51
чтобы ошибочный аларм быстро закрыть
11:52
а еще я считаю, что после закрытия аларма, job'ы не надо сразу снимать, надо еще какое-то время мониторить состояние
11:52
ошибки на порту
11:53
и подобное
dvolodin #
11:55
это уже детали реализации job'а
zi_rus #
11:57
отнюдь, ты периодичность джобов упомянул без контекста ее изменяемости
11:58
а это принципиальный вопрос
dvolodin #
11:59
у нас job сам решает, когда выполняться в следующий раз
_4ePTeHok #
14:13
блин..а как сортировку в inv-interfaces отключить?
14:14
отображалось все нормально по порядку
14:14
ткнул сортировку по имени - и стало сортироваться по 1/1 - 1/19 - 1/2
14:15
а,все, по макам нормально.
Tweet
Share this page
Share this page: Tweet