About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 08.10.2012
mikevlz #
05:26
Ну это уже совсем не смешно... 37 процентов памяти, весь своп под ноль. НАХЕРА дискавери столько памяти?
freeseacher #
05:27
mikevlz, он ее ест!
05:27
у меня дискаери 256 метров съел
mikevlz #
05:27
ээээ... стоп
05:28
беру слова обратно...
05:28
дискавери всего 600 мегов. А 14 гигов свопа съело sae. Вопрос - оно в своем уме?
freeseacher #
05:28
упс не угадал.
mikevlz #
05:28
не, такого ваопроса не будет
freeseacher #
05:28
14 гигов это вкусняшка.
05:29
он не ипишники ли чейчас заносит ?
mikevlz #
05:29
в смысле?
freeseacher #
05:30
что именно заносит дискаври сейчас в систему ?
lexus-omsk #
05:30
выходные с отключенными всеми видами дискавери: в итоге и память свободна, и цпу менее 10%...
05:30
правда печалька, когда не заносится в базу автоматом ничего
freeseacher #
05:31
у меня как раз наоборот. я обновился через почти 1000 ревизий и этот механизм появился. все выходные дрюкал базу.
05:31
~187000 адресов добавил.
05:31
памяти ел только когад была создана зона Example.com в днс
05:31
и добавлял по доному адресу в 4 секунды.
05:32
как только зону кильнул память есться перестала и сало под 25-30 адресов в секунду.
05:32
дефолтный темплейт не менял
mikevlz #
05:32
ээээ
05:33
думаешь, утечка в генерации ДНС-зон?
lexus-omsk #
05:33
т.е. затык в добавлении адреса в зону?
mikevlz #
05:33
этажпиздец
freeseacher #
05:33
нет не утечка
05:33
он на каждое добавление адреса в зону делает коммит в зону
mikevlz #
05:33
ну кагбе 14 гигов за выходные намекают...
freeseacher #
05:33
меркуриал дрочится по полной.
mikevlz #
05:33
не, коммит проходит при днс-пулл
freeseacher #
05:33
а в сае видать храниться весь "кеш"
05:34
mikevlz, увы это не так.
mikevlz #
05:34
сомнения есть...
05:34
чем отслеживал?
freeseacher #
05:34
sudo su - noc
05:34
cd /var/repo/dns
05:35
hg summ
05:35
версия коммита за выходные увеличилась на 12 тысяч.
05:35
это как раз столько сколько успело добавиться перед тем как я грохнул Example.com
mikevlz #
05:38
я опечален...
freeseacher #
05:38
почему я думаю что sae кеш ? потому как discovery -> sae дай мне ip_discovery. sae -> активатор ща сгоняю. активтор -> sae забирай. sae -> discovery на ip_discovery. discovery -> Sae погоди я записываю.
05:39
во
05:39
а вот и дима
05:39
привет
mikevlz #
05:39
gkbdtn
freeseacher #
05:39
скаджи мое размышления верны ?
mikevlz #
05:39
пливет, Дмитрий
freeseacher #
05:39
почему я думаю что sae кеш ? потому как discovery -> sae дай мне ip_discovery. sae -> активатор ща сгоняю. активтор -> sae забирай. sae -> discovery на ip_discovery. discovery -> Sae погоди я записываю.
dvolodin #
05:39
привет
mikevlz #
05:40
за выходные noc-sae сожрал 14 гигов свопа, сейчас удерживает в заложниках 1.5 гига физической памяти и весь своп
05:40
сервер полужив :)
05:40
вопрос - зачем ему столько?
dvolodin #
05:41
SAE ли сожрал?
mikevlz #
05:41
дискавери ща кушается скромные 600 мегов.
dvolodin #
05:41
у меня есть большие подозрения, что это клиент mongo память прихавывает
mikevlz #
05:41
noc 13909 0.0 46.6 14883208 1460420 ?? S Fri10AM 240:57.99 /usr/local/bin/python ./scripts/noc-sae.py launch -c etc/noc-sae.conf -i 0
05:43
это 46.6% mem, 14883208 vsize, 1460420 rss
05:44
нужно лекарство от обжорства :)
freeseacher #
05:44
mikevlz, выстрел -9
mikevlz #
05:44
это скучно
05:44
я не пулеметчик Джо
05:45
нужно что-то тонкое и изысканное
dvolodin #
05:45
RSS таки 1.4
mikevlz #
05:45
а толку?
05:46
сервер еле жив
dvolodin #
05:49
с зонами я механизм немного поправлю
05:50
сейчас при изменении ip'шника вызваевает DNSZone.touch_zone()
05:50
он, соответсвенно, крутит serial
05:51
и при этом вызывается update_repo
05:51
в обработчике сигнала
05:51
это затычка
mikevlz #
05:51
а зачем?
dvolodin #
05:52
чтобы ушел сигнал, что зона поменялась
05:52
более правильно будет сделать job touch_zone
05:52
если зона поменялась -- проверять, есть ли в очереди этот job, если есть -- сдвигать его секунда на 5
05:53
если нет -- ставить задачу на выполнение через 5 секунд
mikevlz #
05:53
я по документации думал, что зоны в репо обновляются исключительно шедулером по задаче ДНС-пул
dvolodin #
05:53
при постоянном потоке изменений в зоне job будет все время отодвигаться, пока изменения не прекратятся
mikevlz #
05:53
а если поток не иссякнет? :)
zi_rus #
05:55
если сможешь это реализовать - создавай issue :)
mikevlz #
05:56
крон =)
05:56
или что-то любое внешнее, дергающее один и тот же адрес в зоне
zi_rus #
05:56
например?
mikevlz #
05:56
раз в 4 секунды меняем его
zi_rus #
05:58
не имеет смысла, кеш клиента или днс сервера будет дольше держать старую запись
mikevlz #
05:58
Дмитрий мне показывал тут прям на канале, как сделать скрипт для ./noc shell простым скриптом
dvolodin #
05:58
загляни в scripts
05:58
любой из скриптов
05:58
можно предусмотреть два параметра
mikevlz #
05:59
я не о том говорю. Пусть держит. Я говорю про то, что если бесконтрольно сдвигать на 5 секунд job, то есть возможность, что этот Job никогда не выполнится
dvolodin #
05:59
задержку обновления зоны и интервал сброса
05:59
задержка, например, - 5 секунд, интервал - час
mikevlz #
05:59
вот пусть раз в 5 минут сбрасывает, а в пределах 5 минут двигает
dvolodin #
05:59
если мы в течении часа откладываем обновление - сбрасываем его принудительно
06:00
что касается репо -- есть решение в виде GridVCS
06:00
:)
06:01
я думаю, оно до 1000 коммитов в секунду переварит и не сдохнет
mikevlz #
06:01
когда обновляться - скажешь? Я про затычку эту с коммитом на каждый адрес
dvolodin #
06:02
угу
06:02
заодно надо планировать переход на новую схему dns provisioning'а
mikevlz #
06:03
вот думал этим заняться, чтоб обкатать, впоролся в тормоза
dvolodin #
06:03
ну поправим
06:04
благо механизм синхронизации действительно получился достаточно мощным
freeseacher #
06:15
Кстати у меня одного не получается добавить address range ?
06:15
мрет и все тут
06:16
может там FQDN надо как то по другому писать ?
mikevlz #
06:20
у нас получилось
freeseacher #
06:33
скажи какой у тя темплейт ?
mikevlz #
06:50
dvolodin: чтоб сменить синхронизатор надо отключать schedules/dns_push или чистить provisioning command?
06:51
freeseacher: nat-static-{{ip1}}-{{ip2}}-{{ip3}}-{{ip4}}.domain.com
dvolodin #
06:51
достаточно отключить push
mikevlz #
06:55
хренова -то как...
06:55
from django.utils import simplejson
06:55
ImportError: No module named django.utils
dvolodin #
06:56
это где это такое?
mikevlz #
06:56
./scripts/noc-sync.py -f start
dvolodin #
06:56
в некоторых системах из django выкидывают simplejson
06:56
поставь cjson
06:56
и не парься
mikevlz #
06:57
не, это я на сервер с ДНС демона вытащил. Вот первая зависимость
06:58
py27-cjson-1.0.5, я так понимаю, сойдет
06:59
единственная вроде зависимость
07:00
а имя подключаемого файла конфига для бинда поменялось специально?
07:01
было autozones.conf стало noc-zones.conf
07:02
точнее noc_zones.conf
07:03
ну и это, hg на ДНС-серваке ведь больше не нужен?:
dvolodin #
07:21
да, поменялось специально
07:21
hg больше не нужен, да
mikevlz #
07:26
все, запустил, наблюдаем
07:27
скрипт стартовый наваять пришлось, ланчер не знает ведь про этого демона
acid232_ #
07:32
утро
07:32
а скажите мне пожалуйста
07:33
в get_interfaces (и как следствие в inventory) должны быть интерфейсы которые в up или все ?
Dmitry1 #
07:37
все, которые есть реально на железке
lexus-omsk #
07:38
shutdown-тые с циски не заносятся
Dmitry1 #
07:38
но если есть виртуальный интерфейс, у которого нет MAC и IP адреса - то он не нужен
acid232_ #
07:41
с цисковских свичей интерфейсы видятся все, в инвентори попадают не все
07:42
и плюс shut (disabled) в get_interfaces не выводятся
zi_rus #
07:44
и это плохо, в результате physical таблица получается неполной
07:45
кто-нибудь сегодня обновлялся? проблем нет?
Dmitry1 #
07:46
я обновлялся. вроде проблем нету
zi_rus #
07:47
в логах ничего не вылезло, шедули не поломались?
Dmitry1 #
07:47
вроде не поломались
zi_rus #
07:48
ок, рискну
acid232_ #
07:49
issue писать?
07:49
раньше виделись все интерфейсі
07:50
может быть это связано с введением admin_status / oper_status ?
Dmitry1 #
07:52
Это к dvolodin'у
zi_rus #
07:53
хрен, трейс
07:54
noc-discovery
07:55
dvolodin, на это issue рисовать? http://pastebin.com/V7bSCq3H
07:58
чего-то на мак-дисковери жалуется
dvolodin #
07:59
интерфейс убежал
lexus-omsk #
07:59
zi_rus: постоянно раньше было такое
zi_rus #
07:59
раньше? а теперь нет? я только что апдейтнулся
lexus-omsk #
08:00
были в базе левые сабинтерфейсы, без родительских интерфейсов - всё повыносил, стало меньше, но осталось... отом вынес из базы все маки и вроде пропало
08:00
видимо маки тоже к левым интерфейсам привязаны были
08:01
нужна какая-то проверка целостности, чтобы не изобретать велосипед в noc shell каждывй раз после глючного скрипта дискавери
zi_rus #
08:03
lexus-omsk, это ты как раз про целостность упомянул, а я еще трейс нашел. dvolodin, http://pastebin.com/fJBcPVKC
08:03
не все так хорошо как казалось
lexus-omsk #
08:04
и такое вылезает периодически после перезапуска noc
acid232_ #
08:05
zi_rus: плюсую
08:05
периодически
zi_rus #
08:05
плохо, надо бы починить, трейс это ведь ошибка
08:06
и нок еще что-то взбесился, каждые полторы минуты дискавери запускается
08:06
видимо потому что падает
08:07
а еще говорят, все работает, ошибок нет
08:07
вот у меня работало, а теперь тольок трейсы
08:09
а шедули dns_pull/push еще не deprecated?
dvolodin #
08:10
zi_rus: пока еще нет, старая схема полностью функциональна
zi_rus #
08:10
ладно, тогда меня беспокоят тольок эти 2 трейса
lexus-omsk #
08:11
вообще немного смущают метания между подсистемами - одно не доделали, за другое хватаемся... понимаю, что, видимо, в связи с нуждами основных заказчиков делается, но всё же...
08:12
мне вот уже который раз перед руководством неудобно - начинают меня распрашивать про систему, что да как, хочу расхвалить, а в итоге наоборот получается :)
acid232_ #
08:13
вот вот
lexus-omsk #
08:13
* :(
zi_rus #
08:13
дык да, я тут безуспешно пытаюсь продвинуть идею что надо бы ФМ добить, зарелизиться и тогда за новое хвататься
dvolodin #
08:13
продуктив и тестовая среда - все-таки разные вещи
08:13
держите две среды, и будет счастье
zi_rus #
08:14
дело не в этом, фм так и не доделан
08:16
про стабилизированый релиз с каими-то готовыми плюшками приятно людям рассказать, а сейчас большее что я могу сказать, это взяли, но еще не доделали по огромному количеству пунктов
lexus-omsk #
08:17
да, именно об этом речь... вот с меня давно уже справшивают сообщения о закрытии аларма, например... пытался сам ковыряться, пока ниосилил
mikevlz #
08:20
dvolodin: noc-sync валится
08:20
трейсов нет, просто в логах "STOP" yb c njuj yb c ctuj
08:20
ни с того ни с сего
dvolodin #
08:21
mikevlz: попробуй запусти ./scripts/noc-sync.py -f start
mikevlz #
08:22
запустил
08:22
оно не сразу дохнет, через какое-то время или какое-то количество данных
zi_rus #
08:22
а у меня даже не запустился, в конфиге ланчера его нет
08:23
в дефолтном еонфиге
mikevlz #
08:23
zi_rus: я спецом rc-скрипт писал
08:23
чтоб без ланчера, один фиг не нужен
08:23
ну тока ради перезапуска и слежки если
zi_rus #
08:24
я через ланчер все делаю, не понимаю зачем работать без него
08:24
это проще
mikevlz #
08:27
без ланчера причину стопа не увидим
08:27
точнее с ланчером не заметим проблему
08:27
а без него заметим и увидим
acid232_ #
08:27
noc-discovery 1.5g rss mem отожрал
Dmitry1 #
08:29
у меня 3 гига отожрал,
mikevlz #
08:29
у кого больше? =)
zi_rus #
08:31
а может у себя кто-нибудь проверить, у меня run_command и rus_snippet не работают
mikevlz #
08:33
все чудесатее и чудесатее...
08:33
noc 940 5.9 56.2 2036232 1759844 ?? S 10:43AM 14:05.32 /usr/local/bin/python ./scripts/noc-scheduler.py
08:33
этот, блядь, куда 2 гига сожрал?
08:34
dvolodin: пинг
e_zombie #
08:35
http://pastebin.com/YG0QgTuz
mikevlz #
08:35
или это как раз та затычка?
08:36
e_zombie: в mongo надо мибы зачистить
08:37
и все взлетит
zi_rus #
08:37
вобще страшности какие-то тварятся, пинги не пингуют, активаторы, сае и дискавери нагибают процессор по страшному
e_zombie #
08:38
mikevlz: а как зачистить?
mikevlz #
08:38
mongo
08:38
use noc
08:38
db.noc.mibs.drop()
08:38
например так
e_zombie #
08:39
senks
mikevlz #
08:39
mongo запустит клиента Mongodb, дальше в консоль вводи команды
08:39
потом ишо раз пост-апдейт
zi_rus #
08:44
блин, все скрипты валятся по таймауту, хрень какая-то
e_zombie #
08:45
mikevlz: > use noc
08:45
switched to db noc
08:45
> db.noc.mibs.drop()
08:45
true
08:45
> quit
08:46
function () {
08:46
return nativeHelper.apply(quit_, arguments);
08:46
}
08:46
> exit;
08:46
но все равно не прокатывает
08:46
валится с такой же ошибкой
mikevlz #
08:47
клева как
08:53
попробуй еще noc.db.mibdata.drop()
08:54
вот помню, что чистили чота, а вот что - из мибов - не помню
dvolodin #
08:59
так, давайте по очереди
08:59
что не работает
mikevlz #
09:00
свалился опять noc-sync
09:00
ничего не сказал. Просто stop
acid232_ #
09:00
написал NOC-738
mikevlz #
09:01
эт раз
09:02
два - noc-scheduler сожрал память. 2 гига.
09:02
у меня дискавери сожрать много памяти не может, ему не остается. Непорядок =)
acid232_ #
09:03
добавь памяти )
mikevlz #
09:04
acid232_: ха-ха. Три раза.
09:05
у мне за выходные sae 14 гиг свопа выжрал и 1.5 гига ОЗУ. Сейчас шедулер на банкет пришел. Я так устану память добавлять
09:06
dvolodin: что с noc-sync делать-то?
dvolodin #
09:08
просто STOP он не имеет привычки говорить
09:08
запусти его с debug
acid232_ #
09:09
14 гиг свопа это мощно
mikevlz #
09:11
эт в секцию [main] добавить debug = true в noc-sync.conf ?
zi_rus #
09:12
так, расступись, моя очередь жаловаться :))
09:12
все скрипты, задачи etc которые заходят на железки валятся по таймауту
09:13
cript=Cisco.IOS.get_interfaces status=failed code=17 error=timed out
dvolodin #
09:13
loglevel = debug
mikevlz #
09:13
тьфу
zi_rus #
09:13
логи активатора загажены
09:13
2012-10-08 13:14:38,172 Bundled packaging. Skipping software updates
09:13
2012-10-08 13:14:38,172 Negotiation protocol 'NOC SAE PROTOCOL (http://nocproject.org/)' version '1.0'
09:13
2012-10-08 13:14:51,186 Bundled packaging. Skipping software updates
09:13
2012-10-08 13:14:51,186 Negotiation protocol 'NOC SAE PROTOCOL (http://nocproject.org/)' version '1.0'
dvolodin #
09:13
он у тебя рестартует постоянно
zi_rus #
09:15
это я вижу, а почему, обновился сегодня
mikevlz #
09:15
ждем, когда свалится
zi_rus #
09:15
запустил -f start
09:15
http://pastebin.com/snsmpLgn
09:16
как китайская грамота, никакого намека на проблему
mikevlz #
09:16
логлевел = дебаг ? :)
zi_rus #
09:17
я ему не верю
09:17
-f start дает больше информации чем дебаг
09:17
но видимо сейчас не мой случай
mikevlz #
09:17
а ДМитрий говорит, что нифига
09:18
вот я с -f start запустил noc-sync на сервере, оно закончилось простым словом STOP в логах
09:18
и все
zi_rus #
09:18
в логах да, а в консоль ничего не написала
mikevlz #
09:19
логи были на консоли
zi_rus #
09:19
ты сравни что у меня в логах (4 строчки) и то что в пастебин
mikevlz #
09:19
ну а в моем случае разницы не было
09:19
что в логах, что в консоли
09:19
ладно, драться не будем
lexus-omsk #
09:21
zi_rus: и с летающими туда-сюда активаторами бывает иногда ситуация.. лечится полным остановом всего, проверкой, вдруг чего не среагировало, тогда -9 ему
09:21
и запуск
09:22
обычно помогает, но нехорошо это, согласен
09:22
вот послде такого обычно кстати и начинаются косяки с целостностью в sa_maptask и sa_reducetask... или наоборот
zi_rus #
09:23
lexus-omsk, я сейчас loglevel = debug сделал, кое-что поменялось, пока наблюдаю. очень странно
09:24
пишет sae overloaded, all activators busy
09:24
начал работать вроде как, но таймауты пролетают
09:25
пока дам поработать
09:25
lexus-omsk, есть мысли чья это вина? питон, ОС или NOC?
lexus-omsk #
09:27
у меня после перезапуска всё полностью в норму возвращается, так что не скажу... кстати я сегодня не обновлялся
dvolodin #
09:35
-f -- это дебаг
zi_rus #
09:35
странно это все
09:36
2012-10-08 13:37:12,571 Touching pidfile: /var/run/noc/noc-activator.0.pid
09:36
2012-10-08 13:37:15,574 Touching pidfile: /var/run/noc/noc-activator.0.pid
09:36
2012-10-08 13:37:18,577 Touching pidfile: /var/run/noc/noc-activator.0.pid
09:36
2012-10-08 13:37:21,580 Touching pidfile: /var/run/noc/noc-activator.0.pid
09:36
2012-10-08 13:37:21,580 [Activator(0x804e6b310)]<CONNECTED> Timeout expired
09:36
хотя файл создается
dvolodin #
09:36
так
09:36
накатывайте апдейт
09:36
там задержка provisioning'а DNS
09:37
если включен ip discovery, то могут постоянно апдейтиться зоны
mikevlz #
09:37
ща дождусь, что noc-sync свалится, накачу. Этого демона обновлять как?
09:38
о
09:38
свалился :)
zi_rus #
09:39
чего-то лучше не становится
09:43
блин, вот рестартанул нок, и активаторы опять начали перезапускаться, а только что скрипты отрабатывали
dvolodin #
09:43
загрузку системы посмотри
zi_rus #
09:44
Load average: 1.82 2.10 2.10
09:44
sae и discovery нагибают
09:45
но криминальной нагрузки не вижу
dvolodin #
09:48
странно
09:48
я сейчас discovery в процессе наблюдаю, ничего странного не вижу
zi_rus #
09:49
dvolodin, меня терзают смутные сомнения, кажется это происходит когда я секции дискавери отключаю (enabled = false)
dvolodin #
09:50
мстит?
zi_rus #
09:50
хз
09:51
еще в пятницу заметил что с ним что-то не то когда отключаю
Andreas-SWE #
09:54
dvolodin: Merging the 2 VRFs... Getting error on 0/0 already exists... DETAIL: Key (vrf_id, afi, prefix)=(1, 4, 0.0.0.0/0) already exists.
zi_rus #
09:54
dvolodin, дискавери включил, в логах каждые 30секунд 2012-10-08 13:43:11,562 [inv.discovery] Running job interface_discovery(...
dvolodin #
09:54
Andreas-SWE: skip 0.0.0.0/0
Andreas-SWE #
09:55
Trying to figure that out.
09:55
I can't delete it in the web gui...
dvolodin #
09:55
Andreas-SWE: vrf.prefix_set.exclude(prefix="0.0.0.0/0")
Andreas-SWE #
09:55
Thanks
zi_rus #
09:56
дискавери сн5есло крышу
dvolodin #
09:56
zi_rus: возможно, если noc-discovery долго лежал
zi_rus #
09:57
но почему job запускается каждые 30сек. я специально выбрал одну железку и смотрю в логе по ее имени, оно всплывает в этой строчке каждые 30сек
09:58
кажется начинаю понимать
dvolodin #
09:58
?
Andreas-SWE #
09:58
dvolodin: AttributeError: 'module' object has no attribute 'prefix_set'
zi_rus #
09:59
dvolodin, первый трейс, который я скинул, кажется в нем дело
dvolodin #
09:59
Andreas-SWE: vrf1 or vrf2
09:59
повтори трейс
Andreas-SWE #
09:59
=)
zi_rus #
09:59
дискавери постоянно рестартует
Andreas-SWE #
09:59
Sorry. My bad.
zi_rus #
09:59
dvolodin http://pastebin.com/V7bSCq3H
dvolodin #
10:00
zi_rus: угу, понял где
zi_rus #
10:01
это очень и очень хорошо
dvolodin #
10:09
отключи пока mac discovery в конфиге
zi_rus #
10:12
я даже не знал что он есть в конфиге :)
10:12
уже отключил
10:12
смотрю
10:12
dvolodin, ну почти, теперь активаторы начали опять перезапускаться :)
dvolodin #
10:13
может опять в теплые края хотят?
zi_rus #
10:13
не понял шутки юмора
dvolodin #
10:14
в логах discovery чисто?
freeseacher #
10:15
у меня активтороры виснут тоже
10:15
хертбит говорят сдох
zi_rus #
10:16
с толкача, те с шестой попытки, активаторы стартанули,в логах дискавери только таймауты, трейса нет, только второй сегодняшний трейсбек
10:16
в crashinfo
dvolodin #
10:20
патчик от трейсов накатил
zi_rus #
10:20
обоих?
dvolodin #
10:20
от удаленных интерфейсах при живых сабах
zi_rus #
10:21
dvolodin и этого -> http://pastebin.com/fJBcPVKC
dvolodin #
10:21
это можно игнорировать смело
zi_rus #
10:22
но креш создается. что это вообще
10:28
ух, нок немного ожил, а то с утреннего обновления так и валялся
10:32
обновления у нока очень суровые
e_zombie #
10:33
dvolodin: http://pastebin.com/YG0QgTuz обнуление таблицы нока не помогает
ufir #
10:34
zi_rus а у меня по прежнему крэши швыряет раз в час-другой, с "Invalid job class."
zi_rus #
10:34
это не мой креш, смотри что у тебя
ufir #
10:35
а активаторы чего у тебя не стартовали ?
zi_rus #
10:37
а я хз, то стартую, то нет, вернее они стартуют, только пстоянно перезапускались
dvolodin #
10:43
ufir: давай трейс
zi_rus #
10:45
еще какая-то неприятность, fm.ping то отрабатывает то нет
10:45
fm.ping_check: Ping failed on activator 'noc': {'text': 'Timed out', 'code': 17}
10:46
с чего вдруг
10:46
через раз
ufir #
10:48
http://pastebin.com/zAcFyker
dvolodin #
10:53
ufir: останови классификатор, дай отработать коррелятору
10:54
и в монге > db.noc.schedules.fm.correlator.drop()
10:56
эмпирическим путем выяснили, что не стоит на фре собирать python с gnu pth :)
mikevlz #
10:57
по крайней мере на 9.0 amd64
10:57
а то будут люди верить в магические числа...
Dmitry1 #
11:00
А нафига включать GNU Pth ? Он по умолчанию и так выключен. ССЗБ.
ufir #
11:01
заодно еще и монгу рестартанул... крашей нет, трейсов нет - пока все гладко
mikevlz #
11:01
Dmitry1: Threading/multiprocessing via GNU Pth
11:01
вот за этим
11:02
зачем оно - не скажу, но без него таки лучше =)
Dmitry1 #
11:02
так оно по умолчанию и так выключено
11:04
а включено использование нативной библиотеки libpthread.so
mikevlz #
11:04
ну это самое... обзываться не надо :)
Dmitry1 #
11:05
Ну так внутри Makefile посмотри:
mikevlz #
11:05
ну не хочу уже. Проблему решил
Dmitry1 #
11:05
.else # !defined(WITH_PTH)
11:05
CONFIGURE_ARGS+= --with-threads
11:05
CFLAGS+= ${PTHREAD_CFLAGS}
11:05
LDFLAGS+= ${PTHREAD_LIBS}
11:05
.endif # defined(WITH_PTH)
11:06
используется родная для фри libpthread
11:07
которая на порядок лучше и стабильнее линуксовской
dvolodin #
11:07
я вообще не очень понимаю, зачем на фре pth
Dmitry1 #
11:08
для совместимости с какими-то линуксовыми либами
11:09
фря, в отличие от линкуса, спокойно исполняет линксовые экзешники
11:10
и использует при этом родные линуксовые библиотеки для бинарной совместимости
11:10
у меня, например, таким образом работает линуксовый флешплеер
11:23
dvolodin: Можно ли на вкладке Physical в Inventory значек link/unlink делать красным, если порт в дауне?
dvolodin #
11:26
не уверен, что это посто
mikevlz #
11:26
mrt надо будет звать, чтоб дергало get_interface_status
11:27
а по результату менять значок
11:27
dvolodin: если на основном серваке noc-stomp остановить, должен остановиться Noc-sync?
dvolodin #
11:27
нет
11:28
он будет пытаться переконнектиться
mikevlz #
11:28
значит не полечили
11:28
опять STOP и все :)
11:28
прям как Blue Screen Of Death у винды =/
Dmitry1 #
11:29
как тогда увидеть результаты oper_status ?
mikevlz #
11:29
ну и шедулер опять 1.5 гига памяти сожрал
Dmitry1 #
11:29
Актуально для инвентори, особенно, когда на этой же вкладке указанно, куда коннектится данный порт (который в дауне)
mikevlz #
11:30
Dmitry1: надо переписать EXTJS приложение и view
Dmitry1 #
11:31
Замечание для процедуры link/unlink: при выборе портов, показывать рядом в скобках description. А то я на память не помню, какой из 52=х портов куда подключен
mikevlz #
11:32
=)
11:32
это да, есть такое...
11:33
туда бы еще кнопку "показать возможные связи", которая бы дергала get_topology_data для CDP/FDP/LLDP
zi_rus #
11:35
да сама бы она их заполняла, чего уж там
Dmitry1 #
11:35
пока только для D-link собираются протоколы
11:35
Доделаю D-Link - займусь Cisco
mikevlz #
11:35
для брокейда тоже собираются, но не все
11:47
Dmitry1: строка 194 noc/inv/apps/interface/views.py Можешь попробовать изменить "label": i.name на "label": i.name + "-" + i.description
11:47
тогда интерфейс при выборе "с кем линкуем" должен подписываться "2/5-линк_в_мусохранск"
11:48
поломаться ничего не должно. Но если вдруг сломается - откатить изменения не сложно
Dmitry1 #
11:48
так это к dvolodin. я доступа на коммит туда не имею
mikevlz #
11:48
ну эт для себя можешь такое сделать
11:49
убедиться, что все красиво, запостить issue с улучшением, откатить у себя, ждать апдейта :)
Dmitry1 #
11:51
хм. работает
mikevlz #
11:53
прелесть :)
Dmitry1 #
11:54
ждем dvolodin'а
11:55
Блин. Нужен, однако, человек на fulltime. Как раз для таких вещей
11:55
Хоть на kickstart'е регистрироваться
mikevlz #
11:56
надо трех человек на фултайм
11:56
один болеет, другой в отпуске, третий закоммитил
11:56
=)
11:56
если их трое - нужен начальник, бухгалтер, директор и уборщица :)
zi_rus #
11:58
... охранник, юрист и повар в столовую
freeseacher #
12:00
Люди!
12:00
Нужен маркетолог!!!!
mikevlz #
12:01
да
12:01
маркетолог нужен обязательно
12:01
нужно же кого-то бить по понедельникам для профилактики и эмоциональной разрядки
12:03
а программисты не нужны
12:03
от них вред один :)
12:19
знаете, что плохо в работе с мегакорпорациями?
12:20
каждый раз новому человеку рассказываешь, что они делают не так.
zi_rus #
12:33
Dmitry1, а у тебя было такое с оспф, когда длинк ABR и он не анонсит лупбек если он не в area 0
Dmitry1 #
12:34
я OSPF на D-Link не использую
zi_rus #
12:34
статика рулит :)
Dmitry1 #
12:34
У меня BGP, по причине того, что я тупо везде мультикаст рубаю
zi_rus #
12:35
сомнительное мероприятие - рубить мультикаст
12:47
save as new так и не починили
Dmitry1 #
12:55
мультикаст и броадкаст - зло
acid232_ #
12:55
зло это длинк
Dmitry1 #
12:55
особенно, когда в l2 сетке пара сотен свичей
freeseacher #
12:56
зло это "l2 сетке пара сотен свичей". qinq наша тема
12:57
мы рубим избирательно. pvst+, stp, cdp и прочее, но только там где это дейстивительно надо.
acid232_ #
12:58
Dmitry1: про адаптивный промпт для хуавея - только одну строчку с ним добавть в init.py и все?
Dmitry1 #
12:58
yes
freeseacher #
12:59
dvolodin, у дефолтной иконки нока есть проблема. она не отличимма от иконки kb по цвету.
acid232_ #
13:00
и в какие правила ifindex добавлять?
zi_rus #
13:02
вот пожалуйста, нок опять начал пустые уведомления присылать 20 new addresses discovered
13:14
dvolodin, что ты с днс сделал, у меня уже 57 ревизия зон валится за сегодня
13:15
- 2012100855 ; serial
13:15
+ 2012100857 ; serial
dvolodin #
13:17
хм
13:17
при включеном discovery?
zi_rus #
13:17
да
dvolodin #
13:18
адреса из нее находит?
zi_rus #
13:18
may be один новый мог найти
13:19
уведомления не доходят
13:19
от дискавери
13:19
все что можно было найти - уже давно найдено
acid232_ #
13:19
zi_rus: да, пустые письма
13:20
в темплейте вроде все красиво, а письма пустые
zi_rus #
13:20
acid232_, оно раньше нгормально работало, это из-за новой джанги сломалось
acid232_ #
13:20
только у меня это выглядит как 1 new prefixes discovered
zi_rus #
13:21
отпишитесь кто-нибудь в issue про джангу что письма пустые стали приходить
13:24
убег, а тем временем
13:24
- 2012100859 ; serial
13:24
+ 2012100861 ; serial
13:29
интересно, что будет когда дойдет до 99
13:35
Dmitry1, к тебе тема, правила для фм надо порисовать
Dmitry1 #
13:35
кинь issue. разгребу по свободе
zi_rus #
13:35
ок
Dmitry1 #
13:35
и на меня issue сделай
zi_rus #
13:35
может даже уже есть такой, сейчас посмотрю
acid232_ #
13:44
почините save as new пожалуйста )
zi_rus #
13:45
Dmitry1, не нашел как на тебя сделать, создал новый, сам возьми его
Dmitry1 #
13:46
ok
acid232_ #
13:49
zi_rus: в какое issue ?
zi_rus #
13:50
acid232_, чего какое? смотри последние, если интересно
13:50
Dmitry1, еще один кинул
13:50
пока все
Dmitry1 #
13:51
я уже сделал алармкласс Memory Insufficient
zi_rus #
13:51
dvolodin, уже 2012100871, медленно приближаемся к сотне
13:52
Dmitry1, да, я видел, но это уже другой
Dmitry1 #
13:52
думаю, проблему с переполнением TCAM туда же модно засунуть
13:52
TCAM - та бе память
13:52
та же память
zi_rus #
13:52
все-таки не таже
Dmitry1 #
13:52
только с хитровжаренным способом доступа
ufir #
13:53
Huawei.VRP.get_ip_discovery трейсбэкает на ethernettrunk интерфейсах
zi_rus #
13:53
я бы их назвал софтварная память и хардварная
Dmitry1 #
13:53
у нас вроде есть класс по ошибкам ASIC
13:54
ufir: issue кидай
zi_rus #
13:55
Dmitry1, по АСИК, мне кажется это тоже что-то не то
Dmitry1 #
13:55
TCAM вроде бы в ASIC живет
13:55
Всякие там FIB, RIB и т.п.
13:56
В D-Link'е, насколько я понимаю, для них разная память, а в циске они живут в одной области.
13:56
и дерутся за нее :)
acid232_ #
14:10
zi_rus: что-то я не вижу issue с django
ufir #
14:27
если в huawei-vrp железяке в конфиге есть пробел - get_config не отрабатывает
acid232_ #
14:32
в конфиге чего?
14:32
ufir: трейсбек покажи
ufir #
14:33
в конфиге ничего, просто таймаут
14:34
щас уже поправил объекты на которых было так
acid232_ #
14:34
в списке названий интерфейсов?
ufir #
14:40
имеется в виду - в названии самого коммутатора
14:40
тогда он просто пищит
14:40
2012-10-08 18:36:49,719 MRT task=283853/1053732 object=cct01-krasnog(10.200.200.42) script=Cisco.IOS.get_ip_discovery status=failed code=17 error=Timed out
14:40
ой, не то
zi_home #
15:07
acid232_, NOC-427
Tweet
Share this page
Share this page: Tweet