nocproject.org
08:19
dvolodin, есть ли какая-нибудь возможность подебажить классификатор? он с завидной регулярностью уходит в 100% загрузку цпу и начинает очень медленно обрабатывать ивенты. это начинает уже раздражать. в логах даже уровня дебяга никакого кримин
08:19
ала нет
08:20
на каких исенно событиях?
08:20
эммм
08:20
я не вижу с какого момента он начинает
08:21
просто замечаю что ивенты начинают отставать
08:21
чищу очередь новых ивентов и рестартую нок
08:21
и он начинает дальше работать
08:22
он не просто не обрабатывает, он делает это очень медленно
08:22
вероятно потому что процесс нагружает ядро цпу в полку
08:22
я и так и эдак к нему подходил
08:22
и в логи смотрел
08:22
ну ничего нет
08:25
08:26
в 09:12:27 производительность резко упала
08:26
я домашний. в спячке.
08:26
и так пока я сейчас не дропнул ивенты и не рестартанул лог
08:27
link down плодятся/
08:27
?
08:27
в сентябре выйду на работу и буду вам ебсти мозг по чистке 100+ гиговой бд монги и как она херова крутится с такими объёмами.
08:27
проверь индексы в монге на интерфейсах
08:29
dvolodin, линк даунов у меня много, дсламы кучу сообщений шлют, да и всякого валится много это да. а как индексы проверить?
08:29
db.noc.interfaces.getIndexes()
08:29
да и вообще запусти mongostat
08:29
E_zombie21, в отпусге чтоли)
08:32
подожем когда опять начнется тогда
08:36
HaLVeR: да. за окном +35-40 и такая жопа что не поедешь никуда на природу.
08:38
dvolodin, а графитовой веткой уже можно баловаться или там смотреть не на что?
08:38
там есть писалка в базу и рендерилка графика
08:39
так, которая из графита
08:39
можно играться прикручивая внешние дашборды
08:39
интегрировать со сбором данных буду на следующей неделе
08:39
не, внешнего ничего нет, хотелось из нока уже посмотреть
08:40
графики это крута
08:40
пока такое пытаюсь примотать
08:40
08:41
сейчас есть общий коллектор данных, хранение в базе и отдача из нее
08:41
все - совместимое с графитом
08:43
есть тестилка из карбона -- example-client.py, которая пишет 3 параметра load average
08:43
E_zombie21, дык у нас так все лето, ничо нормуль
08:44
несчастные
08:44
у нас 26
08:44
ненавижу эту жару
08:44
хорошо уже август
08:46
HaLVeR: ну пойти то можно. волга тёплая. но транспорт и компания как то не радует. поэтому только после захода солнца.
09:20
у меня народ с работы говорит что после "чистки" сети от перестроения стп и ошибок на портах агрегации стало значительно меньше инцидентов приходить.
09:30
да неужели
09:30
и как так может быть
09:30
:)
09:42
да я вот тоже думаю.
09:42
рассказали такую вот фигню.
09:44
есть агрегация на хуавее. идеально промерянная оптика без глюков. замененные сфп на новые - а ошибки на интерфейсах продолжают переть. грешим на то что не работает кондиционер и сфп в руке не удержать если выдернуть из коммутатора.
09:58
туда сходится достаточно большая туча колец.
09:58
но глючат только определённая группа портов. думаю что это локальный перегрев
09:58
или ещё что то такое.
10:00
это называется хуавей)
10:01
но ничо, вот как запретят еще сетевое оборудование импортировать - так заживем!
10:01
ну не совсем. у нас их достаточно много таких и на других такое не проявляется.
10:01
ну значит локальный китаец перегрелся, что в коробочке сидит, пакеты перекладывает)
10:01
ну в америкосии давно запретили в гос структуры ставить ничего кроме циски.
10:02
у них хоть циска есть)
10:02
у них внезапно оказались поддельные циски .
10:02
непонятно с какой начинкой.
10:02
ну ты понял где они стояли.
10:03
последние апдейты девелопа нормально встают?
10:33
конечно боян но у меня в браузере переколбасило всё после апдета
11:02
какие закляться произносить?
11:05
ну раз молчите - пойду готовиться к съёмке девочки
12:00
опять нок вспоминают
12:00
12:12
"Как пользователь, администратор и контрибутор NOC Project могу сказать что там внутри всё тоже очень и очень грустно. "
12:12
ай-яй-яй
12:13
предать анафеме!
12:13
отлучить от репозитория!
12:55
:-D+
13:40
зойбанить с извращениями
14:52
dvolodin, noc не продержался и полдня, опять началось. вот монгостат текущего состояния
14:52
14:58
zi_home: вообще никакого криминала
14:58
и при этом у классификатора загрузка CPU до упора?
14:58
PID USERNAME THR PRI NICE SIZE RES STATE C TIME WCPU COMMAND
14:58
37400 root 1 103 0 427M 261M CPU1 1 367:31 100.00% /opt/noc/bin/python ./scripts/noc-classifier.py launch -c
14:59
угу
15:00
что-нибудь свое наворачивал?
15:00
в классификатор не лазил
15:00
только правила
15:06
правила классификации?
15:06
с регулярками не перемудрил?
15:06
да нет, пошлостей врде не было
15:07
я вообще думал про это
15:07
я дропнул все свои правила кроме
15:07
двух
15:07
это не помогло
15:07
попробую конечно эти два добить
15:07
хз что это даст
16:57
Всем доброго вечера
16:57
Кто нибудь подскажет где окружение питона живет? Куда его проставить?
16:58
Пока так нибуда и не сдвинулся с проблемой своей
16:58
"/opt/noc/lib/python2.7/site-packages/pip/pep425tags.py:62: RuntimeWarning: invalid Python installation: unable to open /opt/noc/local/include/python2.7/pyconfig.h (No such file or directory)"
17:06
так это новая инсталляция или что?
17:14
zi_home: печальная история - был на develop, обновился на днях и оно вот такое стало
17:14
сейчас покажу скрин
17:15
17:15
потом как я понял, сделал глупость и откатился на default ветку
17:15
а где связь с питоном?
17:15
а откат на дефолт это жопа
17:15
в логах ошибки при обновлении
17:15
вот я так и понял
17:16
вернулся назад - ситуация не измениолась
17:16
с виду не хуже и не лучше - просто не работает)
17:16
и чего делать не понятно
17:16
мое предложение все забекапить
17:16
снести нок
17:16
и заново установить
17:17
если повезет то данные в базе останутся живы и не придется бекап разворачивать
17:17
мм, как забэкапить?
17:18
только ipam по сути vc
17:18
если автоматический бекап не включал, то можно из консоли в csv export сделать
17:19
./noc csv-export vc.vc > /home/qqq/vc
17:19
./noc csv-export ip.address > /home/qqq/ip
17:19
./noc csv-export ip.prefix > /home/qqq/pref
17:20
ага, спасибо. проекты еще вроде были
17:20
а потом чего удалять?
17:20
весь /opt/noc ?
17:20
да
17:20
в базах только данные
17:20
конфиги из /opt/noc/etc еще забери
17:21
ага. потом по инструкции проставить все занова?
17:21
пасиб. если не взлетит - чо делать?
17:21
теоретически он к базе должен подцепиться и все взлетит
17:21
тогда бекапы можно будет убить
17:22
это чисто на всякий случай, кто знает что беготня туда-обратно могла сделать с данными
17:22
пасиб. а если не взлетит - что с этими бэкапами делать?
17:23
БД надо чистить перед этим?
17:23
будем уже смотреть по факту
17:24
понятно)
17:24
что еще забэкапить можно полезного?
17:24
были SA немного
17:24
и проекты
17:24
ну их значит
17:24
sa.managedobject
17:24
project.project
17:25
ага, нашел портянку модулей - повыбираю
17:25
пасиб большое! попробую
17:39
zi_home: автоинстал прокатит?
17:39
17:40
хз
17:40
я только руками ставил всегда
17:40
в смысле БД не потрет
17:41
не должен
17:41
он тоже самое что и руками когда ставишь, должен делать
17:48
E: Unable to locate package libgdal1
17:48
sh: Failed to install libgdal1
17:48
Terminating
17:48
либа стоит на самом деле
17:48
попробовал удалить и снова инсталл - опять на этом же месте спотыкается
17:52
zi_home: выручай
17:52
где стоит?
17:53
а точно она?
17:54
root@noc:/opt# aptitude search libgdal1
17:54
i libgdal1-1.7.0 - Geospatial Data Abstraction Library
17:54
просто libgdal1 без номера версии нет
17:54
это скрипт не сработал?
17:55
это баг скрипта
17:55
скачай его на сервер и закомменть эту строчку
17:55
или поставь руками как я говорил
17:55
в скрипте для убунты я уже говорил про этот баг, но никто так и не исправил
17:57
дальше проблем быть не должно, я пользовал однажды этот скрипт
17:59
etc полностью заменить?
17:59
можно было бы и по инструкции поставить, с учетом того что половина шагов уже выполнена это дело 5 минут
17:59
ну кроме дефолтовых конфигов
17:59
их не трогай
17:59
а конфы свои старые копируй туда
17:59
ага. а он какую ветку сейчас ставит?
18:00
или надо будет develop поставить и обновить?
18:00
как прописано в конфиге
18:01
скорее всего это дефолт
18:01
лучше сразу поставить девелоп и сделать апгрейд
18:04
для этого и делались бекапы
18:04
18:04
это при апгрейде на develop
18:05
не достучался до сервера
18:05
попробуй позже
18:05
странно pypi.python.org пингуется
18:05
и отвечает
18:05
ок
18:08
вроде проскочило дальше
18:10
обновилось
18:10
запустил. картинка 1 снова
18:12
не понятно почему сам интерфейс разваливается
18:22
посмотри в веб консоли 404 ошибки
18:23
в noc.conf есть пути до файлов с темами, может что-то не на месте
18:23
на сколько я понял, у кого голубая тема, те и жалуются
18:23
в /srv/noc/log/noc-web.log нет 404 вроде
18:23
попробуй для нее прописать путь до файлов серой темы
18:24
кстати интересно, если таки кое как в меню выбрать ipam, то он в нормальном виде открывается, сама сетка с данными, только надо проматать на пару страниц вниз. меню все равно разваленое остается.
18:24
сейчас посмотрю
18:26
так у тебя голубая тема?
18:27
может юзеру вписать серую
18:27
и всего делов
18:28
голубая
18:29
в noc.conf пробовал - не реагирует
18:29
пробовал и gray ставить и другие все там же в noc.conf
18:30
сделай файлик
18:30
user,theme
18:30
username,gray
18:30
username только свой
18:31
и ./noc csv-import -r update main.userprofile <file>
18:32
уфффф
18:32
так что это было?)))
18:32
волшебник!
18:32
испорченная тема?
18:33
ну да
18:33
в профиль прописал серую тему
18:33
при апдейте получается как-то съехала чтоли
18:34
ну спасибо! выручил!
18:34
все теперь на своих местах
18:34
там хз, обновили на extjs 5
18:34
может чего-то поломалось
18:34
я не в курсе
18:34
заметил только что люди с голубой темой жалуются
18:34
а у меня серая
18:35
никаких проблем не заметил при апгрейде
18:35
ну в любом случае переустановка по крайней мере ошибки при обновлении убрала
18:35
так что польза все равно была от всего этого
18:35
спасибо тебе огромное!
18:35
а не подскажешь еще, где бэкап включить?
18:36
main > setup > schedules
18:36
еще в конфигах порыться, настроить куда бекап класть
18:36
ага, пасиб
18:36
он в csv ведь бэкапит?
18:37
ты только голубую тему не ввключай, она так сломаная сейчас и осталась
18:37
ага, на долго запомню эту тему
18:39
вот еще
18:39
18:39
18:39
спасибо, пошел изучать)
20:15
я в конфиг запретил все темы кроме grey и у меня интерфейс исправился без телодвижений.
20:47
2014-08-18 00:49:43,531 MRT task=38515473/38842783 object=fsw-5-Chapaeva-114-0-atk(10.64.106.166) script=Huawei.VRP.get_version status=completed
20:47
2014-08-18 00:49:43,547 MRT task=-/38842621 object=fsw2-1-lesnrespublika-5a-35-sar(10.64.38.253) script=Huawei.VRP.commands status=completed
20:47
2014-08-18 00:49:43,572 MRT task=-/38842626 object=fsw2-1-malajaelshanskaja-15-35-sar(10.64.39.243) script=Huawei.VRP.commands status=completed
20:47
2014-08-18 00:49:43,589 MRT task=38515537/38842849 object=bgw2-sar(88.147.128.89) script=Juniper.JUNOS.get_discovery_id status=completed
20:47
2014-08-18 00:49:43,606 MRT task=38515503/38842813 object=fsw-1-zarechnaja-39-92-sar(10.64.95.57) script=Huawei.VRP.get_lldp_neighbors status=completed
20:47
2014-08-18 00:49:43,637 MRT task=-/38842661 object=fsw-2-1studenyprzd-8-35-sar(10.64.39.140) script=Huawei.VRP.commands status=completed
20:47
2014-08-18 00:49:43,658 MRT task=38515530/38842840 object=fsw-11-dnepropetrovskaja-18k3-32-sar(10.64.31.103) script=Huawei.VRP.get_lldp_neighbors status=completed
20:47
2014-08-18 00:49:43,696 MRT task=-/38842666 object=fsw-2-1tulskprzd-24-92-sar(10.64.93.210) script=Huawei.VRP.commands status=completed
20:47
2014-08-18 00:49:43,531 MRT task=38515473/38842783 object=fsw-5-Chapaeva-114-0-atk(10.64.106.166) script=Huawei.VRP.get_version status=completed
20:47
2014-08-18 00:49:43,547 MRT task=-/38842621 object=fsw2-1-lesnrespublika-5a-35-sar(10.64.38.253) script=Huawei.VRP.commands status=completed
20:47
2014-08-18 00:49:43,572 MRT task=-/38842626 object=fsw2-1-malajaelshanskaja-15-35-sar(10.64.39.243) script=Huawei.VRP.commands status=completed
20:47
2014-08-18 00:49:43,589 MRT task=38515537/38842849 object=bgw2-sar(88.147.128.89) script=Juniper.JUNOS.get_discovery_id status=completed
20:47
2014-08-18 00:49:43,606 MRT task=38515503/38842813 object=fsw-1-zarechnaja-39-92-sar(10.64.95.57) script=Huawei.VRP.get_lldp_neighbors status=completed
20:47
2014-08-18 00:49:43,637 MRT task=-/38842661 object=fsw-2-1studenyprzd-8-35-sar(10.64.39.140) script=Huawei.VRP.commands status=completed
20:47
2014-08-18 00:49:43,658 MRT task=38515530/38842840 object=fsw-11-dnepropetrovskaja-18k3-32-sar(10.64.31.103) script=Huawei.VRP.get_lldp_neighbors status=completed
20:47
2014-08-18 00:49:43,696 MRT task=-/38842666 object=fsw-2-1tulskprzd-24-92-sar(10.64.93.210) script=Huawei.VRP.commands status=completed
20:47
странный вывод.
20:48
кое где есть есть цифра первая в номере - кое где нету
Share this page
Share this page: