About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 18.12.2014
TSergey #
03:58
кто использует кутеки на доступе? глючнее чем длинки?
misak #
05:59
доброе утро
CfYz`R #
06:00
утро добрым не бывает
misak #
06:00
вот именно, у меня с 15-го числа не собираются конфиги
06:00
Activator pool is down пишет
06:00
ничего за эти два дня на канале не писали ?
TSergey #
06:01
misak: а из SA\MO\Edit discovery руками запускается?
06:01
(и вроде не писали такого)
bee26 #
06:01
логи смотри
misak #
06:02
неа
TSergey #
06:02
т.е. не запускается?
06:02
у меня так было с новым МО
06:03
перешедуливал программно
06:03
и не факт что это помогло
misak #
06:08
потер логи, запустил заново
06:08
посмотрю что
06:09
но есть непонятные ошибки, пока что не связанные
06:11
начало собирать вроде-бы
06:12
[noc.lib.nbsocket.basesocket] [Ping4Socket] Failed to create ping socket. Check process permissions - а вот с этим как бороться кто знает?
06:19
а еще эти две ошибки
06:19
[noc.lib.daemon.configuration] Cannot get config from http://127.0.0.1:8000/main/sync/default/0/config/: HTTP Error 403: FORBIDDEN
06:19
[noc.lib.daemon.configuration] Cannot get config from http://127.0.0.1:8000/pm/probe/default/0/config/: HTTP Error 403: FORBIDDEN
06:24
активатор надо запускать от рута, это первая проблема
zi_rus #
06:26
misak, ты тоже инструкцию не до конца читаешь?
misak #
06:27
zi_rus: просто не успеваю все логи канала читать
06:27
нашел уже все
06:28
работы у меня много, как ни банально это не звучит
06:36
TSergey: а как ты INTERNAL SERVER ERROR победил?
zi_rus #
06:49
dvolodin, пируль при стандартной работе и при запуске через noc shell может давать разные результаты?
dvolodin #
06:49
не должен
zi_rus #
06:50
а вот дает
06:51
у меня валидатор конфига выдает
06:51
interface FastEthernet0/18
06:51
no mac access-group NOVRRP in
06:51
interface FastEthernet0/13
06:51
no mac access-group NOVRRP in
06:51
interface FastEthernet0/16
06:51
no mac access-group NOVRRP in
06:51
interface FastEthernet0/17
06:51
no mac access-group NOVRRP in
06:51
interface FastEthernet0/14
06:51
no mac access-group NOVRRP in
06:52
хотя я в коде сделал костыль чтобы эта и некоторые другие настройки игнорились
06:52
с консоли все нормально
06:53
m3g_ignore_config = set([
06:53
'description ',
06:53
'switchport mode',
06:53
'switchport trunk allowed vlan',
06:53
'mac access-group NOVRRP in',
06:53
'speed ',
06:53
'duplex ',
06:53
'switchport access vlan',
06:53
'l2protocol-tunnel ',
06:53
'media-type',
06:53
'shutdown',
06:53
'channel-group',
06:53
'port-type eni',
06:53
])
06:53
все эти настройки игнорятся
06:54
а при сборе конфига с железок тоже все работает
06:55
но почему-то пропускает NOVRRP и предлагает его удалить
06:56
подозрение что что-то залипло
06:56
потому что эту строчку я добавил последней
e_zombie1 #
06:58
http://www.opennet.ru/opennews/art.shtml?num=41291
06:59
TSergey: у меня кутеков 1500 стоит. ну не знаю как длинки , но работает. но через анус. если там айпитиви.
06:59
кютеки второй месяц ищут баги у себя.
TSergey #
07:01
e_zombie1: спасиб
07:01
мы видимо начинаем на этих граблях прыгать
zi_rus #
07:02
dvolodin, есть варианты как можно разлипнуть пируль?
e_zombie1 #
07:02
если у тебя такое же гавно типа 2800 и 8200 то главное профиль для него ставь который qsw.2800 а не тот что идёт стандартно
TSergey #
07:02
e_zombie1: зная наши "надмозги", может еще передумают
07:03
и спасибо за советы, буду спрашивать
e_zombie1 #
07:03
ну по факту вариантов у тебя почти нету. это типа русская контора.
TSergey #
07:03
"8[12:36] misak: TSergey: а как ты INTERNAL SERVER ERROR победил?"
07:03
это про пробы-метрики?
e_zombie1 #
07:04
хотяи п делают всё в китае
misak #
07:04
TSergey: да, но я создал дефолтные, вроде-бы все ок сейчас
TSergey #
07:04
e_zombie1: наши почему-то думают, что кутеки будут дешевле длинков
07:04
misak: ок
e_zombie1 #
07:05
ну это сколько денег занесут.
07:05
у нас хотябы есть представительство длинка под боком и чуть что - сразу мордой об стол.
misak #
07:06
длинк нормально
07:07
остальное или по функционалу плохо или запредельно дорого
TSergey #
07:14
надеюсь мы это обнаружим быстро, до того как накупим значительное количество
e_zombie1 #
07:20
обнаружишь да
TSergey #
07:23
а как на айпитв сказывается?
e_zombie1 #
07:23
я не в курсе всех подробностей но были баги со стабильностьюкоммутаторов на 7 ветке вообще
07:23
и для мультикаста в частности.
misak #
07:34
это вы про кутеки?
e_zombie1 #
07:34
но них радимых
misak #
07:34
нда
07:35
а кроме логов канала, про графики есть где почитать?
07:35
про то как с нула настроить
07:35
нуля
e_zombie1 #
07:35
https://kb.nocproject.org/pages/viewpage.action?pageId=17858564
misak #
07:35
пасиба!
e_zombie1 #
07:36
ггыгыгы . у тебя всё равно не получится
misak #
07:41
:)
07:41
а 8000 порт надо оставлять?
07:41
в настройке строеджа?
e_zombie1 #
07:42
да
07:42
там путь который у тебя в браузере
misak #
07:42
http://noc.gnc.am:8000/render - у меня так получается, при открытии с браузера коннекшен рефюзд
TSergey #
07:43
мне кажется порт не 8000
e_zombie1 #
07:43
смотри в логи noc-web
misak #
07:44
без порта трейсбек вываливается
TSergey #
07:44
а с 80?
misak #
07:44
global name 'cairo' is not defined - подозреваю, что что-то надо доустанавливать
TSergey #
07:45
а, ты на другом этапе :)
misak #
07:45
да, именно с 80-м портом
07:45
:)
e_zombie1 #
07:47
я тебе говорил что не получится :)
misak #
07:48
я еще побарахтаюсь
e_zombie1 #
08:03
мнда. не получилось .
08:03
всего в 10 потоков идёт
TSergey #
08:07
dvolodin: привет
08:08
а чего может быть такое, save MO сам не заканчивается
dvolodin #
08:09
он метрики там всякие пересчитывает
TSergey #
08:10
я вроде вырезал все по интерфейсам
08:10
ну и не закрывается совсем, я оставлял на час --- крутилось
08:10
закрываешь вкладку
08:10
снова заходишь --- сохранено
zi_rus #
09:00
dvolodin, почему активаторы могут случайным образом отваливаться?
09:01
работают, ваыполняют скрипты
09:01
отправляют результат
09:01
и инстансы от сае начинают отваливаться
09:01
конектятся заново
09:01
потом опять отваливаются
09:01
и так по кругу
09:02
2014-12-18 11:49:09,554 [root] Registering as 'noc'
09:02
2014-12-18 11:51:38,171 [root] Registering as 'noc'
09:02
2014-12-18 11:52:28,408 [root] Registering as 'noc'
09:02
2014-12-18 11:52:53,560 [root] Registering as 'noc'
09:02
2014-12-18 11:55:43,925 [root] Registering as 'noc'
09:02
2014-12-18 11:57:56,061 [root] Registering as 'noc'
09:07
в логах сае только трейс http://pastebin.com/dBVw9gUF
09:07
но мне кажется это следствие а не причина отвалов
e_zombie1 #
09:11
есть такая поебень
09:11
хотя у меня трейсов нету
09:11
но непонятное поведение присутствует
dvolodin #
09:14
там в логах бывает при этом что-то типа SAE is overwhelmed by MRT scheduling
e_zombie1 #
09:14
во во
dvolodin #
09:15
это проблема с постгресом
09:15
вариант быстрый и грязный -- truncate sa_maptask; reindex sa_maptask
09:16
вариант правильный -- подтюнить постгрес
e_zombie1 #
09:18
тоесть если валится оверхелмет - тюнить постгресс?
dvolodin #
09:19
да
e_zombie1 #
09:19
и в какую сторону?
dvolodin #
09:20
for mt in MapTask.objects.filter(
09:20
status="W",
09:20
next_try__lte=t,
09:20
managed_object__activator__shard__is_active=True,
09:20
managed_object__activator__shard__name__in=self.shards
09:20
).order_by("next_try").select_related().select_for_update():
09:20
чтобы нормально выполнял такой вот запрос
09:22
можно, кстати, сделать индекс по полю next_try
09:22
может и поможет
e_zombie1 #
09:22
давайте сделаем
09:24
отвлечённый вопрос. как по русски найти инфу как собрать на с\с++ прогу с отладочными символами но на клиента отправить только исполняемый файл, и иметь возможность у себя по core файлу отследить что там упало.
zi_rus #
09:25
dvolodin, а у меня нет overwhelmed
e_zombie1 #
09:26
2014-12-18 12:25:19,588 [noc-sae] SAE is overloaded by MRT scheduling (took 1.460105s)
09:26
?
09:26
или это не то?
zi_rus #
09:27
root@noc:/var/noc/log # grep overl noc-sae.log
09:27
2014-12-18 11:52:46,025 [noc-sae] SAE is overloaded by MRT scheduling (took 5.617778s)
09:27
2014-12-18 11:53:11,413 [noc-sae] SAE is overloaded by MRT scheduling (took 5.727386s)
09:27
2014-12-18 11:53:31,105 [noc-sae] SAE is overloaded by MRT scheduling (took 1.298574s)
09:27
2014-12-18 11:53:32,577 [noc-sae] SAE is overloaded by MRT scheduling (took 1.299712s)
09:27
да
09:27
вот у меня оно же
e_zombie1 #
09:27
[root@nocproject log]# grep overloaded noc-sae.log | wc -l
09:27
161
09:27
последние пару часов работы
zi_rus #
09:27
мне тут уже freeseacher подсказывал
09:28
я тюнил постгрес
09:28
хотя
e_zombie1 #
09:28
а ты что тюнил?
zi_rus #
09:28
какой это нахрен тюнинг
09:29
e_zombie1, там какой-то сайт есть, вводишь данные, а он показывает какие параметры постгресму лучше захерачить
e_zombie1 #
09:32
http://habrahabr.ru/post/217073/
09:32
есть в стандартных репах
zi_rus #
09:34
e_zombie1, да, этот сайт
e_zombie1 #
09:34
maintenance_work_mem = 1GB # pgtune wizard 2014-12-18
09:34
effective_cache_size = 24GB # pgtune wizard 2014-12-18
09:34
work_mem = 208MB # pgtune wizard 2014-12-18
09:34
wal_buffers = 8MB # pgtune wizard 2014-12-18
09:34
shared_buffers = 8GB # pgtune wizard 2014-12-18
09:52
не помогает
09:52
2014-12-18 12:52:19,000 [noc-sae] SAE is overloaded by MRT scheduling (took 1.717952s)
09:52
2014-12-18 12:52:22,798 [noc-sae] SAE is overloaded by MRT scheduling (took 2.076081s)
09:52
2014-12-18 12:52:26,098 [noc-sae] SAE is overloaded by MRT scheduling (took 1.563214s)
09:52
2014-12-18 12:52:30,544 [noc-sae] SAE is overloaded by MRT scheduling (took 2.377718s)
09:52
2014-12-18 12:52:34,059 [noc-sae] SAE is overloaded by MRT scheduling (took 1.503781s)
09:52
2014-12-18 12:52:37,763 [noc-sae] SAE is overloaded by MRT scheduling (took 1.507259s)
10:03
хотя меня походу ничего не спасёт. дисковые массивы просто не осиляют более 100 tps
lexus-omsk #
10:12
TSergey у меня qtech 2800 серия, уже года полтора, пара сотен, наверное. Не жалуюсь, скорее наоборот, особенно на фоне недавнего получения DES-1210-28/ME/B2
TSergey #
10:20
lexus-omsk: спасиб
lexus-omsk #
10:22
но у нас мультикаста нет в сети
dvolodin #
10:24
100 tps -- совсем детский лепет
e_zombie1 #
10:24
How much can I expect from my storage? It depends how fast the disks are spinning, and how many there is. As a rule of thumb I assume for a single disk: 7.2k RPM -> ~100 IOPS 10k RPM -> ~150 IOPS 15k RPM -> ~200 IOPS Our hadoop servers were pushing about 70 IOPS to each disk at peak and they are 7.2k ones so that is in line with this estimate.
zi_rus #
10:26
dvolodin, так чего делать? видишь нас тут много и ничего не работает
e_zombie1 #
10:26
:-D
dvolodin #
10:32
у вас все время ничего не работает
zi_rus #
10:33
нет
10:33
у нас все время не работает только нок
dvolodin #
10:33
посмотрите, сколько записей в sa_maptask
10:33
работа у него такая - не работать
zi_rus #
10:33
еще с залипающими пробами не могу отловить багу
10:35
dvolodin, noc=# select id from sa_maptask;
10:35
id
10:35
---------
10:35
1216649
10:35
...
10:35
1216645
10:35
(43 rows)
dvolodin #
10:36
ну вот теперь вопрос - что вы делаете с постгресом, что он 40 записей за 2 секунды извлекает?
zi_rus #
10:37
я ничего с ним не делаю
e_zombie1 #
10:37
noc=# SELECT count (*) from sa_maptask;
zi_rus #
10:37
постгрес только на нок работает
e_zombie1 #
10:37
count
10:37
-------
10:37
4849
10:38
удваиваю предыдущего оратора
10:38
noc=# SELECT count (*) from sa_reducetask;
10:38
count
10:38
-------
10:38
7276
10:38
(1 строка)
10:39
как только маптаск\редусе выползает за 1000 - всё пиздет
zi_rus #
10:41
у тебя железок много
10:41
у меня 43
10:41
и там и там
10:41
нок нашел ответ на самый главный вопрос
10:52
e_zombie1, ты настраивал метику для постгреса в ноке?
TSergey #
10:52
zi_rus: я настраивал
zi_rus #
10:52
чего там надо выбирать?
TSergey #
10:52
а, ты наверное про другое
e_zombie1 #
10:53
zi_rus: у меня оно каким то чудом запустилось . чёто страдало хуйнёй и я в ужасе вырубил до лучших времён более подробной доки. в ней кстатине хватает как график на графоне поглядеть
TSergey #
10:53
я добавил в PM\Setup\Metric Configs
10:54
оставид метрики, которые берутся по умолчанию
10:54
*оставил
10:54
прописал хост, порт, базу и пользователей
10:54
и метрики потсргеса полезли в PM\Setup\Metrics
10:55
zi_rus: про это спрашивал?
zi_rus #
10:55
да
TSergey #
10:55
я ответил?
zi_rus #
10:56
не уверен
TSergey #
10:57
зайди в PM\Setup\Metric Configs, есть хэндлер "Postgres"
zi_rus #
10:57
есть
10:57
но метрики почему-то не создались
TSergey #
10:58
у меня не сразу
dvolodin #
10:58
e_zombie1: попробуй индекс по полю next_try сделать
TSergey #
10:58
провеб probeconfig
10:58
*проверь
dvolodin #
10:58
может и отпустит
TSergey #
11:00
dvolodin: знаешь про косяк, что при переключении между Metric Config в PM\Setup\Metric Configs, отображаются поля и из текущего метрик конфига и из предыдущего?
11:03
zi_rus: ./noc probeconfig --list
11:03
показывает постгресовские?
zi_rus #
11:03
да,все уже появилось
11:04
еще бы кто объяснил какие метрики критичны чтобы посмотреть на сколько ему плохо
e_zombie1 #
11:11
noc=# CREATE INDEX sa_maptask_next_try ON sa_maptask (next_try);
11:11
CREATE INDEX
11:13
походу пофигу
11:14
noc=# EXPLAIN ANALYZE SELECT * from sa_maptask;
11:14
QUERY PLAN
11:14
--------------------------------------------------------------------------------------------------------------
11:14
Seq Scan on sa_maptask (cost=0.00..966.67 rows=4867 width=495) (actual time=0.012..4.490 rows=4868 loops=1)
11:14
Total runtime: 7.422 ms
11:14
(2 строки)
11:14
noc=# EXPLAIN ANALYZE SELECT * from sa_reducetask;
11:14
QUERY PLAN
11:14
--------------------------------------------------------------------------------------------------------------------
11:14
Seq Scan on sa_reducetask (cost=0.00..20377.11 rows=7311 width=320) (actual time=0.013..33.997 rows=7297 loops=1)
11:14
Total runtime: 37.906 ms
11:14
(2 строки)
dvolodin #
11:36
e_zombie1: на select * у тебя в любом случае будет seq scan
e_zombie1 #
11:36
а какой туда запрос идёт?
dvolodin #
11:36
select * from pg_stat_activity;
11:36
:)
e_zombie1 #
11:37
:-D
11:37
шайтана
11:38
научись админить постгресс и уйду в сбербанк работать
lexus-omsk #
11:39
а не ломали недавно kb.nocproject.org? что-то пускать перестал, причём говорит, что не неправильный пароль, а ошибка при регистрации
11:40
а без входа не всё видно, не все блоги
11:41
точнее, не блоги, а пространства, или как там оно называется
e_zombie1 #
11:42
dvolodin: чёто у меня запросов туда ваще не видно
11:42
http://pastebin.com/7dVw3h79
bee26 #
13:03
interface_discovery стал трейсить этим
13:03
<type 'exceptions.AttributeError'>
13:03
'NoneType' object has no attribute 'default_collector'
13:03
как лечить?
e_zombie1 #
13:09
у сае может нету этого атребута
misak #
13:13
а какие метрики сделать, чтобы следить за самим нок-ом?
13:13
и как пофиксить этот global name 'cairo' is not defined ?
zi_rus #
13:16
установить каир,вестимо
misak #
13:19
дык стоит
13:19
Package cairo-1.12.14-2.fc19.x86_64 already installed and latest version
13:20
Package cairo-devel-1.12.14-2.fc19.x86_64 already installed and latest version
dvolodin #
13:29
bee26: давай полный трейс
bee26 #
13:37
dvolodin: http://pastebin.com/KqDTUM3c
e_zombie1 #
13:44
она тоже перешла на графит https://pp.vk.me/c623222/v623222151/f34e/7aRRzqCn48k.jpg
13:45
и теперь она вштыряет в картинку что он рисует https://pp.vk.me/c623222/v623222151/f301/4a5UUZrPeLQ.jpg
bee26 #
14:12
у меня девелоп. 0.8dev10428 (прошел правда через графит)
dvolodin #
14:15
bee26: ты в pm > setup > storages не указал коллектор
zi_rus #
14:15
dvolodin, snmp v1 посмотри в issue
dvolodin #
14:15
чего его смотреть?
zi_rus #
14:16
ну закоммить если все заебись
14:16
dvolodin, я эпушки в нок добавил, а он их обнюхать не может без v1
dvolodin #
14:17
какой именно issue?
bee26 #
14:17
dvolodin: дефолтный на месте
dvolodin #
14:17
bee26: скриншот покажи
zi_rus #
14:17
dvolodin, 1495 или 1132
14:18
rfrjq nt,t ,jkmit yhfdbncz
14:18
какой тебе больше нравится
bee26 #
14:18
в лончере может запустить надо что-то?
techwriter #
14:18
Всем привет! Просьба подсказать, то такое MIB в модуле Fault Management
14:22
freeseacher, привет, просьба помоь с доступом в документацию, по-прежнему не работает
bee26 #
14:25
dvolodin: картинко http://i65.fastpic.ru/big/2014/1218/42/d74e5917eb3ff6c0593ef558c6b9f942.png
dvolodin #
14:26
bee26: он один?
bee26 #
14:26
да
14:26
[noc-pmprobe]
14:26
enabled = false
14:26
user = noc
14:26
group =
14:26
config = etc/noc-pmprobe.conf
14:27
может включить?
14:27
в лончере
zi_rus #
14:30
нет
14:30
это старая проба
14:30
удали вообще этот конфиг
bee26 #
14:31
и это тоже?
14:31
[noc-probe]
14:31
enabled = false
14:31
user = noc
14:31
group =.
14:32
config = etc/noc-probe.conf
zi_rus #
14:32
а это новая проба
14:32
это надо настроить
14:32
dvolodin, нашел issue про snmp v1?
dvolodin #
14:37
нашел
zi_rus #
14:41
полджела сделано :)
Tweet
Share this page
Share this page: Tweet