About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 25.10.2014
dvolodin #
08:21
zi_home: ну чего, отпустило?
zi_home #
09:05
dvolodin, нет, пики повторились, сообщений в логах нет
dvolodin #
09:05
давай-ка тогда залогируем еще переполнения
zi_home #
09:06
dvolodin, стой
09:06
я похоже дифф забыл накатить
dvolodin #
09:07
http://pastebin.com/Erb6bRPg
zi_home #
09:07
накатил
dvolodin #
09:07
вот тогда тебе дифф
09:07
добавь там сообщение counter wrap :)
zi_home #
09:08
новый дифф скопировал, сейчас накачу
09:09
накатил
13:04
dvolodin, ты тут?
dvolodin #
13:04
набегами
zi_home #
13:04
смотри
13:04
noc-probe.3.log:2014-10-25 13:45:53,220 [noc.pm.probe.metric] Possible counter stepback for object.bb-vitus.interface.gi0-1-0-13.interface.load.in: 1671558178204 -> 815900060
13:04
noc-probe.3.log:2014-10-25 13:45:53,221 [noc.pm.probe.metric] Possible counter stepback for object.bb-vitus.interface.gi0-1-0-13.interface.load.out: 5812409626568 -> 1318875080
13:05
что интересно этот 13 порт с утра выключен
13:05
а на графике пик
13:06
но по времени в точке на +1 час от этого сообщения
13:07
http://i66.fastpic.ru/big/2014/1025/9b/52b890dc296af318838805bb9fedfa9b.png
13:09
время на сервере и на грфиках правильное
13:18
dvolodin, хотя, судя по другим графикам, фикс работает, пиков нет в точках по которым появились сообщения в логе
13:20
надо еще наблюдать
13:21
и опять же, это все про одиночные пики
dvolodin #
13:21
но факт медицинский
13:21
счетчик дергается назад
zi_home #
13:21
да
dvolodin #
13:21
причем не с нуля, а черти откуда
zi_home #
13:21
причем на всех железках без разбору
13:21
и ме3400 и 2960 и ASR9k
dvolodin #
13:23
причем только на IOS?
zi_home #
13:23
ytn
13:24
нет
13:24
ASR9k это IOS XR
13:24
про дсламы пока сообщений не было, но у меня их только 10%
dvolodin #
13:37
zi_home: дерготня счетчиков может быть связана с link up/link down?
zi_home #
13:40
dvolodin, нет, про клиентские линки ничего не скажу, но сетевые точно стабильны, но самое интересное вон про тот линк что я тебе в начале написал, 13 порт сегодня в 9 утра погасили, там вообще не было трафика
13:40
и он соответственно точно не дергался
dvolodin #
16:16
zi_home: графики причесались?
zi_home #
16:18
dvolodin, как тебе сказать, пока новых пиков на тех графиках что я наблюдаю, у меня нет
16:18
но я и десяти графиков не создал
16:18
ты же свои будешь пилить
16:18
разворачиваться широко на графане не вижу смысла в такой ситуации
dvolodin #
16:19
откаты счетчиков новые были?
zi_home #
16:19
да
16:19
noc-probe.7.log:2014-10-25 17:17:53,171 [noc.pm.probe.metric] Possible counter stepback for object.isam-beketova13.interface.enet1.interface.load.in: 2141498080 -> 6501945
16:19
смотри-ка
16:19
даже на дсламе произошло
16:20
а вот тут целая пачка
16:20
noc-probe.4.log:2014-10-25 17:29:17,827 [noc.pm.probe.metric] Possible counter stepback for object.bb-mkazakova.interface.gi0-0-1-1.interface.load.in: 211365203456 -> 1579647355
16:20
noc-probe.4.log:2014-10-25 17:29:17,828 [noc.pm.probe.metric] Possible counter stepback for object.bb-mkazakova.interface.gi0-0-1-1.interface.load.out: 445791382470 -> 370925961
16:20
noc-probe.4.log:2014-10-25 17:44:18,151 [noc.pm.probe.metric] Possible counter stepback for object.bb-mkazakova.interface.gi0-0-1-1.interface.load.in: 4002457275 -> 189448738
16:20
noc-probe.4.log:2014-10-25 17:46:48,239 [noc.pm.probe.metric] Possible counter stepback for object.bb-mkazakova.interface.gi0-0-1-1.interface.load.out: 3890791385 -> 90290536
16:20
noc-probe.4.log:2014-10-25 18:06:48,464 [noc.pm.probe.metric] Possible counter stepback for object.bb-mkazakova.interface.gi0-0-1-1.interface.load.in: 3837979918 -> 3336148
16:20
noc-probe.4.log:2014-10-25 18:06:48,465 [noc.pm.probe.metric] Possible counter stepback for object.bb-mkazakova.interface.gi0-0-1-1.interface.load.out: 3916742044 -> 184225014
16:20
noc-probe.4.log:2014-10-25 18:26:48,299 [noc.pm.probe.metric] Possible counter stepback for object.bb-mkazakova.interface.gi0-0-1-1.interface.load.out: 3881977635 -> 98896568
dvolodin #
16:21
о
16:21
насчет твоих DSLAM'ов
16:21
а не кажется ли тебе, что у них COUNTER не только 32-битный, но еще и со знаком
16:21
;)
16:21
>>> "%x" % 2141498080
16:21
'7fa4aae0'
zi_home #
16:22
хм
16:22
не задумывался
dvolodin #
16:22
так и есть
16:22
:)
zi_home #
16:23
наркоманы алкателевские
dvolodin #
16:23
ему 5 мегабайт оставалось до 0x7FFFFFFF
zi_home #
16:23
а может он перешел эти 5 мегабайт за период опроса
dvolodin #
16:24
5 перешел и 6 еще добрал
16:25
11 мегов в минуту
16:25
чуть больше мегабита
16:25
я в это верю
zi_home #
16:25
за 3 минуты
dvolodin #
16:25
ну тем более
16:25
ехидно назовем это 31-битными счетчиками :)
16:26
bb-* -- это у тебя BRAS'ы?
zi_home #
16:26
нет
16:26
backbone
16:28
dvolodin,
16:28
2014-10-25 20:26:47,547 [noc.pm.probes.generic.network.snmp_interface] [9113d0e0-745a-55e0-b75a-fad1831cd9f4] Disabling missed oid 1.3.6.1.2.1.31.1.1.1.6.10102
16:28
2014-10-25 20:26:47,549 [noc.pm.probes.generic.network.snmp_interface] [9113d0e0-745a-55e0-b75a-fad1831cd9f4] Disabling missed oid 1.3.6.1.2.1.31.1.1.1.10.10102
16:28
2014-10-25 20:26:47,550 [noc.pm.probes.generic.network.snmp_interface] [9113d0e0-745a-55e0-b75a-fad1831cd9f4] No valid OIDs to poll
16:29
как по uuid посмотреть что это за метрика
dvolodin #
16:31
в probeconfig
16:32
./noc probeconfig --list --uuid=XXXX
zi_home #
17:28
dvolodin, у менялоги просто завалены сообщениями No valid OIDs to poll, при том что у меня почти все циски, а оиды все стандартные, мне кажется это подозрительным
dvolodin #
18:08
zi_home: ACL, SNMP community
18:08
ну и подебажить надо
zi_home #
18:08
все в порядке
18:09
дернул выборочно, даже графики для некоторых построены
18:10
а некоторые uuid вообще не находит в конфиге
18:12
ну ладно, с этми потом разберемся, пока что про пики
18:15
dvolodin, а вот по поводу провалов, вот сейчас опять случился
18:15
http://pastebin.com/dE6C2V2G
18:15
в течение часа одни степбеки
18:15
теперь первого пика нет
18:15
а второй есть
dvolodin #
18:18
кстати
18:18
а у нас не получается, что на этих железках нет 64-битных счетчиков?
zi_home #
18:18
ну это одна железка
18:19
и
18:19
IF-MIB::ifHCInOctets.47 = Counter64: 323009794106236
18:19
64-битные счетчики есть
18:19
хотя что думает по этому поводу нок - это второй вопрос
18:20
возможно он откатывается на 32 битные счетчики, а через час конфиг перестраивается и он возвращается на 64
dvolodin #
18:21
а на 32-битные он откатывается если не смог получить результат 64-битных
zi_home #
18:21
и возможно это связано с той же проблемой No valid OIDs to poll
18:22
может быть у меня где-то в сервере затык
18:22
не все запросы проходят
dvolodin #
18:22
ну да
18:22
это оттуда же
18:23
не отдали 64-битный счетчик -- ушли на 32-битный
zi_home #
18:23
это же виртуалка
dvolodin #
18:23
не отдали 32-битный -- no oids to poll
zi_home #
18:23
может блидж не выдерживает такой поток
18:23
хм
dvolodin #
18:23
может у тебя где-то udp режется по объему?
zi_home #
18:24
в явном виде нигде
18:24
думается мне нужен тюнинг хостовой системы
dvolodin #
18:24
кстати может быть все эти переходы как раз и связаны вот с чем
18:24
начали опрашивать 64 бита
18:24
он заткнулся и мы отдали результат в 32 бита
zi_home #
18:25
да, я про это и говорю
dvolodin #
18:26
по цифрам похоже
18:26
алгоритм, похоже, нужно дорабатывать
zi_home #
18:26
хм
dvolodin #
18:26
после того, как нащупали работающие oid'ы -- оставаться на них
zi_home #
18:26
я думаю это мне сервер надо доработать
18:26
чтобы потерь запросов не было
18:34
но думаю да, на счетчиках надо оставаться, это логично
dvolodin #
18:37
по логике вещей -- за первый заход нащупываем правильные oid'ы
zi_home #
18:46
до сервера с ноком 18% потерь пингами
18:47
а хотя нет
dvolodin #
18:58
хм
zi_home #
18:59
на быстрых пингах потери
19:00
до хоста потерь нет
19:02
до другой виртуалки тоже норм
19:02
надо фряху тюнить
Tweet
Share this page
Share this page: Tweet