About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 28.01.2013
dvolodin #
05:13
погонял попингуйку на разных сценариях, blackhole на локальном хосте она нормально переносит
freeseacher #
05:14
привет. говорит что все упало ?
dvolodin #
05:15
честно говорит что он упал
05:15
там проблема в том, что в отдельных случаях send возвращает ошибку
zi_rus #
05:16
dvolodin_, это смешно, но он опять не сменил статус той железке
dvolodin_ #
05:17
он ее персонально не любит?
zi_rus #
05:18
чтоб я знал, честно говоря, я думал оно не повторится
05:30
dvolodin, я понблюдал
05:30
он прекратил пинговать эту железку
05:30
я не вижу icmp на ее ip
dvolodin #
05:34
ловить надо, в какой момент он ее потерял
zi_rus #
05:35
dvolodin, а еще я не вижу пинги на другие недоступные адреса
05:35
похоже, раньше он полностью отсыхал
mikevlz #
05:36
а шоб пинговалка запахала придется активатор от рута запускать?
zi_rus #
05:36
теперь отсыхают только недоступные
dvolodin #
05:36
ping_test как на них реагирует
05:36
zi_rus: может быть, ловить надо
mikevlz #
05:36
мне оно жалуется, что его нах послали, когда Icmpv4 socket открыть попыталось
dvolodin #
05:36
mikevlz: либо root, либо права на raw socket'ы
mikevlz #
05:36
понял
zi_rus #
05:37
dvolodin, пинг тест пингует доступную и неуспешно пингует недоступную, все как надо
mikevlz #
05:37
кстати... Я тут поэкспериментировал... Прикрутил к pgsql pgbouncer(тесты кто-то в инетах выкладывал, оно лучше чем pgpool2)
dvolodin #
05:38
mikevlz: это интересно, кстати
05:38
пиши блог :)
05:38
меня регулярно спрашивают насчет кластеризации NOC
mikevlz #
05:38
но чот дискавери систему кладет на лопатки. вместе с активаторами... Запустить принудительное задание очень сложно... Когда монитор может снять данные - из 240 сессий активаторов занято 238
dvolodin #
05:38
с монгой все пучком, а с постгресом возня
mikevlz #
05:38
ну и LA 3.5-4 lth;bncz
dvolodin #
05:38
mikevlz: не надо сразу на все запускать
mikevlz #
05:38
держится
05:39
а кто сразу на все запускает? эт SAE так планирует...
05:39
я тоже не дурачок. Под принудиловкой я имел в виду MO->Scripts-> get_version например.
05:40
или Refresh в том же мониторе(оно ведь запускает что-то в духе get_activator_status на SAE)
dvolodin #
05:43
какие скрипты он пускает?
mikevlz #
05:44
как-то не исследовал вопрос. Но когда можно посмотреть текущие скрипты, то в основном это get_ip_discovery, get_lldp_neighbors, get_version, get_config вроде
05:46
я связываю рост нагрузки с тем, что моя дискаверилка отнаходила дофига железяк. Если до запуска этого скрипта в системе было 700 железок, то сейчас 1994 железки
lexus-omsk #
07:37
ufir: Привет. Спрашивал про QTech? Я для серии 2800 пишу профиль, он ещё не в общем repo, но могу поделиться - будем вместе тестировать :)
zi_rus #
07:39
Dmitry1, NOC-915
Dmitry1 #
07:40
ага
07:41
что за железка, и можно ли будет увидеть с нее тушенку
zi_rus #
07:43
Dmitry1, DES-3200-26
Dmitry1 #
07:43
hw revision ?
zi_rus #
07:43
с тушенкой будет сложнее, я выпили все длинки из нока, у меня есть на них доступ, но они не под моим управлением, так что решил что им тут не место
07:44
Dmitry1, А1
07:44
Dmitry1, я уверен у тебя где-то есть такой же свич
08:42
http://forum.nocproject.org/index.php?topic=162
08:42
народ, не стесняйтесь, проголосуйте
08:43
всего 10 человек решилось
08:43
а пользователей здесь я вижку гораздо больше
acid232 #
08:43
ух
08:43
Jan 28 10:06:14.384 EEST: %SW_MATM-4-MACFLAP_NOTIF: Host 707b.e828.e0c0 in vlan 2700 is flapping between port Gi0/14+Efp2700 and port Gi0/13+Efp2700
08:44
interface GigabitEthernet0/10
08:44
service instance 1 ethernet
08:44
bridge-domain XX
08:44
rewrite ingress tag pop 1 symmetric
08:44
а как такое отображать?
zi_rus #
08:45
где отображать?
mikevlz #
08:48
Brocade/Dlink/Cisco/Ericsson SE =)
08:48
за кошку забыл проголосовать
zi_rus #
08:49
за циску и без тебя голосов хватает
acid232 #
08:49
ну обработать нужно лог
08:49
а это вроде как сабинтерфейсы
zi_rus #
08:51
acid232, тебе надо в NOC-760
08:52
меня удивляет что за джуниперы голосов меньше чем за зуксели
Dmitry1 #
09:03
acid232: Это в каком профиле MAC FLAP не классифицировался?
zi_rus #
09:03
dvolodin, NOC-918
09:03
Dmitry1, это опять Cisco.IOS
Dmitry1 #
09:05
должно
09:06
можешь raw-values ивента кинуть?
zi_rus #
09:08
мне кажется он это сделал несколькими строками выше? или ты хочешь что-то еще
09:08
?
09:09
Dmitry1, ты NOC-760 будешь делать-то?
Dmitry1 #
09:09
погодь
dvolodin #
09:33
да, с новой попингуйкой еще такой момент
09:33
надо будет проверить, как обрабатываются alarm'ы если между падением и подъемом железки проходит больше одного дня
zi_rus #
10:06
dvolodin, а еще (не критично, просто факт такой) расписание пингов едет, вот что в первый раз
10:06
14:09:50
10:06
14:09:55
10:06
14:10:01
dvolodin #
10:06
ну да
zi_rus #
10:06
а следующий заход идет
dvolodin #
10:06
там время завершения + 1 минута
zi_rus #
10:06
14:11:07
10:06
14:11:12
10:06
14:11:18
10:07
я бы сказал +1 минута и врямя таймаута
dvolodin #
10:07
как только получает ответ на 3 пинг или таймаут - + 1 минута
10:07
я думаю это не критично
10:07
ведь задачи пинговать строго раз в минуту не стоит
zi_rus #
10:08
ну да, просто смущает что в конфиге пишешь одно, а по факту получаешь другое
10:08
я бы этот факт отразил в доке, хуже точно не будет, зато будет понимание
dvolodin #
10:09
да можно и раз в минуту сделать
zi_rus #
10:11
как тебе проще, писать код или писать доку
mikevlz #
10:11
доку писать все-равно придется
zi_rus #
10:11
dvolodin, на самом деле меня больше волнует ложно положительный пинг
10:12
mikevlz, отнюдь, видишь как он упорно сопротивляется
dvolodin #
10:29
zi_rus: поправил я сдвиг расписания
10:29
проверяй
10:35
теперь должно с точностью до секунды железку мучать
zi_rus #
10:37
dvolodin, до секунды точно, только на .1 все равно едет
10:37
и я не понял
10:37
он тут одну проверку пропустил
10:37
14:36:42
10:37
потом
10:37
14:37:42
10:37
потом
10:37
14:39:43
10:38
потом 40 и 41
10:38
потом опять 2 минуты
dvolodin #
10:39
хм
10:39
в пору логгировать пинги отдельно и разбираться
zi_rus #
10:40
причем рандом какой-то
10:41
36-37-39-40-41-43-45-46
10:42
1-2-1-1-2-2-1
10:42
-1
10:43
я фактически тут с tcpdump сижу и логирую
10:43
прям по факту
10:43
есть запрос
10:43
или нет
10:44
правда в консоль
10:44
не гибко
dvolodin #
10:49
zi_rus: плывет все равно?
zi_rus #
10:51
ну +/- нормально
10:52
было
10:52
14:36:42.890731
10:52
стало 14:57:42.907816
dvolodin #
10:53
в пределах секунды может гулять
zi_rus #
10:53
немного плавает, но не уходит
dvolodin #
10:53
но уходить не должно теперь
zi_rus #
10:53
это терпимо
10:53
почему проверки начал пропускать?
dvolodin #
10:54
давай детальнее, что пропустил?
zi_rus #
10:55
куда уж детальнее
dvolodin #
10:55
железка ему отвечает?
zi_rus #
10:56
dvolodin, вот статистика http://pastebin.com/N6mtJbiS
dvolodin #
10:56
давай дочное время пингов по этой железке с точностью до секунды
10:56
можешь по одной отфильтровать?
10:56
кажется понял
10:57
если пинг начинается в одной минуте, а заканчивается в другой - может минуту пропустить
zi_rus #
10:58
похоже на правду
dvolodin #
10:58
http://code.nocproject.org/browse/noc/sa/activator/activator.py?hb=true#to864
10:58
вот она
10:58
get_next_ping_time выдает время следующего пинга
10:58
ping_interval = 60 -- из конфига
10:59
для каждогоа адреса при составлении расписания генерируется смещение (random от 0 до 1)
11:02
сделал по-другому
11:03
проверяй
zi_rus #
11:06
пока накапливаю статистику
11:07
dvolodin, скажи почему репорт Filter не ищет по подстроке, а только exact match?
dvolodin #
11:07
что именно он должен по подстроке найти?
zi_rus #
11:08
custom_field integer содержит 123456
11:08
ищу 123
dvolodin #
11:08
хм
11:08
внимание, вопрос
11:08
что такое подстрока при поиске по целому числу?
zi_rus #
11:09
да я понимаю, но неудобно, хотя пофигу
11:10
dvolodin, ладно, хрен с ним, проверить пинговалку я не смогу, тут нидо везение, но зато я вижу другое
dvolodin #
11:10
пропускать перестало?
zi_rus #
11:11
он шлет пинг и ждет ответа, если пришел ответ или прошел таймаут, то шлет следующий
dvolodin #
11:11
да, так и есть
zi_rus #
11:11
внимание, вопрос: зачем слать еще раз пинг если ответ уже пришел
dvolodin #
11:11
у него 2 режима работы
11:12
если из 3 раз пришел хоть один ответ - все хорошо
11:12
или если из 3 раз хоть один ответ не дошел - все плохо
11:12
:)
zi_rus #
11:14
первый вариант правильный, второй нет
11:15
dvolodin, нет, не могу проверить, разъезжается время
dvolodin #
11:24
zi_rus: сделал завершение проверки сразу по успешному ответу
11:24
теперь приличные железки будет пинговать только один раз
zi_rus #
11:24
вот и отлично
11:25
а как на счет ложно положительного пинга?
dvolodin #
11:26
может кто другой ответил?
11:26
proxy arp, скажем
zi_rus #
11:27
прокси арп тут не при чем, хотя бы потому что он отвечает на арп, а не icmp
11:27
и как мог другой ответить, если потом пропало
dvolodin #
11:30
чтобы он зафиксировал ответ у него должен совпасть sequence number и payload
veng #
11:30
а где можно логи посмотреть вызова пинг-процесса с результатом его работы? или оно только в debug
dvolodin #
11:32
хотя
11:32
дружно смотрим lib/nbsocket/pingsocket.py
zi_rus #
11:34
veng, нигде, теперь это внитренние дела системы
11:36
смотрю в пингсокет, ничего не понимаю, так и задумано? :)
dvolodin #
11:36
нашел я проблему
11:36
сессия у него идентифицируется сейчас по request id
11:37
а request id -- self.req_id = id(self) & 0xFFFF
11:37
id -- это указатель на PyObject, фактически
zi_rus #
11:38
я думаю, ты здесь один кто понимает что ты пишешь ;)
dvolodin #
11:39
короче
11:39
request id оказался далеко не уникальным
11:40
и звезды сложились так, что ответ одного ящика отнесли на счет другого
zi_rus #
11:41
ы, я уже начал подозревать что ты хочешь это сказать
11:49
вообще говоря, если это действительн оокажется так, то это очень даже гуд, лучше это отловить и справить сейчас, чем оно возникнет потом, и никто уже не вспонит что и почему
dvolodin #
12:17
в общем - понятно
12:17
думаю, до завтра пофикшу
zi_rus #
12:23
dvolodin, это гуд, а как тебе еще такое предложение в приложении МО и МО профиль отображать выбранный shape в главной таблице
dvolodin #
12:23
именно как иконку?
zi_rus #
12:24
да
13:43
за последние полчала пришло еще 3 ложно положительных сообщения
13:45
про две разные железки
Tweet
Share this page
Share this page: Tweet