nocproject.org
03:25
про вчерашнее ".1.4.1.171.12.23.4.1.1.1", это не от хорошей жизни, почемуто в OID прилетает так:
03:25
"1.3.<port>.1.4.1.171.12.23.4.1.1.1" что очень похоже на косяк длинка
03:28
03:28
а точки заэкранирую, спасибо
03:28
ну и в правиле есть IpMacBindingIpIndex, при корректном OID на нем сработает
03:47
если я вижу DLINK-ID-REC-MIB::dlink-products.61.2 это значит у нас в ноке нет миба, в котором есть кусок для 61.2?
03:47
не совсем так
03:47
у dlink'а на платформу свой базовый oid
03:48
чтобы не париться с большим количеством MIB'ов мы их alias'им
03:48
а Dmitry1 ведет хитрый сводный MIB куда попадают все эти OID'ы
03:49
и если 1.3.6.1.4.1.171.10.61.2.5.3.0 мы видим как DLINK-ID-REC-MIB::dlink-products.61.2.5.3.0,
03:49
то это значит, что чего не хватает?
03:49
в конечном же счете значения из миба?
03:50
чтобы Dmytry1 его внес в сводник?
04:26
как-то так, по деталям для DLink'ов лучше к Диме
04:27
спасиб
04:55
dvolodin: подскажешь его почту?
04:55
на ноке нашел mitya@cabletv.dp.ua
04:56
написал на этот адрес
05:04
06:56
здрасте
06:56
а чего коммитов нет моного дней, не в курсе?
06:56
много
06:59
misak: их в гравит делают
06:59
жди пока ветки сольют
06:59
*в графит
07:00
там уже от графита ответвление успели сделать
07:02
никто не хочет написать конфиг файл для systemd чтобы нок запускал?
07:02
у меня не получилось
07:08
freeseacher, ты на графите последнем сидишь
07:08
у тебя в ноке железок много?
07:09
на загрузку цпу жалоб нет?
07:09
а то у меня печально
07:10
Теперь develop будет default, где ничего нет и на неё забили =)
08:03
в sa - mo - config есть поиск?
08:04
ctr-f не ищет
08:04
у меня вот так
08:04
08:04
почти типично
08:04
7800 обьектов
08:05
те ищет , но в пределах видимого куска конфига
08:08
bee26, у тебя поиск браузерный? просто там в конфиге какой-то свой поиск по цтрл-ф запускается
08:08
e_zombie, у тебя девелопная ветка, активаторы все жрут. я хотел про пробу узнать
08:09
нуда.
08:09
там ещё корелятор взбрыкивает и монга
08:09
интересно что у тебя будет когда ты метрики с интерфейсов начнешь собирать
08:10
пиздец у него будет)
08:11
будет как всегда.
08:12
опять будем сидеть с володиным и заниматься индексированиями монги и другой поеботинкой
08:14
не
08:14
мтрики не в монге
08:14
там свой стораж
08:14
bee26: нет поиска в конфиге и конфигах
08:18
есть. ctr-a ctr-c в текстовый редактор ctr-v и ищем
08:19
ctrl+a у тебя весь конфиг отмечает?
08:21
dvolodin, есть аларм TCAM entry capacity exceeded, который периодически самозакрывается, хотя закрывающего сообщения для него не существует. как так?
08:21
Dmitry1 говорит что это не он
08:23
dvolodin, в логах написано Cleared by disposition rule "Ping OK"
08:23
типа оно закрывает когда я перезапускаю нок
08:23
ахренеть
08:23
а зачем?
09:06
как чего-нибудь завернуть циски?
09:06
snmp-server enable traps snmp authentication linkdown linkup coldstart warmstart
09:06
она пока молчит
09:09
Добрый день. NOC каждую минуту лезет на железку и засыпает логи следующей информацией: Command executed by xxx: quit Command executed by xxx: display interface brief Command executed by xxx: display version Command executed by xxx: screen-length 0 temporary. Создал отдельный Managed Object Profile, в котором есть только ping
09:13
поздравляю
09:13
или отключать логирование команд или не включать никакие методы дискавери
09:14
или доработать и поделиться скриптами чтобы нок ходил по снмп
09:14
zi_rus: не могу я так с циской :)
09:17
TSergey, воткни патч а потом выдерни
09:18
она на другом конце города
09:18
а про stp она должна сообщать по snmp?
09:20
как настроил
09:20
spanning-tree logging
09:21
можно попробовать включить
09:21
но это сислог
09:21
в принципе тоже можно завернуть в нок
09:26
zi_rus, спасибо за ответ
09:29
Revenant, если у тебя циски, то есть фича для фильтрации лога. я использую, все сообщения о юзере нока зафильтровал чтобы не отвлекали
09:30
zi_rus, у меня Huawei, склоняюсь к отключению дискавкри
09:31
дискавери на самом деле полезная штука
09:33
а может на хуавеях есть фильтрация логов. они же копируют циску как могут
09:33
да, надо будет почитать
10:02
noc-probe
10:02
для чего у нас?
10:10
как в ноке опрос по snmp включить? в мо communityro прописал
10:11
а что ты называешь опросом?
10:11
хочешь читать ноком трапы?
10:11
если скрипт для твоей железки поддерживает - пойдет по снмп
10:12
у профиля есть snmp
10:14
10:15
в профиле опрос по snmp есть. в трейсе ничего. сразу telnet
10:16
snmpwalk -v 2c -c xxx 10.21.255.194
10:16
iso.3.6.1.2.1.1.1.0 = STRING: "QSW-8200-28F-AC-DC Device, Compiled May 21 12:21:20 2014
10:16
SoftWare Version 7.0.3.5(R0224.0020)
10:16
в профиле править?
10:17
Run script with SNMP RO community public:
10:17
"./noc debug-script -c public get_version"
10:18
другой коммунити. в sa - mo прописан
10:18
"./noc debug-script get_interfaces Metro_s5328-45.4"
10:18
ты запускаешь дебаг без snmp
10:19
Debug SA Script
10:19
manage.py: error: no such option: -
10:20
./noc debug-script -с xxxx get_interfaces
10:22
да
10:23
telnet править ... может через snmp пройдет. нихт
10:23
разве тут есть поддержка snmp?
10:23
10:24
через sa-mo-script тоже без snmp
10:25
"bee26: у профиля есть snmp" --- ? в QSW.get_interfaces.py нет поддержки snmp
10:26
а в чем изначально был вопрос? почему не отрабатывает get_interfaces?
10:27
как же нет? а это
10:27
# Try SNMP first
10:27
"""
10:27
# SNMP working but without IP
10:27
........
10:27
if self.snmp and self.access_profile.snmp_ro:
10:27
try:
10:27
# Get mac
10:27
mac = self.scripts.get_chassis_id()
10:27
# Get switchports
10:27
for swp in self.scripts.get_switchport():
10:28
оно заремарчено же
10:28
"""
10:28
текст
10:28
"""
10:29
ну и смотри, кусок с snmp заремарчен
10:30
85, 138 строки
10:31
раскомитил. тоже самое
10:32
ты думаешь его от нехер делать закомментировали
10:32
да, я не успел так написать
10:33
bee26: надо разбираться почему у тебя до "show interface" дело не доходит
10:33
вроде на стандартную ветку кутек отвечает
10:34
в 8200 нет такой команды show ip interface и такой show ip
10:35
а можешь патануть чего говорит тебе кутек после входа?
10:35
если руками зайти
10:35
*пастануть
10:35
show ip interface brief
10:35
Index Interface IP-Address Protocol
10:35
11088 Vlan88 10.21.255.194 up
10:35
11101 Vlan101 10.21.0.1 up
10:35
17500 Loopback 127.0.0.1 up
10:36
Q8200_ATS-45_SW4#
10:36
не, прям логин-пассворд
10:36
ведь до этих команд дело не доходит
10:37
скрипт в железку заходит
10:38
посмотри скрипты в своем ноке
10:38
дает команду
10:38
2014-10-02 14:34:53,317 [TELNET: 10.21.255.194] submit('show interface brief', bulk_lines=None, streaming=False)
10:38
а нет такой команды
10:39
show interface ?
10:39
IFNAME Interface Name
10:39
detail Detail information of the port(s)
10:39
ethernet Ethernet port
10:39
loopback Loopback
10:39
port-channel Port-channel
10:39
vlan Vlan port
10:39
| Output modifiers
10:39
<cr>
10:39
ты чего хочешь?
10:39
причем тут снмп
10:40
хочу чтобы нок собрал инфу по нитерфейсам
10:40
по телнету не хочет (и по снмп тоже). хотябы как-нибудь
10:40
почему у тебя нет той команды?
10:41
может зависит от версии софта
10:41
и почему те не выгладываеш полный дебаг по гет_интерфейс?
10:41
*почему ты?
10:41
а может там софт другой и надо отдельный профиль создавать
10:41
show version
10:41
QSW-8200-28F-AC-DC Device, Compiled on May 21 12:21:20 2014
10:41
sysLocation Russia, Moscow, Novozavodskaya st 18, bld 1
10:41
CPU Mac 00:1f:ce:86:45:f2
10:41
Vlan MAC 00:1f:ce:86:45:f1
10:41
SoftWare Package Version 7.0.3.5(R0224.0020)
10:41
BootRom Version 7.2.3
10:41
HardWare Version 2.0.3
10:41
мне это ниочем
10:41
у меня нет кутечей
10:42
HaLVeR кажется имеет
10:42
bee26: сделай полный дебаг и будет видно где трейсится и чего править
10:42
TSergey, да понятно в чем дело, у него нет команды которую нок дергает
10:42
исходя из ответа почему, можно думать о следующих шагах
10:43
щас еще раз. видимо не полный получился
10:43
zi_rus: так щас насоветуем как поправить :)
10:43
так надо советовать правильно
10:44
просто если там одна команда другая, может еще regexp придется править
10:44
так мы правильно и насоветуем
10:45
иссе, +тушенка
10:46
10:47
что бы можно было попробовать поправить скрипт, нужен json, который отдает скрипт
10:47
что бы можно было запустить без железки
10:49
"/opt/noc$ ./noc debug-script get_interfaces -o output.json"
10:49
вот так делается json
10:52
вроже же здесь ошибка:
10:52
"2014-10-02 14:48:25,591 [Qtech.QSW.get_switchport(Metro_s5328-45.4, 10.21.255.194)] cli(show description interface)
10:52
2014-10-02 14:48:25,591 [TELNET: 10.21.255.194] submit('show description interface', bulk_lines=None, streaming=False)"
10:53
bee26: ты пробовал дебажить get_switchport?
10:53
нет еще. отдебажить?
10:54
такая команда "show description interface" на железке есть?
10:54
нет
10:54
аналог поискать?
10:55
не знаю
10:55
делай иссе и туда данные прикладывай
10:56
похоже?
10:56
show interface ethernet status
10:56
Codes: A-Down - administratively down, a - auto, f - force, G - Gigabit
10:56
Interface Link/Protocol Speed Duplex Vlan Type Alias Name
10:56
1/0/1 UP/UP a-1G a-FULL 1 SFP test
10:56
1/0/2 UP/UP a-1G a-FULL 1 SFP
10:57
что должно быть в show description interface
11:00
это надо спросить у того кто писал профиль
11:00
или посмотреть в тушенку
11:25
кютечи кривые профили вроде как
12:47
12:52
смотреть pluggable store
12:52
и document level locking
13:18
dvolodin, так что делать с высокой загрузкой цпу из-за пробы?
13:19
в 100 раз выросла с обновлением
13:32
а попробуй убери этот отлов BrokenPipe
13:33
dvolodin, какой? manhole? так он и был выключен, дело-то не в нем
13:36
не
13:37
там где в сокетах write заворачивался в try .. except
13:54
как просто
13:54
я не знаю где это
16:21
dvolodin, а ты что новую синкалку днс в графит влил?
16:22
нет
16:22
там отдельная ветка сбоку
16:23
а
16:23
там наоборот
16:23
графит туда уехал
16:24
коммиты просто смотрю
16:25
да, там же фиксы были
16:25
я там еще переделал обновление удаленных демонов
16:25
и сейчас доделываю быстрое развертывание всяких активаторов, проб и прочих синков
16:26
в noc-web теперь встроен mercurial-server
16:26
;)
16:30
ты тогда научи лаунчер несколько инстансов проб запускать
16:32
запускает
16:32
config =
16:32
config.0 = .....
16:33
[noc-probe]
16:33
enabled = true
16:33
user = noc
16:33
group =
16:33
config.0 = etc/noc-probe.conf
16:33
config.1 = etc/noc-probe.conf
16:33
config.2 = etc/noc-probe.conf
16:33
config.3 = etc/noc-probe.conf
16:33
config.4 = etc/noc-probe.conf
16:33
config.5 = etc/noc-probe.conf
16:33
config.6 = etc/noc-probe.conf
16:34
config.7 = etc/noc-probe.conf
16:34
впиши такое и имено так
16:35
config =
16:35
config.0 = etc/noc-activator.conf
16:35
config.1 = etc/noc-activator.conf
16:35
а то он будет считать, что конфиг у него строго один
16:35
да
16:35
root@noc:/opt/noc/etc # /usr/local/etc/rc.d/noc restart
16:35
Stopping noc.
16:35
Waiting for PIDS: 43144.
16:35
Starting noc.
16:35
root@noc:/opt/noc/etc # ps aux | grep noc-probe
16:35
noc 43421 76.8 0.1 158588 24596 ?? S 8:38PM 0:00.52 /opt/noc/bin/python ./scripts/noc-probe.py launch -c etc/noc-probe.conf -i 0 (python2.7)
16:35
root 43608 0.0 0.0 16332 1708 3 S+ 8:38PM 0:00.00 grep noc-probe
16:36
ой
16:36
да, спасибо помогло
16:39
16:39
все
16:39
теперь всякие клоны и манифесты не нужны
16:40
а удаленом серваке делается что-то вроде
16:40
cd /opt/
16:40
make-node.py <NOC URL>
16:40
оно все само вытащит, размотает и ланчер настоит
16:41
остается только включить у него в конфиге нужных демонов
16:41
ланчер при этом периодически ходит к центральной инсталляции и синхронизируется с ней
16:41
при этом умеет запускать PIP и ставить требуемые пакеты сам
17:38
когда запустил несколько инстансов загрузка до нормы упала
18:01
ага
18:03
кроликом будешь для тестирования синхронизатора?
18:07
готов
18:08
на новую ветку идти?
18:08
да
18:09
накатывайся на нее
18:09
топай на свой DNS
18:09
тебе там нужен будет python и virtualenv
18:10
то есть старый сносить?
18:10
да
18:10
ну или рядом поставь
18:10
первый шаг -- подготовка новой ноды
18:10
делается так
18:11
cd /opt
18:11
curl <URL NOC>/main/update/make-node.py | python -
18:11
NOC у тебя поставится в /opt/noc
18:12
конфиг ланчера полностью готов и настроен
18:12
на нем загашены все демоны
18:12
размотал
18:13
?
18:14
ланчеру в конфиге в секции [update] подкрути check_interval, поставь, например, в 60
18:14
тогда нода будет апдейты проверять раз в минуту
18:14
по умолчанию - 300 секунд
18:15
обновляюсь
18:16
dvolodin, abort: uncommitted changes
18:17
как обойти?
18:17
у меня тут пара изменений
18:17
hg diff > blabla
18:17
hg revert --all
18:19
костыль, ну ладно
18:19
18:20
где у него heartbeat'ы засели?
18:21
я вычистил все из конфигов
18:21
он там выше еще ругнулся
18:21
Unknown command: 'sync-manifest'
18:22
обновляйся
18:23
поправил вс
18:23
все
18:25
проехало?
18:27
18:27
% Total % Received % Xferd Average Speed Time Time Time Current
18:27
Dload Upload Total Spent Left Speed
18:27
100 3963 100 3963 0 0 229k 0 --:--:-- --:--:-- --:--:-- 241k
18:27
Failed to get updates: <urlopen error [Errno 61] Connection refused>
18:27
dvolodin, почти
18:27
xkis# python make-node.py
18:27
Failed to get updates: <urlopen error [Errno 61] Connection refused>
18:28
18:28
это же неправильно
18:28
ну так это ты URL кривой ввел
18:28
я на днс должен разворачивать
18:29
погоди
18:29
он тебе в make-node прописал 127.0.0.1:8000 ?
18:29
да
18:29
usage = "usage: %prog [options] <NOC URL>"
18:29
18:29
18:30
когда руками поправил
18:30
xkis# python make-node.py
18:30
abort: error: Connection refused
18:30
18:31
ну на самом деле я дернул файл через фетч
18:31
18:31
а потом его запускаю
18:31
xkis# python make-node.py
18:31
но какая разница
18:31
через курл тоже был 127,0,0,1
18:32
он должен был тебе правильный URL подставить
18:32
в принципе -- ./make-node.py <URL>
18:32
но не спортивно
18:32
фокус в том, что URL должен подставиться сам
18:33
у тебя HTTP или HTTPS?
18:35
сам NOC за nginx стоит?
18:36
кусок nginx.conf покажи
18:36
где ты на tornado скидываешь коннекты
18:41
proxy_set_header Host $http_host;
18:41
proxy_set_header X-Scheme $scheme;
18:41
в location /
18:42
вот это надо бы в доку и в шаблоны
18:43
накати апдейты, там еще распознавание ssl
18:44
Downloading mercurial-3.1.2.tar.gz (4.0MB): 6% 262kB
18:44
как-то грустно качает
18:44
ты машинку еще не настраивал что я тебе давал
18:47
пока еще нет
18:47
я в uk настраиваю для переезда
18:47
Downloading mercurial-3.1.2.tar.gz (4.0MB): 45% 1.8MB
18:48
ну как есть
18:48
не от нас качается
18:48
у меня сейчас за секунды вытаскивалось все
18:51
Downloading mercurial-3.1.2.tar.gz (4.0MB): 68% 2.7MB
18:56
ты уверен, что у тебя DNS в хорошем месте?
18:58
dvolodin, в смысле?
18:58
ну как сказать
18:59
у меня mercurial качается за пару секунд
19:00
никто не жалуется
19:00
будь уверен, по сети у меня все норм
19:00
dvolodin, я скопировал старый конфиг синка. стомп из него выпиливать?
19:01
и запускать?
19:03
нет
19:03
смотри
19:03
в noc-launcher.conf включи sync
19:03
посмотри в его default конфиг
19:03
там есть закоментированая секция под bind
19:04
они по семантике соответсвуют более-менее
19:04
лаунчере включил
19:04
то есть старый конфиг вообще не годится
19:05
и как теперь это настраивать
19:05
у меня один сервер синкаося по двум каналам
19:06
настраивать так
19:06
идешь в main > setup > sync
19:06
прописываешь эти синкалки
19:06
оно тебе должно было скопировать все
19:07
и синкалки лепишь на dns server в морде
19:07
там, где раньше каналы были
19:07
сделал?
19:08
включи пока noc-sync'у дебаг
19:08
у меня нок в двух экземплярах
19:10
нок отвратительно стопится
19:10
постоянно процессы залипают
19:10
приходится киллять
19:13
dvolodin, я переименовал два синка которые приехали из днс и два удалил, теперь при открытии вкладки с днс серверами трейс
http://pastebin.com/jir87SGT
19:14
удалил какой-то из используемых?
19:14
синка то у меня два будет
19:14
пропиши на нем правильный синк
19:14
зачем тебе два
19:15
dns один?
19:15
два сервера
19:15
ну пока один
19:15
а
19:15
ну да
19:15
два так два
19:15
два dns в базе, у них два синка разных
19:15
ну вот и как делать
19:15
я не могу открыть днс и поправить как надо
19:16
update dns_dsnzone set sync=null where name='ns1.local';
19:17
noc=# update dns_dsnzone set sync=null where name='ns1.local';
19:17
ERROR: relation "dns_dsnzone" does not exist
19:17
LINE 1: update dns_dsnzone set sync=null where name='ns1.local';
19:18
очепятка
19:18
noc=# update dns_dnszone set sync=null where name='ns1.local';
19:18
ERROR: column "sync" of relation "dns_dnszone" does not exist
19:18
LINE 1: update dns_dnszone set sync=null where name='ns1.local';
19:18
dns_dnsserver
19:18
туплю уже
19:19
да
19:19
ну вот
19:19
все прописано
19:20
так
19:21
теперь разок перестрой кеши ему для синкаа
19:21
открой и сохрани zone profile
19:23
ну и логи синкали смотри
19:23
поставь ей раз в минуту ходить за апдейтами
19:23
чаще не надо
19:23
я ее еще не запустил
19:23
все говно к тебе приедет
19:23
я не понимаю как ее правильно настроить
19:24
смотри
19:24
у меня сервер отвечает за два, скажем, профиля
19:24
внутренний и внешний
19:24
раньше было два канала в синкалке
19:25
а как теперь это делать?
19:25
а в ноке соответственно два сервера прописаны
19:27
мне теперь в настройках днс серверов, для серверов которые на самом деле являются одним и тем же сервером прописать один и тот же sync channel?
19:27
я ничего не понимаю
19:28
зачем тебе два канала
19:28
один сервер - один канал
19:29
и?
19:29
ты ему внутреннюю и наружную раскладку делаешь?
19:29
а на сервере как разводишь?
19:29
никак
19:29
смотри
19:29
два профиля
19:30
различаются набором мастеров
19:30
шпдшные мастер сервера и глобальные
19:30
ns.local и ns.kis.ru соответственно
19:30
но в реале это один сервер
19:31
раньше разные каналы писались в разные папки
19:31
autozones-shpd и autozones-global
19:32
но в принципе в одну папку записать не проблема
19:32
ну свали в одну
19:32
я пока не вижу проблемы
19:33
если хочется именно в разные папки -- то два сервера на noc, и две синкалки на одном хосте
19:33
они достаточно легковесные
19:33
их можно из одного ланчера поднять с двумя конфигами
19:33
как и пробы
19:33
dvolodin, проблема вот где, dns-server, ns.kis.ru - канал 1, ns.local - что писать?
19:34
тоже канал 1?
19:34
в NOC ты их хочешь держать как один или как 2?
19:34
их два, они по ip попадают в зону
19:35
в разные зоны
19:35
ну тогда сделай два конфига для sync с разными настройками
19:35
пропиши их в ланчере
19:35
в зонах для локальных юзеров там серый адрес, для глобальных - белый
19:35
и у тебя будет два sync'а со стороны NOC
19:36
раньше это решалось двумя каналами
19:36
по одному на каждый DNS
19:36
смотри
19:36
[noc-sync]
19:36
а если я пропишу один канал для двух?
19:36
config =
19:36
config.0 = noc-sync-0.conf
19:36
config.1 = noc-sync-1.conf
19:36
не, с инстансами я идею понял
19:36
ищу прямее варианты
19:37
прямее вариант - оставить один DNS в NOC
19:37
какая тебе разница, откуда приходят юзеры
19:37
там разные зоны
19:37
совершенно
19:37
локальным юзерам адреса брасов раздаются
19:38
глобальным - обслуживаем клиентские зоны
19:38
тогда 2 DNS и 2 sync в NOC, и два instance
19:38
и пиши в разные каталоги
19:38
ровно как и сейчас
19:51
dvolodin, а как теперь его обновить?
19:51
он же ставился твоим скриптом
19:52
обновляешь центральную инсталляцию
19:52
этот сам притопает за апдейтами
19:52
так он не запускается
19:54
ну вот опять, лаунчер остановился, но забыл поубивать других демонов
19:55
какой из них
19:55
центральный?
19:57
центральны
19:57
да
19:57
и вот опять
20:00
а это похоже из-за необновленности
20:00
сейчас разберемся
20:03
надо тестовый нок заводить
20:03
давно пора
20:03
взлетело?
20:05
обновил центр только
20:05
dvolodin,
20:05
2014-10-03 00:04:21,198 [noc.lib.debug] UNHANDLED EXCEPTION (2014-10-03 00:04:21.195927)
20:05
Working directory: /opt/noc
20:05
<type 'exceptions.AttributeError'>
20:05
'Activator' object has no attribute 'heartbeat_enable'
20:05
START OF TRACEBACK
20:06
20:09
снес синк, запустил еще раз
20:09
меркуриал в лет скачался
20:11
иначе не обновить
20:11
ладно, синк что-то крешится, завтра разберусь. уже поздно
20:12
а у нас ночные работы, не хватало единственный мониторинг перед ними сломать
20:13
:)
20:13
сам синк можно было обновить по hg pull -u
20:13
;)
Share this page
Share this page: