About Forum Blogs NOC Docs Downloads KB Issues Code CI Registration

nocproject.org

#nocproject.org at irc.freenode.net log.
Back to nocproject.org Back to IRC log index
Date: 03.08.2011
dvolodin #
06:37
RR
06:37
`kk: вот он, красавец :)
Unbeerable #
06:37
я думал оно и в Африке FQDN :)
06:38
блин, что же с репой делать
dvolodin #
06:39
Unbeerable: он и в африке FQDN. Точка - это извраты DNS уже
`kk #
06:39
dvolodin, =)
dvolodin #
06:39
с репой делаем так
06:39
cd /opt/noc
06:39
тьфу
06:39
cd /opt
06:39
mv noc noc1
06:39
hg clone http://hg.nocproject.org/noc noc
06:39
cp noc1/etc/*.conf noc/etc
06:40
cp noc1/etc/ssh/* noc/etc/ssh
06:40
cd noc
06:40
mkdir local static/doc
06:40
chown noc:noc local static/doc
06:40
и взлетаем
zi_rus #
06:40
dvolodin, а будет так, что чем больше связанных аварий окажется, тем выше устанавливается серьезность, а то ЕIGRP может отвалиться на границе сети, а может на подключении к ядру, по BGP может отвалиться 1 клиент, а может упасть весь внешний канал
`kk #
06:41
хм. смотрю LA за ночь до 20 вылезло..
dvolodin #
06:41
zi_rus: на эту тему думаю
06:41
http://redmine.nocproject.org/projects/noc/arch_decisions/show/5
06:42
`kk: кто грузит?
`kk #
06:42
смотрю пока
lexus-omsk #
06:43
а где-то было же обсуждение как сделать e-mail оповещение по определённым алармам?
06:44
точнее хочется по одному ping fail сделать оповещения разным людям в зависимости от упавших объектов
06:45
т.е. тип аварии будет один и тот же
`kk #
06:46
error: can't copy 'contrib/src/README': doesn't exist or not a regular file
06:46
abort: path 'Jinja2/AUTHORS' is inside repo 'Jinja2'
06:47
http://dpaste.com/585172/
06:47
hg clone меня спасёт 7
06:47
?
Unbeerable #
06:48
dvolodin, то же самое. не создаётся /var/repo/config. он же встроенными питоновыми функциями создаёт? никаких зависимостей для этого не нужно?
dvolodin #
06:49
да, должен создавать
Unbeerable #
06:49
а python manage.py test если выдаёт какие-то ошибки
06:49
это плохо, да? :)
dvolodin #
06:50
Unbeerable: хотя, сейчас попробую научить его создавать каталог
icCE #
06:50
можно еще вопрос на стадии установки
dvolodin #
06:50
test может засыпаться между релизами
icCE #
06:50
You just installed Django's auth system, which means you don't have any superusers defined.
06:50
это пользователь чего ?
Unbeerable #
06:50
http://pastebin.ru/320150
icCE #
06:51
это после ./scripts/post-update
06:51
все понял
Unbeerable #
06:51
icCE, это пользователь системы, под которым уже в интерфейс логиниться
icCE #
06:51
опять я не так делал :)
06:51
ахха сообразил
06:52
просто в другой консоли сидел пакеты ставил
06:52
там не хватало
06:52
забыл что в noc должен быть
dvolodin #
06:56
Unbeerable: попробуй r4190, теперь должен создавать каталог
Unbeerable #
07:07
я чувствую себя каким-то идиотом, но оно всё равно не работает
07:07
где там дебаг включается
07:08
если в foreground его запустить, он будет писать что делает/не делает?
07:10
о
07:10
создался
07:10
спустя время
dvolodin #
07:11
при первой записи в репо
`kk #
07:19
dvolodin, сжирает память correlator. вслед за ним classifier
dvolodin #
07:19
`kk: сильно жрет?
`kk #
07:19
а на счёт abort: path 'Jinja2/AUTHORS' is inside repo 'Jinja2' ?
07:19
около гига выел
dvolodin #
07:20
cd /opt
07:20
[10:39AM] dvolodin: mv noc noc1
07:20
[10:39AM] dvolodin: hg clone http://hg.nocproject.org/noc noc
07:20
[10:39AM] dvolodin: cp noc1/etc/*.conf noc/etc
07:20
[10:40AM] dvolodin: cp noc1/etc/ssh/* noc/etc/ssh
07:20
[10:40AM] dvolodin: cd noc
07:20
[10:40AM] dvolodin: mkdir local static/doc
07:20
[10:40AM] dvolodin: chown noc:noc local static/doc
`kk #
07:20
понял
07:21
как лучше помониторить почему он так ест ?
lexus-omsk #
07:26
а срабатывания alarm trigger где-то логируются?
dvolodin #
07:33
lexus-omsk: в логе коррелятора нет?
lexus-omsk #
07:38
нету... я вот и не уверен, что срабатывает он... тестирую
icCE #
07:39
var/repo/config какие прова надо ?
07:46
и тишина
lexus-omsk #
07:50
у меня на repo 755 noc:noc
icCE #
08:11
спс
lexus-omsk #
08:13
так, триггер срабатывает, но такая же проблема как в http://redmine.nocproject.org/boards/2/topics/2397 - не подставляются данные в шаблон
icCE #
08:16
Так поставил
08:16
в ошибку упал
08:16
при web
08:16
http://pastebin.com/FiDUABRL
08:17
основная DoesNotExist at /main/auth/login/
08:17
так
08:17
уже понял почему Наверно
08:30
в общем не понял почему не работает
dvolodin #
08:32
django_site нужен
08:32
syncdb прошел?
icCE #
08:33
dvolodin: я по манулу делал от debian
08:33
собсвтенно везде где возникали ошибки я правил
08:33
python manage.py runserver 0.0.0.0:8000
08:33
и результат ты видешь
08:36
django я так понимаю внутри ?
dvolodin #
08:39
да
08:40
./noc dbshell
08:40
select * from django_site;
08:41
grep SITE_ID settings.py
08:41
должны совпадать
icCE #
08:41
ну я скажу что баз нету
08:41
id | domain | name
08:41
----+--------+------
08:41
(0 rows)
dvolodin #
08:42
надо добавить запись
icCE #
08:42
dvolodin: делаю как тут
08:42
http://redmine.nocproject.org/projects/noc/wiki/InstallationDebian6
08:42
с поправкой на fedora
08:44
dvolodin: если надо поправить Поправим. Как бы узнать, что ? Дальше возникает вопрос, почему оно не сделалось, если оно должно создоватся. Я когда буду оттачивать манул (щас заметки на полях по установке) Все равно убуд ставить систему еще раз.
08:47
можнт полные логи прислать ?
08:47
Request information
Unbeerable #
08:49
пробую получить конфиги, выбрал свитч, сделал get now, он после долгих размышлений показывает config pulling result: имя свитча и знак кирпич
08:49
это означает, что ничего не получилось, да?
_4ePTeHok #
08:49
угу
08:50
в логах активаторов погляди что неполучилось
08:50
может логин криво забил в managment object
icCE #
08:54
dvolodin: тогда как будишь свободен, кажи что делать дальше.
dvolodin #
08:56
icCE: Обычно создается
Unbeerable #
08:57
блин, я точно идиот. активатор вообще не был запущен
08:57
я думал он через launcher запускается
08:57
хм
08:58
а в конфиге noc-launcher есть activator enabled=true
icCE #
08:59
dvolodin: а на каком этапе ?
dvolodin #
08:59
с правами у него хорошо?
08:59
icCE: syncdb
09:00
ему может рут понадобится, чтобы сислог и трапы слушать
icCE #
09:00
dvolodin: прова на папку noc
09:00
в конфига я так же указал noc
09:00
ой
freeseacher #
09:00
права на папку логов
09:00
и на логи
icCE #
09:00
не
09:00
opt/noc = root
09:00
Change user to root in section [noc-activator]
09:00
сделал
09:02
dvolodin: syncdb нету в мануле :)
09:02
syncdb
dvolodin #
09:02
в post-update он вписан
icCE #
09:02
логи щас гляну
09:05
в логах все хорошо
09:05
dvolodin: post-update вроде то же прошел без проблем
09:05
щас попробю еще раз
09:06
во
09:07
так noc в opt должен иметь прова noc ?
dvolodin #
09:08
нет
09:09
только /opt/noc/local и /opt/noc/static/doc
09:09
post-install выставляет их
icCE #
09:09
хорошо ./scripts/post-update от какого имени запускаем ?
09:09
root ?
zi_rus #
09:09
noc
09:10
dvolodin, /opt/noc/etc/ssh тоже должен быть noc
dvolodin_ #
09:13
да
09:14
post-update -- строго от noc
Unbeerable #
09:19
оу. а я рутом запускал
dvolodin_ #
09:27
зря
09:27
права могут покоцаться
Unbeerable #
09:28
ну я уже всё поправил
09:28
а где почитать про то, что в нокбуке пустое? :)
lexus-omsk #
09:29
например про шаблоны для рассылки оповещений по алармам - где посмотреть какие переменные можно использовать? :)
dvolodin_ #
09:29
Неправильная формулировка - куда выслать документацию по упущенным в nocbook моментам
09:29
:)
Unbeerable #
09:30
ой, если она по запросу высылается, я был бы очень рад
dvolodin_ #
09:31
нет, она принимается от всех :)
Unbeerable #
09:32
я пытаюсь понять virtual circuit management
09:32
все эти фильтры, бинды
dvolodin_ #
09:35
что именно непонятно?
09:36
фильтры - список возможных vlan'ов
09:36
бинды - к каким префиксам какие vlan'ы можно привязывать в принципе
Unbeerable #
09:41
а вот есть у меня цепочка свитчей, и мне надо на последнем создать влан с автоматическим созданием его на промежуточных, такое возможно?
dvolodin #
09:43
Unbeerable: это вам модуль staticvlan нужен, был на форуме
09:43
В NOC подобный функционал ожидается через месяц-два
zi_rus #
09:44
что делают шедули main.backup main.cleanup?
dvolodin #
09:45
реззервные копии баз и репо
09:46
cleanup - чистит мусор из баз
Unbeerable #
09:46
а для routeimport интерфейс уже есть, но он пока не работает, да?
09:46
и везде, где я вижу пустую страничку, это означает то же самое
icCE #
09:49
dvolodin: попробую я тогда все завново :)
09:50
Error:
09:50
etc/noc.conf: permission denied
09:50
etc/noc-sae.conf: permission denied
dvolodin #
09:50
route import работает для тех железок, для которых есть скрипт get_interfaces
icCE #
09:50
:)
zi_rus #
09:50
icCE, магическое число 5, раньше не заведется
icCE #
09:50
zi_rus: ну у меня пока 0 стадия :)
09:50
и думаю заведется
09:50
харизма у меня прокачена
zi_rus #
09:51
dvolodin, что именно получает этот скрипт и почему это не сделано для длинков?
dvolodin #
09:52
zi_rus: скрипт получает инфломацию об интерфейсах железки
zi_rus #
09:54
на длинке show ports - покажет все физические порты, show ipif - покажет все ip-интерфейсы (кроме лупбеков, там show loopback ipif)
lexus-omsk #
09:55
вот, в show ports наша любимая засада от длинка - хитрый пейджер
dvolodin #
09:55
ага
09:55
:)
zi_rus #
09:57
ну портс там и не нужен, он максимум покажет есть линк/нет линка, тут надо sh ipif запускать, там проще "а" нажал и он все выводит
icCE #
10:04
dvolodin: а можно поинтересоватся почему Change user to root in section [noc-activator] ? Почему бы не оставить noc ?
10:05
и папку /opt/noc не дать прова
10:05
или есть определенные проблемы ?
dvolodin #
10:05
коллектор для syslog/snmp trap
10:05
он на младших портах
icCE #
10:05
ясно
dvolodin #
10:06
на соляре можно без извратов
10:07
на фре, в принципе, тоже диапазоны портов подкрутить можно
icCE #
10:07
dvolodin: да в linux ято же как то это обходил
10:07
надо вспомнить будет
10:07
хотя конечно там жестоко ядром все
dvolodin #
10:07
можно через capabilities, но там в обратную сторону все
icCE #
10:08
ладно после обеда попробую вторую инстоляцию сделать,заодно how to уже в человеческий вид пречешу
10:08
инсталяцию
lexus-omsk #
10:19
в линуксе через iptables можно занатить на другие порты
dvolodin #
10:23
это изврат уже
lexus-omsk #
10:24
зато делается в пару строчек и никаких заморочек с ядром
icCE #
10:28
Нет Это плохой вариант
dvolodin #
10:32
я вообще резко против каких-либо фильтров на серверах
selivanov #
10:34
hi
freeseacher #
10:36
привет
zi_rus #
11:41
dvolodin, я вообще против каких либо фильтров вообще. из-за долбаных acl, мы три дня искали причину, почему клиент не может адрес по дхцп получить
dvolodin #
11:41
хотя бы
11:42
а еще серверники обожают позакрывать все, что только можно и имеют мозг, почему у них не работает
11:42
они и в двух сетевых картах заблудиться могут на раз-два
`kk #
11:43
ну не надо всех под 1 гребёнку =)
Dmitry1 #
11:51
Выражаю надежду всех пользователей D-Link, что dvolodin сделает возможность работы с их пейджером. Тогда можно будет задуматься о скриптах get_switchport, get_interfaces
zi_rus #
12:00
Dmitry1, выражаю надежду, что эти скрипты будут реализованы с помощью snmp
Dmitry1 #
12:02
К сожалению, должен сказать, что я вообще отключаю SNMP на всех свичах D-Link. Обнаружили очень неприятную особенность, что при опросе свичей по SNMP загрузка CPU достигает 100%.
icCE #
12:04
dvolodin: вопрос еще, зачем принудительно ставить shell sh ?
12:04
просто он как бы по default
12:04
это для noc
12:04
useradd -g noc -s /bin/sh -d /opt/noc noc
zi_rus #
12:08
Dmitry1, не замечали такой проблемы. в отсутствие других возможностей, надо реализовывать так, тем более что снмп более правильно, чем ходить телнетом
Dmitry1 #
12:08
на разных моделях коммутаторов snmp различается гораздо сильнее, чем CLI
`kk #
12:09
zi_rus, подтверждаю проблему с snmp
zi_rus #
12:11
есть стандартные параметры, есть специфические, они лежат в разных ветках дерева. cacti, например, без труда достает с любой железки список портов с описаниями и скоростями
icCE #
12:13
zi_rus: согласен
12:14
для нестандартных есть mib
zi_rus #
12:20
и кстати, почему нок так медленно работает? запускаю get vlan и ждешь, быстрее было самому залогиниться на железку
dvolodin #
12:41
zi_rus: это явно не понядок - на железки он быстро заходит
zi_rus #
12:42
на сколько быстро? готов спорить, я смог бы его обогнать
dvolodin #
12:42
от одного до 3 секунд на начало выполнения задания
12:42
дальше - как CLI работает
zi_rus #
12:43
нажал get_vlan. 12секунд по секундомеру
dvolodin #
12:43
записи в DNS там нигде не резолвятся?
zi_rus #
12:43
нет
12:43
все по ip
dvolodin #
12:43
./noc debug-script get_vlan <объект>
12:43
можно посмотреть, чего и когда отрабатывается
zi_rus #
12:43
откуда запускать?
dvolodin #
12:44
от юзера noc из /opt/noc
zi_rus #
12:45
чего-то я не понял, так похоже он вообще не сработал
12:45
Error: Invalid script 'DLink.DxS.get_vlan'
dvolodin #
12:46
get_vlans :)
zi_rus #
12:47
так быстрее
12:48
но в frontend отображается только через 12 секунд, что происходит еще 10секунд?
_4ePTeHok #
12:48
кли отрабатывает
12:48
он у длинке неторопливый
dvolodin #
12:49
refresh статуса в браузере - раз в 5 секунд
_4ePTeHok #
12:49
все хотят аякс и риалтайм как всегда
zi_rus #
12:49
значит должен через 5 секунд показать а не 12
12:58
_4ePTeHok, лучшее - враг хорошего
_4ePTeHok #
12:59
то что оно лучшее будет грузить железку на 100% большую часть времени - не будет "лучшим".
zi_rus #
13:00
реал тайм будет очень к месту для такого интеракстивного приложения. чем это интересно аякс нагрузит сервер на 100%
_4ePTeHok #
13:01
я не про аякс в принципе, а про архитектуру работы приложения в "реалтайме".
13:02
про кучу скриптов лезущих на железки, где телнет, таймауты, и т д.
13:02
snmp например очень сильно грузит некоторые железки
13:03
а теперь представим что там подряд 5-6 скриптов долбит железку запросами для "реалтайма".
13:03
надо баланс между юзабилити и непосредственной работы железки
13:03
соблюдать
zi_rus #
13:06
то есть 5-6 скриптов по телнету нагружают железо намного меньше? то есть передать в ответ на snmpget номер влан 200 коротким числом создает нагрузку больше, чем передача огромного количества мусора, который парсер потом отбрасывает чтобы получить тоже сам
13:06
ое короткое число
13:07
я все правильно понял?
`kk #
13:07
мини офтоп про длинки. как же блин не хватает на них ctrl+W
13:08
zi_rus, и да. на некоторых snmpget загрузка будет больше
icCE #
13:08
что то как то я не верю, что snmp грузит железо
13:09
с другой стороны есть веб смарты
13:09
где только snmp
`kk #
13:09
я спорить не буду. просто сталкивались
zi_rus #
13:09
это значит кривое железо, вернее руки у программеров прошивок
`kk #
13:09
3526. да и ченжлог посмотрите на 3028
zi_rus #
13:10
это кривые поделки,сейчас 3200 идут, нормально снмп работает
`kk #
13:10
3200 ну да. ну да.
13:11
пока его запилят ....
icCE #
13:11
мнул кривой все же
`kk #
13:11
мнул?
icCE #
13:11
вот пример судя по echo "[ui]" > /opt/noc/.hgrc
13:11
он должен работать от noc
13:11
но
13:11
-bash: /opt/noc/.hgrc: Отказано в доступе
13:11
где правда ?
13:13
и тишина :)
zi_rus #
13:18
а еще без снмп performance management (хотя правильней это называть monitoring) будет большим геморроем, а так можно было бы как в cacti, строить графики c помощью rrdtool, для которой данные берутся через snmp мибы со счетчиками, а через телнет - это просто занятие мазохизмом
icCE #
13:20
zi_rus: ну как всегда Не нравится пиши :) код открыт
13:20
Я вот думаю как мне с зоопарком WebSmart управлять
13:21
писать что то свое очень тяжко будет
13:21
а NOCтут не поможет
13:21
как я понял
`kk #
13:23
zi_rus, это да. только мне кажется надо будет проверять на железках и прошивках как будет отрабатывать(грузить или нет). и не исключаю, что стандартные мибы допилины уже
_4ePTeHok #
13:23
по поводу нагрузки у Dmitry1 поинтересуйтесь
13:24
давайте остановимся на том, что делаем noc таким, чтобы он не мешал работе железки
zi_rus #
13:24
кто не использует снмп, не укажут в свойствах снмп комьюнити, и сами решат нужен им снмп или нет
_4ePTeHok #
13:25
а грузить может много чего
Dmitry1 #
13:25
Подтверждаю. Свичи 2-го уровня еще кое-как переживают snmp опрос, но железяки 3-го уровня, если на них таблица MAC адресов подходит к 2000 - тихо мирно умирают.
_4ePTeHok #
13:25
и веб и телнет и ссш
13:25
на груфики делается запрос 1 раз в 5 минут
zi_rus #
13:25
давайте тогда и телнет уберем раз он грузит
13:26
а гет влан делается раз в день
_4ePTeHok #
13:26
zi_rus, давайте не будем передергивать. "делаем noc таким, чтобы он не мешал работе железки".
zi_rus #
13:26
или реже
Dmitry1 #
13:26
Я не против SNMP, но представь себе ситуацию, когда к свичу действительно подключено больше 2000 абонентов, а свич начинает время от времени впадать в ступор.
icCE #
13:27
ну что
13:27
я поставл с 1 раза под fedora =)
zi_rus #
13:27
так может админу лучше решать? подключено у него 2000человек или 200
Dmitry1 #
13:27
И когда разъяренные директора и абоненты находят причину - админа, который хотел поставить крутую управлялку/мониторилку, знаешь, что потом с таким админом сделают?
icCE #
13:27
манул почти готов
_4ePTeHok #
13:28
zi_rus, дык ктож вам мешает решать то?)
13:28
решайте на здоровье
zi_rus #
13:29
вы решаете, у вас снмп глючит, и вы орете что не нужен снмп потому что он нагружает
13:29
поэтому его не надо использовать
icCE #
13:29
так народ можно вот только один вопрос
_4ePTeHok #
13:29
эвокак. покажите мне хоть одну фразу мою с таким заявлением)
icCE #
13:29
есть у меня щас только с железкой возможность общаться по snmp
13:29
можно как то прикрутить к noc ?
zi_rus #
13:30
лучшее будет грузить железку на 100% большую часть времени - не будет "лучшим". надо баланс между юзабилити и непосредственной работы железки ==== ненужен снмп
Dmitry1 #
13:30
Конечно. Профили SA позволяют использовать как telnet и ssh, так и snmp
_4ePTeHok #
13:30
zi_rus, последнее дописано вами и не имеет ко мне никакого отношения
13:30
я сказал что нужен баланс
icCE #
13:31
Dmitry1: просто я вот щас поставил и на админку смотрю как тот баран =)
zi_rus #
13:31
а я сказал что нужен снмп, но вы все время против
icCE #
13:31
куда дальше жать немонятно
dvolodin #
13:31
zi_rus: PM нормально работает по SNMP и снимает загрузку. Я даже DCU с juniper'а снимал, когда приперло
_4ePTeHok #
13:31
чота развели флуд из ничего
icCE #
13:31
zi_rus: я за snmp :) а решать что использовать уже за человека
_4ePTeHok #
13:31
никто не говорил что кто то там против снмп
Dmitry1 #
13:31
А как узнать этот самый баланс, если от прошивки к прошивке сами представителт D-Link не могут внятно объяснить, что там и как зависит?
zi_rus #
13:31
dvolodin, что мешает остальные параметры забирать по снмп для ускорн=ения работы и упрощения кода
dvolodin #
13:32
и performance management - это PM, мониторинг у него - всего лишь одна из задач, а именно - соответсие параметров производительности заданным ограничениям
_4ePTeHok #
13:32
Dmitry1, отключить снмп на них и делов
13:32
просто не надо пороть горячку и все грести под оодну гребенку
zi_rus #
13:32
dvolodin, менеджент == управление, слежение все-таки != управление
selivanov #
13:33
control plane ?
dvolodin #
13:33
По SNMP - да, есть проблемы
13:34
сталкивался с высоким CPU usage на разных IOS'ах
13:34
встречал memory leaks в IOS'ах и FTOS'е
icCE #
13:34
а теперь о проблемах
13:34
Page not found
13:34
Request URL:
13:34
http://10.211.55.7:8000/inv/vendor/add/
dvolodin #
13:34
были рекомендации индусов "выключите эту свою SNMP-поебень нафиг, пока мы не разобрались, чего это у вас свич залипает"
13:35
zi_rus: отслеживание соответсвия - одна из составляющих управления
13:35
для эффективного управления надо
13:35
1. Хотеть
13:35
2. Мочь
13:36
3. Проверять
zi_rus #
13:36
пусть будет, это вопрос терминологии, тем более что раздел все равно пустой
dvolodin #
13:36
да не, noc-probe работает и нормально
Dmitry1 #
13:37
Хорошо. Вот явный пример. Всего-навсего надо прочитать port descrioption
zi_rus #
13:39
dvolodin, я там вообще ничего не понял, может лучше cacti-style. открыл manged object -> список интерефейсов -> проставил галочки загрузку каких интерфейсов отрисовывать
Dmitry1 #
13:39
Для DES-3028 - .1.3.6.1.4.1.171.11.63.6.2.2.2.1.6
13:39
Для DES-3026 - 1.3.6.1.4.1.171.11.63.3.2.2.2.1.6
13:39
Для DES-3028P - .1.3.6.1.4.1.171.11.63.7.2.2.2.1.6
13:40
Для DES-3028G - .1.3.6.1.4.1.171.11.63.11.2.2.2.1.6
13:40
Еще продолжать?
_4ePTeHok #
13:41
бывает еще и от прошивок пляшет
Dmitry1 #
13:41
Объясните тогда мне, какой OID я должен использовать для получения port description для DES-3526 ?
dvolodin #
13:42
zi_rus: и нафига нам еще один кактус
_4ePTeHok #
13:42
mib под каждый managment object?))))
dvolodin #
13:42
тем более он неудобен
13:42
мне больше импонирует вариант, когда я выбираю сервис в каталоге, активирую его, и он ставится на мониторинг SLA
13:43
а что именно и как именно мониторить - задано в описании сервиса
Dmitry1 #
13:43
Тем более, что я не могу получить доступ ко всем 100% моделям свичей D-Link. Так что если использовать SNMP, то мы охватим максимум 10-20 типов свичей.
zi_rus #
13:44
dvolodin, сделать удобным + интеграция со списком объектов
dvolodin #
13:44
привязка - в каталоге сервисов
zi_rus #
13:44
Dmitry1, ftp.dlink.ru там есть мибы ковсем моделяи
dvolodin #
13:44
кактус, между нами - движение в никуда
13:44
мониторинг ради мониторинга
13:45
да и тот же заббикс дубоват в этом плане
icCE #
13:45
dvolodin: ну зачем упиратся в мониторинг
zi_rus #
13:45
мы через него строим графики для отчетов
icCE #
13:45
по snmpи управлять можно
dvolodin #
13:45
конкретно что я хочу, например
Dmitry1 #
13:45
zi_rus: посмотри для примера ftp://ftp.dlink.ru/pub/Switch/DES-3526_3526DC/SNMP/
dvolodin #
13:45
вот определил я для себя сервис - BGP пир
13:46
задал какие там параметры могут быть, как его активировать, как его мониторить
13:46
дальше тупо делаю instance сервиса, указываю параметры - и все
Dmitry1 #
13:46
Я там нашел 5 разных MIB'ов к одному свичу и еще 3 каталога, где тоже лежат разные MIB'ы
13:46
А ведь это самый распространенный свич.
zi_rus #
13:46
dvolodin, логика понятная только создателю
dvolodin #
13:47
дальше меня не колебет абсолютно - пусть NOC топает и настраивает пир, обновляет префикс-листы на нем, мониторит его, графики хранит, в SCU/DCU учитывает, базы RIPE обновлят и прочее и прочее
13:48
то же самое с клиентами - сказали, что VIP на таком-то порту - паси этот порт и всю цепочку
selivanov #
13:48
des-3526 )
dvolodin #
13:49
увидишь жопу - ори в FM громко
13:49
а мне первично - оказать услугу и проверять, что она соответсвует тому, на что подписался
13:50
кактус в такой модели даром что лизать можно
13:50
:)
icCE #
13:50
^_^
13:51
dvolodin: описалово установки noc на fedora тебе скидывать ?
zi_rus #
13:51
dvolodin, без мануала и поллитра понятно только создателю
icCE #
13:51
zi_rus: будет и манул и поллитра
13:51
надо только писать
13:51
и кстати Манул должны писать пользователи
13:52
так как создателю многие вещи просто очевидны
13:52
это факт =)
13:52
вот мне нужна завтра жертва на задавание глупых вопросов
dvolodin #
13:53
icCE: на wiki описалово
13:55
zi_rus: ты когда нибудь сталкивался с внедрением больших систем?
zi_rus #
13:55
dvolodin, не довелось
dvolodin #
13:55
там еще веселее - мануал писать и растолковывать тебе будут за твои же деньги
13:55
:)
misak #
13:55
добрый день
_4ePTeHok #
13:55
и далеко не факт что сразу разберешься)
dvolodin #
13:56
и разобраться не дадут
misak #
13:56
очень не хватает кнопки для групповой работы с алармами и событиями
dvolodin #
13:56
как только дойная корова осознает, что ее банально доят, она тут же теряет молоко и становится банальным козлом
zi_rus #
13:56
MS Windows, Cisco IOS такие же большие системы
13:57
открытой документации как грязи, сиди читай
Dmitry1 #
13:57
А-ха-ха!
dvolodin #
13:57
zi_rus: есть такое понятие, как тиражируемая система
13:57
и малотиражная
Dmitry1 #
13:57
Документации, как загрузить и настроить vlan и ip максимум
dvolodin #
13:57
и подходы разные
13:58
например -- мы продаем миллионы копий, вот тебе дока, имейся как знаешь
13:58
или, например -- у нас 10 копий, давай разберемся, в чем твоя проблема и как ее решать
Dmitry1 #
13:58
Вот ради интереса почитай про Cisco CMTS - сразу поймешь, что без помощи специалиста никакая документация не поможет.
dvolodin #
13:59
да хотя бы - BTS, PGW
13:59
особенно если напрочь не понимаешь, что такое ОКС7 или SIP
_4ePTeHok #
13:59
не, ну чо вы, мультикаст роутинг тоже та еще тема)
dvolodin #
13:59
ага
Dmitry1 #
13:59
ага :(
dvolodin #
14:00
да и в MPLS -части тоже
_4ePTeHok #
14:00
особенно с костылями на 6500 когда оно должно, а не работает как надо)
Dmitry1 #
14:00
Особенно Cisco + D-Lini
_4ePTeHok #
14:00
Dmitry1, да тут можно много связок напридумывать)
dvolodin #
14:00
и диагностика разъехавшихся FIB'ов на разных линейных картах с софтом
14:01
тоже, блин, удовольствие
14:01
отловишь срач, потом ловишь причину его возникновления
Dmitry1 #
14:01
Это уже проходили. Я теперь с ужасом свотрю на шасси, где больше одного модуля
dvolodin #
14:01
а потом имеешь мозг TAC'у
14:02
Dmitry1: до сих пор тот ExaScale помню
14:02
2 супервизора (RPM по Force10)
14:02
на каждом 3 проца PowerPC и по 2 гига памяти на проц
14:02
и плюс один или два port-pipe на линейную карту
14:03
и куча switch fabric модулей
14:03
пол-сотни LAG-интерфейсов
selivanov #
14:04
cisco
14:04
*
dvolodin #
14:04
ловили, какого хрена он периодически начинал ненавидеть парочку отдельно взятых серверов
Dmitry1 #
14:04
Не, у нас стоит 3845 с кучей ASIC и HWIC. В свое время через нее frame-relay пускали. начала глючить - проще оказалось купить такую же, чем разбираться, в чем проблема.
dvolodin #
14:05
на ящике 40 десяток и 180 гигабитных
14:05
и вот просто так - немотивированная периодичвеская ненависть к паре серверов
Dmitry1 #
14:06
Это бывает. Я вычислил битый кабель по такому принципу: через физический интерфейс проходило трафика в два раза больше, чем по vlan, поднятому на нем.
14:06
Или бывают часто глючные SFP
dvolodin #
14:07
И workaround в виде - сменить primary interface на LAG и попробовать вывести его на другую карту
14:08
SFP да, не отвечает толком и срет в I2C
14:08
в результате отлетает совсем другой интерфейс, котоырй вообще ни при чем :)
zi_rus #
14:09
воспоминания о боевой юности)))
Dmitry1 #
14:09
угу.
dvolodin #
14:09
да уж
_4ePTeHok #
14:09
хех, тут вот только с HP саппортом бодался по поводу старенькой 5300. валялись а тут приперло на вынос небольшой включить оспф роутером..)
dvolodin #
14:09
:)
_4ePTeHok #
14:09
а оно возьми и не сожри анонсы
14:10
lsa is to big
Dmitry1 #
14:10
:)
dvolodin #
14:10
у меня был прикол с тем, что FTOS не поддержкивал ISIS Tag Extension и тупо считал начало TLV префиксом
14:10
в результате в FIB попадал чудесный префикс 0.0.0.0/1
_4ePTeHok #
14:11
дык они мне месяц мозг трахали разными способами, что дескать у меня руки кривые)
Dmitry1 #
14:11
Мне когде-то Allied Telesyn на попытку вывести список MAC адресов ответил, что у него для этого не хватает памяти. С тех пор он как подставка под цветок используется.
_4ePTeHok #
14:11
гг, цветы - это прекрасно)
dvolodin #
14:11
При попытке вычистить его из CLI или хотя бы в правильный интерфейс зарулить ящик вежливо так инетерсовался, много ли я ухи скушал
14:11
сам додумался до такого, или надоумил кто
Dmitry1 #
14:12
Префикс 0.0.0.0/1 это не самое крутое, а как тебе такое, что в таблицу FIB попадают мкльтикаст адреса на некоторых моделях D-Link ?
dvolodin #
14:12
Dmitry1: ну как тебе сказать
14:13
он эффективно перебивает половину дефолта
Dmitry1 #
14:13
Это такой юмор китайских разработчиков?
dvolodin #
14:14
для китаез индусы пишут обычно
14:14
тот же хуавеевский VRP в индии разрабатывают
14:14
они так в бангалоре своем и шляются с работы на работу, каждый со своим кальяном
14:15
и кумарят в страшных комбинациях
14:15
не зря в фамилии каждого второго индуса из поддержки есть слово Kumar
Dmitry1 #
14:16
Хорошо, что не -аглы
_4ePTeHok #
14:23
=))) да курят они там знатно
14:23
мы тут как то официальный русский сайт хуавея читали всем офисом
14:23
оборжались
dvolodin #
14:24
ДАААА
_4ePTeHok #
14:24
там как будто китаец кнутри каробки сидит и руками фовардит пакеты)
dvolodin #
14:24
светлый путь неподражаем
14:24
да-да
14:24
про softx мы так и говорили, что на каждой платке - три обученных китайца
_4ePTeHok #
14:25
=)
14:25
редунданси отдельная тема по ржачу)
dvolodin #
14:25
я помню довел раз до истерики их учебный центр
14:25
есть у них волшебная железка - MRS
14:25
она же резиновая теля
14:25
тетя
14:26
у нее форм-фактор OSTA plane
14:26
бэкплейн в середине и платы с двух сторон втыкаются
14:26
причем одна строго напротив другой
14:26
там есть платка с BAM для управления
14:26
точнее - две платы
14:27
я, естественно, как злой гремлин сказал, что коли у вас такое redundancy на все, давайте выдерем BAM и посмотрим, как отреагирует ящик
14:28
результат щокировал нафиг весь китай
14:28
ящик загнулся в конвульсиях и не встал даже после того, как вернули плату
14:29
при разборе полетов выяснилось, что плата управления - просто писюк с виндой, распиленный пополам и втыкаемый с обоих сторон
14:29
Представьте себе реакцию винды, когда у нее на ходу оторвали пол компа
14:29
:)
14:30
Она, конечно, пробовала встать и починить NTFS, но он напрочь был засран event log'ом
14:30
:)
14:31
Там даже переставить винду не получилось - там был хитрый интеловский драйвер, который был запилен хуавеем
14:31
и работал только на китайской винде определенных версий
14:32
три дня они с ним имелись
14:32
потом слезно умоляли больше не подстрекать к дерганию зарезервированных плат :)
_4ePTeHok #
14:33
ыыыыы
dvolodin #
14:33
а дока на softx + обвязку была просто потрясная
14:33
перевод на английский с китайского
14:33
причем разными людьми, далекими от телефонии
_4ePTeHok #
14:34
дада, люблю такие переводы)
dvolodin #
14:34
у меня сложилось впечатление, что это у них навроде пытки
14:34
провинившегося сотрудника заставляют переводить случайные куски документации
14:34
под угрозой понижения зарплаты на два доллара или высылкой на рисовые поля
14:36
Иначе как "мягкий Х." из изделие не называли
14:38
Неподражаемые ребята, чего сказать
14:41
ладно, поползу я
Tweet
Share this page
Share this page: Tweet