nocproject.org
06:25
zi_rus, нотификатор как работает?
06:26
По какому принципу? На каждую потерю пинга шлет мыло?
06:26
или на сам факт и факт восстановления?
06:27
ss_, нет только на факт появления. появился аларм в ФМ - послал на почту письмо, если пинг файлед, а аларм уже есть, он ничего не присылает
06:29
все равно не совсем понял, т.е. допустим пинг каждые 30 секунд
06:29
он на каждый неответ будет спамить?
06:29
или только на первый и далее просто будет висеть авария
06:30
хм откуда тогда 1900 писем?
06:30
если она пропадет а потом опять вернется - будет еще одно письмо
06:30
у меня там просто до хрена железок
06:30
ну это понятно так как по логике это уже новое событие
06:30
а как бы зависимости?
06:30
а вот об чем и разговор
06:31
что они есть но нок их не видит
06:31
т.е. если агрегатор лег то все остальное можно не проверять
06:31
терь понял)
06:31
Я тут с zabbix паралель провел в голове
06:32
нок вроде как должен быть лучше, ан этого не может
06:36
у нас тут так совпало, аварийный ребут двух цисок в ядре + проблемы с элекстричеством в области
06:36
06:36
это твое счастье?
06:36
dvolodin, я даже залогиниться не могу
06:36
Sorry, your username and password are incorrect
06:39
dvolodin, по трейсу скажешь чего? это тоже самое, что у _4ePTeHok ?
06:40
что за система?
06:40
проблема явно с simplejson
06:41
да
06:41
2.6.32-5-amd64
06:41
debian
06:42
changeset: 4888:cb01790c7c58
06:44
zi_rus, поробуй открыть ссылку опять
06:44
python-simplejson 2.1.6-1
06:45
dvolodin, попробовать до его обновить до 2.2.1 ?
06:47
нет пока
06:52
lib/serialize.py надо смотреть и крутить
06:52
там автоопределение стоит
06:52
если есть cjson, используем его, он в 10 раз быстрее
06:53
нет - использует django'вский
06:53
а в нем тоже свой автодетект есть
06:53
он выбирает, использовать ли либу из python 2.7, системный simplejson или свой
06:54
рабочие комбинации для encode и decode какие?
06:54
удалить его и поставить cjson ?
06:55
dvolodin, ссылка сработала
06:56
это не я написал, но буду очень не против если это реализуют
06:57
это решение проблемы с твоими радиусами, насколько я понимаю
06:59
на сколько я понимаю это одно из предположительных описаний решения моей проблемы
07:02
_4ePTeHok, приём
07:07
dvolodin, замена на cjson помогла
07:07
о братно simple&
07:07
?
07:08
попробуйте разобраться, как правильно использовать вашу ускоренную версию simplejson
07:08
да
07:08
по-хорошему нужен патчик, который зафиксит вашу проблему
07:08
у меня она нигде не воспроизводится, при всем желании не могу проверить и зафиксить
07:09
это только при апгрейде со старых версий(последний перед ui)
07:09
на новой инсталяции всё ок
07:09
а патчик... нет таких познаний в питоне -(
07:23
ни у кого не валился noc-web на "cannot import name AUTH_FORM_PYRULE" ?
07:25
не встречал такого
07:25
в каком случае озникает?
07:25
ufir: адепты каэса одобряют идею использования HP 7xx для серваков.
07:26
`kk: у меня тоже все ок..
07:27
механизм аутентификации какой?
07:29
07:29
вытри висячие *.pyc
07:33
dvolodin: Я тут в settings заметил, что IS_WEB определяется, если он как fcgi запущен или как runserver. Это важно?
07:35
чистка *.pyc не помогла -(
07:43
noc-web.py -f start, так же в трейс падает
07:54
dvolodin, что после чистки *.pyc пробовать??
07:55
grep -r AUTH_FORM_PYRULE *
07:55
где оно вообще засело
07:57
известно где-)
07:57
noc/main/apps/auth/views.py
07:57
../noc/main/apps/auth/views.py:from noc.settings import AUTH_FORM_PYRULE, LANGUAGE_CODE
07:57
../noc/main/apps/auth/views.py: authentication_form = PyRule.call(AUTH_FORM_PYRULE if AUTH_FORM_PYRULE else "auth_form_user_password")
07:58
noc-ui влили в noc ?
07:59
`kk: ЭЭ... А что у тебя за версия такая? :)
08:00
`kk: main/apps/auth перенесли
08:01
или удалили :) нет егео :)
08:03
нет его, давно уже
08:03
:)
08:05
dvolodin: Закоммить, пожалуйста, правильный патчик про смену темы. Я в issue поправил :)
08:05
это апдейт предыдущей версии
08:09
удалил. не помогло ....спотыкается на - "from noc.settings import AUTH_FORM_PYRULE, LANGUAGE_CODE"
08:10
`kk: странная инсталляция, уж не через setup.py обновляешь ли?
08:11
да. так и есть
08:11
сделать hg pull в /opt/noc ?
08:12
ага
08:15
KTO-TO_: закоммитил, проверяй
08:21
мда. сделал hg pull. вытянулать папка auth - трейс. удалил папку auth - трейс (ImportError: cannot import name ChangesQuarantineRule)
08:21
Подскажи пожалуйста, при добавление каммутаторы, выводит ошибку - Repo path must be relative path inside repo
08:22
какой путь прописать нужно?
08:22
dvolodin, main/apps/changesquarantinerule ушло в историю?
08:22
`kk, я счас пробую clone.. отпишу.
08:22
он сработает
08:24
как сделать клон в существующую папку чтобы переписал нужные файлы?
08:26
а смысл
08:26
mv старую папку, новую clone конфиги скопируешь и вуаля
08:27
ну ессно там setup / post-update по необходимости
08:27
dvolodin: Нормальное :) А можно еще попорсить и про "меню" закоммитить? :)
08:27
из старой надо выгребать скрипты... что не хотелось бы делать. но, видимо, придётся
08:27
при добавление каммутаторы выводит ошибку - Repo path cannot be a directory, какой нужно путь прописать?
08:28
а вот хрена с два.
08:28
у меня чистый инсталл поверх старой базы валится в трейс
08:28
faks: все просто - создай /var/repo с правами для юзера нок, а в repo path пишешь просто имя файла без путей - он попадет при стягивании конфига потом в /var/repo/config/имя_файла
08:28
Syncing noc.eventclasses:
08:28
Creating: Network | MPLS | LDP Neighbor Up
08:28
ERROR:root:UNHANDLED EXCEPTION (2011-10-11 12:27:44.773220)
08:28
все там же, все так же.
08:29
clone в пустую директорию
08:29
<class 'mongoengine.base.ValidationError'>
08:29
Value must be one of [('D', 'Drop'), ('L', 'Log'), ('A', 'Log & Archive')].
08:30
_4ePTeHok: Если нет ничего ценного, то просто дропни базу в монге
08:30
блин, там ивенты.
08:31
08:32
_4ePTeHok, на новой базе и чистым инсталом прокатывает.
08:32
но база нужна старая...
08:32
_4ePTeHok: sync-contrib сделай
08:33
да делал.
08:33
all is in sync
08:34
_4ePTeHok: в contrib/lib лежит mongoengine?
08:34
какой версии?
08:35
mongoengine is in sync (version 0.5
08:35
_4ePTeHok: посмотри в contrib/lib может там еще старая версия есть
08:36
> ls contrib/lib |grep mongo
08:36
240 -rw-r--r-- 1 root wheel 221758 Oct 11 12:26 mongoengine-0.5-py2.7.egg
08:38
помогите дальше разобраться, добавил устройство, все данный для него прописал, оно добавилось, но конфиг не отображаеться
08:38
faks, статус активаторов каков?
08:38
его надо выделить и в менюшке сказать get now - а вообще в шедулере включить
08:39
если нет активаторов, это не поможет)
08:39
я как раз исходил из того что активатор(ы) на месте
08:40
а что в активаторах прописывать вообще нужно? подсети кгде стоят каммутаторы?
08:40
_4ePTeHok: Все страньше и страньше :) А в системе не стоит mongoengine? Т.к. значение у тебя правильное, судя по трэйсбэку...
08:41
мм..ну pkg_info |grep mongo
08:41
mongodb-1.8.2 A NOSQL distributed document-oriented database
08:41
dvolodin: еще раз понадоедаю...где найти описание переменных типа alarm.managed_object.name для использования в шаблонах?
08:43
который в noc/main?
08:48
faks: я сделал несколько тэгов, привязал к ним объекты - а в активаторах выбираю по тэгам
08:48
а ип там - по дефолту осталось 127.0.0.1
08:51
_4ePTeHok, у меня заработало
08:51
кажется я нашел причину свою
08:52
hg clone, cp noc_old/etc/*.conf etc/
08:52
post-update
08:52
и всё ок
08:52
ну и simplejson всё так же -(
08:53
да, у меня дело было таки в системном монго енджине старом(0.4) ставленном когда то easy_install'ом
08:54
_4ePTeHok: Я понял свою ошибку :))
08:54
_4ePTeHok: Я не на всех колекциях проверял, поэтому у меня все хорошо :)
08:55
я вот непонимаю - если можно просто post-update, то каков смысл install.py?
08:55
setup.py т.e.
08:57
_4ePTeHok: Блин... не помогло :) У меня нормально добавилось...
08:57
так..трейсов нет, зато демоны летать начали
08:59
setup.py если клон сделан в другую папку
08:59
2011-10-11 12:59:33,387 Daemon noc-sae[#0] started as PID 40505
08:59
2011-10-11 12:59:35,399 noc-sae[#0] daemon is terminated with status 40505
08:59
2011-10-11 12:59:36,428 Launching noc-sae[#0]
08:59
2011-10-11 12:59:36,430 Daemon noc-sae[#0] started as PID 40511
08:59
2011-10-11 12:59:38,448 noc-sae[#0] daemon is terminated with status 40511
08:59
:(
09:00
_4ePTeHok: потри все *.pyc
09:01
_4ePTeHok: если ты в старое место ставил :)
09:01
да куда тереть то, все в чистую директорию
09:01
_4ePTeHok: А рядом старого noc'а нет? :)
09:02
логи sae посмотри
09:02
09:02
у кого апач?
09:02
надо переписать конфиг для noc-web
09:02
_4ePTeHok: А новый noc в каком каталоге? :) А стары?
09:03
logfile = /var/log/noc/noc-sae.log
09:03
loglevel = debug
09:03
2011-10-11 13:02:52,778 Serving shards: default
09:03
2011-10-11 13:02:56,664 Serving shards: default
09:03
2011-10-11 13:03:00,225 Serving shards: default
09:03
и ничего больше
09:03
someone suggestion for the failure of the post-update script?
09:03
KTO-TO_, да в разных, в разных :)
09:04
_4ePTeHok: Там самое главное - название :) Вот у меня был старый нок -в /noc, а новый в /noc-devel и я долго не мог понять в чем подвох :)
09:04
_4ePTeHok: Может у тебя так же? :)
09:04
KTO-TO_, одно имя. старый выносится mv noc noc_old
09:04
на его место новое ложится
09:06
_4ePTeHok: А если убить noc-launcher и руками запустить noc-scheduler?
09:07
ConfigParser.NoOptionError: No option 'max_mrt_rate_per_sae' in section: 'sae' - это когда такое появилось?
09:08
в конфиге вроде не было
09:08
_4ePTeHok: в последних коммитах
09:08
ну вот еще один inv)
09:08
_4ePTeHok: сегодня :)
09:08
defaults ты зачем-то снес
09:09
и подложил старый хлам :)
09:09
епт..я вчера обновлял, не было, сегодня просто скопировал
09:09
)
09:09
zi_rus: проверь, полегчает твоему курятнику?
09:09
`kk, - помоги человеку (qweasd) с inv
09:09
поставь ограничение на SAE, скажем в 30 коннектов в секунду
09:10
qweasd: update noc to last revision. This problem fixed in r4888
09:10
qweasd, hg pull -u & post-update
09:12
is this after friday?
09:13
& post-update is not the right syntax
09:13
mz
09:13
cd /opt/noc and just hg -pull ?
09:13
qweasd: hg pull -u
09:13
qweasd: then, scripts/post-update
09:15
dvolodin, предварительно скажу что ничего не поменялось, сейчас пообедаю и повнимательней все проверю
09:18
KTO-TO_, а как темы посмотреть ?
09:22
В sae-log сообщения throttling появились?
09:22
hm, seems to be working and som web pages seems to be workign again too but not all, when i get a message inventory>setup>models > page not found 404 django tried these url patterns blablabla .. what could this bee?
09:22
-e
09:22
как перезалить contrib через hg?
09:22
neonman, проще помоему clone в соседнюю папку и вытащить что нужно.
09:24
qweasd: inventory - experimental and not working properly now
09:24
Насколько я знаю, сейчас только одна тема - серая :) други можно поискать на сайте extjs.
09:25
neonman: cd contrib/src && hg pull -u не помогает?
09:26
такс, вроде все устаканилось
09:27
_4ePTeHok: А чего было с post-update то?
09:29
в системе был старый mongoengine поставленный easy_install'ом когда то.
09:29
KTO-TO_, тесты выложены были вчера. видел ?
09:30
freeseacher: Ага. Случайно набрел :) Спасибо
09:30
есть у тя асы ?
09:30
давай консолидируем усилия ?
09:31
только на складе одна :)
09:31
пытаюсь настряпать конфиг апача для нового noc-web...
09:31
щас по ios будем делать
09:31
Я нечто подобное хочу на наши l3 сделать, где терминация.
09:32
freeseacher: Кстати, а как выглядит, когда конфиг не прошгел проверку? он его все-равно собирает, только на почту ругается?
09:32
ну базовые проверки я думю пересекутся
09:32
Какие модули этому апачу нужны: proxy proxy_connect proxy_http proxy_scgi proxy_ajp ???
09:32
да ругается н почту
09:32
gnu-linux: возможно proxy и proxy_http
09:32
перед уборкой было до 400 ошибок
09:33
то есть строк в этих письмах.
09:33
freeseacher: круто... Я думаю у на стоже есть бардачокс :)
09:33
если проверка прошла то нет письма
09:33
root@noc log/noc# cat noc-sae.log | grep throttling
09:33
root@noc log/noc#
09:33
OperationError at /ip/ipam/1/4/0.0.0.0/0/add_prefix/
09:33
Could not save document (Can't take a write lock while out of disk space)
09:33
500MB left,
09:34
09:36
gnu-linux: включай модули по одному и смотри, работает или нет :) Или выключай :) Но вроде как connect,ajp,scgi не надо
09:38
теперь проверки надо интегрировать с configuration management
09:38
freeseacher: А можно pyrule натравить на уже скачанный конфиг и посмотреть на результат? Как вы тестировали, когда все это писали?
09:38
чтобы в списке писал количество ошибок и warning'ов
09:38
мы тестировали стендом :)
09:38
а потом делали get_now
09:38
freeseacher: стендом?
09:39
и в просмотре конфига подсвечивал строки с ошибками и warning'ами в стиле разных IDE'шек
09:39
dvolodin: А может сделать добавлений функций к профилю через web? :) типа сделать check_ntp в generic и в зависимости от профиля править.
09:40
только не живом профиле, а через web
09:42
dvolodin: Можно запустить pyrule на уже скачанный конфиг и посмотреть, что не так?
09:44
KTO-TO_, надо делать. этго кода нет.
09:44
Было бы неплохо чтобы ошибки сразу показывались при get_now конфига. Почта может быть и не настроена ведь.
09:44
freeseacher: ясно :)
09:46
Для начала хотя бы статус показываьт :)
09:52
last week i setup logging high but forgot which conf file this is, can someone point me to the right file?:D
09:53
grep -r debug etc/*.conf
09:54
nha it was one file which i could edit for the /var/log/noc/*.conf
10:14
У меня кажись apach завёлся :)
10:15
10:15
В /etc/apache2/httpd.conf надо добавить:
10:16
LoadModule proxy_module modules/mod_proxy.so
10:16
LoadModule proxy_http_module modules/mod_proxy_http.so
10:16
Соотведственно сам apach должен быть собран с поддержкой этих модулей..
10:17
подскажите что дальше делать, добавил cisco 2960 - Service Activation - Managed Objects - Добавить Объект \ но не конфиг нечего посмотреть не могу, что езщё нужно сделать?
10:19
faks, Configuration Management - Configs - выдели свой свитч и ввверху в выпадающем меню get now
10:21
gnu-linux: А если rewrite убрать? У тебя по идее, есть alias для этого.
10:22
dvolodin, проверил внимательней, ничего не изменилось, в логе САЕ тротлинга нету
10:22
root@noc log/noc# cat noc-sae.log | grep throttling
10:22
root@noc log/noc#
10:22
gnu-linux: И попробуй, пожалуйста, еще с ProxyRequests off
10:24
_4ePTeHok, выводин название свича и down (красный круг)
10:25
с машины с ноком свитч пингуется вообще?
10:25
zi_rus: а какие параметры ставил?
10:26
dvolodin max_mrt_rate_per_sae = 30
10:26
max_mrt_rate_per_shard = 30
10:26
запускал на 1100 железок для надежности
10:26
_4ePTeHok, пинг с сервера до свича идет
10:26
gnu-linux: попроюуй с ProxyRequests off. А то "on" - опасная штука
10:39
есть две баги:
10:41
1. noc-web у меня работает после остановки нока... Соотведственно перезагрузка нока не работает..
10:42
2. У меня не отображается в новом web результат выполнения приложений SA, даже прогрес строки нет, белый экран..
10:44
gnu-linux, 1 - отключен ли "detect number of CPU cores" в etc/noc-web.conf?
10:45
gnu-linux: ты к ноку ходишь по имени или по IPшнику? У меня подобная фигная с SA была, когда я к ноку ходил по IPшнику, а он редиректит результат на имя.
10:46
помагите разобраться с cisco 2960, добавить, добавил, а конфиг получить не как не могу... :-(
10:47
gnu-linux: вот :) ходи по имени в который у тебя IP резолвится :)
10:47
ProxyRequests off и без rewrite работает..
10:55
хм..а это нормально, что по тыку в главном меню, если такой таб уже открыт - оно просто пренаправляет на таб, даже не обновляя содержимое?
10:55
zi_rus: шарды тебе не нужны
10:56
вот хочу я сделать version inventory, зашел, вижу не хватает селектора. Пошел делать селектор, тыкаю в главном снова на version inv - а селектора тютю. Ибо не обновил.
10:57
чот мне кажется не совсем верное поведение. При прямом тыке на таб - да, просто открывать, при тыке в главном - либо открывать новый таб, либо обновлять старый.
10:58
_4ePTeHok: открыть новый - alt click. И по дефолту это неудобно. ИМХО :).
10:58
но без обновления тоже как то странно
10:58
учитывая что ф5 вообще все табы закроет)
10:59
_4ePHeHok: Изменил в etc/noc-web.conf: workes = 1 - Помогло, нок перегружается нормально..
10:59
Вот сделать кнопку для рефреша ТЕКУЩЕЙ страницы в табе - ИМХО стоит
11:00
А вот обращатся по имени не помогло... Также не помогла подгрузка proxy_ajp proxy_connect... Какие идеи с отображением результатов работы в SA?
11:01
gnu-linux: посмотреть логи апача и noc-web доходит ли запрос и куда он приходит
11:04
favorites ещё не работает?
11:07
Нашол ошибку в конфиге ProxyPassReverse плохо прописал.. Здесь надо указать по имени..
11:08
11:09
gnu-linux: а попробуй gzip врубить
11:10
по аналогии с конфигом nginx
11:10
реально ускоряет прогрузку клиента
11:11
Да, у меня можно обращатся и по IP.. Всё работает!
11:14
gnu-linux: Хмм.. А ты теперь зайди по имени и сделай logout. А потом по IP зайди :)
11:18
KTO-TO_, по поводу рефреша текущей страницы. если будет реализован нормальный пуш, то ничего решрешить не надо будет
11:19
zi_rus: неуверен. Что значит "нормальный пуш"? Или есть мысль пушить ВСЕ объекты?
11:19
типа - добавили prefix - он запушился?
11:21
суть в том зачем делать рефреш? обновить содержимое страницы, и тут просто рассмотреть варианты изза чего меняется это содержимое
11:21
можно и через push изменения проталкивать
11:21
выглядеть будет шизоидно
11:21
тут вопрос того, что иногда нужно оставить на табе старый результат
11:22
а иногда - обновить.
11:22
сейчас для второго приходится либо альт клик, либо закрыть таб и открыть обычным кликом
11:23
_4ePTeHok: В твоем случае вообще должна открыться формочка. Нет селектора - закрыл формочку. Сделал селектор, нажал Add заново :)
11:23
зачем оставлять старый результат - не вижу применения
11:24
zi_rus: Вот ушел ты далеко по иерархии префиксов... А тут бац! и в самое начало тебя! неприятно
11:24
ну нужно мне к примеру на табе выведенный алярм оставить открытым, а во втором табе поглядеть результат классификации.
11:24
а где тут необходимость рефреша, старый и новый результат?
11:43
давайте поэстетсвуем
11:45
Нужно придумать новую систему нумерации релизов NOC
11:45
сейчас у нас X.Y.Z[rAAAA]
11:45
где X - что-то глобально-мажорное
11:45
Y - major
11:45
Z - minot
11:46
AAAA - #changeset между релизами
11:47
Хочется немного изменить релизный цикл
11:47
например, делать между релизами X.Y.Z интервал в 1-3 месяца
11:48
и для каждого релиза выпускать относительно стабильные interim релизы
11:48
раз в 1-2 недели
11:48
interim'ы должны быть стабильны, проходить unittest'ы, но будут содержать не весь запланированный функционал
11:49
тогда большинству будет удобнее апгрейдить production на очередной interim и спокойно игратся с tip
11:50
годно. только я бы предложил interim релизы раз в 2-3 недели.
11:51
хочется покороче
11:51
не совсем то, что в agile назвается sprint
11:52
но немного похоже
11:53
А будут багфиксы и security фиксы для старых веток между релизами? По идее должны же быть. Или только вариант - обновляйтесь по текущего interim?
11:54
И по хорошему бы версию менять после релиза. А то сейчас пишется 0.6.4, хотя она реаль же 0.7pre :)
11:54
думаю это важно только когда Х поменяется
11:54
KTO-TO_: пока не будет, или только за серьезные коврижки
11:55
сейчас нет ресурсов на backport'ы фиксов
11:55
версию, да, будем менять после релиза
11:55
я так и думал :) Пока конечно не надо :) Но как только мажор начнется или еще что... Даже сейчас апгрейд с 0.6.4 до 0.7 занятие не тривальное и не быстрая.
11:56
нумерация немного сбивает, та
11:56
пора уже 0,7 выпускать
11:56
Предлагают тогда AAAA - заменить на версию internim
11:56
реально это 6.4 и 7.0
11:56
zi_rus: надо бы все проблемы победить
11:56
новый УИ планировался в будущем, а он уже почти реализован
11:56
zi_rus: вылижем версию, выпустим
11:56
все проблемы решать, тогде сразу 1,0
11:57
zi_rus: с интерфейсом и noc-web.
11:57
dvolodin: Как насчет заменить АААА на номер internim?
11:58
AAAA - автоматом подставляет, если это tip
11:58
ещё fm не готов на 100%. какой тут релиз =)
11:58
тут еще важный момент - interim - это не релиз
11:59
ФМ без нормальной корреляции алармов - не ФМ совсем
12:00
dvolodin: А где оно автоматом подставляется? в about? И только, если запущено там где делали hg pull. А если нок куда-то поставили - то все. фигу вам, а не tip ;(
12:00
так вот - у нас есть огромное количество хотелок, багов и идей
12:01
баги в первую очередь
12:01
может не париться совсем, а делать просто major.minor.interim
12:02
хотя это не правильно
12:02
мне казалось нормальным, что-то подкрутили, одну строчку поправили и циферка увеличилась
12:02
dvolodin: interim - это же таг? Можно сделать - если таг совпадает с tip - то пишем tag, если нет - то номер ревизии
12:02
zi_rus: Не всегда :)
12:03
условно - выходит у нас версия 0.7
12:03
далее до 0.7.1 выходит 3 interim'а - они должны называться 0.7.1
12:03
и какой-то суффик
12:03
что меняется от того, как вы будете эти циферки называть, все равно их 3
12:03
или 4
12:04
вон фаерфокс начал цифры штамповать и что это дало?
12:04
цифры штамповать не надо
12:04
zi_rus: они хром догонят :)
12:04
погнались, называется, за гуглохламом
12:04
но номер должен отображать суть
12:05
dvolodin: 0.7.1preX - где X номер internim начиная с 0.
12:05
"АААА", как у майкрософта номер билда
12:05
чтобы было видно, что идет работа над версией такой-то, и это промежуточный результат
12:06
нормально выглядит и понятно
12:06
запили фич - сделали таг - 0.7.1pre1
12:06
pre не хочется, так как носит негативный оттенок
12:06
не активен noc-activator, как сделать, чтоб он заработал?
12:06
в логах посмотреть
12:06
прав ему хватате?
12:07
Сам нок при определении версии - сомтрит - если tip=tag, то пишем таг - если нет, то берем 0.7.1rAAAA
12:07
кстати, ввиду сильного ухода от 0,6,4, предлагаю запилить 0,6,5
12:07
zi_rus: зачем? Да и поздно, я думаю :)
12:08
это вопрос номера
12:08
значит 0,6,9
12:08
еще не поздно
12:08
:)
12:08
реально номер версии состоит из <release><interim sep><interim><changeset sep><changeset>
12:08
надо пилить fm и новый ui. релизить 7.0 и переходить на новую систему нумерации
12:08
сразу 7.0 выдать? :)
12:09
я хочу в течении одной двух недель начать выпускать interim'ы для 0.7
12:09
это если инвентори замутишь
12:09
но, блин, самое сложное в деле - придумать какого цвета должно быть наше колесо
12:10
dvolodin: Для internim'ом будут использоваться тэги, да? :)
12:10
наверное
12:10
пока не решено
12:10
но имеет смысл
12:11
по поводу того, что проверять, совпадает ли tip с последним тегом - приняно
12:11
если tip совпадает с последним тегом или нет репо вообще rAAAA будет отбрасываться
12:12
interim от релиза отличается хотя бы тем, что нет необходимости разводить массированную PR-компанию
12:12
как исправить, вот это -
12:12
2011-10-11 16:10:34,212 Protocol version negotiated
12:12
2011-10-11 16:10:34,212 In-bundle package. Skiping software updates
12:12
2011-10-11 16:10:34,215 Registering as 'default'
12:12
2011-10-11 16:10:34,222 Registration accepted
12:12
2011-10-11 16:10:34,222 Authenticating as default
12:12
2011-10-11 16:10:34,232 Authentication failed: Authencication failed for activator 'default'
12:12
2011-10-11 16:10:37,238 Bundled packaging. Skipping software updates
12:12
12:12
2011-10-11 16:10:37,251 Protocol version negotiated
12:12
2011-10-11 16:10:37,251 In-bundle package. Skiping software updates
12:12
2011-10-11 16:10:37,256 Registering as 'default'
12:12
в логах активатора
12:13
имя активатора и secret должны совпадать с тем, что пробито в web'е в настройках активатора
12:13
это понятно. Но называть отлично от "pre" или "rc" - черевато тем, что будет путаница в будущем :)
12:13
основная идея interim-а -- он должен быть неким островком стабильности
12:13
еще точнее - имя активатора и секрет в noc-activator.conf должны совпадать..
12:13
надо иметь возможность что-то ломать и делать критичные баги
12:14
но к interim'у они должны уйти
12:14
чтоб заработал активатор, нужно указать логин и пароль, тот же самый что и на web интерфейсе?
12:15
ИМХО, есть проблема восприятия больших имен... Например, что круче 0.7.1, 0.7.1i2, 0.7.1pre5, 0.7.1r7657 ? :)
12:15
выстройте последовательность - по готовности релиза :)
12:15
faks, имя активатора и секрет в noc-activator.conf должны совпадать в web интерфейсе в настройках акт.
12:16
А нифига! :))) самый крутой - 0.7.1 - так как релиз! :)
12:16
точнее так - они одинаковые и в текстовом конфиге активатора - и в том конфиге который через веб-ифейс (main-setup-configs-noc-activator.conf)
12:16
в последнем номер релиза + номер билда после релиза
12:16
реально для релиза достаточно двух цифр
12:17
zi_rus: у нас нет билда как такового
12:17
В ситауации с "pre" - понятно что это 0 pre, а не релиз :)
12:17
АААА - по сути тоже самое
12:17
bamboo запускаем, конечно
12:17
но билд - это именно успешный билд, когда вся лобудень построилась и прошла тесты
12:18
это вопрос терминологии
12:18
zi_rus: Это проканает, если будут отдельные ветки на релизы и будет бэкпорт в них. При сквозном репозитории это неверно :)
12:18
казалось бы успешный билд, а тротлинг не работает
12:18
Т.к. в tip - идет разработка НОВОЙ версии, а недопиливание старой
12:19
И по хорошему надо видеть, что ты работаешь на новой, но еще НЕ ГОТОВОЙ версии
12:19
Можно конечно тэги называть - 0.7-release для релизов :)
12:19
как различать, ты делаешь новую версию или что-то пофиксил в старой?
12:20
zi_rus: пока никак. Старая версия не фикситься. Идет постоянная разработка новой. Если я правильно понял dvolodin :)
12:21
я считаю, пока дело не дойдет до 1,0, все так и должно оставаться
12:22
Предлагаю: релиз - X.Y.Z-release, промежутки - X.Y.Z(pre|i)I, остальное - X.Y.ZrAAAA
12:24
Еще вариант. для interim - просто сквозная нумерация в цифрах и тэг - interim-BBB
12:24
в независимости от текущей версии.
13:10
navigation> fault management > setup > alarm classes > add alarm class gives 404 page not found, test phase too? :d
13:13
не хочется держать -RELEASE
13:13
qweasd: adding classes from web interface is not implemented yet
13:14
look at fm/collections folder
13:19
dvolodin: почему?
13:21
А как насчет сквозной нумерации interim?
13:24
хочется чтобы релиз был красивой цифрой
13:24
например, 7.0
13:25
в смысле - таг? А зачем? :) Чем 7.0-release хуже 7.0?
13:25
зато понятно, что релиз.
13:26
буков много
13:26
и -re, -pre и так далее
13:26
да и что? :)
13:27
Ну много этих буков... Никто ж не будет ручками писать
13:28
слово из 3 букв на заборах пишут почему?
13:28
потому что всего 3 буквы
13:31
ну ты еще номера версий VRP приведи
13:31
:)
13:31
:)
13:33
но это не мешает многолетний опыт использовать :)
13:35
главная трудность ИМХО сейчас, как определить на какой версии продукта ты работаешь. При этом у продукта есть три стадии - релиз, interim, между interim. так?
13:36
И надо решить две задачи - что показывать пользователю в виде версии и как назвать тэги, чтобы можно было обновиться/откатиться на определенную точку?
13:37
При этом версия должна меняться после релиза на следующую.
13:37
Это верно? Или нет? И я все перепутал?
13:38
статусы - да, будет так
13:39
release, interim, tip
13:40
Всегда ли известен номер следующего релиза?
13:40
не всегда
13:41
предыдущие релизы определялись объемом изменений
13:41
Тогда, может нумеровать interim сквозняком? И в версии выводить interim-XX
13:41
собственно проблема в текущем процессе разработки очень простая
13:41
сделали релиз, дальше пошел полет фантазий
13:42
Соотвественно, если работаем на релизе - видем номер релиза, если работаетм на interim - видем номер сквохной interim'а, если на tip - видим DevelRAAAA
13:42
то есть делаем функционал под текущие задачи, правим найденные баги, делаем целые подсистемы с заделом на будущее
13:42
процесс непрерывный
13:42
рано или позно надо просто остановиться и зарелизиться
13:43
с двумя целями - зафиксировать какое-то стабильное состояние и попиариться по хорошему поводу
13:43
на ранних стадиях развития система работала очень хорошо
13:44
сейчас же в разработке учавствуют и хотят поучавствовать куда больше народу
13:44
и начинаются проблемы
13:44
связанные с необходимостью банального управления
13:45
если 10 разработчиков начнут фантазировать, результат будет напоминать лебедя, рака и щуку
13:45
до настоящего момента боролись с этим жестким ограничением прав
13:46
отдавая на откуп только небольшие участки кодовой базы
13:47
поэтому подход меняется
13:47
в сторону хоть какого-то планирования
13:48
делаются относительно небольшие таски
13:48
is a event class subpart of classification rule or ccw /
13:48
разработчики их разбирают к себе
13:49
под имеющиеся задачи накидывается несколько interim'ов
13:49
и задачи размазываются между ними
13:50
короткий интервал между промежуточными релизами не дает чересчур разлететься фантазии
13:51
и упорядочивает сам процесс разработки
13:54
Хорошо.
13:54
Почему тогда не использовать сквозную нумерацию интеримов?
13:54
qweasd: no, classification rule determines which events fit for given event class
13:55
i have an event class assigned to a classification rule, i added a event trigger with name of the classification rule, i added a user group with notification mail, when i am testing the event the screen is green, does it send an email too ?
13:55
сквозную нумерацию вообще между релизами?
13:55
Напланировал интеримов с 200 по 220. А тут на 212 решили зарелизиться :)
13:55
да. Вообще сквозную. по всему проекту
13:55
qweasd: really, classification rule is bound to class
13:56
think of common event processing flow
13:56
you have a knowledge base, consisting of two parts: classification and correlation rules
13:57
you have a flow of new events
13:57
default rule the one named unhandled exception
13:57
first, they are checking against classification rules by noc-classifier
13:57
i have messages in the events
13:57
i'm using those event id to test
13:59
next they have event class assigned, and depending upon event class have disposed to correlator
14:00
KTO-TO_: допустим, нумерация сквозная
14:00
но как разобраться, между какими релизами попал interim
14:00
?
14:00
but if a event is classified by the class rule
14:00
is it possible to use this event to test 'test event' ?
14:00
and send mail?
14:01
dvolodin: А нафига? Пользователи могут работать или на релизе или на интериме или на tip
14:01
талбличка) с такого то по такой то interhim - такой релиз, c такого то - следующий)
14:02
dvolodin: На релиза? - номер релиза. На интериме? - номер интерима (в скобках можно написать будущую примерную версию). На tip? - dev rAAAA
14:02
there are events in fault management > events and i want to use the event to test the rule and <test> the mail fucntion i defined in the event trigger > notification group
14:02
i named the event class RE: the same as the rule
14:03
qweasd: seemed you gouing wrong way
14:03
what do you want in result?
14:04
trigger something on condition?
14:04
if a rule is hit, a notification group email
14:05
at least you event must match some event class
14:05
which event class do you catching?
14:05
can you describe you task with details?
14:06
KTO-TO_: вот смотри, проблема с другой стороны
14:06
dvolodin: Для кого важно знать между какими релизами интерим? Для разработчиков? для планирования? Для клиента? для тех.поддержки?
14:06
кто-то оформляет багу, которую он нашел в релизе I220
14:06
у нас текущая версия - tip
14:07
последний релиз - 0.6.4
14:07
как они между собой соотнесутся?
14:07
by default there is a classification rule NOC | Unhandled Exception, thisone have a event class NOC | Unhandled exception too. in my fault management > events i have some hits which are classified as NOC | Unhandled Exception
14:08
when i copy / past a event number into a classification rule > test event i get green screens
14:08
so it seems to be working for the 'filter' part
14:08
but now i want to add a notification email
14:08
so when a event class rule is hit, i get an email about this problemn
14:08
so i added a new even trigger
14:08
create event class trigger, select unhandled exception
14:09
as class, fill notification group and template
14:09
and restart noc-classifier
14:09
Если он нашел багу в интериме i220, то надо смотреть починена ли бага позже этого интерима, если нет - то чинить в tip и бага будет починена в следующем интериме (напрмер, i224). И тому, кто нашел багу, в ЛЮБОМ случает надо будет обновиться до I224, т.к. модель
14:09
i cannot select, i need to type, dont know if it makes diff
14:09
i cannot select a template, i created a notification group with email
14:09
KTO-TO_: а вот и неправильно
14:09
Тому кто нашел багу и решил обновиться надо будет очень внимательно читать changelog
14:10
dvolodin: :) А как правильно? :)
14:10
логично, наверное, для начала попросить проапдейтиться до последнего поддерживаемого релиза
14:10
(последний и предпоследний)
14:11
это в безусловном порядке
14:11
или пусть сам backport делает для себя
14:11
is it possible to restart noc-classifier via web?
14:11
Чтобы сделать бэкпорт - надо знать когда починили.
14:11
а дальше - либо ждать следующего релиза, либо interim'а, на который назначили исправление этого бага
14:12
Обновиться до последнего релиза или интерима?
14:12
qweasd: no, refreshing via web is temporary disabled
14:12
waiting for global message passing framework
14:12
KTO-TO_: зависит от параноидальности
14:13
ok, testing with an old event in the class rule > test event does not trigger an email?
14:13
test will not trigger enything
14:13
you must restart noc-classifier and select reclassify event
14:14
then it will be passed through classifier again and will trigger
14:14
dvolodin: Релиз менеджер же знает, на каком интериме - какой релиз был. И тех. поддрежка должна знать :) Поэтому им не составит труда сказать - до куда обновлятся. В принципе, даже табличку можно вести, после какого интерима зарелизились
14:14
KTO-TO_: мы придем к схеме нумерации версий IOS
14:15
с весьма запутанным upgrade path
14:15
реально я вижу примерно такое
14:15
называем версии X.Y.Z(IIII)rAAAA
14:16
rAAAA добавляем только в случае расхождения с последним interim
14:16
goddamn, last q, where do i find the 'select reclassify event' i onyl see change classification rule
14:17
релизы - фактически совпадают с последним interim'ом
14:17
в котором закрыли все задачи
14:17
и номер interim'а для удобства просто опускается
14:17
Только плохо, что найдя багу в 0.7.1(22) мне надо будет заапгрейдиться до 0.7.1 сначала. Не очевидно.
14:17
для interim'а -- указываем ориентировочную целевую версию
14:18
неее
14:18
если у тебя 0.7.1(22) - это значит, что 0.7.1 еще не вышел
14:18
нумерация interim'ов - уникальная для каждой target-ветки
14:18
Ага. Я его поставил, когда 0.7.1 ЕЩЕ не вышел. Нашел багу и написал ПОСЛЕ выходя 0.7.1
14:19
то есть последовательность у нас такая
14:20
0.6.4 -> 0.7(1) -> 0.7(2) -> .... -> 0.7(20), он же просто 0.7 -> 0.7.1(1) -> ... -> 0.7.1(15) -> а тут мы поняли, что опять накодерили и это уже 0.8 -> 0.8(16) -> ... -> 0.8
14:21
или начинаем с 0.8(1)
14:21
при этом делаем так
14:21
ветку 0.7.1 закрываем и никогда не релизим
14:22
все таски, запланированные на interim'ы 0.7.1 скидываем на 0.8(1) и дальше
14:23
0.7.1 в версиях фигурирует в промежуточных, но не релизится
14:24
в любой момент времени имеем
14:24
Может все-таки добавить "pre" до релиза? :) Типа 0.7pre(1) - .. 0.7pre(20) - 0.7
14:25
будущий interim < tip < последний interim < последний релиз
14:26
dvolodin: where do i find 'select reclassify event trigger'
14:26
Это понятно. Смущает только одна вещь, что 0.7(2) - это меньше чем 0.7. А так все хорошо :)
14:26
qweasd: in event viewer
14:26
reclassify button
14:26
KTO-TO_: если бы 0.7(2) был бы больше, то он был бы 0.7.2
14:29
Но мы твердо знаем, что скобки - признак незаконченности
14:30
в общем виде релиз выглядит так 0.7(2)r4895
14:30
если видим буковку r - значит ахтунг, тут девелоперы резвятся, про все баги старательно сообщаем, зная, что они в следующий интерим не войдут
14:30
а может и войдут
14:31
но - если ходим с буковкой "r" - то тестим и не ноем
14:31
дошли до interim'а
14:31
стали 0.7(2)
14:32
если у нас interim, мы надеемся на какую-то стабильность
14:32
dvolodin: не. Стали 0.7(3). разве нет? Номер будущего интерима нигде же не пишем?
14:32
стали 0.7(2)
14:33
у нас версия так выглядит
14:33
ИМХО, 0.7(2) - смотриться как 2-я версия релиза 0.7, а не как - вторая ступень к релизу 0.7
14:33
<целевой релиз> ( <целевой interim>) r<changeset>
14:33
как только доходим до цели - отбрасываем хвост
14:33
сначала changeset
14:34
потом - interim
14:34
чем короче версия, тем меньше багов :)
14:34
да
14:34
:)
14:35
немного невыразительно, действительно
14:35
Красиво. но опятьже ИМХО, можно замучатся объяснять при большой массововсти :) А может и нет
14:36
Просто ИМХО в сознании большенства - чем больше буков - тем исправленее версия :)
14:36
наверное, номера версий я распишу, как выглядит
14:36
надо несколько задач решить махом
14:36
1. дать ответ на вопрос, на какую версию обновляться
14:37
where to debug the trigger / email part ? var/log/noc/* dont display anything about email
14:37
mz
14:37
2. по версии определять, что у нас
14:38
как с этим жить
14:38
наверное так
14:38
в принципе - любая нумерация требует описания
14:39
чет-нечет -- еще более запутанно
14:40
для девероперов такая система будет удобна
14:40
делаем по repo на каждый interim, в котором планируем поучавствовать
14:41
работаем в repo под грядущий interim
14:41
назваем по номеру версии
14:41
например, в таком случае
14:41
0.7(2)/noc/$ hg tip
14:42
hg tip | head -1
14:42
changeset: 4896:ce721c719c67
14:42
мы точно знаем, что находимся на уровне или чуть выше
14:42
0.7(2)r4896
14:42
и в этом repo делаем коммиты
14:43
и отсюда делаем push в основной репо
14:44
если нам приперно сделать что-нибудь наперед - делаем себе репо 0.7(3)
14:44
тупо локальным клоном с 0.7(2)
14:44
играемся как хотим
14:44
вот как раз разработчики то привыкнут к чему угодно :) Тем более что работа идет надо одним интеримом? Или паралельно над несколькими?
14:45
Мержить потом не замучаемся?
14:45
мержит тот, кто забежал вперед
14:45
его задача в момент фиксации 0.7(2) сделать merge со своим 0.7(3)
14:46
а тем кто пишет свои плюшки, чего все ветки ставить?)
14:46
Как понять что ты перестал бежать вперет и теперь из 0.7(3) можно запушить все в основное хранилище?
14:46
после этого вылить все, что у него есть в 0.7(3) запушить в основной хранилище
14:46
А если я случайно запушу из 0.7(3)? :)
14:46
KTO-TO_: выпилим из репо, не беда
14:47
_4ePTeHok: В принципе не обязательно :) мержить только из транка.
14:47
чтобы не запушить случайно - ты делаешь локальный клон и мержишь с локальным
14:47
Ну или протестироваными кусками в момент релиза интеримов
14:47
если по ошибке сделал push - испоганишь только свою локальную копию
14:47
dvolodin: Как разработчик поймет, что уже можно? :)
14:48
анонс от релиз-мастера
14:48
типа все ребята, 0.7(2) зафиксирован
14:48
в jira делаем 0.7(3)
14:49
по идее фиксация как наступает
14:49
закрыты все тикеты
14:49
не завалились unittest'ы в ci.nocproject.org
14:50
в идеале - ручной Q&A дал подтверждение, что все нормально
14:50
как приговор - релиз-мастер делает hg tag 0.7(3) и коммитит его
14:50
при очередном pull все увидят новый тег
14:51
ладно, пойду домой, может набросаю в kb пару статей
14:51
может еще имеет смысл делать interim'ы с меткой RC
14:52
dvolodin: where to debug the email sent part? where can i see if the email is sent via the localpostfix mail server
14:52
если поставили RC - то все новые фичи пойдут в первый interim после релиза
14:52
qweasd: check noc-notifier daemon
14:52
and main > pending notifications
Share this page
Share this page: