Странные падения системы

Случилось второй раз за, примерно, полтора месяца, что нечасто, но уже настораживает.

Ночью выполняется бэкап зимбры на отдельный диск. Сама зимбра живет на LVM-томе, и перезапуск делается только для того, чтобы между остановом и запуском создать гарантированно консистентный снапшот тома, с которого уже будет делаться бэкап, пока сама зимбра продолжает работать.

Зимбра останавливается, делается снапшот, запускается, а дальше начинается веселье:

May 27 04:01:40 mx40 zimbramon[24634]: 24634:info: Starting snmp via zmcontrol
May 27 04:01:40 mx40 zimbramon[24634]: 24634:info: Starting spell via zmcontrol
May 27 04:01:40 mx40 zimbramon[24634]: 24634:info: Starting mta via zmcontrol
May 27 04:01:41 mx40 sudo:   zimbra : TTY=unknown ; PWD=/data/zimbra ; USER=root ; COMMAND=/opt/zimbra/libexec/zmmtastatus
May 27 04:01:41 mx40 saslauthd[26046]: detach_tty      : master pid is: 26046
May 27 04:01:41 mx40 saslauthd[26046]: ipc_init        : listening on socket: /opt/zimbra/cyrus-sasl-2.1.23.3z/state/mux
May 27 04:01:41 mx40 zimbramon[24634]: 24634:info: Starting stats via zmcontrol
May 27 04:01:44 mx40 sudo:   zimbra : TTY=unknown ; PWD=/data/zimbra ; USER=root ; COMMAND=/opt/zimbra/libexec/zmstat-fd
May 27 04:01:59 mx40 clamd[25957]: Reading databases from /opt/zimbra/data/clamav/db
May 27 00:02:00 mx40 postfix/postqueue[26719]: fatal: Queue report unavailable - mail system is down
May 27 04:02:04 mx40 clamd[25957]: Database correctly reloaded (846254 signatures)
May 27 04:02:07 mx40 sudo:   zimbra : TTY=unknown ; PWD=/data/zimbra ; USER=root ; COMMAND=/opt/zimbra/libexec/zmmailboxdmgr status
May 27 04:02:07 mx40 zmmailboxdmgr[27075]: status requested
May 27 04:02:07 mx40 zmmailboxdmgr[27075]: status OK
May 27 04:02:07 mx40 sudo:   zimbra : TTY=unknown ; PWD=/data/zimbra ; USER=root ; COMMAND=/opt/zimbra/libexec/zmmtastatus
May 27 00:02:30 mx40 postfix/postqueue[27239]: fatal: Queue report unavailable - mail system is down
May 27 00:03:00 mx40 postfix/postqueue[27274]: fatal: Queue report unavailable - mail system is down

Постфиксу во время старта поплохело и последние строчки будут сыпаться до полного рестарта либо zmmta либо всей зимбры (как повезет, мы уже даже не задумываясь перезапускаем всё, настолько оно стало глючное).

При этом в консоль service zimbra start отрапортовал, что всё отлично:

Fri May 27 04:00:01 MSD 2011 Stopping zimbra...
Host mx40
        Stopping stats...Done.
        Stopping mta...Done.
        Stopping spell...Done.
        Stopping snmp...Done.
        Stopping cbpolicyd...Done.
        Stopping archiving...Done.
        Stopping antivirus...Done.
        Stopping antispam...Done.
        Stopping imapproxy...Done.
        Stopping memcached...Done.
        Stopping mailbox...Done.
        Stopping logger...Done.
        Stopping zmconfigd...Done.
        Stopping ldap...Done.
Fri May 27 04:00:34 MSD 2011 Creating snapshot
  Logical volume "zmsnapshot" created
Fri May 27 04:00:36 MSD 2011 Starting zimbra...
Host mx40
        Starting ldap...Done.
        Starting zmconfigd...Done.
        Starting logger...Done.
        Starting mailbox...Done.
        Starting memcached...Done.
        Starting imapproxy...Done.
        Starting antispam...Done.
        Starting antivirus...Done.
        Starting snmp...Done.
        Starting spell...Done.
        Starting mta...Done.
        Starting stats...Done.
Fri May 27 04:01:42 MSD 2011 Mounting and backing up...

Есть у кого-нибудь идеи, куда лечить? Чем копать?
PS: На форумах зимбры этот момент был проигнорирован, что характерно.

Комментарии

если не сложно при отваливании что оно показывает

zmcontrol status

а так http://www.ossportal.ru/forum/zimbra/223 и если это то что было у меня, то надеюсь поможет.

Желаю удачного дня

Если зимбра 7.1.1, то:

1. Ставишь патч

http://files2.zimbra.com/downloads/7.1.1_GA/zcs-patch-7.1.1_GA_3213.tgz

2. su - zimbra
zmcontrol restart

3. под root:

/opt/zimbra/libexec/zmfixperms --verbose --extended

4. su - zimbra
zmcontrol restart

мне помогло

Есть небольшое решение и мне оно помогло.
Недавно обновил Zimbr'у до версии 8.0.6 и получил вот такую ошибку при запуске:

"postfix/postqueue[5256]: fatal: Queue report unavailable - mail system is down"

Покурив несколько форумов, в том числе и официальный, нашел сообщение от наших забугорных друзей, что оказываеться файл master.pid при необычных обстоятельствах крашится, поэтому было принято решение его удалить, что впринципе и было сделано.

Файл лежит вот поэтому пути /opt/zimbra/data/postfix/spool/pid
После этого перезапускаем сервисы и вуаля, postfix снова работает.
 
мне, в версии 8.5.0, удаление файла  master.pid не помогло, а наоборот mta перестал запускаться совсем, несмотря на то, что файл система пересоздала, воевал с этим минут 30-ть, потом вернул на место старый master.pid (я его сохранял на всякий пожарный) и все заработало...