C'è un modo per sapere perché un servizio viene riavviato e chi lo ha fatto?

  • Ubuntu 14.04
  • clamav 0.98.7

Il problema viene clamav-daemonriavviato quasi quotidianamente:

Sep  1 06:30:00 x-master clamd[6778]: Pid file removed.
clamd[6778]: --- Stopped at Tue Sep  1 06:30:00 2015
clamd[5979]: clamd daemon 0.98.7 (OS: linux-gnu, ARCH: x86_64, CPU: x86_64)
clamd[5979]: Running as user root (UID 0, GID 0)
clamd[5979]: Log file size limited to 4294967295 bytes.
clamd[5979]: Reading databases from /var/lib/clamav
clamd[5979]: Not loading PUA signatures.
clamd[5979]: Bytecode: Security mode set to "TrustSigned".

Ha causato un problema se clamdscanè in esecuzione:

ERROR: Could not connect to clamd on x.x.x.x: Connection refused

Si noti che ho detto "quasi" all'inizio:

/var/log/syslog:Sep  1 06:30:00 x-master clamd[6778]: Pid file removed.
/var/log/syslog.1:Aug 31 06:27:54 x-master clamd[20128]: Pid file removed.
/var/log/syslog.4.gz:Aug 28 06:28:34 x-master clamd[4475]: Pid file removed.
/var/log/syslog.5.gz:Aug 27 06:27:47 x-master clamd[21466]: Pid file removed.

Come potete vedere:

  • non è successo il 29 e il 30 agosto
  • si riavviava spesso intorno alle 06:27, che è il tempo di cron.dailyesecuzione

    27 6 * * * root nice -n 19 ionice -c3 run-parts --report /etc/cron.daily

Il contenuto di /etc/cron.daily/clamav_scan:

find / $exclude_string ! \( -path "/tmp/clamav-*.tmp" -prune \) ! \( -path "/var/lib/elasticsearch" -prune \) ! \( -path "/var/lib/mongodb" -prune \) ! \( -path "/var/lib/graylog-server" -prune \) -mtime -1 -type f -print0 | xargs -0 clamdscan --quiet -l "$status_file" || retval=$?

Esiste un file logrotate per clamav-daemon:

/var/log/clamav/clamav.log {
     rotate 12
     create 640  clamav adm
     /etc/init.d/clamav-daemon reload-log > /dev/null

ma ricarica semplicemente il registro:

Sep  1 02:30:24 uba-master clamd[6778]: SIGHUP caught: re-opening log file.

So che possiamo usare auditdper monitorare il file binario ed ecco un registro di esempio:

ausearch -f /usr/sbin/clamd                                                                                                        [2/178]
time->Tue Sep  1 07:56:44 2015
type=PATH msg=audit(1441094204.559:15): item=1 name=(null) inode=2756458 dev=fc:00 mode=0100755 ouid=0 ogid=0 rdev=00:00
type=PATH msg=audit(1441094204.559:15): item=0 name="/usr/sbin/clamd" inode=3428628 dev=fc:00 mode=0100755 ouid=0 ogid=0 rdev=00:00
type=CWD msg=audit(1441094204.559:15):  cwd="/"
type=EXECVE msg=audit(1441094204.559:15): argc=1 a0="/usr/sbin/clamd"
type=SYSCALL msg=audit(1441094204.559:15): arch=c000003e syscall=59 success=yes exit=0 a0=7ffd277e03dc a1=7ffd277dfa78 a2=7ffd277dfa88 a3=7ffd277df570 items=2
 ppid=5708 pid=5946 auid=4294967295 uid=109 gid=114 euid=109 suid=109 fsuid=109 egid=114 sgid=114 fsgid=114 tty=pts1 ses=4294967295 comm="clamd" exe="/usr/sbin/clamd" key=(null)

109 è l'UID clamavdell'utente ... :

getent passwd clamav clamav:x:109:114::/var/lib/clamav:/bin/false

Esiste un altro modo per risolvere i problemi in questo caso?

Rispondi a @HBruijn:

Forse FreshCam dopo aver aggiornato le definizioni AV?

Ci ho pensato. Ecco il registro:

Sep  1 05:31:04 x-master freshclam[16197]: Received signal: wake up
Sep  1 05:31:04 x-master freshclam[16197]: ClamAV update process started at Tue Sep  1 05:31:04 2015
Sep  1 05:31:04 x-master freshclam[16197]: main.cvd is up to date (version: 55, sigs: 2424225, f-level: 60, builder: neo)
Sep  1 05:31:05 x-master freshclam[16197]: Downloading daily-20865.cdiff [100%]
Sep  1 05:31:09 x-master freshclam[16197]: daily.cld updated (version: 20865, sigs: 1555338, f-level: 63, builder: neo)
Sep  1 05:31:10 x-master freshclam[16197]: bytecode.cvd is up to date (version: 268, sigs: 47, f-level: 63, builder: anvilleg)
Sep  1 05:31:13 x-master freshclam[16197]: Database updated (3979610 signatures) from db.local.clamav.net (IP:
Sep  1 05:31:13 x-master freshclam[16197]: Clamd successfully notified about the update.
Sep  1 05:31:13 x-master freshclam[16197]: --------------------------------------
Sep  1 04:34:10 x-master clamd[6778]: SelfCheck: Database status OK.
Sep  1 05:31:13 x-master clamd[6778]: Reading databases from /var/lib/clamav
Sep  1 05:31:22 x-master clamd[6778]: Database correctly reloaded (3974071 signatures)

Non ne sono sicuro, ma sembra che freshclam abbia un "meccanismo interno" per informare clamd dell'aggiornamento. E dopo ciò può semplicemente ricaricare il database, non è necessario riavviare il processo. Puoi confermare?

Inoltre, dal timestamp, ho visto che clamav-daemon è stato riavviato dopo un'ora dal database di aggiornamento di freshclam. È normale?

AGGIORNAMENTO mar 1 set 22:10:49 ICT 2015

ma sembra che freshclam abbia un "meccanismo interno" per informare clamd dell'aggiornamento. E dopo ciò può semplicemente ricaricare il database, non è necessario riavviare il processo.

Posso confermare che questo è corretto facendo un test:

  • modifica il file freshclam.conf per cambiare l'intervallo in minuti ( Checks 1440)
  • riavvia clamav-freshclam
  • cd / var / lib / clamav
  • rm daily.cvd
  • aspetta un minuto

    Sep  1 14:49:25 p freshclam[7654]: Downloading daily.cvd [100%]
    Sep  1 14:49:28 p freshclam[7654]: daily.cvd updated (version: 19487, sigs: 1191913, f-level: 63, builder: neo)
    Sep  1 14:49:28 p freshclam[7654]: Reading CVD header (bytecode.cvd):
    Sep  1 14:49:28 p freshclam[7654]: OK
    Sep  1 14:49:28 p freshclam[7654]: bytecode.cvd is up to date (version: 245, sigs: 43, f-level: 63, builder: dgoddard)
    Sep  1 14:49:31 p freshclam[7654]: Database updated (3616181 signatures) from clamav.local (IP:
    Sep  1 14:49:31 p freshclam[7654]: Clamd successfully notified about the update.
    Sep  1 14:49:31 p freshclam[7654]: --------------------------------------
    Sep  1 14:49:32 p clamd[6693]: Reading databases from /var/lib/clamav
    Sep  1 14:49:39 p clamd[6693]: Database correctly reloaded (3610621 signatures)

e il clamav-daemon non viene riavviato.

Ho risposto alla domanda originale.

Non troppo sicuro, quindi il mio commento provvisorio piuttosto che una risposta completa ... ☺

Forse provare a trovare quale processo elimina il file pid clamav? askubuntu.com/questions/48844/…

Non stai usando alcun sistema di gestione della configurazione, ad esempio burattino, cuoco, cfengine, che può interferire?
Soumyadip DM

@SoumyadipDM: mi hai salvato la giornata. Sentiti libero di pubblicare il tuo commento come risposta, lo accetterò e ti darò una taglia: D.



Controlla se stai utilizzando un sistema di gestione della configurazione, ad esempio Puppet, Chef, CFEngine, ecc. Possono interferire con i servizi a intervalli regolari. Perché le azioni esatte da intraprendere per correggere ciò dipendano da come viene utilizzato il servizio nel sistema di gestione della configurazione.


Nota a me stesso.

L'output dalla cache dei lavori:

          ID: clamav-daemon
    Function: service.running
      Result: True
     Comment: Service restarted
     Started: 06:27:52.736890
    Duration: 12997.632 ms

Guarda la formula di clamav:

      - running
      - order: 50
      - require:
        - service: clamav-freshclam
      - watch:
        - pkg: clamav-daemon
        - file: clamav-daemon
        - user: clamav

Nulla negli watchstati ed è stato modificato:

          ID: clamav-daemon
    Function: pkg.latest
      Result: True
     Comment: Package clamav-daemon is already up-to-date.
     Started: 06:27:51.531415
    Duration: 53.224 ms

          ID: clamav-daemon
    Function: file.managed
        Name: /etc/clamav/clamd.conf
      Result: True
     Comment: File /etc/clamav/clamd.conf is in the correct state
     Started: 06:27:51.760019
    Duration: 625.075 ms

          ID: clamav
    Function: user.present
      Result: True
     Comment: User clamav is present and up to date
     Started: 06:27:51.590214
    Duration: 2.455 ms

Perché il servizio è stato riavviato?

Alla ricerca di watch_in, ho trovato uno stato che gestisce il file pid e il servizio verrà riavviato se il file pid ha ricevuto modifiche:

{%- macro manage_pid(path, user, group, watch_in_service, mode=644) -%}
    {%- if salt['file.file_exists'](path) %}
{{ path }}:
    - managed
    - user: {{ user }}
    - group: {{ group }}
    - mode: {{ mode }}
    - replace: False
        {%- if caller is defined -%}
            {%- for line in caller().split("\n") -%}
                {%- if loop.first %}
    - require:
                {%- endif %}
{{ line|trim|indent(6, indentfirst=True) }}
            {%- endfor -%}
        {%- endif %}
    - watch_in:
      - service: {{ watch_in_service }}
    {%- else %}
# {{ path }} does not exist, no need to manage
    {%- endif -%}
{%- endmacro -%}

{%- call manage_pid('/var/run/clamav/clamd.pid', 'clamav', 'clamav', 'clamav-daemon', 664) %}
- pkg: clamav-daemon
{%- endcall %}

Nell'output di salt-run jobs.lookup_jid <job id number>, ho visto questo:

          ID: /var/run/clamav/clamd.pid
    Function: file.managed
      Result: True
     Started: 06:27:52.392555
    Duration: 2.364 ms

Quindi, il proprietario / gruppo di quel file pid è stato modificato in clamav. Infine, ho scoperto che la ragione è che il demone clamav è in esecuzione nella modalità di rete come rootutente. Pertanto, il file pid è stato creato come root. Quindi, lo stato che gestisce il file pid deve essere modificato in qualcosa del tipo:

{%- call manage_pid('/var/run/clamav/clamd.pid', 'root', 'root', 'clamav-daemon', 664) %}
- pkg: clamav-daemon
{%- endcall %}
