Hi,<div><br></div><div>We have several recursive cache bind servers and experiencing weird things when named is compiled with-threads:</div><div><br></div><div>In 4 steps:</div><div><br></div><div>1) everything goes ok</div>
<div><br></div><div>2) for ~1h named began to answer slower (0,5ms to >100ms) and with symptoms:</div><div>  - load increase on the server (from 0,3 to >4)</div><div>  - number of recursive queries increase (+500%)</div>
<div>  - number of recursive slot increase (from 200 to 600)</div><meta http-equiv="content-type" content="text/html; charset=utf-8"><div>  - cache hit decrease (from 9X% to </div><div>  - number of cache entries drops from 2M to 0</div>
<div><br></div><div>3) named answer no query</div><div>  - no recursive queries</div><div>  - 0 entry in cache</div><div>  - rndc stats/status works</div><div><br></div><div>4) We flush the named cache (rndc flush) and everything goes ok</div>
<div><br></div><div>We do a "rndc stats" every minute to get some stats.</div><div><br></div><div>Hardware:</div><div> - intel or amd with a total of 4 or 8 cores</div><div> - solaris 10</div><div> - bind 9.6.2 with threads (gcc) or bind 9.5.1-P3 with threads (SUNWspro)</div>
<div><br></div><div>any clue ?</div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div>some numbers from named.stats :</div><div><br></div><div><div>++ Name Server Statistics ++</div>
</div><div><div>       437118882 IPv4 requests received</div></div><div><div>++ Zone Maintenance Statistics ++</div><div>++ Resolver Statistics ++</div></div><div><div>         120096973 IPv4 queries sent</div></div><div>
<div>           29784114 queries with RTT < 10ms</div><div>           49289542 queries with RTT 10-100ms</div><div>           33448291 queries with RTT 100-500ms</div><div>               277957 queries with RTT 500-800ms</div>
<div>               105059 queries with RTT 800-1600ms</div><div>                 31079 queries with RTT > 1600ms</div></div><div><br></div><div><div>[View: _bind]</div><div>++ Socket I/O Statistics ++</div><div>           120075062 UDP/IPv4 sockets opened</div>
<div>                   35059 TCP/IPv4 sockets opened</div><div>           120074870 UDP/IPv4 sockets closed</div><div>                   42651 TCP/IPv4 sockets closed</div><div>                   13116 UDP/IPv4 socket bind failures</div>
<div>                     5513 TCP/IPv4 socket connect failures</div><div>           120061921 UDP/IPv4 connections established</div><div>                     6901 TCP/IPv4 connections established</div><div>                     7599 TCP/IPv4 connections accepted</div>
<div>                 276089 UDP/IPv4 recv errors</div><div>                       315 TCP/IPv4 recv errors</div></div><div><div>++ Cache DB RRsets ++</div><div>[View: mire]</div><div>[View: abonnes]</div><div>              885677 A</div>
<div>              751488 NS</div><div>              171869 CNAME      </div><div>              144655 PTR</div><div>              312051 MX</div><div>                41667 RRSIG</div><div>                38816 NSEC      </div>
<div>              130572 NXDOMAIN</div></div><div><br></div><div>-- <br>Fabien<br>
</div>