<html>
<head>
<style>
 .sw_message P{margin:0px;padding:0px;}
 .sw_message {FONT-SIZE: 12pt;FONT-FAMILY:Tahoma,Arial,Helvetica,sans-serif;background:white;}
 .sw_message blockquote{margin-left:5px;padding-left:5px;border-left:2px solid #144fae;color: #144fae;}
 .sw_message blockquote blockquote{border-left:2px solid #006312;color: #006312;}
 .sw_message blockquote blockquote blockquote{border-left:2px solid #8e5656;color: #8e5656;}
 .sw_message blockquote blockquote blockquote blockquote{border-left:2px solid #888;color: #888;}
</style>
</head>
<body class="sw_message">
<div> </div><div> </div><div id="editor_signature"></div><div>On Monday 08/09/2014 at 9:05 pm, lconrad@go2france.com wrote: </div><blockquote type="cite"><div class="sw_message"><div><br></div><div><br></div><div> </div><div id=""></div><div>On Tuesday 09/09/2014 at 9:22 am, Mike Hoskins (michoski)  wrote: </div><blockquote>Do you guys have max-cache-size set?  I didn't see it in the borderworlds<br>named.conf.  I've seen similar growth problems when testing 9.x before<br>setting that (experiment at the time just to see what would happen, and<br>confirmed this behavior).  Set sensible resource limits based on available<br>resources.<br><br>-----Original Message-----<br>From: Vinícius Ferrão <ferrao@if.ufrj.br><br>Date: Tuesday, September 9, 2014 at 10:17 AM<br>To: Thomas Schulz <schulz@adi.com><br>Cc: "bind-users@isc.org" <bind-users@isc.org><br>Subject: Re: bind-9.10.0-P2 memory leak?<br><br><blockquote>I'm having the exactly same issue. Take a look at my post @ServerFault:<br><a target="_blank" href="http://serverfault.com/questions/616752/bind-9-10-constantly-killed-on-fre">http://serverfau<wbr>lt.com/questions/616752/bind-9-10-constantly-killed-on-fre</a><br>ebsd-10-0-with-out-of-swap-space<br><br>Sent from my iPhone<br><br>On 09/09/2014, at 11:15, "Thomas Schulz" <schulz@adi.com> wrote:<br><br><blockquote><blockquote> Hello<br> <br> I recently upgraded my authoritative nameservers to bind-9.10.0-P2 and<br> after a while one of them ended up using all its swap and the named<br> process got killed. The other servers are seeing similar behaviour,<br>but <br> I restarted named on all of them to postpone further crashes.<br> <br> I am using rate-limiting as well DLZ with PostgreSQL. The server has<br>two <br> views. The operating system is FreeBSD 8.4.<br> <br> My configuration:<br> <a target="_blank" href="http://borderworlds.dk/~xi/named-leak/named.conf">http://borderwor<wbr>lds.dk/~xi/named-leak/named.conf</a><br> <br> Log of the memory usage:<br> <a target="_blank" href="http://borderworlds.dk/~xi/named-leak/named-mem-usage.log">http://borderwor<wbr>lds.dk/~xi/named-leak/named-mem-usage.log</a><br> <br> As you can see, in less than a week, named has grown more than 900MB<br>in <br> size.<br> <br> Is anyone else experiencing something similar?<br> <br> If I need to provide more information, I will be happy to do so.<br> <br> -- <br> Christian Laursen<br></blockquote> <br> What version did you upgrade from? I am seeing bind 9.9.5 and 9.9.6<br> grow without any evidence that it will ever stop. See my mail to this<br> list with the subject "Re: Process size versus cache size." Mine is<br> growing slower than yours, but it is now up to 548 MB.<br> <br> Tom Schulz<br> Applied Dynamics Intl.<br> schulz@adi.com</blockquote></blockquote></blockquote><div><div> freebsd 10.0, bind-9.10.0-p2</div><div><br></div><div>logging the rss field for named process:</div><div><br></div><div><div>less /var/tmp/bind_rss_history.txt</div><div><br></div><div>2014-09-06  17:03:34     338224</div><div>2014-09-06  18:00:00     395828</div><div>2014-09-06  19:00:00     444008</div><div>2014-09-06  20:00:00     487236</div><div>2014-09-06  21:00:00     525892</div><div>2014-09-06  22:00:00     567940</div><div>2014-09-06  23:00:00     611120</div><div>2014-09-07  00:00:00     644772</div><div>2014-09-07  01:00:00     674904</div><div>2014-09-07  02:00:00     700492</div><div>2014-09-07  03:00:00     726364</div><div>2014-09-07  04:00:00     748328</div><div>2014-09-07  05:00:00     774316</div><div>2014-09-07  06:00:00     799064</div><div>2014-09-07  07:00:00     827808</div><div>2014-09-07  08:00:00     867444</div><div>2014-09-07  09:00:00     917444</div><div>2014-09-07  10:00:00     972268</div><div>2014-09-07  11:00:00    1029304</div><div>2014-09-06  17:03:34     338224</div><div>2014-09-06  18:00:00     395828</div><div>2014-09-06  19:00:00     444008</div><div>2014-09-06  20:00:00     487236</div><div>2014-09-06  21:00:00     525892</div><div>2014-09-06  22:00:00     567940</div><div>2014-09-06  23:00:00     611120</div><div>2014-09-07  00:00:00     644772</div><div>2014-09-07  01:00:00     674904</div><div>2014-09-07  02:00:00     700492</div><div>2014-09-07  03:00:00     726364</div><div>2014-09-07  04:00:00     748328</div><div>2014-09-07  05:00:00     774316</div><div>2014-09-07  06:00:00     799064</div><div>2014-09-07  07:00:00     827808</div><div>2014-09-07  08:00:00     867444</div><div>2014-09-07  09:00:00     917444</div><div>2014-09-07  10:00:00     972268</div><div>2014-09-07  11:00:00    1029304</div><div>2014-09-06  17:03:34     338224</div><div>2014-09-06  18:00:00     395828</div><div>2014-09-06  19:00:00     444008</div><div>2014-09-06  20:00:00     487236</div><div>2014-09-06  21:00:00     525892</div><div>2014-09-06  22:00:00     567940</div><div>2014-09-06  23:00:00     611120</div><div>2014-09-07  00:00:00     644772</div><div>2014-09-07  01:00:00     674904</div><div>2014-09-07  02:00:00     700492</div><div>2014-09-07  03:00:00     726364</div><div>2014-09-07  04:00:00     748328</div><div>2014-09-07  05:00:00     774316</div><div>2014-09-07  06:00:00     799064</div><div>2014-09-07  07:00:00     827808</div><div>2014-09-07  08:00:00     867444</div><div>2014-09-07  09:00:00     917444</div><div>2014-09-07  10:00:00     972268</div><div>2014-09-07  11:00:00    1029304</div><div>2014-09-07  12:00:00    1088408</div><div>2014-09-07  13:00:00    1142456</div><div>2014-09-07  14:00:00    1184344</div><div>2014-09-07  15:00:00    1226052</div><div>2014-09-07  16:00:00    1267760</div><div>2014-09-07  17:00:00    1309736</div><div>2014-09-07  18:00:00    1347532</div><div>2014-09-07  19:00:00    1383300</div><div>2014-09-07  20:00:00    1418932</div><div>2014-09-07  21:00:00    1459112</div><div>2014-09-07  22:00:00    1506108</div><div>2014-09-07  23:00:00    1544512</div><div>2014-09-08  00:00:00    1576344</div><div>2014-09-08  01:00:00    1600988</div><div>2014-09-08  02:00:00    1623128</div><div>2014-09-08  03:00:00    1644520</div><div>2014-09-08  04:00:00    1665716</div><div>2014-09-08  05:00:00    1688844</div><div>2014-09-08  06:00:00    1713836</div><div>2014-09-08  07:00:00    1748720</div><div>2014-09-08  08:00:00     240072</div><div>2014-09-08  09:00:00     371388</div><div>2014-09-08  10:00:00     456952</div><div>2014-09-08  11:00:00     530696</div><div>2014-09-08  12:00:00     599792</div><div>2014-09-08  13:00:00     666280</div><div>2014-09-08  14:00:00     727884</div><div>2014-09-08  15:00:00     789672</div><div>2014-09-08  16:00:00     853456</div><div>2014-09-08  17:00:00     916520</div><div>2014-09-08  18:00:00     967940</div><div>2014-09-08  19:00:00    1011616</div><div>2014-09-08  20:00:00    1051452</div><div>2014-09-08  21:00:00    1095352</div><div>2014-09-08  22:00:00    1146388</div><div>2014-09-08  23:00:00    1198776</div><div>2014-09-09  00:00:00    1241256</div><div>2014-09-09  01:00:00    1279640</div><div>2014-09-09  02:00:00    1312936</div><div>2014-09-09  03:00:00    1342592</div><div>2014-09-09  04:00:00    1372092</div><div>2014-09-09  05:00:00    1407444</div><div>2014-09-09  06:00:00    1441632</div><div>2014-09-09  07:00:00    1483464</div></div><div><br></div><div>This never happened with earlier BIND9, and our mx1 uses this recursive BIND machine for all domain/ptr  lookups</div><div><br></div><div>I've never seen any bind take over 1GB of RAM.</div><div><br></div><div>max-cache-size isn't the solution, only a band-aid</div><div><br></div><div>the sawtooth above is from restarting named.</div><div><br></div><div>named has halted twice in the past couple weeks, we suspected some kind of attack, the only trace we had was in syslog with something like "swap space failed, named halted", but with a dedicated DNS box and 3 GB, there should never be any swapping.  I set a watcher for "swap used > 1%".  Got an alert, I saw the named rss to be 1<span style="font-size: 12pt;">.9GB.  restarted bind and wrote the rss named logging script.</span></div><div><br></div><div>Len</div></div><div><br></div></div></blockquote>I added<div><br></div><div>max-cache-size  512m;</div><div><br></div><div>... did rndc reconfig, <span style="font-size: 12pt;">but after 12+ hours</span></div><div><br></div><div><div> ps auxw | egrep named</div><div><br></div><div>USER      PID %CPU %MEM    VSZ    RSS TT  STAT STARTED        TIME COMMAND</div><div><br></div><div>bind    48153 12.9 27.0 869128 843444  -  Rs    3:34PM   111:42.29 /usr/local/sbin/named -t /var/named -u bind -c /usr/local/etc/na</div></div><div><br></div><div>here is the log of bind sizes per hour:</div><div><br></div><div><div>2014-09-22  08:00:00    2313544</div><div>2014-09-22  09:00:00    2364360</div><div>2014-09-22  10:00:00    2417516</div><div>2014-09-22  11:00:00    2473336</div><div>2014-09-22  12:00:00    2525620</div><div>2014-09-22  13:00:00    2574624</div><div>2014-09-22  14:00:00    2625256</div><div>2014-09-22  15:00:00    2665212   < got a MONIT alert that mem swap size > 1%</div><div><br></div><div>2014-09-22  16:00:00     144168   <<<  reconfig with <span style="font-size: 12pt;">max-cache-size  512m;</span></div><div>2014-09-22  17:00:00     229640</div><div>2014-09-22  18:00:00     292020</div><div>2014-09-22  19:00:00     340384</div><div>2014-09-22  20:00:00     382100</div><div>2014-09-22  21:00:00     432468</div><div>2014-09-22  22:00:00     475600</div><div>2014-09-22  23:00:00     511724</div><div>2014-09-23  00:00:00     546976</div><div>2014-09-23  01:00:00     574872</div><div>2014-09-23  02:00:00     599428</div><div>2014-09-23  03:00:00     621684</div><div>2014-09-23  04:00:00     645568</div><div>2014-09-23  05:00:00     672608</div><div>2014-09-23  06:00:00     702096</div><div>2014-09-23  07:00:00     741240</div><div>2014-09-23  08:00:00     789264</div></div><div><br></div><div><div>named -v</div><div>BIND 9.10.0-P2</div></div><div><br></div><div><div>uname -a</div><div>FreeBSD 10.0-RELEASE-p7</div></div><div><br></div><div>Len</div><div><br></div> 
</body></html>