<html>
<head>
<style>
 .sw_message P{margin:0px;padding:0px;}
 .sw_message {FONT-SIZE: 12pt;FONT-FAMILY:Tahoma,Arial,Helvetica,sans-serif;background:white;}
 .sw_message blockquote{margin-left:5px;padding-left:5px;border-left:2px solid #144fae;color: #144fae;}
 .sw_message blockquote blockquote{border-left:2px solid #006312;color: #006312;}
 .sw_message blockquote blockquote blockquote{border-left:2px solid #8e5656;color: #8e5656;}
 .sw_message blockquote blockquote blockquote blockquote{border-left:2px solid #888;color: #888;}
</style>
</head>
<body class="sw_message">
<div><br></div><div><br></div><div> </div><div id="editor_signature"></div><div>On Tuesday 09/09/2014 at 9:22 am, Mike Hoskins (michoski)  wrote: </div><blockquote type="cite">Do you guys have max-cache-size set?  I didn't see it in the borderworlds<br>named.conf.  I've seen similar growth problems when testing 9.x before<br>setting that (experiment at the time just to see what would happen, and<br>confirmed this behavior).  Set sensible resource limits based on available<br>resources.<br><br>-----Original Message-----<br>From: Vinícius Ferrão <ferrao@if.ufrj.br><br>Date: Tuesday, September 9, 2014 at 10:17 AM<br>To: Thomas Schulz <schulz@adi.com><br>Cc: "bind-users@isc.org" <bind-users@isc.org><br>Subject: Re: bind-9.10.0-P2 memory leak?<br><br><blockquote type="cite">I'm having the exactly same issue. Take a look at my post @ServerFault:<br><a target="_blank" href="http://serverfault.com/questions/616752/bind-9-10-constantly-killed-on-fre">http://serverfault.com/questions/616752/bind-9-10-constantly-killed-on-fre</a><br>ebsd-10-0-with-out-of-swap-space<br><br>Sent from my iPhone<br><br>On 09/09/2014, at 11:15, "Thomas Schulz" <schulz@adi.com> wrote:<br><br><blockquote type="cite"><blockquote type="cite"> Hello<br> <br> I recently upgraded my authoritative nameservers to bind-9.10.0-P2 and<br> after a while one of them ended up using all its swap and the named<br> process got killed. The other servers are seeing similar behaviour,<br>but <br> I restarted named on all of them to postpone further crashes.<br> <br> I am using rate-limiting as well DLZ with PostgreSQL. The server has<br>two <br> views. The operating system is FreeBSD 8.4.<br> <br> My configuration:<br> <a target="_blank" href="http://borderworlds.dk/~xi/named-leak/named.conf">http://borderworlds.dk/~xi/named-leak/named.conf</a><br> <br> Log of the memory usage:<br> <a target="_blank" href="http://borderworlds.dk/~xi/named-leak/named-mem-usage.log">http://borderworlds.dk/~xi/named-leak/named-mem-usage.log</a><br> <br> As you can see, in less than a week, named has grown more than 900MB<br>in <br> size.<br> <br> Is anyone else experiencing something similar?<br> <br> If I need to provide more information, I will be happy to do so.<br> <br> -- <br> Christian Laursen<br></blockquote> <br> What version did you upgrade from? I am seeing bind 9.9.5 and 9.9.6<br> grow without any evidence that it will ever stop. See my mail to this<br> list with the subject "Re: Process size versus cache size." Mine is<br> growing slower than yours, but it is now up to 548 MB.<br> <br> Tom Schulz<br> Applied Dynamics Intl.<br> schulz@adi.com</blockquote></blockquote></blockquote><div><div> freebsd 10.0, bind-9.10.0-p2</div><div><br></div><div>logging the rss field for named process:</div><div><br></div><div><div>less /var/tmp/bind_rss_history.txt</div><div><br></div><div>2014-09-06  17:03:34     338224</div><div>2014-09-06  18:00:00     395828</div><div>2014-09-06  19:00:00     444008</div><div>2014-09-06  20:00:00     487236</div><div>2014-09-06  21:00:00     525892</div><div>2014-09-06  22:00:00     567940</div><div>2014-09-06  23:00:00     611120</div><div>2014-09-07  00:00:00     644772</div><div>2014-09-07  01:00:00     674904</div><div>2014-09-07  02:00:00     700492</div><div>2014-09-07  03:00:00     726364</div><div>2014-09-07  04:00:00     748328</div><div>2014-09-07  05:00:00     774316</div><div>2014-09-07  06:00:00     799064</div><div>2014-09-07  07:00:00     827808</div><div>2014-09-07  08:00:00     867444</div><div>2014-09-07  09:00:00     917444</div><div>2014-09-07  10:00:00     972268</div><div>2014-09-07  11:00:00    1029304</div><div>2014-09-06  17:03:34     338224</div><div>2014-09-06  18:00:00     395828</div><div>2014-09-06  19:00:00     444008</div><div>2014-09-06  20:00:00     487236</div><div>2014-09-06  21:00:00     525892</div><div>2014-09-06  22:00:00     567940</div><div>2014-09-06  23:00:00     611120</div><div>2014-09-07  00:00:00     644772</div><div>2014-09-07  01:00:00     674904</div><div>2014-09-07  02:00:00     700492</div><div>2014-09-07  03:00:00     726364</div><div>2014-09-07  04:00:00     748328</div><div>2014-09-07  05:00:00     774316</div><div>2014-09-07  06:00:00     799064</div><div>2014-09-07  07:00:00     827808</div><div>2014-09-07  08:00:00     867444</div><div>2014-09-07  09:00:00     917444</div><div>2014-09-07  10:00:00     972268</div><div>2014-09-07  11:00:00    1029304</div><div>2014-09-06  17:03:34     338224</div><div>2014-09-06  18:00:00     395828</div><div>2014-09-06  19:00:00     444008</div><div>2014-09-06  20:00:00     487236</div><div>2014-09-06  21:00:00     525892</div><div>2014-09-06  22:00:00     567940</div><div>2014-09-06  23:00:00     611120</div><div>2014-09-07  00:00:00     644772</div><div>2014-09-07  01:00:00     674904</div><div>2014-09-07  02:00:00     700492</div><div>2014-09-07  03:00:00     726364</div><div>2014-09-07  04:00:00     748328</div><div>2014-09-07  05:00:00     774316</div><div>2014-09-07  06:00:00     799064</div><div>2014-09-07  07:00:00     827808</div><div>2014-09-07  08:00:00     867444</div><div>2014-09-07  09:00:00     917444</div><div>2014-09-07  10:00:00     972268</div><div>2014-09-07  11:00:00    1029304</div><div>2014-09-07  12:00:00    1088408</div><div>2014-09-07  13:00:00    1142456</div><div>2014-09-07  14:00:00    1184344</div><div>2014-09-07  15:00:00    1226052</div><div>2014-09-07  16:00:00    1267760</div><div>2014-09-07  17:00:00    1309736</div><div>2014-09-07  18:00:00    1347532</div><div>2014-09-07  19:00:00    1383300</div><div>2014-09-07  20:00:00    1418932</div><div>2014-09-07  21:00:00    1459112</div><div>2014-09-07  22:00:00    1506108</div><div>2014-09-07  23:00:00    1544512</div><div>2014-09-08  00:00:00    1576344</div><div>2014-09-08  01:00:00    1600988</div><div>2014-09-08  02:00:00    1623128</div><div>2014-09-08  03:00:00    1644520</div><div>2014-09-08  04:00:00    1665716</div><div>2014-09-08  05:00:00    1688844</div><div>2014-09-08  06:00:00    1713836</div><div>2014-09-08  07:00:00    1748720</div><div>2014-09-08  08:00:00     240072</div><div>2014-09-08  09:00:00     371388</div><div>2014-09-08  10:00:00     456952</div><div>2014-09-08  11:00:00     530696</div><div>2014-09-08  12:00:00     599792</div><div>2014-09-08  13:00:00     666280</div><div>2014-09-08  14:00:00     727884</div><div>2014-09-08  15:00:00     789672</div><div>2014-09-08  16:00:00     853456</div><div>2014-09-08  17:00:00     916520</div><div>2014-09-08  18:00:00     967940</div><div>2014-09-08  19:00:00    1011616</div><div>2014-09-08  20:00:00    1051452</div><div>2014-09-08  21:00:00    1095352</div><div>2014-09-08  22:00:00    1146388</div><div>2014-09-08  23:00:00    1198776</div><div>2014-09-09  00:00:00    1241256</div><div>2014-09-09  01:00:00    1279640</div><div>2014-09-09  02:00:00    1312936</div><div>2014-09-09  03:00:00    1342592</div><div>2014-09-09  04:00:00    1372092</div><div>2014-09-09  05:00:00    1407444</div><div>2014-09-09  06:00:00    1441632</div><div>2014-09-09  07:00:00    1483464</div></div><div><br></div><div>This never happened with earlier BIND9, and our mx1 uses this recursive BIND machine for all domain/ptr  lookups</div><div><br></div><div>I've never seen any bind take over 1GB of RAM.</div><div><br></div><div>max-cache-size isn't the solution, only a band-aid</div><div><br></div><div>the sawtooth above is from restarting named.</div><div><br></div><div>named has halted twice in the past couple weeks, we suspected some kind of attack, the only trace we had was in syslog with something like "swap space failed, named halted", but with a dedicated DNS box and 3 GB, there should never be any swapping.  I set a watcher for "swap used > 1%".  Got an alert, I saw the named rss to be 1<span style="font-size: 12pt;">.9GB.  restarted bind and wrote the rss named logging script.</span></div><div><br></div><div>Len</div></div><div><br></div> 
</body></html>