<div>On Mon, Mar 12, 2012 at 3:37 PM, Kevin Oberman <span dir="ltr"><<a href="mailto:kob6558@gmail.com">kob6558@gmail.com</a>></span> wrote:<br></div><div><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="HOEnZb"><div class="h5">On Mon, Mar 12, 2012 at 12:05 PM, Mr X <<a href="mailto:xproject128@gmail.com">xproject128@gmail.com</a>> wrote:<br>
> Hey there<br>
><br>
> I'm having a bizarre issue with 9.7.3-P3-RedHat-9.7.3-8.P3.el6_2.2 -<br>
> recursive queries stop functioning after bind has been running for a few<br>
> hours. It's a very low volume system (dev), maybe a few queries per hour at<br>
> most. It's not due to cache filling or anything like I've dealt with in the<br>
> past. I suspect it's related to DNSSEC and root-server validation but I<br>
> could use another set of eyes on my debug log. Sorry for posting from a<br>
> inconspicuous e-mail address. My employer asks that I'm careful about the<br>
> information I disclose on public mailing lists.<br>
><br>
> You can see my debug log during a failed query<br>
> <a href="http://pastebin.com/5hh05WjM" target="_blank">http://pastebin.com/5hh05WjM</a><br>
><br>
> Successful query here<br>
> <a href="http://pastebin.com/H9qSQcyG" target="_blank">http://pastebin.com/H9qSQcyG</a><br>
><br>
> If you would like to see my config, I can include portions, but it's huge so<br>
> please let me know exactly what parts you're looking for.<br>
<br>
</div></div>You are getting timeouts for some reason. The obvious question is<br>
whether the queries are actually being sent or whether they and and<br>
responses are not coming back. Or,perhaps the response IS coming back,<br>
but named is not picking them up.<br>
<br>
Could you try getting a packet capture? As these are UDP and assuming<br>
Unix, something like 'tcpdump -w badquery.bpf -s0 -p port 53`. This<br>
will capture all DNS traffic to/from this system, but you say it is<br>
not all that much, so it should be tractable.<br>
<br>
Once you have captured the data, you can use a tool like wireshark to<br>
look at it.<br>
<span class="HOEnZb"><font color="#888888"></font></span></blockquote><div><br></div><div><br></div><div>I had to sanitize some data, so the -vvv output of the packet capture is here:<div><br></div><div><a href="http://pastebin.com/GKSspL2L">http://pastebin.com/GKSspL2L</a></div>
</div><div><br></div><div>Unfortunately this server is both authoritative and recursive. I have an upcoming project to segment these two functions, but for now getting this host operational is my priority. It's also worth mentioning that I have IO data center nameservers as a forwarder as seen in this packet capture. When bind is in a failed state I can query against these nameservers directly - so I had not considered this a potential cause.</div>
<div><br></div><div>I really appreciate everyones help.</div><div> <br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="HOEnZb"><font color="#888888">--<br>

R. Kevin Oberman, Network Engineer<br>
E-mail: <a href="mailto:kob6558@gmail.com">kob6558@gmail.com</a><br>
</font></span></blockquote></div><br></div>