]> git.ipfire.org Git - thirdparty/AWStats.git/commitdiff
Updated documentation adding FAQ for processing several log files in one run.
authoreldy <>
Sun, 19 Sep 2004 10:43:44 +0000 (10:43 +0000)
committereldy <>
Sun, 19 Sep 2004 10:43:44 +0000 (10:43 +0000)
docs/awstats_faq.html

index 4975ca5e9e092aefa9a08c000193bbd15e876cbc..20273af1a194dfc8583d394ec489a5da48ae20df 100644 (file)
@@ -61,7 +61,8 @@ FAQ-COM200 <a href="#DNS">How reverse DNS Lookup works, unresolved IP Addresses
 FAQ-COM250 <a href="#DIFFERENT_RESULTS">Different results than other log analyzers (Analog, Webalizer, WUsage, wwwStats...).</a><br>
 FAQ-COM300 <a href="#DIFFERENCE_HOURS">Difference between local hour and AWStats reported hour.</a><br>
 FAQ-COM350 <a href="#OLDLOG">How can I process old log file ?</a><br>
-FAQ-COM400 <a href="#MULTILOG">How can I update my statistics when I use a load balancing system that splits my logs ?</a><br>
+FAQ-COM360 <a href="#MULTILOG">How can I process several log files in one run ?</a><br>
+FAQ-COM400 <a href="#LOADLOG">How can I update my statistics when I use a load balancing system that splits my logs ?</a><br>
 FAQ-COM500 <a href="#RESET">How can I reset all my statistics ?</a><br>
 FAQ-COM600 <a href="#DAILY">How can I compile and build statistics on a daily basis only ?</a><br>
 FAQ-COM700 <a href="#EDITHISTORY">Can I safely remove a line in AWStats history files (awstatsMMYYYY*.txt) ?</a><br>
@@ -811,7 +812,7 @@ So to avoid AWStats to make an already done lookup (with success or not), you
 can set <a href="awstats_config.html#DNSLookup">DNSLookup</a>=0 in AWStats config file.
 If you prefer, you can make the reverse DNS lookup on a log file before running
 your log analyzer (If you only need to convert a logfile with IP Addresses into a
-logfile with resolved hostnames). You can use for this <a href="awstats_config.html#logresolvemerge">logresolvemerge</a> tool
+logfile with resolved hostnames). You can use for this <a href="awstats_tools.html#logresolvemerge">logresolvemerge</a> tool
 provided with AWStats distribution (This tools is an improved version of <i>logresolve</i> provided with Apache).<br>
 <br>
 
@@ -871,7 +872,9 @@ AWStats does not count twice (by default) redirects made by rewrite rules that m
 log files but that are only one page "viewed".<br>
 Etc...<br>
 <br>
-If you want to check how serious is your log analyzer, try to parse the following log file:<br>
+If you want to check how serious is your log analyzer, try to parse the following log file.
+It's a very common log file but results will show you how bad are most log analyzers (above
+all commercial products):<br>
 <table width="95%" border=1 cellpadding=0 cellspacing=0><tr class=CFAQ><td class=CFAQ>
 <i><font style="font: 8px verdana,arial,helvetica">
 <br># This is a sample of log file that contains a lot of various data we can find
@@ -879,12 +882,12 @@ If you want to check how serious is your log analyzer, try to parse the followin
 <br># analyzer.
 <br># ----------------------------------------------------------------------------
 <br># This sample log file contains 10 differents IPs that are :
-<br># 6 human visits done, by 5 different true visitors
-<br># 1 proxy visit done, by one of the 5 true visitors
-<br># 1 try of a 6th human visit failed because of wrong url
-<br># 1 bot visit
+<br># 6 human visits, done by 5 different true visitors
+<br># 1 proxy visit, done by one of the 5 true visitors
+<br># 1 try of a 6th human visit failed because of wrong url (He saw nothing)
+<br># 1 bot visit to index your site
 <br># 1 worm attack
-<br># 1 add to favourites (two hits but first is non root hit with error)
+<br># 1 add to favourites (two hits but first is non root hit with error meaning it's same "add")
 <br># ----------------------------------------------------------------------------
 <br># 80.8.55.1     2 visits (start at 00:00:00 and at 12:00:00 with both entry page on /)
 <br># 80.8.55.2     this is not a visit, only an image included into a page of an other site
@@ -895,8 +898,7 @@ If you want to check how serious is your log analyzer, try to parse the followin
 <br># 80.8.55.7     1 visit (authenticated visitor with space in name)
 <br># 80.8.55.8     not a visit (try but failed twice with 404 and 405 error)
 <br># 80.8.55.9     not a visit (but a worm attack)
-<br># 80.8.55.10    1 visit that come from web page not search engines
-<br># TOTAL:
+<br># 80.8.55.10    1 visit that come from a web page that is not a search engine
 <br>
 <br>80.8.55.1 - - [01/Jan/2001:00:00:10 +0100] "GET /page1.html HTTP/1.0" 200 7009 "-" "Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0)"
 <br>80.8.55.1 - - [01/Jan/2001:00:00:00 +0100] "GET / HTTP/1.0" 200 7009 "http://www.sitereferer/cgi-bin/search.pl?q=a" "Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0)"
@@ -950,7 +952,7 @@ If you want to check how serious is your log analyzer, try to parse the followin
 1 bot visit<br>
 1 worm attack<br>
 The entry pages for true visits should be "/" (even for 80.8.55.1) or "/cgi-bin/order.cgi" but nothing else.<br>
-
+Note: I did not find any commercial log analyzer that can deal such a common log file correctly, so if you find, let me know !<br>
 <br>
 
 <a name="DIFFERENCE_HOURS"></a><br>
@@ -980,12 +982,12 @@ where TZ is value of your signed timezone (+2 for Paris, -8 for ...)<br>
 <br>
 
 <a name="OLDLOG"></a><br>
-<b><u>FAQ-COM350 : HOW CAN I PROCESS OLD LOG FILE ?</u></b><br>
+<b><u>FAQ-COM350 : HOW CAN I PROCESS AN OLD LOG FILE ?</u></b><br>
 <font class=CProblem>PROBLEM:</font><br>
 I want to process an old log file to include its data in my AWStats reports.<br>
 <font class=CSolution>SOLUTION:</font><br>
 You must change your <a href="awstats_config.html#LogFile">LogFile</a> parameter to point to the old log file and run
-the update (or use the -logfile option on command line to overwrite <a href="awstats_config.html#LogFile">LogFile</a> parameter).
+the update (or use the -LogFile option on command line to overwrite <a href="awstats_config.html#LogFile">LogFile</a> parameter).
 The update process can only accept files in chronological order for a particular month, so if you
 have already processed a recent file and forgot to run update
 on a log file that contains older data, you must before reset all
@@ -1008,15 +1010,38 @@ Your statistics are up to date and the missing days are no more missing.<br>
 <br>
 
 <a name="MULTILOG"></a><br>
+<b><u>FAQ-COM360 : HOW CAN I PROCESS SEVERAL LOG FILES IN ONE RUN ?</u></b><br>
+<font class=CProblem>PROBLEM:</font><br>
+How can I update my statistics for several log file, in one run ?<br>
+<font class=CSolution>SOLUTION:</font><br>
+A solution should be to setup your config file with something like:<br>
+<i>LogFile=mylog*.log</i><br>
+However, with such a syntax, AWStats can't know in wich order processing log files (wich log file is the first, next or last). So
+to work like this you must use the following syntax:<br>
+<i>LogFile="/pathto/logresolvemerge.pl mylog*.log |"</i><br>
+<a href="awstats_tools.html#logresolvemerge">Logresolvemerge</a> is a tool provided with
+AWStats (in tools directory) that merge several log files on the fly sending line by line always the older record
+from a list of several log files. Using such a tool as a pipe source for AWStats <a href="awstats_config.html#LogFile">LogFile</a>
+parameter is a very good solution because, it allows you to merge log files whatever their size
+with no memory use, no hard disk use (no temporary files built), it is fast, it prevents
+you from a bad order if your log files are not correctly ordered, etc...<br>
+This tool can also be used to process log files from load balanced systems (see <a href="awstats_faq.html#LOADLOG">FAQ-COM400</a>)<br>
+<br>
+
+<a name="LOADLOG"></a><br>
 <b><u>FAQ-COM400 : HOW CAN I UPDATE MY STATISTICS WHEN I USE A LOAD BALANCING SYSTEM THAT SPLITS MY LOGS ?</u></b><br>
 <font class=CProblem>PROBLEM:</font><br>
 How can I update my statistics when i use a load balancing system that split my logs ?<br>
 <font class=CSolution>SOLUTION:</font><br>
-The best solution is to merge all split log files resulted from all your load balanced servers into one. For this, you can use
-the <a href="awstats_config.html#logresolvemerge">logresolvemerge</a> tool provided with AWStats :<br>
+First solution is to merge all split log files resulted from all your load balanced servers into one. For this, you can use
+the <a href="awstats_tools.html#logresolvemerge">logresolvemerge</a> tool provided with AWStats :<br>
 <i>logresolvemerge.pl file1.log file2.log ... filen.log > newfiletoprocess.log</i><br>
 And setup the <a href="awstats_config.html#LogFile">LogFile</a> parameter in your config file to process the <i>newfiletoprocess.log</i> file or use
-the <i>-logfile</i> command line option to overwrite <a href="awstats_config.html#LogFile">LogFile</a> value.<br>
+the <i>-LogFile</i> command line option to overwrite <a href="awstats_config.html#LogFile">LogFile</a> value.<br>
+As an other solution, if you miss disk space, or to save time, you can ask <a href="awstats_tools.html#logresolvemerge">logresolvemerge</a>
+to merge log files on the fly during the AWStats update process. For this, you can use the following syntax in your AWStats config file:<br>
+<i>LogFile="/pathto/logresolvemerge.pl file*.log |"</i><br>
+See also <a href="awstats_faq.html#MULTILOG">FAQ-COM360</a> for explanation on logresolvemerge use.<br>
 <br>
 
 <a name="RESET"></a><br>
@@ -1140,6 +1165,8 @@ The effect of the bug was more prononced as the page contents increased (above 3
 And also at Apache.org<br>
 <a href="http://www.apache.org/dist/httpd/binaries/win32/">http://www.apache.org/dist/httpd/binaries/win32/</a><br>
 MS produced a Hotfix which is now included in SP1.<br>
+But the best solution is to use a better web browser. Take a look at <a href="http://www.mozilla.org/products/firefox/">Firefox</a>,
+one of the best and most popular web browser.<br>
 <br>
 
 <a name="PERSONALIZEDLOG"></a><br>
@@ -1303,7 +1330,7 @@ ATTENTION: The only solution in this case might be to recompile your GLIBC. This
 task. Please consult the documentation and F.A.Q.s of your linux distribution first!! (experts: first
 check your global compile flags, eg. march=Pentium4. Trying with other compile flags can solve problem
 quickly in some cases.<br>
-NOTE: In some cases, this error might occour "suddenly", even though AWStats was already running
+NOTE: In some cases, this error might occur "suddenly", even though AWStats was already running
 perfect already.<br>
 <br>