]> git.ipfire.org Git - thirdparty/AWStats.git/commitdiff
Update search engine database
authoreldy <>
Thu, 25 May 2006 00:18:32 +0000 (00:18 +0000)
committereldy <>
Thu, 25 May 2006 00:18:32 +0000 (00:18 +0000)
wwwroot/cgi-bin/lib/search_engines.pm

index b6f4a2f05af73074ec5548581ea3050e1750da0a..95172510500ad89c6154032bae3b348c663a5092 100644 (file)
 #                     internationnal -> international
 #            added 'google\.'=>'mail\.google\.', to NotSearchEnginesKeys in order to
 #            avoid counting gmail referrals as search engine traffic
-# 2005-08-21 Sean Carlos http://www.antezeta.com/awstats.html:
+# 2005-08-21 Sean Carlos http://www.antezeta.com/awstats.html
 #            avoid counting babelfish.altavista referrals as search engine traffic
 #            avoid counting translate.google referrals as search engine traffic
 # 2005-11-20 Sean Carlos
 #           added missing 'tiscali','key=', entry.  Check order
 # 2005-11-22 Sean Carlos
 #           added Google Base & Froogle.  Froogle not tested.
+# 2006-04-18 Sean Carlos http://www.antezeta.com/awstats.html
+#           added biglotron.com (France)
+#           added blingo http://www.blingo.com/
+#           added Clusty & Vivisimo
+#           added eniro.no (Norway) [https://sourceforge.net/forum/message.php?msg_id=3134783]
+#           added GPU p2p search http://search.centraldatabase.org/
+#           added mail.tiscali to "not search engines list" [https://sourceforge.net/forum/message.php?msg_id=3166688]
+#           added Ask group's "mysearch"
+#           added sify.com (India)
+#           added sogou.com (Cina) [https://sourceforge.net/forum/message.php?msg_id=3501603]
+#           Ask changes:
+#           - added Ask Japan (ask.jp) 
+#           - break out Ask new country level variants (DE, ES, FR, IT, NL)
+#           - updated Ask name from Ask Jevees
+#           - added Ask q= parameter - many recent searches probably not recognized; [https://sourceforge.net/forum/message.php?msg_id=3465444]
+#           - updated Ask uk (new uk.ask.com added to older ask.co.uk)
+#           updated voila kw|rdata parameter [https://sourceforge.net/forum/message.php?msg_id=3373912]
+#           for each new engine, added link to Search Engine.  This serves to document engine. Done for major & Italian engines as well. Requires patch
+#              to AWStats to allow untranslated html.  Otherwise html will appear instead of link.
+#           reviewed mnoGoSearch (http://www.mnogosearch.org/); the search engined mentioned no longer
+#              exists https://sourceforge.net/forum/message.php?msg_id=3025426
+# 2006-05-13 Sean Carlos http://www.antezeta.com/awstats.html
+#            added 10 Chello European broadband portals (Austria, Belgium, Czech Republic, France, Hungary, The Netherlands, Norway, Poland, Slovakia, Sweden)
+#           added Alice Internal Search (blends data with Google?) search.alice.it.master:10005
+#            added detection of google cache views from IPs 66.249.93.104 72.14.203.104 72.14.207.104
+#              To do: add more extensive IP list; keywords not yet detected.
+#            added icerocket.com blog search http://www.icerocket.com/
+#           added live.com (msn) http://www.live.com/
+#           added Meta motor kartoo.  Note: Kartoo does not provide search words in referrers, thus the engine will appear in the
+#              search engine list but the actual search words are not available.
+#           added netluchs.de http://www.netluchs.de/
+#           added sphere.com blog search http://www.sphere.com/
+#           added wwweasel.de http://wwweasel.de
+#           added Yahoo Mindset! http://mindset.research.yahoo.com/
+#            updated Mirago query parameter recognition (qry=); added breakout for each country (France, Germany, Spain, Italy, Norway, Sweden, Denmark, Netherlands, Belgium, Switzerland)
+# 2006-05-13 
+#           added Google cache IPs 64.233.183.104 & 66.102.7.104
+# 2006-05-20 
+#              anzwers.com.au
+#              schoenerbrausen.de http://www.schoenerbrausen.de/
+#              216.239.59.104
+#              answerbus http://www.answerbus.com/
 
 #package AWSSE;
 
 'base\.google\.',
 'froogle\.google\.',
 'images\.google\.',
-'google\.','216\.239\.(35\.101|37\.101|39\.100|39\.101|51\.100|51\.101|35\.100)',
+'google\.','216\.239\.(35\.101|37\.101|39\.100|39\.101|51\.100|51\.101|35\.100|59\.104)',
+'64\.233\.183\.104',
+'66\.102\.7\.104',
+'66\.249\.93\.104',
+'72\.14\.(203\.104|207\.104)',
 'msn\.',
+'live\.com',
 'voila\.',
+'mindset\.research\.yahoo',
 'yahoo\.','(66\.218\.71\.225|216\.109\.117\.135)',
 'search\.aol\.co',
 'tiscali\.',
 'looksmart\.',
 'spray\.',
 'nbci\.com/search',
+'de\.ask.\com', # break out Ask country specific engines.  (.jp is in Japan section)
+'es\.ask.\com',
+'fr\.ask.\com',
+'it\.ask.\com',
+'nl\.ask.\com',
+'uk\.ask.\com',
 '(^|\.)ask\.com',
 'atomz\.',
 'overture\.com',               # Replace 'goto\.com','Goto.com',
 'ixquick\.com',
 'search\.earthlink\.net', 
 'i-une\.com',
+'blingo\.com',
+'centraldatabase\.org',
+'clusty\.com',
+'mysearch\.',
+'vivisimo\.com',
+'kartoo\.com',
+'icerocket\.com',
+'sphere\.com',
+# Chello Portals
+'chello\.at',
+'chello\.be',
+'chello\.cz',
+'chello\.fr',
+'chello\.hu',
+'chello\.nl',
+'chello\.no',
+'chello\.pl',
+'chello\.se',
+'chello\.sk',
+'chello', # required as catchall for new countries not yet known
+# Mirago 
+'mirago\.be',
+'mirago\.ch',
+'mirago\.de',
+'mirago\.dk',
+'es\.mirago\.com',
+'mirago\.fr',
+'mirago\.it',
+'mirago\.nl',
+'no\.mirago\.com',
+'mirago\.se',
+'mirago\.co\.uk',
+'mirago', # required as catchall for new countries not yet known
+'answerbus\.com',
+# Minor Australian search engines
+'anzwers\.com\.au',
 # Minor brazilian search engines
 'engine\.exe', 'miner\.bol\.com\.br',
 # Minor chinese search engines
-'baidu\.com','search\.sina\.com','search\.sohu\.com',
+'baidu\.com','search\.sina\.com','search\.sohu\.com', 'sogou\.com',
 # Minor czech search engines
 'atlas\.cz','seznam\.cz','quick\.cz','centrum\.cz','jyxo\.(cz|com)','najdi\.to','redbox\.cz',
 # Minor danish search-engines 
 # Minor dutch search engines
 'ilse\.','vindex\.',
 # Minor english search engines
-'(^|\.)ask\.co\.uk','bbc\.co\.uk/cgi-bin/search','ifind\.freeserve','looksmart\.co\.uk','mirago\.','splut\.','spotjockey\.','ukdirectory\.','ukindex\.co\.uk','ukplus\.','searchy\.co\.uk',
+'(^|\.)ask\.co\.uk','bbc\.co\.uk/cgi-bin/search','ifind\.freeserve','looksmart\.co\.uk','splut\.','spotjockey\.','ukdirectory\.','ukindex\.co\.uk','ukplus\.','searchy\.co\.uk',
 # Minor finnish search engines
 'haku\.www\.fi',
 # Minor french search engines
 'recherche\.aol\.fr','ctrouve\.','francite\.','\.lbb\.org','rechercher\.libertysurf\.fr', 'search[\w\-]+\.free\.fr', 'recherche\.club-internet\.fr',
-'toile\.com', 
+'toile\.com', 'biglotron\.com', 
 # Minor german search engines
 'sucheaol\.aol\.de',
 'fireball\.de','infoseek\.de','suche\d?\.web\.de','[a-z]serv\.rrzn\.uni-hannover\.de',
 'suchen\.abacho\.de','brisbane\.t-online\.de','allesklar\.de','meinestadt\.de',
 '212\.227\.33\.241',
 '(161\.58\.227\.204|161\.58\.247\.101|212\.40\.165\.90|213\.133\.108\.202|217\.160\.108\.151|217\.160\.111\.99|217\.160\.131\.108|217\.160\.142\.227|217\.160\.176\.42)',
+'wwweasel\.de',
+'netluchs\.de',
+'schoenerbrausen\.de',
 # Minor hungarian search engines
 'heureka\.hu','vizsla\.origo\.hu','lapkereso\.hu','goliat\.hu','index\.hu','wahoo\.hu','webmania\.hu','search\.internetto\.hu',
+# Minor Indian search engines
+'sify\.com',
 # Minor italian search engines
-'virgilio\.it','arianna\.libero\.it','supereva\.com','kataweb\.it',
-# Minor norvegian search engines
-'sok\.start\.no',
+'virgilio\.it','arianna\.libero\.it','supereva\.com','kataweb\.it','search\.alice\.it\.master',
+# Minor Japanese search engines
+'ask\.jp',
+# Minor Norwegian search engines
+'sok\.start\.no', 'eniro\.no',
 # Minor polish search engines
 'szukaj\.wp\.pl',
 # Minor russian search engines
 'google\.'=>'mail\.google\.',
 'google\.'=>'translate\.google\.',
 'msn\.'=>'hotmail\.msn\.',
+'tiscali\.'=>'mail\.tiscali\.',
 'yahoo\.'=>'mail\.yahoo\.'
 );
 
 'base\.google\.','google_base',
 'froogle\.google\.','google_froogle',
 'images\.google\.','google_image',
-'google\.','google','216\.239\.(35\.101|37\.101|39\.100|39\.101|51\.100|51\.101|35\.100)','google',
+'google\.','google','216\.239\.(35\.101|37\.101|39\.100|39\.101|51\.100|51\.101|35\.100|59\.104)','google',
+'64\.233\.183\.104','google_cache',
+'66\.102\.7\.104','google_cache',
+'66\.249\.93\.104','google_cache',
+'72\.14\.(203\.104|207\.104)','google_cache',
 'msn\.','msn',
+'live\.com','live',
 'voila\.','voila',
+'mindset\.research\.yahoo','yahoo_mindset',
 'yahoo\.','yahoo','(66\.218\.71\.225|216\.109\.117\.135)','yahoo',
 'lycos\.','lycos',
 'alexa\.com','alexa',
 'looksmart\.','looksmart',
 'spray\.','spray',
 'nbci\.com/search','nbci',
+'de\.ask.\com','askde', # break out Ask country specific engines.
+'es\.ask.\com','askes',
+'fr\.ask.\com','askfr',
+'it\.ask.\com','askit',
+'nl\.ask.\com','asknl',
+'uk\.ask.\com','askuk',
+'(^|\.)ask\.co\.uk','askuk',
 '(^|\.)ask\.com','ask',
 'atomz\.','atomz',
 'overture\.com','overture',            # Replace 'goto\.com','Goto.com',
 'ixquick\.com','ixquick',
 'search\.earthlink\.net','earthlink',
 'i-une\.com','iune',
+'blingo\.com','blingo',
+'centraldatabase\.org','centraldatabase',
+'clusty\.com','clusty',
+'mysearch\.','mysearch',
+'vivisimo\.com','vivisimo',
+'kartoo\.com','kartoo',
+'icerocket\.com','icerocket',
+'sphere\.com','sphere',
+# Chello Portals
+'chello\.at','chelloat',
+'chello\.be','chellobe',
+'chello\.cz','chellocz',
+'chello\.fr','chellofr',
+'chello\.hu','chellohu',
+'chello\.nl','chellonl',
+'chello\.no','chellono',
+'chello\.pl','chellopl',
+'chello\.se','chellose',
+'chello\.sk','chellosk',
+'chello','chellocom',
+# Mirago 
+'mirago\.be','miragobe',
+'mirago\.ch','miragoch',
+'mirago\.de','miragode',
+'mirago\.dk','miragodk',
+'es\.mirago\.com','miragoes',
+'mirago\.fr','miragofr',
+'mirago\.it','miragoit',
+'mirago\.nl','miragonl',
+'no\.mirago\.com','miragono',
+'mirago\.se','miragose',
+'mirago\.co\.uk','miragocouk',
+'mirago','mirago', # required as catchall for new countries not yet known
+'answerbus\.com','answerbus',
+# Minor Australian search engines
+'anzwers\.com\.au','anzwers',
 # Minor brazilian search engines
 'engine\.exe','engine',
 'miner\.bol\.com\.br','miner',
 'baidu\.com','baidu',
 'search\.sina\.com','sina',
 'search\.sohu\.com','sohu',
+'sogou\.com','sogou',
 # Minor czech search engines
 'atlas\.cz','atlas',
 'seznam\.cz','seznam',
 'ilse\.','ilse',
 'vindex\.','vindex',
 # Minor english search engines
-'(^|\.)ask\.co\.uk','askuk',
 'bbc\.co\.uk/cgi-bin/search','bbc',
 'ifind\.freeserve','freeserve',
 'looksmart\.co\.uk','looksmartuk',
-'mirago\.','mirago',
 'splut\.','splut',
 'spotjockey\.','spotjockey',
 'ukdirectory\.','ukdirectory',
 'search[\w\-]+\.free\.fr','free',
 'recherche\.club-internet\.fr','clubinternet',
 'toile\.com','toile',
+'biglotron\.com', 'biglotron',
 # Minor german search engines
 'sucheaol\.aol\.de','aolde',
 'fireball\.de','fireball',
 'meinestadt\.de','meinestadt',
 '212\.227\.33\.241','metaspinner',
 '(161\.58\.227\.204|161\.58\.247\.101|212\.40\.165\.90|213\.133\.108\.202|217\.160\.108\.151|217\.160\.111\.99|217\.160\.131\.108|217\.160\.142\.227|217\.160\.176\.42)','metacrawler_de',
+'wwweasel\.de','wwweasel',
+'netluchs\.de','netluchs',
+'schoenerbrausen\.de','schoenerbrausen',
 # Minor hungarian search engines
 'heureka\.hu','heureka',
 'vizsla\.origo\.hu','origo',
 'wahoo\.hu','wahoo',
 'webmania\.hu','webmania',
 'search\.internetto\.hu','internetto',
+# Minor Indian search engines
+'sify\.com','sify',
 # Minor italian search engines
 'virgilio\.it','virgilio',
 'arianna\.libero\.it','arianna',
 'supereva\.com','supereva',
 'kataweb\.it','kataweb',
-# Minor norvegian search engines
-'sok\.start\.no','start',
+'search\.alice\.it\.master','aliceitmaster',
+# Minor Japanese search engines
+'ask\.jp','askjp',
+# Minor Norwegian search engines
+'sok\.start\.no','start', 'eniro\.no','eniro',
 # Minor polish search engines
 'szukaj\.wp\.pl','wp',
 # Minor russian search engines
 'google_base','(p|q|as_p|as_q)=',
 'google_froogle','(p|q|as_p|as_q)=',
 'google_image','(p|q|as_p|as_q)=',
+'google_cache','(p|q|as_p|as_q)=cache:*.(?=\+)',
 'google','(p|q|as_p|as_q)=',
 'lycos','query=',
 'msn','q=',
+'live','q=',
 'netscape','search=',
 'tiscali','key=',
 'aol','query=',
 'terra','query=',
-'voila','kw=',
+'voila','(kw|rdata)=',
 'search.com','q=',
+'yahoo_mindset','p=',
 'yahoo','p=',
 'sympatico', 'query=', 
 'excite','search=',
 # Minor international search engines
 'go','qt=',
-'ask','ask=',
+'askde','(ask|q)=', # break out Ask country specific engines.
+'askes','(ask|q)=',
+'askfr','(ask|q)=',
+'askit','(ask|q)=',
+'asknl','(ask|q)=',
+'ask','(ask|q)=',
 'atomz','sp-q=',
 'euroseek','query=',
 'findarticles','key=',
 'dogpile', 'q(|kw)=',
 'spray','string=',
 'teoma','q=',
-'virgilio','qs=',
-'arianna','query=',
-'supereva','q=',
-'kataweb','q=',
 'webcrawler','searchText=',
 'wisenut','query=', 
 'ixquick', 'query=',
 'earthlink', 'q=',
 'iune','(keywords|q)=',
+'blingo','q=',
+'centraldatabase','query=',
+'clusty','query=',
+'mysearch','searchfor=',
+'vivisimo','query=',
+# kartoo: No keywords passed in referring URL.
+'kartoo',,
+'icerocket','q=',
+'sphere','q=',
+# Chello Portals
+'chelloat','q1=',
+'chellobe','q1=',
+'chellocz','q1=',
+'chellofr','q1=',
+'chellohu','q1=',
+'chellonl','q1=',
+'chellono','q1=',
+'chellopl','q1=',
+'chellose','q1=',
+'chellosk','q1=',
+'chellocom','q1=',
+# Mirago
+'miragobe','(txtsearch|qry)=',
+'miragoch','(txtsearch|qry)=',
+'miragode','(txtsearch|qry)=',
+'miragodk','(txtsearch|qry)=',
+'miragoes','(txtsearch|qry)=',
+'miragofr','(txtsearch|qry)=',
+'miragoit','(txtsearch|qry)=',
+'miragonl','(txtsearch|qry)=',
+'miragono','(txtsearch|qry)=',
+'miragose','(txtsearch|qry)=',
+'miragocouk','(txtsearch|qry)=',
+'mirago','(txtsearch|qry)=',
+'answerbus','', # Does not provide query parameters
+# Minor Australian search engines
+'anzwers','search=',
 # Minor brazilian search engines
 'engine','p1=', 'miner','q=',
 # Minor chinese search engines
-'baidu','word=', 'sina', 'word=', 'sohu','word=',
+'baidu','word=', 'sina', 'word=', 'sohu','word=', 'sogou', 'query=',
 # Minor czech search engines
 'atlas','searchtext=', 'seznam','w=', 'quick','query=', 'centrum','q=', 'jyxo','s=', 'najdi','dotaz=', 'redbox','srch=',
 # Minor danish search engines
 # Minor dutch search engines
 'ilse','search_for=', 'vindex','in=',
 # Minor english search engines
-'askuk','ask=', 'bbc','q=', 'freeserve','q=', 'looksmartuk','key=',
-'mirago','txtsearch=', 'splut','pattern=', 'spotjockey','Search_Keyword=', 'ukindex', 'stext=', 'ukdirectory','k=', 'ukplus','search=', 'searchy', 'search_term=',
+'askuk','(ask|q)=', 'bbc','q=', 'freeserve','q=', 'looksmartuk','key=',
+'splut','pattern=', 'spotjockey','Search_Keyword=', 'ukindex', 'stext=', 'ukdirectory','k=', 'ukplus','search=', 'searchy', 'search_term=',
 # Minor finnish search engines
 'haku','w=',
 # Minor french search engines
 'francite','name=', 'clubinternet', 'q=',
 'toile', 'q=',
+'biglotron','question=',
 # Minor german search engines
 'aolde','q=',
 'fireball','q=', 'infoseek','qt=', 'webde','su=',
 'abacho','q=', 't-online','q=', 
 'metaspinner','qry=',
 'metacrawler_de','qry=',
+'wwweasel','q=',
+'netluchs','query=',
+'schoenerbrausen','q=',
 # Minor hungarian search engines
 'heureka','heureka=', 'origo','(q|search)=', 'goliat','KERESES=', 'wahoo','q=', 'internetto','searchstr=',
-# Minor norvegian search engines
-'start','q=',
+# Minor Indian search engines
+'sify','keyword=',
+# Minor Italian search engines
+'virgilio','qs=',
+'arianna','query=',
+'supereva','q=',
+'kataweb','q=',
+'aliceitmaster','qs=',
+# Minor Japanese search engines
+'askjp','(ask|q)=',
+# Minor Norwegian search engines
+'start','q=', 'eniro','q=',
 # Minor polish search engines
 'wp','szukaj=',
 # Minor russian search engines
 @WordsToCleanSearchUrl= ('act=','annuaire=','btng=','cat=','categoria=','cfg=','cof=','cou=','count=','cp=','dd=','domain=','dt=','dw=','enc=','exec=','geo=','hc=','height=','hits=','hl=','hq=','hs=','id=','kl=','lang=','loc=','lr=','matchmode=','medor=','message=','meta=','mode=','order=','page=','par=','pays=','pg=','pos=','prg=','qc=','refer=','sa=','safe=','sc=','sort=','src=','start=','style=','stype=','sum=','tag=','temp=','theme=','type=','url=','user=','width=','what=','\\.x=','\\.y=','y=','look=');
 
 # SearchEnginesKnownUTFCoding
-# Known param that proves a search engines has coded its param in UTF8
+# Known parameter that proves a search engine has coded its parameters in UTF-8
 #------------------------------------------------------------------------------
 %SearchEnginesKnownUTFCoding=(
 # Most common search engines
 #------------------------------------------------------------------------------
 %SearchEnginesHashLib=(
 # Major international search engines
-'alexa','Alexa',
-'alltheweb','AllTheWeb',
-'altavista','AltaVista',
-'a9', 'A9.com',
-'dmoz','DMOZ',
-'google_base','Google (Base)',
-'google_froogle','Froogle (Google)',
-'google_image','Google (Images)',
-'google','Google',
-'lycos','Lycos',
-'msn','MSN',
-'netscape','Netscape',
-'aol','AOL',
-'terra','Terra',
-'tiscali','Tiscali',
-'voila','Voila',
-'search.com','Search.com',
-'yahoo','Yahoo',
-'sympatico', 'Sympatico',
-'excite','Excite',
+'alexa','<a href="http://www.alexa.com/" title="Search Engine Home Page [new window]" target="_blank">Alexa</a>',
+'alltheweb','<a href="http://www.alltheweb.com/" title="Search Engine Home Page [new window]" target="_blank">AllTheWeb</a>',
+'altavista','<a href="http://www.altavista.com/" title="Search Engine Home Page [new window]" target="_blank">AltaVista</a>',
+'a9', '<a href="http://www.a9.com/" title="Search Engine Home Page [new window]" target="_blank">A9</a>',
+'dmoz','<a href="http://dmoz.org/" title="Search Engine Home Page [new window]" target="_blank">DMOZ</a>',
+'google_base','<a href="http://base.google.com/" title="Search Engine Home Page [new window]" target="_blank">Google (Base)</a>',
+'google_froogle','<a href="http://froogle.google.com/" title="Search Engine Home Page [new window]" target="_blank">Froogle (Google)</a>',
+'google_image','<a href="http://images.google.com/" title="Search Engine Home Page [new window]" target="_blank">Google (Images)</a>',
+'google_cache','<a href="http://www.google.com/help/features.html#cached" title="Search Engine Home Page [new window]" target="_blank">Google (cache)</a>',
+'google','<a href="http://www.google.com/" title="Search Engine Home Page [new window]" target="_blank">Google</a>',
+'lycos','<a href="http://www.lycos.com/" title="Search Engine Home Page [new window]" target="_blank">Lycos</a>',
+'msn','<a href="http://search.msn.com/" title="Search Engine Home Page [new window]" target="_blank">MSN Search</a>',
+'live','<a href="http://www.live.com/" title="Search Engine Home Page [new window]" target="_blank">Windows Live</a>',
+'netscape','<a href="http://www.netscape.com/" title="Search Engine Home Page [new window]" target="_blank">Netscape</a>',
+'aol','<a href="http://www.aol.com/" title="Search Engine Home Page [new window]" target="_blank">AOL</a>',
+'terra','<a href="http://www.terra.es/" title="Search Engine Home Page [new window]" target="_blank">Terra</a>',
+'tiscali','<a href="http://search.tiscali.com/" title="Search Engine Home Page [new window]" target="_blank">Tiscali</a>',
+'voila','<a href="http://www.voila.fr/" title="Search Engine Home Page [new window]" target="_blank">Voila</a>',
+'search.com','<a href="http://www.search.com/" title="Search Engine Home Page [new window]" target="_blank">Search.com</a>',
+'yahoo_mindset','<a href="http://mindset.research.yahoo.com/" title="Search Engine Home Page [new window]" target="_blank">Yahoo! Mindset</a>',
+'yahoo','<a href="http://www.yahoo.com/" title="Search Engine Home Page [new window]" target="_blank">Yahoo!</a>',
+'sympatico','<a href="http://sympatico.msn.ca/" title="Search Engine Home Page [new window]" target="_blank">Sympatico</a>',
+'excite','<a href="http://www.excite.com/" title="Search Engine Home Page [new window]" target="_blank">Excite</a>',
 # Minor international search engines
 'go','Go.com',
-'ask','Ask Jeeves',
+'askde','<a href="http://de.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Ask Deutschland</a>',
+'askes','<a href="http://es.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Ask Espa&ntilde;a</a>', # break out Ask country specific engines.
+'askfr','<a href="http://fr.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Ask France</a>',
+'askit','<a href="http://it.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Ask Italia</a>',
+'asknl','<a href="http://nl.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Ask Nederland</a>',
+'ask','<a href="http://www.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Ask</a>',
 'atomz','Atomz',
 'dejanews','DejaNews',
 'euroseek','Euroseek',
 'nbci','NBCI',
 'northernlight','NorthernLight',
 'overture','Overture',                 # Replace 'goto\.com','Goto.com',
-'dogpile','Dogpile',
+'dogpile','<a href="http://www.dogpile.com/" title="Search Engine Home Page [new window]" target="_blank">Dogpile</a>',
 'spray','Spray',
-'teoma','Teoma',                                                       # Replace 'directhit\.com','DirectHit',
-'webcrawler','WebCrawler',
+'teoma','<a href="http://search.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Teoma</a>',                                                     # Replace 'directhit\.com','DirectHit',
+'webcrawler','<a href="http://www.webcrawler.com/" title="Search Engine Home Page [new window]" target="_blank">WebCrawler</a>',
 'wisenut','WISENut', 
-'ixquick', 'ix quick', 
+'ixquick','<a href="http://www.ixquick.com/" title="Search Engine Home Page [new window]" target="_blank">ix quick</a>', 
 'earthlink', 'Earth Link',
-'iune','i-une.com',
+'iune','<a href="http://www.i-une.com/" title="Search Engine Home Page [new window]" target="_blank">i-une</a>',
+'blingo','<a href="http://www.blingo.com/" title="Search Engine Home Page [new window]" target="_blank">Blingo</a>',
+'centraldatabase','<a href="http://search.centraldatabase.org/" title="Search Engine Home Page [new window]" target="_blank">GPU p2p search</a>',
+'clusty','<a href="http://www.clusty.com/" title="Search Engine Home Page [new window]" target="_blank">Clusty</a>',
+'mysearch','<a href="http://www.mysearch.com" title="Search Engine Home Page [new window]" target="_blank">My Search</a>',
+'vivisimo','<a href="http://www.vivisimo.com/" title="Search Engine Home Page [new window]" target="_blank">Vivisimo</a>',
+'kartoo','<a href="http://www.kartoo.com/" title="Search Engine Home Page [new window]" target="_blank">Kartoo</a>',
+'icerocket','<a href="http://www.icerocket.com/" title="Search Engine Home Page [new window]" target="_blank">Icerocket (Blog)</a>',
+'sphere','<a href="http://www.sphere.com/" title="Search Engine Home Page [new window]" target="_blank">Sphere (Blog)</a>',
+# Chello Portals
+'chelloat','<a href="http://www.chello.at/" title="Search Engine Home Page [new window]" target="_blank">Chello Austria</a>',
+'chellobe','<a href="http://www.chello.be/" title="Search Engine Home Page [new window]" target="_blank">Chello Belgium</a>',
+'chellocz','<a href="http://www.chello.cz/" title="Search Engine Home Page [new window]" target="_blank">Chello Czech Republic</a>',
+'chellofr','<a href="http://www.chello.fr/" title="Search Engine Home Page [new window]" target="_blank">Chello France</a>',
+'chellohu','<a href="http://www.chello.hu/" title="Search Engine Home Page [new window]" target="_blank">Chello Hungary</a>',
+'chellonl','<a href="http://www.chello.nl/" title="Search Engine Home Page [new window]" target="_blank">Chello Netherlands</a>',
+'chellono','<a href="http://www.chello.no/" title="Search Engine Home Page [new window]" target="_blank">Chello Norway</a>',
+'chellopl','<a href="http://www.chello.pl/" title="Search Engine Home Page [new window]" target="_blank">Chello Poland</a>',
+'chellose','<a href="http://www.chello.se/" title="Search Engine Home Page [new window]" target="_blank">Chello Sweden</a>',
+'chellosk','<a href="http://www.chello.sk/" title="Search Engine Home Page [new window]" target="_blank">Chello Slovakia</a>',
+'chellocom','<a href="http://www.chello.com/" title="Search Engine Home Page [new window]" target="_blank">Chello (Country not recognized)</a>',
+# Mirago
+'miragobe','<a href="http://www.mirago.be/" title="Search Engine Home Page [new window]" target="_blank">Mirago Belgium</a>',
+'miragoch','<a href="http://www.mirago.ch/" title="Search Engine Home Page [new window]" target="_blank">Mirago Switzerland</a>',
+'miragode','<a href="http://www.mirago.de/" title="Search Engine Home Page [new window]" target="_blank">Mirago Germany</a>',
+'miragodk','<a href="http://www.mirago.dk/" title="Search Engine Home Page [new window]" target="_blank">Mirago Denmark</a>',
+'miragoes','<a href="http://es.mirago.com/" title="Search Engine Home Page [new window]" target="_blank">Mirago Spain</a>',
+'miragofr','<a href="http://www.mirago.fr/" title="Search Engine Home Page [new window]" target="_blank">Mirago France</a>',
+'miragoit','<a href="http://www.mirago.it/" title="Search Engine Home Page [new window]" target="_blank">Mirago Italy</a>',
+'miragonl','<a href="http://www.mirago.nl/" title="Search Engine Home Page [new window]" target="_blank">Mirago Netherlands</a>',
+'miragono','<a href="http://no.mirago.com/" title="Search Engine Home Page [new window]" target="_blank">Mirago Norway</a>',
+'miragose','<a href="http://www.mirago.se/" title="Search Engine Home Page [new window]" target="_blank">Mirago Sweden</a>',
+'miragocouk','<a href="http://zone.mirago.co.uk/" title="Search Engine Home Page [new window]" target="_blank">Mirago UK</a>',
+'mirago','<a href="http://www.mirago.com/" title="Search Engine Home Page [new window]" target="_blank">Mirago (country unknown)</a>',
 # Minor brazilian search engines
 'engine','Cade', 'miner','Meta Miner',
 # Minor chinese search engines
-'baidu','Baidu', 'sina','Sina', 'sohu','Sohu',
+'baidu','Baidu', 'sina','Sina', 'sohu','Sohu', 'sogou','<a href="http://www.sogou.com/" title="Search Engine Home Page [new window]" target="_blank">Sogou</a>',
 # Minor czech search engines
 'atlas','Atlas.cz',    'seznam','Seznam', 'quick','Quick.cz', 'centrum','Centrum.cz', 'jyxo','Jyxo.cz', 'najdi','Najdi.to', 'redbox','RedBox.cz',
 # Minor danish search-engines
 # Minor dutch search engines
 'ilse','Ilse','vindex','Vindex\.nl',                                           
 # Minor english search engines
-'askuk','Ask Jeeves UK', 'bbc','BBC', 'freeserve','Freeserve', 'looksmartuk','Looksmart UK',
-'mirago','Mirago', 'splut','Splut', 'spotjockey','Spotjockey', 'ukdirectory','UK Directory', 'ukindex','UKIndex', 'ukplus','UK Plus', 'searchy','searchy.co.uk',
+'askuk','<a href="http://uk.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Ask UK</a>',
+'bbc','BBC', 'freeserve','Freeserve', 'looksmartuk','Looksmart UK',
+'splut','Splut', 'spotjockey','Spotjockey', 'ukdirectory','UK Directory', 'ukindex','UKIndex', 'ukplus','UK Plus', 'searchy','searchy.co.uk',
 # Minor finnish search engines
 'haku','Ihmemaa',                                                                              
 # Minor french search engines
 'aolfr','AOL (fr)', 'ctrouve','C\'est trouvé', 'francite','Francité', 'lbb', 'LBB', 'libertysurf', 'Libertysurf', 'free', 'Free.fr', 'clubinternet', 'Club-internet',
 'toile', 'Toile du Québec',
-# Minor german search engines
+'biglotron','<a href="http://www.biglotron.com/" title="Search Engine Home Page [new window]" target="_blank">Biglotron</a>',
+# Minor German search engines
 'aolde','AOL (de)',
 'fireball','Fireball', 'infoseek','Infoseek', 'webde','Web.de',
 'abacho','Abacho', 't-online','T-Online', 
 'allesklar','allesklar.de', 'meinestadt','meinestadt.de', 
 'metaspinner','metaspinner',
 'metacrawler_de','metacrawler.de',
+'wwweasel','<a href="http://wwweasel.de/" title="Search Engine Home Page [new window]" target="_blank">WWWeasel</a>',
+'netluchs','<a href="http://www.netluchs.de/" title="Search Engine Home Page [new window]" target="_blank">Netluchs</a>',
+'schoenerbrausen','<a href="http://www.schoenerbrausen.de/" title="Search Engine Home Page [new window]" target="_blank">Schoenerbrausen/</a>',
 # Minor hungarian search engines
 'heureka','Heureka', 'origo','Origo-Vizsla', 'lapkereso','Startlapkeresõ', 'goliat','Góliát', 'indexhu','Index', 'wahoo','Wahoo', 'webmania','webmania.hu', 'internetto','Internetto Keresõ',
+# Minor Indian search engines
+'sify','<a href="http://search.sify.com/" title="Search Engine Home Page [new window]" target="_blank">Sify</a>',
 # Minor italian search engines
-'virgilio','Virgilio', 'arianna','Arianna', 'supereva','Supereva', 'kataweb','Kataweb',
-# Minor norvegian search engines
-'start','start.no',                                                            
+'virgilio','<a href="http://www.virgilio.it/" title="Search Engine Home Page [new window]" target="_blank">Virgilio</a>',
+'arianna','<a href="http://arianna.libero.it/" title="Search Engine Home Page [new window]" target="_blank">Arianna</a>',
+'supereva','<a href="http://search.supereva.com/" title="Search Engine Home Page [new window]" target="_blank">Supereva</a>',
+'kataweb','<a href="http://www.kataweb.it/ricerca/" title="Search Engine Home Page [new window]" target="_blank">Kataweb</a>',
+'aliceitmaster','<a href="http://www.alice.it/" title="Search Engine Home Page [new window]" target="_blank">search.alice.it.master</a>',
+# Minor Japanese search engines
+'askjp','<a href="http://www.ask.jp/" title="Search Engine Home Page [new window]" target="_blank">Ask Japan</a>',
+# Minor Norwegian search engines
+'start','start.no', 'eniro','<a href="http://www.eniro.no/" title="Search Engine Home Page [new window]" target="_blank">Eniro</a>',   
 # Minor polish search engines
 'wp','Szukaj',
 # Minor russian search engines