Change the implement of remove_fragment method

author Ping <yuanta11@gmail.com>

Fri, 25 Sep 2015 09:04:55 +0000 (17:04 +0800)

committer Ping <yuanta11@gmail.com>

Mon, 28 Sep 2015 02:51:45 +0000 (10:51 +0800)
author Ping <yuanta11@gmail.com>
Fri, 25 Sep 2015 09:04:55 +0000 (17:04 +0800)
committer Ping <yuanta11@gmail.com>
Mon, 28 Sep 2015 02:51:45 +0000 (10:51 +0800)
diff --git a/demos/webspider/webspider.py b/demos/webspider/webspider.py

index a36798def00d2352aa20838554111a8330a4803b..b6468b854cdfc90e186e850b105f1cd2308a8916 100644 (file)
--- a/demos/webspider/webspider.py
+++ b/demos/webspider/webspider.py
@@ -3,10 +3,10 @@ from datetime import timedelta
  
  try:
      from HTMLParser import HTMLParser
-    from urlparse import urljoin, urlparse, urlunparse
+    from urlparse import urljoin, urldefrag
  except ImportError:
      from html.parser import HTMLParser
-    from urllib.parse import urljoin, urlparse, urlunparse
+    from urllib.parse import urljoin, urldefrag
  
  from tornado import httpclient, gen, ioloop, queues
  
@@ -38,8 +38,8 @@ def get_links_from_url(url):
  
  
  def remove_fragment(url):
-    scheme, netloc, url, params, query, fragment = urlparse(url)
-    return urlunparse((scheme, netloc, url, params, query, ''))
+    pure_url, frag = urldefrag(url)
+    return pure_url
  
  
  def get_links(html):
author	Ping <yuanta11@gmail.com>
	Fri, 25 Sep 2015 09:04:55 +0000 (17:04 +0800)
committer	Ping <yuanta11@gmail.com>
	Mon, 28 Sep 2015 02:51:45 +0000 (10:51 +0800)