Merge branch 'atomicdryad-pr-crashfix_compat_urllib_unquote'

author Sergey M․ <dstftw@gmail.com>

Fri, 17 Jul 2015 16:59:17 +0000 (22:59 +0600)

committer Sergey M․ <dstftw@gmail.com>

Fri, 17 Jul 2015 16:59:17 +0000 (22:59 +0600)
author Sergey M․ <dstftw@gmail.com>
Fri, 17 Jul 2015 16:59:17 +0000 (22:59 +0600)
committer Sergey M․ <dstftw@gmail.com>
Fri, 17 Jul 2015 16:59:17 +0000 (22:59 +0600)
diff --git a/youtube_dl/extractor/common.py b/youtube_dl/extractor/common.py

index 271bf85968690f00e25252294b51aa0e4cdecb15..5a2d0d995c75cbbc94709bb8669928de84f46a29 100644 (file)
--- a/youtube_dl/extractor/common.py
+++ b/youtube_dl/extractor/common.py
@@ -836,13 +836,14 @@ class InfoExtractor(object):
          self.to_screen(msg)
          time.sleep(timeout)
  
-    def _extract_f4m_formats(self, manifest_url, video_id, preference=None, f4m_id=None):
+    def _extract_f4m_formats(self, manifest_url, video_id, preference=None, f4m_id=None,
+                             transform_source=lambda s: fix_xml_ampersands(s).strip()):
          manifest = self._download_xml(
              manifest_url, video_id, 'Downloading f4m manifest',
              'Unable to download f4m manifest',
              # Some manifests may be malformed, e.g. prosiebensat1 generated manifests
              # (see https://github.com/rg3/youtube-dl/issues/6215#issuecomment-121704244)
-            transform_source=lambda s: fix_xml_ampersands(s).strip())
+            transform_source=transform_source)
  
          formats = []
          manifest_version = '1.0'
diff --git a/youtube_dl/extractor/howstuffworks.py b/youtube_dl/extractor/howstuffworks.py

index e9733912132798d99be18bb935dcd3c3b190525d..663e6632a194d8ee271a0c031a921d7eed139005 100644 (file)
--- a/youtube_dl/extractor/howstuffworks.py
+++ b/youtube_dl/extractor/howstuffworks.py
@@ -10,7 +10,7 @@ from ..utils import (
  
  
  class HowStuffWorksIE(InfoExtractor):
-    _VALID_URL = r'https?://[\da-z-]+\.howstuffworks\.com/(?:[^/]+/)*\d+-(?P<id>.+?)-video\.htm'
+    _VALID_URL = r'https?://[\da-z-]+\.howstuffworks\.com/(?:[^/]+/)*(?:\d+-)?(?P<id>.+?)-video\.htm'
      _TESTS = [
          {
              'url': 'http://adventure.howstuffworks.com/5266-cool-jobs-iditarod-musher-video.htm',
@@ -46,6 +46,10 @@ class HowStuffWorksIE(InfoExtractor):
                  'thumbnail': 're:^https?://.*\.jpg$',
              },
          },
+        {
+            'url': 'http://shows.howstuffworks.com/stuff-to-blow-your-mind/optical-illusions-video.htm',
+            'only_matching': True,
+        }
      ]
  
      def _real_extract(self, url):
author	Sergey M․ <dstftw@gmail.com>
	Fri, 17 Jul 2015 16:59:17 +0000 (22:59 +0600)
committer	Sergey M․ <dstftw@gmail.com>
	Fri, 17 Jul 2015 16:59:17 +0000 (22:59 +0600)
youtube_dl/extractor/common.py		patch \| blob \| history
youtube_dl/extractor/howstuffworks.py		patch \| blob \| history