Merge pull request #5588 from aajanki/encode_frag_filenames

[youtube-dl] / youtube_dl / extractor / mitele.py
diff --git a/youtube_dl/extractor/mitele.py b/youtube_dl/extractor/mitele.py

index 6691521e58435682a74af87559ce1d1fd9046fbf..852d722664a3d63aafed0f8246949335b4150c09 100644 (file)
--- a/youtube_dl/extractor/mitele.py
+++ b/youtube_dl/extractor/mitele.py
@@ -1,12 +1,14 @@
  from __future__ import unicode_literals
  
-import re
  import json
  
  from .common import InfoExtractor
-from ..utils import (
+from ..compat import (
      compat_urllib_parse,
+    compat_urllib_parse_unquote,
      compat_urlparse,
+)
+from ..utils import (
      get_element_by_attribute,
      parse_duration,
      strip_jsonp,
@@ -15,11 +17,10 @@ from ..utils import (
  
  class MiTeleIE(InfoExtractor):
      IE_NAME = 'mitele.es'
-    _VALID_URL = r'http://www\.mitele\.es/[^/]+/[^/]+/[^/]+/(?P<episode>[^/]+)/'
+    _VALID_URL = r'http://www\.mitele\.es/[^/]+/[^/]+/[^/]+/(?P<id>[^/]+)/'
  
-    _TEST = {
+    _TESTS = [{
          'url': 'http://www.mitele.es/programas-tv/diario-de/la-redaccion/programa-144/',
-        'md5': '6a75fe9d0d3275bead0cb683c616fddb',
          'info_dict': {
              'id': '0fce117d',
              'ext': 'mp4',
@@ -28,15 +29,17 @@ class MiTeleIE(InfoExtractor):
              'display_id': 'programa-144',
              'duration': 2913,
          },
-    }
+        'params': {
+            # m3u8 download
+            'skip_download': True,
+        },
+    }]
  
      def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
-        episode = mobj.group('episode')
+        episode = self._match_id(url)
          webpage = self._download_webpage(url, episode)
          embed_data_json = self._search_regex(
-            r'MSV\.embedData\[.*?\]\s*=\s*({.*?});', webpage, 'embed data',
-            flags=re.DOTALL
+            r'(?s)MSV\.embedData\[.*?\]\s*=\s*({.*?});', webpage, 'embed data',
          ).replace('\'', '"')
          embed_data = json.loads(embed_data_json)
  
@@ -46,7 +49,7 @@ class MiTeleIE(InfoExtractor):
              domain = 'http://' + domain
          info_url = compat_urlparse.urljoin(
              domain,
-            compat_urllib_parse.unquote(embed_data['flashvars']['host'])
+            compat_urllib_parse_unquote(embed_data['flashvars']['host'])
          )
          info_el = self._download_xml(info_url, episode).find('./video/info')
  
@@ -57,12 +60,14 @@ class MiTeleIE(InfoExtractor):
              episode,
              transform_source=strip_jsonp
          )
+        formats = self._extract_m3u8_formats(
+            token_info['tokenizedUrl'], episode, ext='mp4')
  
          return {
              'id': embed_data['videoId'],
              'display_id': episode,
              'title': info_el.find('title').text,
-            'url': token_info['tokenizedUrl'],
+            'formats': formats,
              'description': get_element_by_attribute('class', 'text', webpage),
              'thumbnail': info_el.find('thumb').text,
              'duration': parse_duration(info_el.find('duration').text),