InfoExtractor._search_regex: Suggest updating when the regex is not found (suggested...

[youtube-dl] / youtube_dl / extractor / mtv.py
diff --git a/youtube_dl/extractor/mtv.py b/youtube_dl/extractor/mtv.py

index bc7f49ebbac86cda7aa1bb711076b783e24bfea8..4430b3416afc8af1fab70e47fb597710d6c5a75b 100644 (file)
--- a/youtube_dl/extractor/mtv.py
+++ b/youtube_dl/extractor/mtv.py
@@ -2,7 +2,7 @@ from __future__ import unicode_literals
  
  import re
  
-from .subtitles import SubtitlesInfoExtractor
+from .common import InfoExtractor
  from ..compat import (
      compat_urllib_parse,
      compat_urllib_request,
@@ -23,7 +23,7 @@ def _media_xml_tag(tag):
      return '{http://search.yahoo.com/mrss/}%s' % tag
  
  
-class MTVServicesInfoExtractor(SubtitlesInfoExtractor):
+class MTVServicesInfoExtractor(InfoExtractor):
      _MOBILE_TEMPLATE = None
  
      @staticmethod
@@ -95,25 +95,15 @@ class MTVServicesInfoExtractor(SubtitlesInfoExtractor):
  
      def _extract_subtitles(self, mdoc, mtvn_id):
          subtitles = {}
-        FORMATS = {
-            'scc': 'cea-608',
-            'eia-608': 'cea-608',
-            'xml': 'ttml',
-        }
-        subtitles_format = FORMATS.get(
-            self._downloader.params.get('subtitlesformat'), 'ttml')
          for transcript in mdoc.findall('.//transcript'):
              if transcript.get('kind') != 'captions':
                  continue
              lang = transcript.get('srclang')
-            for typographic in transcript.findall('./typographic'):
-                captions_format = typographic.get('format')
-                if captions_format == subtitles_format:
-                    subtitles[lang] = compat_str(typographic.get('src'))
-                    break
-        if self._downloader.params.get('listsubtitles', False):
-            self._list_available_subtitles(mtvn_id, subtitles)
-        return self.extract_subtitles(mtvn_id, subtitles)
+            subtitles[lang] = [{
+                'url': compat_str(typographic.get('src')),
+                'ext': typographic.get('format')
+            } for typographic in transcript.findall('./typographic')]
+        return subtitles
  
      def _get_video_info(self, itemdoc):
          uri = itemdoc.find('guid').text
@@ -128,6 +118,14 @@ class MTVServicesInfoExtractor(SubtitlesInfoExtractor):
          mediagen_doc = self._download_xml(mediagen_url, video_id,
                                            'Downloading video urls')
  
+        item = mediagen_doc.find('./video/item')
+        if item is not None and item.get('type') == 'text':
+            message = '%s returned error: ' % self.IE_NAME
+            if item.get('code') is not None:
+                message += '%s - ' % item.get('code')
+            message += item.text
+            raise ExtractorError(message, expected=True)
+
          description_node = itemdoc.find('description')
          if description_node is not None:
              description = description_node.text.strip()
@@ -196,8 +194,6 @@ class MTVServicesInfoExtractor(SubtitlesInfoExtractor):
                  webpage, 'mgid')
  
          videos_info = self._get_videos_info(mgid)
-        if self._downloader.params.get('listsubtitles', False):
-            return
          return videos_info