Merge branch 'karrierevideos' of https://github.com/misterhat/youtube-dl into misterh...

[youtube-dl] / youtube_dl / extractor / mtv.py
diff --git a/youtube_dl/extractor/mtv.py b/youtube_dl/extractor/mtv.py

index bc7f49ebbac86cda7aa1bb711076b783e24bfea8..b48fac5e3e434569642284d0b6388cab34696b01 100644 (file)
--- a/youtube_dl/extractor/mtv.py
+++ b/youtube_dl/extractor/mtv.py
@@ -2,7 +2,7 @@ from __future__ import unicode_literals
  
  import re
  
-from .subtitles import SubtitlesInfoExtractor
+from .common import InfoExtractor
  from ..compat import (
      compat_urllib_parse,
      compat_urllib_request,
@@ -23,8 +23,9 @@ def _media_xml_tag(tag):
      return '{http://search.yahoo.com/mrss/}%s' % tag
  
  
-class MTVServicesInfoExtractor(SubtitlesInfoExtractor):
+class MTVServicesInfoExtractor(InfoExtractor):
      _MOBILE_TEMPLATE = None
+    _LANG = None
  
      @staticmethod
      def _id_from_uri(uri):
@@ -95,25 +96,15 @@ class MTVServicesInfoExtractor(SubtitlesInfoExtractor):
  
      def _extract_subtitles(self, mdoc, mtvn_id):
          subtitles = {}
-        FORMATS = {
-            'scc': 'cea-608',
-            'eia-608': 'cea-608',
-            'xml': 'ttml',
-        }
-        subtitles_format = FORMATS.get(
-            self._downloader.params.get('subtitlesformat'), 'ttml')
          for transcript in mdoc.findall('.//transcript'):
              if transcript.get('kind') != 'captions':
                  continue
              lang = transcript.get('srclang')
-            for typographic in transcript.findall('./typographic'):
-                captions_format = typographic.get('format')
-                if captions_format == subtitles_format:
-                    subtitles[lang] = compat_str(typographic.get('src'))
-                    break
-        if self._downloader.params.get('listsubtitles', False):
-            self._list_available_subtitles(mtvn_id, subtitles)
-        return self.extract_subtitles(mtvn_id, subtitles)
+            subtitles[lang] = [{
+                'url': compat_str(typographic.get('src')),
+                'ext': typographic.get('format')
+            } for typographic in transcript.findall('./typographic')]
+        return subtitles
  
      def _get_video_info(self, itemdoc):
          uri = itemdoc.find('guid').text
@@ -128,6 +119,14 @@ class MTVServicesInfoExtractor(SubtitlesInfoExtractor):
          mediagen_doc = self._download_xml(mediagen_url, video_id,
                                            'Downloading video urls')
  
+        item = mediagen_doc.find('./video/item')
+        if item is not None and item.get('type') == 'text':
+            message = '%s returned error: ' % self.IE_NAME
+            if item.get('code') is not None:
+                message += '%s - ' % item.get('code')
+            message += item.text
+            raise ExtractorError(message, expected=True)
+
          description_node = itemdoc.find('description')
          if description_node is not None:
              description = description_node.text.strip()
@@ -171,8 +170,12 @@ class MTVServicesInfoExtractor(SubtitlesInfoExtractor):
          video_id = self._id_from_uri(uri)
          feed_url = self._get_feed_url(uri)
          data = compat_urllib_parse.urlencode({'uri': uri})
+        info_url = feed_url + '?'
+        if self._LANG:
+            info_url += 'lang=%s&' % self._LANG
+        info_url += data
          idoc = self._download_xml(
-            feed_url + '?' + data, video_id,
+            info_url, video_id,
              'Downloading info', transform_source=fix_xml_ampersands)
          return self.playlist_result(
              [self._get_video_info(item) for item in idoc.findall('.//item')])
@@ -196,8 +199,6 @@ class MTVServicesInfoExtractor(SubtitlesInfoExtractor):
                  webpage, 'mgid')
  
          videos_info = self._get_videos_info(mgid)
-        if self._downloader.params.get('listsubtitles', False):
-            return
          return videos_info