[mfs] Modernize

[youtube-dl] / youtube_dl / extractor / brightcove.py
diff --git a/youtube_dl/extractor/brightcove.py b/youtube_dl/extractor/brightcove.py

index b550fad253d552061979d600323322e78b18096b..294670386256dc45a071544345e259cbf545e7c7 100644 (file)
--- a/youtube_dl/extractor/brightcove.py
+++ b/youtube_dl/extractor/brightcove.py
@@ -30,10 +30,11 @@ class BrightcoveIE(InfoExtractor):
          {
              # From http://www.8tv.cat/8aldia/videos/xavier-sala-i-martin-aquesta-tarda-a-8-al-dia/
              'url': 'http://c.brightcove.com/services/viewer/htmlFederated?playerID=1654948606001&flashID=myExperience&%40videoPlayer=2371591881001',
-            'file': '2371591881001.mp4',
              'md5': '5423e113865d26e40624dce2e4b45d95',
              'note': 'Test Brightcove downloads and detection in GenericIE',
              'info_dict': {
+                'id': '2371591881001',
+                'ext': 'mp4',
                  'title': 'Xavier Sala i Martín: “Un banc que no presta és un banc zombi que no serveix per a res”',
                  'uploader': '8TV',
                  'description': 'md5:a950cc4285c43e44d763d036710cd9cd',
@@ -42,8 +43,9 @@ class BrightcoveIE(InfoExtractor):
          {
              # From http://medianetwork.oracle.com/video/player/1785452137001
              'url': 'http://c.brightcove.com/services/viewer/htmlFederated?playerID=1217746023001&flashID=myPlayer&%40videoPlayer=1785452137001',
-            'file': '1785452137001.flv',
              'info_dict': {
+                'id': '1785452137001',
+                'ext': 'flv',
                  'title': 'JVMLS 2012: Arrays 2.0 - Opportunities and Challenges',
                  'description': 'John Rose speaks at the JVM Language Summit, August 1, 2012.',
                  'uploader': 'Oracle',
@@ -152,12 +154,14 @@ class BrightcoveIE(InfoExtractor):
      def _extract_brightcove_urls(cls, webpage):
          """Return a list of all Brightcove URLs from the webpage """
  
-        url_m = re.search(r'<meta\s+property="og:video"\s+content="(http://c.brightcove.com/[^"]+)"', webpage)
+        url_m = re.search(
+            r'<meta\s+property="og:video"\s+content="(https?://(?:secure|c)\.brightcove.com/[^"]+)"',
+            webpage)
          if url_m:
              url = unescapeHTML(url_m.group(1))
              # Some sites don't add it, we can't download with this url, for example:
              # http://www.ktvu.com/videos/news/raw-video-caltrain-releases-video-of-man-almost/vCTZdY/
-            if 'playerKey' in url:
+            if 'playerKey' in url or 'videoId' in url:
                  return [url]
  
          matches = re.findall(
@@ -186,9 +190,13 @@ class BrightcoveIE(InfoExtractor):
              referer = smuggled_data.get('Referer', url)
              return self._get_video_info(
                  videoPlayer[0], query_str, query, referer=referer)
-        else:
+        elif 'playerKey' in query:
              player_key = query['playerKey']
              return self._get_playlist_info(player_key[0])
+        else:
+            raise ExtractorError(
+                'Cannot find playerKey= variable. Did you forget quotes in a shell invocation?',
+                expected=True)
  
      def _get_video_info(self, video_id, query_str, query, referer=None):
          request_url = self._FEDERATED_URL_TEMPLATE % query_str
@@ -200,6 +208,13 @@ class BrightcoveIE(InfoExtractor):
              req.add_header('Referer', referer)
          webpage = self._download_webpage(req, video_id)
  
+        error_msg = self._html_search_regex(
+            r"<h1>We're sorry.</h1>\s*<p>(.*?)</p>", webpage,
+            'error message', default=None)
+        if error_msg is not None:
+            raise ExtractorError(
+                'brightcove said: %s' % error_msg, expected=True)
+
          self.report_extraction(video_id)
          info = self._search_regex(r'var experienceJSON = ({.*});', webpage, 'json')
          info = json.loads(info)['data']
@@ -233,7 +248,6 @@ class BrightcoveIE(InfoExtractor):
  
          renditions = video_info.get('renditions')
          if renditions:
-            renditions = sorted(renditions, key=lambda r: r['size'])
              formats = []
              for rend in renditions:
                  url = rend['defaultURL']
@@ -244,12 +258,15 @@ class BrightcoveIE(InfoExtractor):
                      ext = 'flv'
                  else:
                      ext = determine_ext(url)
+                size = rend.get('size')
                  formats.append({
                      'url': url,
                      'ext': ext,
                      'height': rend.get('frameHeight'),
                      'width': rend.get('frameWidth'),
+                    'filesize': size if size != 0 else None,
                  })
+            self._sort_formats(formats)
              info['formats'] = formats
          elif video_info.get('FLVFullLengthURL') is not None:
              info.update({