[facebook] Bypass download rate limits (closes #21018)

[youtube-dl] / youtube_dl / extractor / facebook.py
diff --git a/youtube_dl/extractor/facebook.py b/youtube_dl/extractor/facebook.py

index 74954049dc79e6e9d0682a73550c52a4d010a06d..a56f85c216177810e2ea217dd4309aee6a453b00 100644 (file)
--- a/youtube_dl/extractor/facebook.py
+++ b/youtube_dl/extractor/facebook.py
@@ -405,6 +405,11 @@ class FacebookIE(InfoExtractor):
          if not formats:
              raise ExtractorError('Cannot find video formats')
  
+        # Downloads with browser's User-Agent are rate limited. Working around
+        # with non-browser User-Agent.
+        for f in formats:
+            f.setdefault('http_headers', {})['User-Agent'] = 'facebookexternalhit/1.1'
+
          self._sort_formats(formats)
  
          video_title = self._html_search_regex(
@@ -424,11 +429,11 @@ class FacebookIE(InfoExtractor):
          uploader = clean_html(get_element_by_id(
              'fbPhotoPageAuthorName', webpage)) or self._search_regex(
              r'ownerName\s*:\s*"([^"]+)"', webpage, 'uploader',
-            fatal=False) or self._og_search_title(webpage, fatal=False)
+            default=None) or self._og_search_title(webpage, fatal=False)
          timestamp = int_or_none(self._search_regex(
              r'<abbr[^>]+data-utime=["\'](\d+)', webpage,
              'timestamp', default=None))
-        thumbnail = self._og_search_thumbnail(webpage)
+        thumbnail = self._html_search_meta(['og:image', 'twitter:image'], webpage)
  
          view_count = parse_count(self._search_regex(
              r'\bviewCount\s*:\s*["\']([\d,.]+)', webpage, 'view count',