Merge pull request #5961 from dstftw/force-generic-extractor

[youtube-dl] / youtube_dl / extractor / generic.py
diff --git a/youtube_dl/extractor/generic.py b/youtube_dl/extractor/generic.py

index 07939b196daa6ef51d3971bbc4d40ea87343c1ca..7769ffc5c5f425ce04dc92147c77803291f0fdd5 100644 (file)
--- a/youtube_dl/extractor/generic.py
+++ b/youtube_dl/extractor/generic.py
@@ -43,6 +43,7 @@ from .senateisvp import SenateISVPIE
  from .bliptv import BlipTVIE
  from .svt import SVTIE
  from .pornhub import PornHubIE
+from .xhamster import XHamsterEmbedIE
  from .vimeo import VimeoIE
  from .dailymotion import DailymotionCloudIE
  
@@ -335,6 +336,15 @@ class GenericIE(InfoExtractor):
                  'skip_download': True,
              },
          },
+        # XHamster embed
+        {
+            'url': 'http://www.numisc.com/forum/showthread.php?11696-FM15-which-pumiscer-was-this-%28-vid-%29-%28-alfa-as-fuck-srx-%29&s=711f5db534502e22260dec8c5e2d66d8',
+            'info_dict': {
+                'id': 'showthread',
+                'title': '[NSFL] [FM15] which pumiscer was this ( vid ) ( alfa as fuck srx )',
+            },
+            'playlist_mincount': 7,
+        },
          # Embedded TED video
          {
              'url': 'http://en.support.wordpress.com/videos/ted-talks/',
@@ -825,6 +835,18 @@ class GenericIE(InfoExtractor):
                  'title': 'Le débat',
                  'thumbnail': 're:^https?://.*\.jpe?g$',
              }
+        },
+        # AdobeTVVideo embed
+        {
+            'url': 'https://helpx.adobe.com/acrobat/how-to/new-experience-acrobat-dc.html?set=acrobat--get-started--essential-beginners',
+            'md5': '43662b577c018ad707a63766462b1e87',
+            'info_dict': {
+                'id': '2456',
+                'ext': 'mp4',
+                'title': 'New experience with Acrobat DC',
+                'description': 'New experience with Acrobat DC',
+                'duration': 248.667,
+            },
          }
      ]
  
@@ -992,7 +1014,9 @@ class GenericIE(InfoExtractor):
              }
  
          if not self._downloader.params.get('test', False) and not is_intentional:
-            self._downloader.report_warning('Falling back on generic information extractor.')
+            force = self._downloader.params.get('force_generic_extractor', False)
+            self._downloader.report_warning(
+                '%s on generic information extractor.' % ('Forcing' if force else 'Falling back'))
  
          if not full_response:
              request = compat_urllib_request.Request(url)
@@ -1331,6 +1355,11 @@ class GenericIE(InfoExtractor):
          if pornhub_url:
              return self.url_result(pornhub_url, 'PornHub')
  
+        # Look for embedded XHamster player
+        xhamster_urls = XHamsterEmbedIE._extract_urls(webpage)
+        if xhamster_urls:
+            return _playlist_from_matches(xhamster_urls, ie='XHamsterEmbed')
+
          # Look for embedded Tvigle player
          mobj = re.search(
              r'<iframe[^>]+?src=(["\'])(?P<url>(?:https?:)?//cloud\.tvigle\.ru/video/.+?)\1', webpage)
@@ -1503,6 +1532,15 @@ class GenericIE(InfoExtractor):
          if dmcloud_url:
              return self.url_result(dmcloud_url, 'DailymotionCloud')
  
+        # Look for AdobeTVVideo embeds
+        mobj = re.search(
+            r'<iframe[^>]+src=[\'"]((?:https?:)?//video\.tv\.adobe\.com/v/\d+[^"]+)[\'"]',
+            webpage)
+        if mobj is not None:
+            return self.url_result(
+                self._proto_relative_url(unescapeHTML(mobj.group(1))),
+                'AdobeTVVideo')
+
          def check_video(vurl):
              if YoutubeIE.suitable(vurl):
                  return True