[rai] Relax _VALID_URL (closes #19232)

[youtube-dl] / youtube_dl / extractor / rai.py
diff --git a/youtube_dl/extractor/rai.py b/youtube_dl/extractor/rai.py

index d22311031f42d5a4d35c66e9182db2993ddda8ce..149153b8fef79654421301c3ba916b02e1f8c259 100644 (file)
--- a/youtube_dl/extractor/rai.py
+++ b/youtube_dl/extractor/rai.py
@@ -32,6 +32,9 @@ class RaiBaseIE(InfoExtractor):
      _GEO_BYPASS = False
  
      def _extract_relinker_info(self, relinker_url, video_id):
+        if not re.match(r'https?://', relinker_url):
+            return {'formats': [{'url': relinker_url}]}
+
          formats = []
          geoprotection = None
          is_live = None
@@ -271,7 +274,6 @@ class RaiPlayPlaylistIE(InfoExtractor):
              ('programma', 'nomeProgramma'), webpage, 'title')
          description = unescapeHTML(self._html_search_meta(
              ('description', 'og:description'), webpage, 'description'))
-        print(description)
  
          entries = []
          for mobj in re.finditer(
@@ -286,7 +288,7 @@ class RaiPlayPlaylistIE(InfoExtractor):
  
  
  class RaiIE(RaiBaseIE):
-    _VALID_URL = r'https?://[^/]+\.(?:rai\.(?:it|tv)|rainews\.it)/dl/.+?-(?P<id>%s)(?:-.+?)?\.html' % RaiBaseIE._UUID_RE
+    _VALID_URL = r'https?://[^/]+\.(?:rai\.(?:it|tv)|rainews\.it)/.+?-(?P<id>%s)(?:-.+?)?\.html' % RaiBaseIE._UUID_RE
      _TESTS = [{
          # var uniquename = "ContentItem-..."
          # data-id="ContentItem-..."
@@ -369,6 +371,13 @@ class RaiIE(RaiBaseIE):
          'params': {
              'skip_download': True,
          },
+    }, {
+        # Direct MMS URL
+        'url': 'http://www.rai.it/dl/RaiTV/programmi/media/ContentItem-b63a4089-ac28-48cf-bca5-9f5b5bc46df5.html',
+        'only_matching': True,
+    }, {
+        'url': 'https://www.rainews.it/tgr/marche/notiziari/video/2019/02/ContentItem-6ba945a2-889c-4a80-bdeb-8489c70a8db9.html',
+        'only_matching': True,
      }]
  
      def _extract_from_content_id(self, content_id, url):