[youtube] Fix extraction.

[youtube-dl] / youtube_dl / extractor / tvc.py
diff --git a/youtube_dl/extractor/tvc.py b/youtube_dl/extractor/tvc.py

index 0055f9598ec12422da069b4c16036bad5c071ebe..008f64cc2e6486cf779f482c24d86f03a740d939 100644 (file)
--- a/youtube_dl/extractor/tvc.py
+++ b/youtube_dl/extractor/tvc.py
@@ -1,6 +1,8 @@
  # coding: utf-8
  from __future__ import unicode_literals
  
+import re
+
  from .common import InfoExtractor
  from ..utils import (
      clean_html,
@@ -8,8 +10,8 @@ from ..utils import (
  )
  
  
-class TVCEmbedIE(InfoExtractor):
-    _VALID_URL = r'http://(?:www\.)?tvc\.ru/video/iframe/id/(?P<id>\d+)'
+class TVCIE(InfoExtractor):
+    _VALID_URL = r'https?://(?:www\.)?tvc\.ru/video/iframe/id/(?P<id>\d+)'
      _TEST = {
          'url': 'http://www.tvc.ru/video/iframe/id/74622/isPlay/false/id_stat/channel/?acc_video_id=/channel/brand/id/17/show/episodes/episode_id/39702',
          'md5': 'bbc5ff531d1e90e856f60fc4b3afd708',
@@ -17,11 +19,18 @@ class TVCEmbedIE(InfoExtractor):
              'id': '74622',
              'ext': 'mp4',
              'title': 'События. "События". Эфир от 22.05.2015 14:30',
-            'thumbnail': 're:^https?://.*\.jpg$',
+            'thumbnail': r're:^https?://.*\.jpg$',
              'duration': 1122,
          },
      }
  
+    @classmethod
+    def _extract_url(cls, webpage):
+        mobj = re.search(
+            r'<iframe[^>]+?src=(["\'])(?P<url>(?:http:)?//(?:www\.)?tvc\.ru/video/iframe/id/[^"]+)\1', webpage)
+        if mobj:
+            return mobj.group('url')
+
      def _real_extract(self, url):
          video_id = self._match_id(url)
  
@@ -54,8 +63,8 @@ class TVCEmbedIE(InfoExtractor):
          }
  
  
-class TVCIE(InfoExtractor):
-    _VALID_URL = r'http://(?:www\.)?tvc\.ru/(?!video/iframe/id/)(?P<id>[^?#]+)'
+class TVCArticleIE(InfoExtractor):
+    _VALID_URL = r'https?://(?:www\.)?tvc\.ru/(?!video/iframe/id/)(?P<id>[^?#]+)'
      _TESTS = [{
          'url': 'http://www.tvc.ru/channel/brand/id/29/show/episodes/episode_id/39702/',
          'info_dict': {
@@ -63,7 +72,7 @@ class TVCIE(InfoExtractor):
              'ext': 'mp4',
              'title': 'События. "События". Эфир от 22.05.2015 14:30',
              'description': 'md5:ad7aa7db22903f983e687b8a3e98c6dd',
-            'thumbnail': 're:^https?://.*\.jpg$',
+            'thumbnail': r're:^https?://.*\.jpg$',
              'duration': 1122,
          },
      }, {
@@ -73,7 +82,7 @@ class TVCIE(InfoExtractor):
              'ext': 'mp4',
              'title': 'Эксперты: в столице встал вопрос о максимально безопасных остановках',
              'description': 'md5:f2098f71e21f309e89f69b525fd9846e',
-            'thumbnail': 're:^https?://.*\.jpg$',
+            'thumbnail': r're:^https?://.*\.jpg$',
              'duration': 278,
          },
      }, {
@@ -83,7 +92,7 @@ class TVCIE(InfoExtractor):
              'ext': 'mp4',
              'title': 'Ещё не поздно. Эфир от 03.08.2013',
              'description': 'md5:51fae9f3f8cfe67abce014e428e5b027',
-            'thumbnail': 're:^https?://.*\.jpg$',
+            'thumbnail': r're:^https?://.*\.jpg$',
              'duration': 3316,
          },
      }]
@@ -92,7 +101,7 @@ class TVCIE(InfoExtractor):
          webpage = self._download_webpage(url, self._match_id(url))
          return {
              '_type': 'url_transparent',
-            'ie_key': 'TVCEmbed',
+            'ie_key': 'TVC',
              'url': self._og_search_video_url(webpage),
              'title': clean_html(self._og_search_title(webpage)),
              'description': clean_html(self._og_search_description(webpage)),