Merge remote-tracking branch 'AGSPhoenix/teamcoco-fix'

[youtube-dl] / youtube_dl / extractor / dailymotion.py
diff --git a/youtube_dl/extractor/dailymotion.py b/youtube_dl/extractor/dailymotion.py

index 6685c94a3d6b283e0b7f2240ebfcf35ce462edc2..5504d93ebf7212f11eb47f2206b63722044f7054 100644 (file)
--- a/youtube_dl/extractor/dailymotion.py
+++ b/youtube_dl/extractor/dailymotion.py
@@ -8,10 +8,10 @@ from .subtitles import SubtitlesInfoExtractor
  from ..utils import (
      compat_urllib_request,
      compat_str,
-    get_element_by_attribute,
      get_element_by_id,
      orderedSet,
      str_to_int,
+    int_or_none,
  
      ExtractorError,
  )
@@ -124,7 +124,7 @@ class DailymotionIE(DailymotionBaseInfoExtractor, SubtitlesInfoExtractor):
              if video_url is not None:
                  m_size = re.search(r'H264-(\d+)x(\d+)', video_url)
                  if m_size is not None:
-                    width, height = m_size.group(1), m_size.group(2)
+                    width, height = map(int_or_none, (m_size.group(1), m_size.group(2)))
                  else:
                      width, height = None, None
                  formats.append({
@@ -179,7 +179,7 @@ class DailymotionIE(DailymotionBaseInfoExtractor, SubtitlesInfoExtractor):
  class DailymotionPlaylistIE(DailymotionBaseInfoExtractor):
      IE_NAME = u'dailymotion:playlist'
      _VALID_URL = r'(?:https?://)?(?:www\.)?dailymotion\.[a-z]{2,3}/playlist/(?P<id>.+?)/'
-    _MORE_PAGES_INDICATOR = r'<div class="next">.*?<a.*?href="/playlist/.+?".*?>.*?</a>.*?</div>'
+    _MORE_PAGES_INDICATOR = r'(?s)<div class="pages[^"]*">.*?<a\s+class="[^"]*?icon-arrow_right[^"]*?"'
      _PAGE_TEMPLATE = 'https://www.dailymotion.com/playlist/%s/%s'
  
      def _extract_entries(self, id):
@@ -189,10 +189,9 @@ class DailymotionPlaylistIE(DailymotionBaseInfoExtractor):
              webpage = self._download_webpage(request,
                                               id, u'Downloading page %s' % pagenum)
  
-            playlist_el = get_element_by_attribute(u'class', u'row video_list', webpage)
-            video_ids.extend(re.findall(r'data-id="(.+?)"', playlist_el))
+            video_ids.extend(re.findall(r'data-id="(.+?)"', webpage))
  
-            if re.search(self._MORE_PAGES_INDICATOR, webpage, re.DOTALL) is None:
+            if re.search(self._MORE_PAGES_INDICATOR, webpage) is None:
                  break
          return [self.url_result('http://www.dailymotion.com/video/%s' % video_id, 'Dailymotion')
                     for video_id in orderedSet(video_ids)]
@@ -211,8 +210,7 @@ class DailymotionPlaylistIE(DailymotionBaseInfoExtractor):
  
  class DailymotionUserIE(DailymotionPlaylistIE):
      IE_NAME = u'dailymotion:user'
-    _VALID_URL = r'(?:https?://)?(?:www\.)?dailymotion\.[a-z]{2,3}/user/(?P<user>[^/]+)'
-    _MORE_PAGES_INDICATOR = r'<div class="next">.*?<a.*?href="/user/.+?".*?>.*?</a>.*?</div>'
+    _VALID_URL = r'https?://(?:www\.)?dailymotion\.[a-z]{2,3}/user/(?P<user>[^/]+)'
      _PAGE_TEMPLATE = 'http://www.dailymotion.com/user/%s/%s'
  
      def _real_extract(self, url):