Check load_more_widget_html for feed paging

[youtube-dl] / youtube_dl / extractor / youtube.py
diff --git a/youtube_dl/extractor/youtube.py b/youtube_dl/extractor/youtube.py

index a346f4c960df87b4f35bda4f8e571c6405f1a316..cd35a16207273c3d6d9ccd81722102f998a0ebc1 100644 (file)
--- a/youtube_dl/extractor/youtube.py
+++ b/youtube_dl/extractor/youtube.py
@@ -611,7 +611,8 @@ class YoutubeIE(YoutubeBaseInfoExtractor, SubtitlesInfoExtractor):
              data = compat_urllib_parse.urlencode({
                  'video_id': video_id,
                  'eurl': 'https://youtube.googleapis.com/v/' + video_id,
              data = compat_urllib_parse.urlencode({
                  'video_id': video_id,
                  'eurl': 'https://youtube.googleapis.com/v/' + video_id,
-                'sts':'16268',
+                'sts': self._search_regex(
+                    r'"sts"\s*:\s*(\d+)', video_webpage, 'sts'),
              })
              video_info_url = proto + '://www.youtube.com/get_video_info?' + data
              video_info_webpage = self._download_webpage(video_info_url, video_id,
              })
              video_info_url = proto + '://www.youtube.com/get_video_info?' + data
              video_info_webpage = self._download_webpage(video_info_url, video_id,
@@ -835,7 +836,8 @@ class YoutubeIE(YoutubeBaseInfoExtractor, SubtitlesInfoExtractor):
                                      player_desc = 'flash player %s' % player_version
                                  else:
                                      player_version = self._search_regex(
                                      player_desc = 'flash player %s' % player_version
                                  else:
                                      player_version = self._search_regex(
-                                        r'html5player-(.+?)\.js', video_webpage,
+                                        r'html5player-([^/]+?)(?:/html5player)?\.js',
+                                        player_url,
                                          'html5 player', fatal=False)
                                      player_desc = u'html5 player %s' % player_version
  
                                          'html5 player', fatal=False)
                                      player_desc = u'html5 player %s' % player_version
  
@@ -1323,6 +1325,7 @@ class YoutubeFeedsInfoExtractor(YoutubeBaseInfoExtractor):
                                            u'%s feed' % self._FEED_NAME,
                                            u'Downloading page %s' % i)
              feed_html = info.get('feed_html') or info.get('content_html')
                                            u'%s feed' % self._FEED_NAME,
                                            u'Downloading page %s' % i)
              feed_html = info.get('feed_html') or info.get('content_html')
+            load_more_widget_html = info.get('load_more_widget_html') or feed_html
              m_ids = re.finditer(r'"/watch\?v=(.*?)["&]', feed_html)
              ids = orderedSet(m.group(1) for m in m_ids)
              feed_entries.extend(
              m_ids = re.finditer(r'"/watch\?v=(.*?)["&]', feed_html)
              ids = orderedSet(m.group(1) for m in m_ids)
              feed_entries.extend(
@@ -1330,7 +1333,7 @@ class YoutubeFeedsInfoExtractor(YoutubeBaseInfoExtractor):
                  for video_id in ids)
              mobj = re.search(
                  r'data-uix-load-more-href="/?[^"]+paging=(?P<paging>\d+)',
                  for video_id in ids)
              mobj = re.search(
                  r'data-uix-load-more-href="/?[^"]+paging=(?P<paging>\d+)',
-                feed_html)
+                load_more_widget_html)
              if mobj is None:
                  break
              paging = mobj.group('paging')
              if mobj is None:
                  break
              paging = mobj.group('paging')