[youtube] Fix ytsearch* when cookies are provided

author Yen Chi Hsuan <yan12125@gmail.com>

Thu, 2 Feb 2017 17:28:24 +0000 (01:28 +0800)

committer Yen Chi Hsuan <yan12125@gmail.com>

Thu, 2 Feb 2017 17:28:24 +0000 (01:28 +0800)
author Yen Chi Hsuan <yan12125@gmail.com>
Thu, 2 Feb 2017 17:28:24 +0000 (01:28 +0800)
committer Yen Chi Hsuan <yan12125@gmail.com>
Thu, 2 Feb 2017 17:28:24 +0000 (01:28 +0800)
diff --git a/ChangeLog b/ChangeLog

index c27907f51b648b127bbec37de8e607ff41eff958..c80126cfbbad6b6c16491be0cefad4a6fdf460a6 100644 (file)
--- a/ChangeLog
+++ b/ChangeLog
@@ -1,6 +1,7 @@
  version <unreleased>
  
  Extractors
+* [youtube] Fix ytsearch when cookies are provided (#11924)
  + [bilibili] Support new Bangumi URLs (#11845)
  
  version 2017.02.01
diff --git a/youtube_dl/extractor/youtube.py b/youtube_dl/extractor/youtube.py

index 0e67fdd127289ba63358182fbab8fc25d50ae2d7..f2f75110445a6bad461fcd92d4ae3d26dd456d69 100644 (file)
--- a/youtube_dl/extractor/youtube.py
+++ b/youtube_dl/extractor/youtube.py
@@ -2348,18 +2348,18 @@ class YoutubeSearchIE(SearchInfoExtractor, YoutubePlaylistIE):
          videos = []
          limit = n
  
+        url_query = {
+            'search_query': query.encode('utf-8'),
+        }
+        url_query.update(self._EXTRA_QUERY_ARGS)
+        result_url = 'https://www.youtube.com/results?' + compat_urllib_parse_urlencode(url_query)
+
          for pagenum in itertools.count(1):
-            url_query = {
-                'search_query': query.encode('utf-8'),
-                'page': pagenum,
-                'spf': 'navigate',
-            }
-            url_query.update(self._EXTRA_QUERY_ARGS)
-            result_url = 'https://www.youtube.com/results?' + compat_urllib_parse_urlencode(url_query)
              data = self._download_json(
                  result_url, video_id='query "%s"' % query,
                  note='Downloading page %s' % pagenum,
-                errnote='Unable to download API page')
+                errnote='Unable to download API page',
+                query={'spf': 'navigate'})
              html_content = data[1]['body']['content']
  
              if 'class="search-message' in html_content:
@@ -2371,6 +2371,12 @@ class YoutubeSearchIE(SearchInfoExtractor, YoutubePlaylistIE):
              videos += new_videos
              if not new_videos or len(videos) > limit:
                  break
+            next_link = self._html_search_regex(
+                r'href="(/results\?[^"]*\bsp=[^"]+)"[^>]*>\s*<span[^>]+class="[^"]*\byt-uix-button-content\b[^"]*"[^>]*>Next',
+                html_content, 'next link', default=None)
+            if next_link is None:
+                break
+            result_url = compat_urlparse.urljoin('https://www.youtube.com/', next_link)
  
          if len(videos) > n:
              videos = videos[:n]
author	Yen Chi Hsuan <yan12125@gmail.com>
	Thu, 2 Feb 2017 17:28:24 +0000 (01:28 +0800)
committer	Yen Chi Hsuan <yan12125@gmail.com>
	Thu, 2 Feb 2017 17:28:24 +0000 (01:28 +0800)
ChangeLog		patch \| blob \| history
youtube_dl/extractor/youtube.py		patch \| blob \| history