[youtube] Extract license (Closes #8725)

[youtube-dl] / youtube_dl / extractor / youtube.py
diff --git a/youtube_dl/extractor/youtube.py b/youtube_dl/extractor/youtube.py

index a2f7760502d3771335fdc88496e443ed67f6ea2b..43fdbfab1f1e637d9201373fb6a659ec0c3ec723 100644 (file)
--- a/youtube_dl/extractor/youtube.py
+++ b/youtube_dl/extractor/youtube.py
@@ -6,6 +6,7 @@ from __future__ import unicode_literals
  import itertools
  import json
  import os.path
+import random
  import re
  import time
  import traceback
@@ -181,7 +182,7 @@ class YoutubeBaseInfoExtractor(InfoExtractor):
              return
  
  
-class YoutubeEntryListBaseInfoExtractor(InfoExtractor):
+class YoutubeEntryListBaseInfoExtractor(YoutubeBaseInfoExtractor):
      # Extract entries from page with "Load more" button
      def _entries(self, page, playlist_id):
          more_widget_html = content_html = page
@@ -233,7 +234,7 @@ class YoutubePlaylistBaseInfoExtractor(YoutubeEntryListBaseInfoExtractor):
  
  class YoutubePlaylistsBaseInfoExtractor(YoutubeEntryListBaseInfoExtractor):
      def _process_page(self, content):
-        for playlist_id in re.findall(r'href="/?playlist\?list=(.+?)"', content):
+        for playlist_id in orderedSet(re.findall(r'href="/?playlist\?list=([0-9A-Za-z-_]{10,})"', content)):
              yield self.url_result(
                  'https://www.youtube.com/playlist?list=%s' % playlist_id, 'YoutubePlaylist')
  
@@ -286,7 +287,8 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
          '22': {'ext': 'mp4', 'width': 1280, 'height': 720, 'acodec': 'aac', 'abr': 192, 'vcodec': 'h264'},
          '34': {'ext': 'flv', 'width': 640, 'height': 360, 'acodec': 'aac', 'abr': 128, 'vcodec': 'h264'},
          '35': {'ext': 'flv', 'width': 854, 'height': 480, 'acodec': 'aac', 'abr': 128, 'vcodec': 'h264'},
-        '36': {'ext': '3gp', 'width': 320, 'height': 240, 'acodec': 'aac', 'abr': 32, 'vcodec': 'mp4v'},
+        # itag 36 videos are either 320x180 (BaW_jenozKc) or 320x240 (__2ABJjxzNo), abr varies as well
+        '36': {'ext': '3gp', 'width': 320, 'acodec': 'aac', 'vcodec': 'mp4v'},
          '37': {'ext': 'mp4', 'width': 1920, 'height': 1080, 'acodec': 'aac', 'abr': 192, 'vcodec': 'h264'},
          '38': {'ext': 'mp4', 'width': 4096, 'height': 3072, 'acodec': 'aac', 'abr': 192, 'vcodec': 'h264'},
          '43': {'ext': 'webm', 'width': 640, 'height': 360, 'acodec': 'vorbis', 'abr': 128, 'vcodec': 'vp8'},
@@ -369,11 +371,12 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
          # RTMP (unnamed)
          '_rtmp': {'protocol': 'rtmp'},
      }
+    _SUBTITLE_FORMATS = ('ttml', 'vtt')
  
      IE_NAME = 'youtube'
      _TESTS = [
          {
-            'url': 'http://www.youtube.com/watch?v=BaW_jenozKcj&t=1s&end=9',
+            'url': 'http://www.youtube.com/watch?v=BaW_jenozKc&t=1s&end=9',
              'info_dict': {
                  'id': 'BaW_jenozKc',
                  'ext': 'mp4',
@@ -381,6 +384,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'uploader': 'Philipp Hagemeister',
                  'uploader_id': 'phihag',
                  'upload_date': '20121002',
+                'license': 'Standard YouTube License',
                  'description': 'test chars:  "\'/\\ä↭𝕐\ntest URL: https://github.com/rg3/youtube-dl/issues/1892\n\nThis is a test video for youtube-dl.\n\nFor more information, contact phihag@phihag.de .',
                  'categories': ['Science & Technology'],
                  'tags': ['youtube-dl'],
@@ -399,12 +403,13 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'upload_date': '20120506',
                  'title': 'Icona Pop - I Love It (feat. Charli XCX) [OFFICIAL VIDEO]',
                  'alt_title': 'I Love It (feat. Charli XCX)',
-                'description': 'md5:782e8651347686cba06e58f71ab51773',
+                'description': 'md5:f3ceb5ef83a08d95b9d146f973157cc8',
                  'tags': ['Icona Pop i love it', 'sweden', 'pop music', 'big beat records', 'big beat', 'charli',
                           'xcx', 'charli xcx', 'girls', 'hbo', 'i love it', "i don't care", 'icona', 'pop',
                           'iconic ep', 'iconic', 'love', 'it'],
                  'uploader': 'Icona Pop',
                  'uploader_id': 'IconaPop',
+                'license': 'Standard YouTube License',
                  'creator': 'Icona Pop',
              }
          },
@@ -420,6 +425,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'description': 'md5:64249768eec3bc4276236606ea996373',
                  'uploader': 'justintimberlakeVEVO',
                  'uploader_id': 'justintimberlakeVEVO',
+                'license': 'Standard YouTube License',
                  'creator': 'Justin Timberlake',
                  'age_limit': 18,
              }
@@ -435,11 +441,12 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'description': 'md5:09b78bd971f1e3e289601dfba15ca4f7',
                  'uploader': 'SET India',
                  'uploader_id': 'setindia',
+                'license': 'Standard YouTube License',
                  'age_limit': 18,
              }
          },
          {
-            'url': 'http://www.youtube.com/watch?v=BaW_jenozKcj&v=UxxajLWwzqY',
+            'url': 'http://www.youtube.com/watch?v=BaW_jenozKc&v=UxxajLWwzqY',
              'note': 'Use the first video ID in the URL',
              'info_dict': {
                  'id': 'BaW_jenozKc',
@@ -448,6 +455,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'uploader': 'Philipp Hagemeister',
                  'uploader_id': 'phihag',
                  'upload_date': '20121002',
+                'license': 'Standard YouTube License',
                  'description': 'test chars:  "\'/\\ä↭𝕐\ntest URL: https://github.com/rg3/youtube-dl/issues/1892\n\nThis is a test video for youtube-dl.\n\nFor more information, contact phihag@phihag.de .',
                  'categories': ['Science & Technology'],
                  'tags': ['youtube-dl'],
@@ -468,6 +476,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'uploader_id': '8KVIDEO',
                  'description': '',
                  'uploader': '8KVIDEO',
+                'license': 'Standard YouTube License',
                  'title': 'UHDTV TEST 8K VIDEO.mp4'
              },
              'params': {
@@ -486,6 +495,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'uploader': 'AfrojackVEVO',
                  'uploader_id': 'AfrojackVEVO',
                  'upload_date': '20131011',
+                'license': 'Standard YouTube License',
              },
              'params': {
                  'youtube_include_dash_manifest': True,
@@ -504,6 +514,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'uploader': 'TaylorSwiftVEVO',
                  'uploader_id': 'TaylorSwiftVEVO',
                  'upload_date': '20140818',
+                'license': 'Standard YouTube License',
                  'creator': 'Taylor Swift',
              },
              'params': {
@@ -520,6 +531,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'upload_date': '20100909',
                  'uploader': 'The Amazing Atheist',
                  'uploader_id': 'TheAmazingAtheist',
+                'license': 'Standard YouTube License',
                  'title': 'Burning Everyone\'s Koran',
                  'description': 'SUBSCRIBE: http://www.youtube.com/saturninefilms\n\nEven Obama has taken a stand against freedom on this issue: http://www.huffingtonpost.com/2010/09/09/obama-gma-interview-quran_n_710282.html',
              }
@@ -535,6 +547,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'uploader': 'The Witcher',
                  'uploader_id': 'WitcherGame',
                  'upload_date': '20140605',
+                'license': 'Standard YouTube License',
                  'age_limit': 18,
              },
          },
@@ -549,6 +562,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'uploader': 'LloydVEVO',
                  'uploader_id': 'LloydVEVO',
                  'upload_date': '20110629',
+                'license': 'Standard YouTube License',
                  'age_limit': 18,
              },
          },
@@ -563,6 +577,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'creator': 'deadmau5',
                  'description': 'md5:12c56784b8032162bb936a5f76d55360',
                  'uploader': 'deadmau5',
+                'license': 'Standard YouTube License',
                  'title': 'Deadmau5 - Some Chords (HD)',
                  'alt_title': 'Some Chords',
              },
@@ -578,6 +593,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'ext': 'mp4',
                  'upload_date': '20150827',
                  'uploader_id': 'olympic',
+                'license': 'Standard YouTube License',
                  'description': 'HO09  - Women -  GER-AUS - Hockey - 31 July 2012 - London 2012 Olympic Games',
                  'uploader': 'Olympics',
                  'title': 'Hockey - Women -  GER-AUS - London 2012 Olympic Games',
@@ -597,6 +613,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'uploader_id': 'AllenMeow',
                  'description': 'made by Wacom from Korea | 字幕&加油添醋 by TY\'s Allen | 感謝heylisa00cavey1001同學熱情提供梗及翻譯',
                  'uploader': '孫艾倫',
+                'license': 'Standard YouTube License',
                  'title': '[A-made] 變態妍字幕版 太妍 我就是這樣的人',
              },
          },
@@ -628,6 +645,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'upload_date': '20150625',
                  'uploader_id': 'dorappi2000',
                  'uploader': 'dorappi2000',
+                'license': 'Standard YouTube License',
                  'formats': 'mincount:33',
              },
          },
@@ -642,6 +660,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'uploader': 'Airtek',
                  'description': 'Retransmisión en directo de la XVIII media maratón de Zaragoza.',
                  'uploader_id': 'UCzTzUmjXxxacNnL8I3m4LnQ',
+                'license': 'Standard YouTube License',
                  'title': 'Retransmisión XVIII Media maratón Zaragoza 2015',
              },
              'params': {
@@ -666,6 +685,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                      'upload_date': '20150721',
                      'uploader': 'Beer Games Beer',
                      'uploader_id': 'beergamesbeer',
+                    'license': 'Standard YouTube License',
                  },
              }, {
                  'info_dict': {
@@ -676,6 +696,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                      'upload_date': '20150721',
                      'uploader': 'Beer Games Beer',
                      'uploader_id': 'beergamesbeer',
+                    'license': 'Standard YouTube License',
                  },
              }, {
                  'info_dict': {
@@ -686,6 +707,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                      'upload_date': '20150721',
                      'uploader': 'Beer Games Beer',
                      'uploader_id': 'beergamesbeer',
+                    'license': 'Standard YouTube License',
                  },
              }, {
                  'info_dict': {
@@ -696,12 +718,22 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                      'upload_date': '20150721',
                      'uploader': 'Beer Games Beer',
                      'uploader_id': 'beergamesbeer',
+                    'license': 'Standard YouTube License',
                  },
              }],
              'params': {
                  'skip_download': True,
              },
          },
+        {
+            # Multifeed video with comma in title (see https://github.com/rg3/youtube-dl/issues/8536)
+            'url': 'https://www.youtube.com/watch?v=gVfLd0zydlo',
+            'info_dict': {
+                'id': 'gVfLd0zydlo',
+                'title': 'DevConf.cz 2016 Day 2 Workshops 1 14:00 - 15:30',
+            },
+            'playlist_count': 2,
+        },
          {
              'url': 'http://vid.plus/FlRa-iH7PGw',
              'only_matching': True,
@@ -721,6 +753,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'upload_date': '20151119',
                  'uploader_id': 'IronSoulElf',
                  'uploader': 'IronSoulElf',
+                'license': 'Standard YouTube License',
                  'creator': 'Todd Haberman, Daniel Law Heath & Aaron Kaplan',
              },
              'params': {
@@ -748,6 +781,23 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  'skip_download': True,
              },
          },
+        {
+            # Video licensed under Creative Commons
+            'url': 'https://www.youtube.com/watch?v=M4gD1WSo5mA',
+            'info_dict': {
+                'id': 'M4gD1WSo5mA',
+                'ext': 'mp4',
+                'title': 'md5:e41008789470fc2533a3252216f1c1d1',
+                'description': 'md5:a677553cf0840649b731a3024aeff4cc',
+                'upload_date': '20150127',
+                'uploader_id': 'BerkmanCenter',
+                'uploader': 'BerkmanCenter',
+                'license': 'Creative Commons Attribution license (reuse allowed)',
+            },
+            'params': {
+                'skip_download': True,
+            },
+        },
          {
              'url': 'https://www.youtube.com/watch?feature=player_embedded&amp;amp;v=V36LpHqtcDY',
              'only_matching': True,
@@ -918,7 +968,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
              if lang in sub_lang_list:
                  continue
              sub_formats = []
-            for ext in ['sbv', 'vtt', 'srt']:
+            for ext in self._SUBTITLE_FORMATS:
                  params = compat_urllib_parse.urlencode({
                      'lang': lang,
                      'v': video_id,
@@ -964,40 +1014,67 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
              return {}
          try:
              args = player_config['args']
-            caption_url = args['ttsurl']
-            if not caption_url:
-                self._downloader.report_warning(err_msg)
-                return {}
-            timestamp = args['timestamp']
-            # We get the available subtitles
-            list_params = compat_urllib_parse.urlencode({
-                'type': 'list',
-                'tlangs': 1,
-                'asrs': 1,
-            })
-            list_url = caption_url + '&' + list_params
-            caption_list = self._download_xml(list_url, video_id)
-            original_lang_node = caption_list.find('track')
-            if original_lang_node is None:
-                self._downloader.report_warning('Video doesn\'t have automatic captions')
-                return {}
-            original_lang = original_lang_node.attrib['lang_code']
-            caption_kind = original_lang_node.attrib.get('kind', '')
+            caption_url = args.get('ttsurl')
+            if caption_url:
+                timestamp = args['timestamp']
+                # We get the available subtitles
+                list_params = compat_urllib_parse.urlencode({
+                    'type': 'list',
+                    'tlangs': 1,
+                    'asrs': 1,
+                })
+                list_url = caption_url + '&' + list_params
+                caption_list = self._download_xml(list_url, video_id)
+                original_lang_node = caption_list.find('track')
+                if original_lang_node is None:
+                    self._downloader.report_warning('Video doesn\'t have automatic captions')
+                    return {}
+                original_lang = original_lang_node.attrib['lang_code']
+                caption_kind = original_lang_node.attrib.get('kind', '')
+
+                sub_lang_list = {}
+                for lang_node in caption_list.findall('target'):
+                    sub_lang = lang_node.attrib['lang_code']
+                    sub_formats = []
+                    for ext in self._SUBTITLE_FORMATS:
+                        params = compat_urllib_parse.urlencode({
+                            'lang': original_lang,
+                            'tlang': sub_lang,
+                            'fmt': ext,
+                            'ts': timestamp,
+                            'kind': caption_kind,
+                        })
+                        sub_formats.append({
+                            'url': caption_url + '&' + params,
+                            'ext': ext,
+                        })
+                    sub_lang_list[sub_lang] = sub_formats
+                return sub_lang_list
+
+            # Some videos don't provide ttsurl but rather caption_tracks and
+            # caption_translation_languages (e.g. 20LmZk1hakA)
+            caption_tracks = args['caption_tracks']
+            caption_translation_languages = args['caption_translation_languages']
+            caption_url = compat_parse_qs(caption_tracks.split(',')[0])['u'][0]
+            parsed_caption_url = compat_urlparse.urlparse(caption_url)
+            caption_qs = compat_parse_qs(parsed_caption_url.query)
  
              sub_lang_list = {}
-            for lang_node in caption_list.findall('target'):
-                sub_lang = lang_node.attrib['lang_code']
+            for lang in caption_translation_languages.split(','):
+                lang_qs = compat_parse_qs(compat_urllib_parse_unquote_plus(lang))
+                sub_lang = lang_qs.get('lc', [None])[0]
+                if not sub_lang:
+                    continue
                  sub_formats = []
-                for ext in ['sbv', 'vtt', 'srt']:
-                    params = compat_urllib_parse.urlencode({
-                        'lang': original_lang,
-                        'tlang': sub_lang,
-                        'fmt': ext,
-                        'ts': timestamp,
-                        'kind': caption_kind,
+                for ext in self._SUBTITLE_FORMATS:
+                    caption_qs.update({
+                        'tlang': [sub_lang],
+                        'fmt': [ext],
                      })
+                    sub_url = compat_urlparse.urlunparse(parsed_caption_url._replace(
+                        query=compat_urllib_parse.urlencode(caption_qs, True)))
                      sub_formats.append({
-                        'url': caption_url + '&' + params,
+                        'url': sub_url,
                          'ext': ext,
                      })
                  sub_lang_list[sub_lang] = sub_formats
@@ -1008,6 +1085,29 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
              self._downloader.report_warning(err_msg)
              return {}
  
+    def _mark_watched(self, video_id, video_info):
+        playback_url = video_info.get('videostats_playback_base_url', [None])[0]
+        if not playback_url:
+            return
+        parsed_playback_url = compat_urlparse.urlparse(playback_url)
+        qs = compat_urlparse.parse_qs(parsed_playback_url.query)
+
+        # cpn generation algorithm is reverse engineered from base.js.
+        # In fact it works even with dummy cpn.
+        CPN_ALPHABET = 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789-_'
+        cpn = ''.join((CPN_ALPHABET[random.randint(0, 256) & 63] for _ in range(0, 16)))
+
+        qs.update({
+            'ver': ['2'],
+            'cpn': [cpn],
+        })
+        playback_url = compat_urlparse.urlunparse(
+            parsed_playback_url._replace(query=compat_urllib_parse.urlencode(qs, True)))
+
+        self._download_webpage(
+            playback_url, video_id, 'Marking watched',
+            'Unable to mark watched', fatal=False)
+
      @classmethod
      def extract_id(cls, url):
          mobj = re.match(cls._VALID_URL, url, re.VERBOSE)
@@ -1194,9 +1294,12 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
              if not self._downloader.params.get('noplaylist'):
                  entries = []
                  feed_ids = []
-                multifeed_metadata_list = compat_urllib_parse_unquote_plus(video_info['multifeed_metadata_list'][0])
+                multifeed_metadata_list = video_info['multifeed_metadata_list'][0]
                  for feed in multifeed_metadata_list.split(','):
-                    feed_data = compat_parse_qs(feed)
+                    # Unquote should take place before split on comma (,) since textual
+                    # fields may contain comma as well (see
+                    # https://github.com/rg3/youtube-dl/issues/8536)
+                    feed_data = compat_parse_qs(compat_urllib_parse_unquote_plus(feed))
                      entries.append({
                          '_type': 'url_transparent',
                          'ie_key': 'Youtube',
@@ -1261,6 +1364,10 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  upload_date = ' '.join(re.sub(r'[/,-]', r' ', mobj.group(1)).split())
          upload_date = unified_strdate(upload_date)
  
+        video_license = self._html_search_regex(
+            r'<h4[^>]+class="title"[^>]*>\s*License\s*</h4>\s*<ul[^>]*>\s*<li>(.+?)</li',
+            video_webpage, 'license', default=None)
+
          m_music = re.search(
              r'<h4[^>]+class="title"[^>]*>\s*Music\s*</h4>\s*<ul[^>]*>\s*<li>(?P<title>.+?) by (?P<creator>.+?)(?:\(.+?\))?</li',
              video_webpage)
@@ -1334,6 +1441,19 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
              encoded_url_map = video_info.get('url_encoded_fmt_stream_map', [''])[0] + ',' + video_info.get('adaptive_fmts', [''])[0]
              if 'rtmpe%3Dyes' in encoded_url_map:
                  raise ExtractorError('rtmpe downloads are not supported, see https://github.com/rg3/youtube-dl/issues/343 for more information.', expected=True)
+            formats_spec = {}
+            fmt_list = video_info.get('fmt_list', [''])[0]
+            if fmt_list:
+                for fmt in fmt_list.split(','):
+                    spec = fmt.split('/')
+                    if len(spec) > 1:
+                        width_height = spec[1].split('x')
+                        if len(width_height) == 2:
+                            formats_spec[spec[0]] = {
+                                'resolution': spec[1],
+                                'width': int_or_none(width_height[0]),
+                                'height': int_or_none(width_height[1]),
+                            }
              formats = []
              for url_data_str in encoded_url_map.split(','):
                  url_data = compat_parse_qs(url_data_str)
@@ -1402,6 +1522,8 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                  }
                  if format_id in self._formats:
                      dct.update(self._formats[format_id])
+                if format_id in formats_spec:
+                    dct.update(formats_spec[format_id])
  
                  # Some itags are not included in DASH manifest thus corresponding formats will
                  # lack metadata (see https://github.com/rg3/youtube-dl/pull/5993).
@@ -1463,7 +1585,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
          # Look for the DASH manifest
          if self._downloader.params.get('youtube_include_dash_manifest', True):
              dash_mpd_fatal = True
-            for dash_manifest_url in dash_mpds:
+            for mpd_url in dash_mpds:
                  dash_formats = {}
                  try:
                      def decrypt_sig(mobj):
@@ -1471,15 +1593,11 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
                          dec_s = self._decrypt_signature(s, video_id, player_url, age_gate)
                          return '/signature/%s' % dec_s
  
-                    dash_manifest_url = re.sub(r'/s/([a-fA-F0-9\.]+)', decrypt_sig, dash_manifest_url)
-                    dash_doc = self._download_xml(
-                        dash_manifest_url, video_id,
-                        note='Downloading DASH manifest',
-                        errnote='Could not download DASH manifest',
-                        fatal=dash_mpd_fatal)
+                    mpd_url = re.sub(r'/s/([a-fA-F0-9\.]+)', decrypt_sig, mpd_url)
  
-                    for df in self._parse_dash_manifest(
-                            dash_doc, namespace='urn:mpeg:DASH:schema:MPD:2011', formats_dict=self._formats):
+                    for df in self._extract_mpd_formats(
+                            mpd_url, video_id, fatal=dash_mpd_fatal,
+                            formats_dict=self._formats):
                          # Do not overwrite DASH format found in some previous DASH manifest
                          if df['format_id'] not in dash_formats:
                              dash_formats[df['format_id']] = df
@@ -1518,11 +1636,14 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
  
          self._sort_formats(formats)
  
+        self.mark_watched(video_id, video_info)
+
          return {
              'id': video_id,
              'uploader': video_uploader,
              'uploader_id': video_uploader_id,
              'upload_date': upload_date,
+            'license': video_license,
              'creator': video_creator,
              'title': video_title,
              'alt_title': video_alt_title,
@@ -1547,7 +1668,7 @@ class YoutubeIE(YoutubeBaseInfoExtractor):
          }
  
  
-class YoutubePlaylistIE(YoutubeBaseInfoExtractor, YoutubePlaylistBaseInfoExtractor):
+class YoutubePlaylistIE(YoutubePlaylistBaseInfoExtractor):
      IE_DESC = 'YouTube.com playlists'
      _VALID_URL = r"""(?x)(?:
                          (?:https?://)?
@@ -1691,13 +1812,7 @@ class YoutubePlaylistIE(YoutubeBaseInfoExtractor, YoutubePlaylistBaseInfoExtract
  
          return self.playlist_result(self._entries(page, playlist_id), playlist_id, playlist_title)
  
-    def _real_extract(self, url):
-        # Extract playlist id
-        mobj = re.match(self._VALID_URL, url)
-        if mobj is None:
-            raise ExtractorError('Invalid URL: %s' % url)
-        playlist_id = mobj.group(1) or mobj.group(2)
-
+    def _check_download_just_video(self, url, playlist_id):
          # Check if it's a video-specific URL
          query_dict = compat_urlparse.parse_qs(compat_urlparse.urlparse(url).query)
          if 'v' in query_dict:
@@ -1708,6 +1823,17 @@ class YoutubePlaylistIE(YoutubeBaseInfoExtractor, YoutubePlaylistBaseInfoExtract
              else:
                  self.to_screen('Downloading playlist %s - add --no-playlist to just download video %s' % (playlist_id, video_id))
  
+    def _real_extract(self, url):
+        # Extract playlist id
+        mobj = re.match(self._VALID_URL, url)
+        if mobj is None:
+            raise ExtractorError('Invalid URL: %s' % url)
+        playlist_id = mobj.group(1) or mobj.group(2)
+
+        video = self._check_download_just_video(url, playlist_id)
+        if video:
+            return video
+
          if playlist_id.startswith('RD') or playlist_id.startswith('UL'):
              # Mixes require a custom extraction process
              return self._extract_mix(playlist_id)
@@ -1902,13 +2028,16 @@ class YoutubeSearchDateIE(YoutubeSearchIE):
  class YoutubeSearchURLIE(InfoExtractor):
      IE_DESC = 'YouTube.com search URLs'
      IE_NAME = 'youtube:search_url'
-    _VALID_URL = r'https?://(?:www\.)?youtube\.com/results\?(.*?&)?search_query=(?P<query>[^&]+)(?:[&]|$)'
+    _VALID_URL = r'https?://(?:www\.)?youtube\.com/results\?(.*?&)?(?:search_query|q)=(?P<query>[^&]+)(?:[&]|$)'
      _TESTS = [{
          'url': 'https://www.youtube.com/results?baz=bar&search_query=youtube-dl+test+video&filters=video&lclk=video',
          'playlist_mincount': 5,
          'info_dict': {
              'title': 'youtube-dl test video',
          }
+    }, {
+        'url': 'https://www.youtube.com/results?q=test&sp=EgQIBBgB',
+        'only_matching': True,
      }]
  
      def _real_extract(self, url):
@@ -2013,11 +2142,20 @@ class YoutubeFeedsInfoExtractor(YoutubeBaseInfoExtractor):
  class YoutubeWatchLaterIE(YoutubePlaylistIE):
      IE_NAME = 'youtube:watchlater'
      IE_DESC = 'Youtube watch later list, ":ytwatchlater" for short (requires authentication)'
-    _VALID_URL = r'https?://www\.youtube\.com/(?:feed/watch_later|playlist\?list=WL)|:ytwatchlater'
+    _VALID_URL = r'https?://www\.youtube\.com/(?:feed/watch_later|(?:playlist|watch)\?(?:.+&)?list=WL)|:ytwatchlater'
  
-    _TESTS = []  # override PlaylistIE tests
+    _TESTS = [{
+        'url': 'https://www.youtube.com/playlist?list=WL',
+        'only_matching': True,
+    }, {
+        'url': 'https://www.youtube.com/watch?v=bCNU9TrbiRk&index=1&list=WL',
+        'only_matching': True,
+    }]
  
      def _real_extract(self, url):
+        video = self._check_download_just_video(url, 'WL')
+        if video:
+            return video
          return self._extract_playlist('WL')