[douyutv] Improve room id regex

author Justsoos <justso@gmail.com>

Wed, 1 Feb 2017 13:30:01 +0000 (21:30 +0800)

committer Sergey M․ <dstftw@gmail.com>

Thu, 2 Feb 2017 20:26:41 +0000 (03:26 +0700)
author Justsoos <justso@gmail.com>
Wed, 1 Feb 2017 13:30:01 +0000 (21:30 +0800)
committer Sergey M․ <dstftw@gmail.com>
Thu, 2 Feb 2017 20:26:41 +0000 (03:26 +0700)
diff --git a/youtube_dl/extractor/douyutv.py b/youtube_dl/extractor/douyutv.py

index 2f3c5113ed03a4aa035477d74d72630ba6c13ce8..91159441369121773a5b3a5b02b5ecc9e9ee01fd 100644 (file)
--- a/youtube_dl/extractor/douyutv.py
+++ b/youtube_dl/extractor/douyutv.py
@@ -18,7 +18,7 @@ from ..utils import (
  
  class DouyuTVIE(InfoExtractor):
      IE_DESC = '斗鱼'
-    _VALID_URL = r'https?://(?:www\.)?douyu(?:tv)?\.com/(?P<id>[A-Za-z0-9]+)'
+    _VALID_URL = r'https?://(?:www\.)?douyu(?:tv)?\.com/(?:[^/]+/)*(?P<id>[A-Za-z0-9]+)'
      _TESTS = [{
          'url': 'http://www.douyutv.com/iseven',
          'info_dict': {
@@ -68,6 +68,10 @@ class DouyuTVIE(InfoExtractor):
      }, {
          'url': 'http://www.douyu.com/xiaocang',
          'only_matching': True,
+    }, {
+        # \"room_id\"
+        'url': 'http://www.douyu.com/t/lpl',
+        'only_matching': True,
      }]
  
      # Decompile core.swf in webpage by ffdec "Search SWFs in memory". core.swf
@@ -82,7 +86,7 @@ class DouyuTVIE(InfoExtractor):
          else:
              page = self._download_webpage(url, video_id)
              room_id = self._html_search_regex(
-                r'"room_id"\s*:\s*(\d+),', page, 'room id')
+                r'"room_id\\?"\s*:\s*(\d+),', page, 'room id')
  
          room = self._download_json(
              'http://m.douyu.com/html5/live?roomId=%s' % room_id, video_id,
author	Justsoos <justso@gmail.com>
	Wed, 1 Feb 2017 13:30:01 +0000 (21:30 +0800)
committer	Sergey M․ <dstftw@gmail.com>
	Thu, 2 Feb 2017 20:26:41 +0000 (03:26 +0700)