[nova] Fix display_id extraction bug
authorSlava Shklyaev <shk.slava@gmail.com>
Tue, 2 Jun 2015 09:47:52 +0000 (12:47 +0300)
committerSlava Shklyaev <shk.slava@gmail.com>
Tue, 2 Jun 2015 09:49:01 +0000 (12:49 +0300)
Make id group non-greedy so that .html is not included in it.

youtube_dl/extractor/nova.py

index 4e999b2379a0310730e79abb14adf6da433d1c16..1dd18511e123c7dc3f5e9a579c1fa42075ffe4bd 100644 (file)
@@ -8,7 +8,7 @@ from .common import InfoExtractor
 
 class NovaIE(InfoExtractor):
     IE_DESC = 'TN.cz, Prásk.tv, Nova.cz, Novaplus.cz, FANDA.tv, Krásná.cz and Doma.cz'
-    _VALID_URL = 'http://(?:[^.]+\.)?(?P<site>tv(?:noviny)?|tn|novaplus|vymena|fanda|krasna|doma|prask)\.nova\.cz/(?:[^/]+/)+(?P<id>[^/]+)(?:\.html|/?)'
+    _VALID_URL = 'http://(?:[^.]+\.)?(?P<site>tv(?:noviny)?|tn|novaplus|vymena|fanda|krasna|doma|prask)\.nova\.cz/(?:[^/]+/)+(?P<id>[^/]+?)(?:\.html|/?)$'
     _TESTS = [{
         'url': 'http://tvnoviny.nova.cz/clanek/novinky/co-na-sebe-sportaci-praskli-vime-jestli-pujde-hrdlicka-na-materskou.html',
         'info_dict': {