[n-tv.de] Fix extraction (closes #10331)

[youtube-dl] / youtube_dl / extractor / ntvde.py
diff --git a/youtube_dl/extractor/ntvde.py b/youtube_dl/extractor/ntvde.py

index 8268eace75fd9f0bc9dc00195f4594a6cd2a9d8a..d28a8154247f75cbc612f7999083cd60275c5a88 100644 (file)
--- a/youtube_dl/extractor/ntvde.py
+++ b/youtube_dl/extractor/ntvde.py
@@ -1,6 +1,8 @@
-# encoding: utf-8
+# coding: utf-8
  from __future__ import unicode_literals
  
+import re
+
  from .common import InfoExtractor
  from ..compat import compat_urlparse
  from ..utils import (
@@ -35,13 +37,13 @@ class NTVDeIE(InfoExtractor):
          webpage = self._download_webpage(url, video_id)
  
          info = self._parse_json(self._search_regex(
-            r'(?s)ntv.pageInfo.article =\s(\{.*?\});', webpage, 'info'),
+            r'(?s)ntv\.pageInfo\.article\s*=\s*(\{.*?\});', webpage, 'info'),
              video_id, transform_source=js_to_json)
          timestamp = int_or_none(info.get('publishedDateAsUnixTimeStamp'))
          vdata = self._parse_json(self._search_regex(
              r'(?s)\$\(\s*"\#player"\s*\)\s*\.data\(\s*"player",\s*(\{.*?\})\);',
-            webpage, 'player data'),
-            video_id, transform_source=js_to_json)
+            webpage, 'player data'), video_id,
+            transform_source=lambda s: js_to_json(re.sub(r'advertising:\s*{[^}]+},', '', s)))
          duration = parse_duration(vdata.get('duration'))
  
          formats = []