[empflix] Revert to XML parser

author Philipp Hagemeister <phihag@phihag.de>

Tue, 26 Aug 2014 13:49:15 +0000 (15:49 +0200)

committer Philipp Hagemeister <phihag@phihag.de>

Tue, 26 Aug 2014 13:51:42 +0000 (15:51 +0200)
author Philipp Hagemeister <phihag@phihag.de>
Tue, 26 Aug 2014 13:49:15 +0000 (15:49 +0200)
committer Philipp Hagemeister <phihag@phihag.de>
Tue, 26 Aug 2014 13:51:42 +0000 (15:51 +0200)
diff --git a/youtube_dl/extractor/empflix.py b/youtube_dl/extractor/empflix.py

index 3c2289e5710d78b9f934ee2e578d9539d3cc267a..1c498d8c8fa0cc95a2963a19384201a42ec2fa4b 100644 (file)
--- a/youtube_dl/extractor/empflix.py
+++ b/youtube_dl/extractor/empflix.py
@@ -3,6 +3,7 @@ from __future__ import unicode_literals
  import re
  
  from .common import InfoExtractor
+from ..utils import fix_xml_ampersands
  
  
  class EmpflixIE(InfoExtractor):
@@ -35,20 +36,17 @@ class EmpflixIE(InfoExtractor):
              r'flashvars\.config = escape\("([^"]+)"',
              webpage, 'flashvars.config')
  
-        # XML is malformed
-        cfg_xml = self._download_webpage(
-            cfg_url, video_id, note='Downloading metadata')
+        cfg_xml = self._download_xml(
+            cfg_url, video_id, note='Downloading metadata',
+            transform_source=fix_xml_ampersands)
  
          formats = [
              {
-                'url': item[1],
-                'format_id': item[0],
-            } for item in re.findall(
-                r'<item>\s*<res>([^>]+)</res>\s*<videoLink>([^<]+)</videoLink>\s*</item>', cfg_xml)
+                'url': item.find('videoLink').text,
+                'format_id': item.find('res').text,
+            } for item in cfg_xml.findall('./quality/item')
          ]
-
-        thumbnail = self._html_search_regex(
-            r'<startThumb>([^<]+)</startThumb>', cfg_xml, 'thumbnail', fatal=False)
+        thumbnail = cfg_xml.find('./startThumb').text
  
          return {
              'id': video_id,
author	Philipp Hagemeister <phihag@phihag.de>
	Tue, 26 Aug 2014 13:49:15 +0000 (15:49 +0200)
committer	Philipp Hagemeister <phihag@phihag.de>
	Tue, 26 Aug 2014 13:51:42 +0000 (15:51 +0200)