Filter DRM protected media in f4m downloader

author rzhxeo <rzhxeot7z81b4700@mailcatch.com>

Wed, 28 May 2014 16:19:23 +0000 (18:19 +0200)

committer rzhxeo <rzhxeot7z81b4700@mailcatch.com>

Mon, 26 Jan 2015 19:44:48 +0000 (20:44 +0100)
author rzhxeo <rzhxeot7z81b4700@mailcatch.com>
Wed, 28 May 2014 16:19:23 +0000 (18:19 +0200)
committer rzhxeo <rzhxeot7z81b4700@mailcatch.com>
Mon, 26 Jan 2015 19:44:48 +0000 (20:44 +0100)
diff --git a/youtube_dl/downloader/f4m.py b/youtube_dl/downloader/f4m.py

index c68b2c303035395f77d3a983d949eb23737e0156..29de7630d3de72bb9ba2cb8efccbe17644d3808f 100644 (file)
--- a/youtube_dl/downloader/f4m.py
+++ b/youtube_dl/downloader/f4m.py
@@ -230,6 +230,23 @@ class F4mFD(FileDownloader):
      A downloader for f4m manifests or AdobeHDS.
      """
  
+    def _get_unencrypted_media(self, doc):
+        media=doc.findall(_add_ns('media'))
+        if not media:
+            self.report_error('No media found')
+        for e in (doc.findall(_add_ns('drmAdditionalHeader')) +
+                  doc.findall(_add_ns('drmAdditionalHeaderSet'))):
+            # If id attribute is missing it's valid for all media nodes
+            # without drmAdditionalHeaderId or drmAdditionalHeaderSetId attribute
+            if not 'id' in e.attrib:
+                self.report_error('Media is DRM protected')
+        media = list(filter(lambda e: 'drmAdditionalHeaderId' not in e.attrib and
+                                      'drmAdditionalHeaderSetId' not in e.attrib,
+                            media))
+        if not media:
+            self.report_error('Media is DRM protected')
+        return media
+
      def real_download(self, filename, info_dict):
          man_url = info_dict['url']
          requested_bitrate = info_dict.get('tbr')
@@ -248,7 +265,8 @@ class F4mFD(FileDownloader):
          )
  
          doc = etree.fromstring(manifest)
-        formats = [(int(f.attrib.get('bitrate', -1)), f) for f in doc.findall(_add_ns('media'))]
+        formats = [(int(f.attrib.get('bitrate', -1)), f)
+                   for f in self._get_unencrypted_media(doc)]
          if requested_bitrate is None:
              # get the best format
              formats = sorted(formats, key=lambda f: f[0])
author	rzhxeo <rzhxeot7z81b4700@mailcatch.com>
	Wed, 28 May 2014 16:19:23 +0000 (18:19 +0200)
committer	rzhxeo <rzhxeot7z81b4700@mailcatch.com>
	Mon, 26 Jan 2015 19:44:48 +0000 (20:44 +0100)