[dailymotion] Fix playlist extraction

author Jaime Marquínez Ferrándiz <jaime.marquinez.ferrandiz@gmail.com>

Fri, 4 Oct 2013 12:07:29 +0000 (14:07 +0200)

committer Jaime Marquínez Ferrándiz <jaime.marquinez.ferrandiz@gmail.com>

Fri, 4 Oct 2013 12:07:29 +0000 (14:07 +0200)
author Jaime Marquínez Ferrándiz <jaime.marquinez.ferrandiz@gmail.com>
Fri, 4 Oct 2013 12:07:29 +0000 (14:07 +0200)
committer Jaime Marquínez Ferrándiz <jaime.marquinez.ferrandiz@gmail.com>
Fri, 4 Oct 2013 12:07:29 +0000 (14:07 +0200)
diff --git a/youtube_dl/extractor/dailymotion.py b/youtube_dl/extractor/dailymotion.py

index 259806f385d621b909f465f0dc78271fb352c4fe..7d83539469d3d7ff120f916cc837a60bacfe8390 100644 (file)
--- a/youtube_dl/extractor/dailymotion.py
+++ b/youtube_dl/extractor/dailymotion.py
@@ -10,6 +10,7 @@ from ..utils import (
      compat_str,
      get_element_by_attribute,
      get_element_by_id,
+    orderedSet,
  
      ExtractorError,
  )
@@ -158,12 +159,12 @@ class DailymotionPlaylistIE(DailymotionBaseInfoExtractor):
                                               id, u'Downloading page %s' % pagenum)
  
              playlist_el = get_element_by_attribute(u'class', u'video_list', webpage)
-            video_ids.extend(re.findall(r'data-id="(.+?)" data-ext-id', playlist_el))
+            video_ids.extend(re.findall(r'data-id="(.+?)"', playlist_el))
  
              if re.search(self._MORE_PAGES_INDICATOR, webpage, re.DOTALL) is None:
                  break
          return [self.url_result('http://www.dailymotion.com/video/%s' % video_id, 'Dailymotion')
-                   for video_id in video_ids]
+                   for video_id in orderedSet(video_ids)]
  
      def _real_extract(self, url):
          mobj = re.match(self._VALID_URL, url)
author	Jaime Marquínez Ferrándiz <jaime.marquinez.ferrandiz@gmail.com>
	Fri, 4 Oct 2013 12:07:29 +0000 (14:07 +0200)
committer	Jaime Marquínez Ferrándiz <jaime.marquinez.ferrandiz@gmail.com>
	Fri, 4 Oct 2013 12:07:29 +0000 (14:07 +0200)