X-Git-Url: http://git.bitcoin.ninja/index.cgi?a=blobdiff_plain;f=youtube_dl%2Fextractor%2Fbpb.py;h=6ad45a1e6a30bac2450743de3f0d12a2c9f2b89d;hb=7ded6545edb18bb008e8277b42a21d60fb6cd653;hp=56068858926fcf78490ed42efeef8c5deb57371d;hpb=355682be016e6916ea0b3565f7e5fb496f3a660a;p=youtube-dl diff --git a/youtube_dl/extractor/bpb.py b/youtube_dl/extractor/bpb.py index 560688589..6ad45a1e6 100644 --- a/youtube_dl/extractor/bpb.py +++ b/youtube_dl/extractor/bpb.py @@ -1,41 +1,57 @@ # coding: utf-8 - from __future__ import unicode_literals import re from .common import InfoExtractor +from ..utils import ( + js_to_json, + determine_ext, +) + class BpbIE(InfoExtractor): - IE_NAME = 'Bundeszentrale für politische Bildung' - _VALID_URL = r'http://www\.bpb\.de/mediathek/.*' - - _TEST = { - 'url': 'http://www.bpb.de/mediathek/297/joachim-gauck-zu-1989-und-die-erinnerung-an-die-ddr', - 'md5': '0792086e8e2bfbac9cdf27835d5f2093', - 'info_dict': { - 'id': '12490', - 'ext': 'mp4', - 'title': 'Joachim Gauck zu 1989 und die Erinnerung an die DDR', - 'description': 'Joachim Gauck, erster Beauftragter für die Stasi-Unterlagen, spricht auf dem Geschichtsforum über die friedliche Revolution 1989 und eine "gewisse Traurigkeit" im Umgang mit der DDR-Vergangenheit.' - } - } - - def _real_extract(self, url): - webpage = self._download_webpage(url, '') - - title = self._html_search_regex(r'

(.*?)

', webpage, 'title') - - video_id = self._html_search_regex(r'http://film\.bpb\.de/player/dokument_(?P[0-9]+)\.mp4', webpage, 'video_id') - - url = 'http://film.bpb.de/player/dokument_' + video_id + '.mp4' - - description = self._og_search_description(webpage) - - return { - 'id': video_id, - 'url': url, - 'title': title, - 'description': description, - 'ext': 'mp4' - } + IE_DESC = 'Bundeszentrale für politische Bildung' + _VALID_URL = r'https?://www\.bpb\.de/mediathek/(?P[0-9]+)/' + + _TEST = { + 'url': 'http://www.bpb.de/mediathek/297/joachim-gauck-zu-1989-und-die-erinnerung-an-die-ddr', + # md5 fails in Python 2.6 due to buggy server response and wrong handling of urllib2 + 'md5': 'c4f84c8a8044ca9ff68bb8441d300b3f', + 'info_dict': { + 'id': '297', + 'ext': 'mp4', + 'title': 'Joachim Gauck zu 1989 und die Erinnerung an die DDR', + 'description': 'Joachim Gauck, erster Beauftragter für die Stasi-Unterlagen, spricht auf dem Geschichtsforum über die friedliche Revolution 1989 und eine "gewisse Traurigkeit" im Umgang mit der DDR-Vergangenheit.' + } + } + + def _real_extract(self, url): + video_id = self._match_id(url) + webpage = self._download_webpage(url, video_id) + + title = self._html_search_regex( + r'

(.*?)

', webpage, 'title') + video_info_dicts = re.findall( + r"({\s*src:\s*'http://film\.bpb\.de/[^}]+})", webpage) + + formats = [] + for video_info in video_info_dicts: + video_info = self._parse_json(video_info, video_id, transform_source=js_to_json) + quality = video_info['quality'] + video_url = video_info['src'] + formats.append({ + 'url': video_url, + 'preference': 10 if quality == 'high' else 0, + 'format_note': quality, + 'format_id': '%s-%s' % (quality, determine_ext(video_url)), + }) + + self._sort_formats(formats) + + return { + 'id': video_id, + 'formats': formats, + 'title': title, + 'description': self._og_search_description(webpage), + }