[youtube] Fix extraction.
[youtube-dl] / youtube_dl / extractor / rtvnh.py
1 # coding: utf-8
2 from __future__ import unicode_literals
3
4 from .common import InfoExtractor
5 from ..utils import ExtractorError
6
7
8 class RTVNHIE(InfoExtractor):
9     _VALID_URL = r'https?://(?:www\.)?rtvnh\.nl/video/(?P<id>[0-9]+)'
10     _TEST = {
11         'url': 'http://www.rtvnh.nl/video/131946',
12         'md5': 'cdbec9f44550763c8afc96050fa747dc',
13         'info_dict': {
14             'id': '131946',
15             'ext': 'mp4',
16             'title': 'Grote zoektocht in zee bij Zandvoort naar vermiste vrouw',
17             'thumbnail': r're:^https?:.*\.jpg$'
18         }
19     }
20
21     def _real_extract(self, url):
22         video_id = self._match_id(url)
23
24         meta = self._parse_json(self._download_webpage(
25             'http://www.rtvnh.nl/video/json?m=' + video_id, video_id), video_id)
26
27         status = meta.get('status')
28         if status != 200:
29             raise ExtractorError(
30                 '%s returned error code %d' % (self.IE_NAME, status), expected=True)
31
32         formats = []
33         rtmp_formats = self._extract_smil_formats(
34             'http://www.rtvnh.nl/video/smil?m=' + video_id, video_id)
35         formats.extend(rtmp_formats)
36
37         for rtmp_format in rtmp_formats:
38             rtmp_url = '%s/%s' % (rtmp_format['url'], rtmp_format['play_path'])
39             rtsp_format = rtmp_format.copy()
40             del rtsp_format['play_path']
41             del rtsp_format['ext']
42             rtsp_format.update({
43                 'format_id': rtmp_format['format_id'].replace('rtmp', 'rtsp'),
44                 'url': rtmp_url.replace('rtmp://', 'rtsp://'),
45                 'protocol': 'rtsp',
46             })
47             formats.append(rtsp_format)
48             http_base_url = rtmp_url.replace('rtmp://', 'http://')
49             formats.extend(self._extract_m3u8_formats(
50                 http_base_url + '/playlist.m3u8', video_id, 'mp4',
51                 'm3u8_native', m3u8_id='hls', fatal=False))
52             formats.extend(self._extract_f4m_formats(
53                 http_base_url + '/manifest.f4m',
54                 video_id, f4m_id='hds', fatal=False))
55         self._sort_formats(formats)
56
57         return {
58             'id': video_id,
59             'title': meta['title'].strip(),
60             'thumbnail': meta.get('image'),
61             'formats': formats
62         }