[youtube] Fix extraction.
[youtube-dl] / youtube_dl / extractor / nick.py
1 # coding: utf-8
2 from __future__ import unicode_literals
3
4 import re
5
6 from .mtv import MTVServicesInfoExtractor
7 from ..utils import update_url_query
8
9
10 class NickIE(MTVServicesInfoExtractor):
11     # None of videos on the website are still alive?
12     IE_NAME = 'nick.com'
13     _VALID_URL = r'https?://(?P<domain>(?:(?:www|beta)\.)?nick(?:jr)?\.com)/(?:[^/]+/)?(?:videos/clip|[^/]+/videos)/(?P<id>[^/?#.]+)'
14     _FEED_URL = 'http://udat.mtvnservices.com/service1/dispatch.htm'
15     _GEO_COUNTRIES = ['US']
16     _TESTS = [{
17         'url': 'http://www.nick.com/videos/clip/alvinnn-and-the-chipmunks-112-full-episode.html',
18         'playlist': [
19             {
20                 'md5': '6e5adc1e28253bbb1b28ab05403dd4d4',
21                 'info_dict': {
22                     'id': 'be6a17b0-412d-11e5-8ff7-0026b9414f30',
23                     'ext': 'mp4',
24                     'title': 'ALVINNN!!! and The Chipmunks: "Mojo Missing/Who\'s The Animal" S1',
25                     'description': 'Alvin is convinced his mojo was in a cap he gave to a fan, and must find a way to get his hat back before the Chipmunks’ big concert.\nDuring a costume visit to the zoo, Alvin finds himself mistaken for the real Tasmanian devil.',
26
27                 }
28             },
29             {
30                 'md5': 'd7be441fc53a1d4882fa9508a1e5b3ce',
31                 'info_dict': {
32                     'id': 'be6b8f96-412d-11e5-8ff7-0026b9414f30',
33                     'ext': 'mp4',
34                     'title': 'ALVINNN!!! and The Chipmunks: "Mojo Missing/Who\'s The Animal" S2',
35                     'description': 'Alvin is convinced his mojo was in a cap he gave to a fan, and must find a way to get his hat back before the Chipmunks’ big concert.\nDuring a costume visit to the zoo, Alvin finds himself mistaken for the real Tasmanian devil.',
36
37                 }
38             },
39             {
40                 'md5': 'efffe1728a234b2b0d2f2b343dd1946f',
41                 'info_dict': {
42                     'id': 'be6cf7e6-412d-11e5-8ff7-0026b9414f30',
43                     'ext': 'mp4',
44                     'title': 'ALVINNN!!! and The Chipmunks: "Mojo Missing/Who\'s The Animal" S3',
45                     'description': 'Alvin is convinced his mojo was in a cap he gave to a fan, and must find a way to get his hat back before the Chipmunks’ big concert.\nDuring a costume visit to the zoo, Alvin finds himself mistaken for the real Tasmanian devil.',
46                 }
47             },
48             {
49                 'md5': '1ec6690733ab9f41709e274a1d5c7556',
50                 'info_dict': {
51                     'id': 'be6e3354-412d-11e5-8ff7-0026b9414f30',
52                     'ext': 'mp4',
53                     'title': 'ALVINNN!!! and The Chipmunks: "Mojo Missing/Who\'s The Animal" S4',
54                     'description': 'Alvin is convinced his mojo was in a cap he gave to a fan, and must find a way to get his hat back before the Chipmunks’ big concert.\nDuring a costume visit to the zoo, Alvin finds himself mistaken for the real Tasmanian devil.',
55                 }
56             },
57         ],
58     }, {
59         'url': 'http://www.nickjr.com/paw-patrol/videos/pups-save-a-goldrush-s3-ep302-full-episode/',
60         'only_matching': True,
61     }, {
62         'url': 'http://beta.nick.com/nicky-ricky-dicky-and-dawn/videos/nicky-ricky-dicky-dawn-301-full-episode/',
63         'only_matching': True,
64     }]
65
66     def _get_feed_query(self, uri):
67         return {
68             'feed': 'nick_arc_player_prime',
69             'mgid': uri,
70         }
71
72     def _real_extract(self, url):
73         domain, display_id = re.match(self._VALID_URL, url).groups()
74         video_data = self._download_json(
75             'http://%s/data/video.endLevel.json' % domain,
76             display_id, query={
77                 'urlKey': display_id,
78             })
79         return self._get_videos_info(video_data['player'] + video_data['id'])
80
81
82 class NickBrIE(MTVServicesInfoExtractor):
83     IE_NAME = 'nickelodeon:br'
84     _VALID_URL = r'''(?x)
85                     https?://
86                         (?:
87                             (?P<domain>(?:www\.)?nickjr|mundonick\.uol)\.com\.br|
88                             (?:www\.)?nickjr\.[a-z]{2}|
89                             (?:www\.)?nickelodeonjunior\.fr
90                         )
91                         /(?:programas/)?[^/]+/videos/(?:episodios/)?(?P<id>[^/?\#.]+)
92                     '''
93     _TESTS = [{
94         'url': 'http://www.nickjr.com.br/patrulha-canina/videos/210-labirinto-de-pipoca/',
95         'only_matching': True,
96     }, {
97         'url': 'http://mundonick.uol.com.br/programas/the-loud-house/videos/muitas-irmas/7ljo9j',
98         'only_matching': True,
99     }, {
100         'url': 'http://www.nickjr.nl/paw-patrol/videos/311-ge-wol-dig-om-terug-te-zijn/',
101         'only_matching': True,
102     }, {
103         'url': 'http://www.nickjr.de/blaze-und-die-monster-maschinen/videos/f6caaf8f-e4e8-4cc1-b489-9380d6dcd059/',
104         'only_matching': True,
105     }, {
106         'url': 'http://www.nickelodeonjunior.fr/paw-patrol-la-pat-patrouille/videos/episode-401-entier-paw-patrol/',
107         'only_matching': True,
108     }]
109
110     def _real_extract(self, url):
111         domain, display_id = re.match(self._VALID_URL, url).groups()
112         webpage = self._download_webpage(url, display_id)
113         uri = self._search_regex(
114             r'data-(?:contenturi|mgid)="([^"]+)', webpage, 'mgid')
115         video_id = self._id_from_uri(uri)
116         config = self._download_json(
117             'http://media.mtvnservices.com/pmt/e1/access/index.html',
118             video_id, query={
119                 'uri': uri,
120                 'configtype': 'edge',
121             }, headers={
122                 'Referer': url,
123             })
124         info_url = self._remove_template_parameter(config['feedWithQueryParams'])
125         if info_url == 'None':
126             if domain.startswith('www.'):
127                 domain = domain[4:]
128             content_domain = {
129                 'mundonick.uol': 'mundonick.com.br',
130                 'nickjr': 'br.nickelodeonjunior.tv',
131             }[domain]
132             query = {
133                 'mgid': uri,
134                 'imageEp': content_domain,
135                 'arcEp': content_domain,
136             }
137             if domain == 'nickjr.com.br':
138                 query['ep'] = 'c4b16088'
139             info_url = update_url_query(
140                 'http://feeds.mtvnservices.com/od/feed/intl-mrss-player-feed', query)
141         return self._get_videos_info_from_url(info_url, video_id)
142
143
144 class NickDeIE(MTVServicesInfoExtractor):
145     IE_NAME = 'nick.de'
146     _VALID_URL = r'https?://(?:www\.)?(?P<host>nick\.(?:de|com\.pl|ch)|nickelodeon\.(?:nl|be|at|dk|no|se))/[^/]+/(?:[^/]+/)*(?P<id>[^/?#&]+)'
147     _TESTS = [{
148         'url': 'http://www.nick.de/playlist/3773-top-videos/videos/episode/17306-zu-wasser-und-zu-land-rauchende-erdnusse',
149         'only_matching': True,
150     }, {
151         'url': 'http://www.nick.de/shows/342-icarly',
152         'only_matching': True,
153     }, {
154         'url': 'http://www.nickelodeon.nl/shows/474-spongebob/videos/17403-een-kijkje-in-de-keuken-met-sandy-van-binnenuit',
155         'only_matching': True,
156     }, {
157         'url': 'http://www.nickelodeon.at/playlist/3773-top-videos/videos/episode/77993-das-letzte-gefecht',
158         'only_matching': True,
159     }, {
160         'url': 'http://www.nick.com.pl/seriale/474-spongebob-kanciastoporty/wideo/17412-teatr-to-jest-to-rodeo-oszolom',
161         'only_matching': True,
162     }, {
163         'url': 'http://www.nickelodeon.no/program/2626-bulderhuset/videoer/90947-femteklasse-veronica-vs-vanzilla',
164         'only_matching': True,
165     }, {
166         'url': 'http://www.nickelodeon.dk/serier/2626-hojs-hus/videoer/761-tissepause',
167         'only_matching': True,
168     }, {
169         'url': 'http://www.nickelodeon.se/serier/2626-lugn-i-stormen/videos/998-',
170         'only_matching': True,
171     }, {
172         'url': 'http://www.nick.ch/shows/2304-adventure-time-abenteuerzeit-mit-finn-und-jake',
173         'only_matching': True,
174     }, {
175         'url': 'http://www.nickelodeon.be/afspeellijst/4530-top-videos/videos/episode/73917-inval-broodschapper-lariekoek-arie',
176         'only_matching': True,
177     }]
178
179     def _extract_mrss_url(self, webpage, host):
180         return update_url_query(self._search_regex(
181             r'data-mrss=(["\'])(?P<url>http.+?)\1', webpage, 'mrss url', group='url'),
182             {'siteKey': host})
183
184     def _real_extract(self, url):
185         mobj = re.match(self._VALID_URL, url)
186         video_id = mobj.group('id')
187         host = mobj.group('host')
188
189         webpage = self._download_webpage(url, video_id)
190
191         mrss_url = self._extract_mrss_url(webpage, host)
192
193         return self._get_videos_info_from_url(mrss_url, video_id)
194
195
196 class NickNightIE(NickDeIE):
197     IE_NAME = 'nicknight'
198     _VALID_URL = r'https?://(?:www\.)(?P<host>nicknight\.(?:de|at|tv))/(?:playlist|shows)/(?:[^/]+/)*(?P<id>[^/?#&]+)'
199     _TESTS = [{
200         'url': 'http://www.nicknight.at/shows/977-awkward/videos/85987-nimmer-beste-freunde',
201         'only_matching': True,
202     }, {
203         'url': 'http://www.nicknight.at/shows/977-awkward',
204         'only_matching': True,
205     }, {
206         'url': 'http://www.nicknight.at/shows/1900-faking-it',
207         'only_matching': True,
208     }]
209
210     def _extract_mrss_url(self, webpage, *args):
211         return self._search_regex(
212             r'mrss\s*:\s*(["\'])(?P<url>http.+?)\1', webpage,
213             'mrss url', group='url')
214
215
216 class NickRuIE(MTVServicesInfoExtractor):
217     IE_NAME = 'nickelodeonru'
218     _VALID_URL = r'https?://(?:www\.)nickelodeon\.(?:ru|fr|es|pt|ro|hu|com\.tr)/[^/]+/(?:[^/]+/)*(?P<id>[^/?#&]+)'
219     _TESTS = [{
220         'url': 'http://www.nickelodeon.ru/shows/henrydanger/videos/episodes/3-sezon-15-seriya-licenziya-na-polyot/pmomfb#playlist/7airc6',
221         'only_matching': True,
222     }, {
223         'url': 'http://www.nickelodeon.ru/videos/smotri-na-nickelodeon-v-iyule/g9hvh7',
224         'only_matching': True,
225     }, {
226         'url': 'http://www.nickelodeon.fr/programmes/bob-l-eponge/videos/le-marathon-de-booh-kini-bottom-mardi-31-octobre/nfn7z0',
227         'only_matching': True,
228     }, {
229         'url': 'http://www.nickelodeon.es/videos/nickelodeon-consejos-tortitas/f7w7xy',
230         'only_matching': True,
231     }, {
232         'url': 'http://www.nickelodeon.pt/series/spongebob-squarepants/videos/a-bolha-de-tinta-gigante/xutq1b',
233         'only_matching': True,
234     }, {
235         'url': 'http://www.nickelodeon.ro/emisiuni/shimmer-si-shine/video/nahal-din-bomboane/uw5u2k',
236         'only_matching': True,
237     }, {
238         'url': 'http://www.nickelodeon.hu/musorok/spongyabob-kockanadrag/videok/episodes/buborekfujas-az-elszakadt-nadrag/q57iob#playlist/k6te4y',
239         'only_matching': True,
240     }, {
241         'url': 'http://www.nickelodeon.com.tr/programlar/sunger-bob/videolar/kayip-yatak/mgqbjy',
242         'only_matching': True,
243     }]
244
245     def _real_extract(self, url):
246         video_id = self._match_id(url)
247         webpage = self._download_webpage(url, video_id)
248         mgid = self._extract_mgid(webpage)
249         return self.url_result('http://media.mtvnservices.com/embed/%s' % mgid)