[nick] Add support for more nickelodeon sites (closes #14553)
[youtube-dl] / youtube_dl / extractor / nick.py
1 # coding: utf-8
2 from __future__ import unicode_literals
3
4 import re
5
6 from .mtv import MTVServicesInfoExtractor
7 from ..utils import update_url_query
8
9
10 class NickIE(MTVServicesInfoExtractor):
11     # None of videos on the website are still alive?
12     IE_NAME = 'nick.com'
13     _VALID_URL = r'https?://(?:(?:www|beta)\.)?nick(?:jr)?\.com/(?:[^/]+/)?(?:videos/clip|[^/]+/videos)/(?P<id>[^/?#.]+)'
14     _FEED_URL = 'http://udat.mtvnservices.com/service1/dispatch.htm'
15     _GEO_COUNTRIES = ['US']
16     _TESTS = [{
17         'url': 'http://www.nick.com/videos/clip/alvinnn-and-the-chipmunks-112-full-episode.html',
18         'playlist': [
19             {
20                 'md5': '6e5adc1e28253bbb1b28ab05403dd4d4',
21                 'info_dict': {
22                     'id': 'be6a17b0-412d-11e5-8ff7-0026b9414f30',
23                     'ext': 'mp4',
24                     'title': 'ALVINNN!!! and The Chipmunks: "Mojo Missing/Who\'s The Animal" S1',
25                     'description': 'Alvin is convinced his mojo was in a cap he gave to a fan, and must find a way to get his hat back before the Chipmunks’ big concert.\nDuring a costume visit to the zoo, Alvin finds himself mistaken for the real Tasmanian devil.',
26
27                 }
28             },
29             {
30                 'md5': 'd7be441fc53a1d4882fa9508a1e5b3ce',
31                 'info_dict': {
32                     'id': 'be6b8f96-412d-11e5-8ff7-0026b9414f30',
33                     'ext': 'mp4',
34                     'title': 'ALVINNN!!! and The Chipmunks: "Mojo Missing/Who\'s The Animal" S2',
35                     'description': 'Alvin is convinced his mojo was in a cap he gave to a fan, and must find a way to get his hat back before the Chipmunks’ big concert.\nDuring a costume visit to the zoo, Alvin finds himself mistaken for the real Tasmanian devil.',
36
37                 }
38             },
39             {
40                 'md5': 'efffe1728a234b2b0d2f2b343dd1946f',
41                 'info_dict': {
42                     'id': 'be6cf7e6-412d-11e5-8ff7-0026b9414f30',
43                     'ext': 'mp4',
44                     'title': 'ALVINNN!!! and The Chipmunks: "Mojo Missing/Who\'s The Animal" S3',
45                     'description': 'Alvin is convinced his mojo was in a cap he gave to a fan, and must find a way to get his hat back before the Chipmunks’ big concert.\nDuring a costume visit to the zoo, Alvin finds himself mistaken for the real Tasmanian devil.',
46                 }
47             },
48             {
49                 'md5': '1ec6690733ab9f41709e274a1d5c7556',
50                 'info_dict': {
51                     'id': 'be6e3354-412d-11e5-8ff7-0026b9414f30',
52                     'ext': 'mp4',
53                     'title': 'ALVINNN!!! and The Chipmunks: "Mojo Missing/Who\'s The Animal" S4',
54                     'description': 'Alvin is convinced his mojo was in a cap he gave to a fan, and must find a way to get his hat back before the Chipmunks’ big concert.\nDuring a costume visit to the zoo, Alvin finds himself mistaken for the real Tasmanian devil.',
55                 }
56             },
57         ],
58     }, {
59         'url': 'http://www.nickjr.com/paw-patrol/videos/pups-save-a-goldrush-s3-ep302-full-episode/',
60         'only_matching': True,
61     }, {
62         'url': 'http://beta.nick.com/nicky-ricky-dicky-and-dawn/videos/nicky-ricky-dicky-dawn-301-full-episode/',
63         'only_matching': True,
64     }]
65
66     def _get_feed_query(self, uri):
67         return {
68             'feed': 'nick_arc_player_prime',
69             'mgid': uri,
70         }
71
72     def _extract_mgid(self, webpage):
73         return self._search_regex(r'data-contenturi="([^"]+)', webpage, 'mgid')
74
75
76 class NickDeIE(MTVServicesInfoExtractor):
77     IE_NAME = 'nick.de'
78     _VALID_URL = r'https?://(?:www\.)?(?P<host>nick\.(?:de|com\.pl)|nickelodeon\.(?:nl|at|dk|no|se))/[^/]+/(?:[^/]+/)*(?P<id>[^/?#&]+)'
79     _TESTS = [{
80         'url': 'http://www.nick.de/playlist/3773-top-videos/videos/episode/17306-zu-wasser-und-zu-land-rauchende-erdnusse',
81         'only_matching': True,
82     }, {
83         'url': 'http://www.nick.de/shows/342-icarly',
84         'only_matching': True,
85     }, {
86         'url': 'http://www.nickelodeon.nl/shows/474-spongebob/videos/17403-een-kijkje-in-de-keuken-met-sandy-van-binnenuit',
87         'only_matching': True,
88     }, {
89         'url': 'http://www.nickelodeon.at/playlist/3773-top-videos/videos/episode/77993-das-letzte-gefecht',
90         'only_matching': True,
91     }, {
92         'url': 'http://www.nick.com.pl/seriale/474-spongebob-kanciastoporty/wideo/17412-teatr-to-jest-to-rodeo-oszolom',
93         'only_matching': True,
94     }, {
95         'url': 'http://www.nickelodeon.no/program/2626-bulderhuset/videoer/90947-femteklasse-veronica-vs-vanzilla',
96         'only_matching': True,
97     }, {
98         'url': 'http://www.nickelodeon.dk/serier/2626-hojs-hus/videoer/761-tissepause',
99         'only_matching': True,
100     }, {
101         'url': 'http://www.nickelodeon.se/serier/2626-lugn-i-stormen/videos/998-',
102         'only_matching': True,
103     }]
104
105     def _extract_mrss_url(self, webpage, host):
106         return update_url_query(self._search_regex(
107             r'data-mrss=(["\'])(?P<url>http.+?)\1', webpage, 'mrss url', group='url'),
108             {'siteKey': host})
109
110     def _real_extract(self, url):
111         mobj = re.match(self._VALID_URL, url)
112         video_id = mobj.group('id')
113         host = mobj.group('host')
114
115         webpage = self._download_webpage(url, video_id)
116
117         mrss_url = self._extract_mrss_url(webpage, host)
118
119         return self._get_videos_info_from_url(mrss_url, video_id)
120
121
122 class NickNightIE(NickDeIE):
123     IE_NAME = 'nicknight'
124     _VALID_URL = r'https?://(?:www\.)(?P<host>nicknight\.(?:de|at|tv))/(?:playlist|shows)/(?:[^/]+/)*(?P<id>[^/?#&]+)'
125     _TESTS = [{
126         'url': 'http://www.nicknight.at/shows/977-awkward/videos/85987-nimmer-beste-freunde',
127         'only_matching': True,
128     }, {
129         'url': 'http://www.nicknight.at/shows/977-awkward',
130         'only_matching': True,
131     }, {
132         'url': 'http://www.nicknight.at/shows/1900-faking-it',
133         'only_matching': True,
134     }]
135
136     def _extract_mrss_url(self, webpage, *args):
137         return self._search_regex(
138             r'mrss\s*:\s*(["\'])(?P<url>http.+?)\1', webpage,
139             'mrss url', group='url')
140
141
142 class NickRuIE(MTVServicesInfoExtractor):
143     IE_NAME = 'nickelodeonru'
144     _VALID_URL = r'https?://(?:www\.)nickelodeon\.ru/(?:playlist|shows|videos)/(?:[^/]+/)*(?P<id>[^/?#&]+)'
145     _TESTS = [{
146         'url': 'http://www.nickelodeon.ru/shows/henrydanger/videos/episodes/3-sezon-15-seriya-licenziya-na-polyot/pmomfb#playlist/7airc6',
147         'only_matching': True,
148     }, {
149         'url': 'http://www.nickelodeon.ru/videos/smotri-na-nickelodeon-v-iyule/g9hvh7',
150         'only_matching': True,
151     }]
152
153     def _real_extract(self, url):
154         video_id = self._match_id(url)
155         webpage = self._download_webpage(url, video_id)
156         mgid = self._extract_mgid(webpage)
157         return self.url_result('http://media.mtvnservices.com/embed/%s' % mgid)