[vod.pl] Add new extractor
[youtube-dl] / youtube_dl / extractor / vodpl.py
1 # coding: utf-8
2 from __future__ import unicode_literals
3
4 from .onet import OnetBaseIE
5 from ..utils import clean_html
6
7
8 class VODPlIE(OnetBaseIE):
9     _VALID_URL = r'https?://vod\.pl/(?:.*/)?(?P<id>[0-9a-zA-Z]+)'
10
11     _TEST = {
12         'url': 'https://vod.pl/filmy/chlopaki-nie-placza/3ep3jns',
13         'md5': 'a7dc3b2f7faa2421aefb0ecaabf7ec74',
14         'info_dict': {
15             'id': '3ep3jns',
16             'ext': 'mp4',
17             'title': 'Chłopaki nie płaczą',
18             'description': 'Kuba Brenner aby pomóc swojemu nieśmiałemu przyjacielowi Oskarowi wynajmuje w agencji towarzyskiej dwie panie. Po upojnej nocy okazuje się, że chłopcy nie byli przygotowani finansowo. "Opiekun artystyczny" dziewczyn zabiera w ramach rekompensaty drogocenną rzeźbę należącą do wujka Oskara. Kłopoty chłopców zaczynają się, gdy Kuba udaje się do agencji aby wykupić figurkę i trafia w sam środek mafijnej transakcji... Idiotyczny przypadek sprawia, że w klubie dochodzi do strzelaniny podczas której Grucha i Bolec zostają ranni, ginie również walizka z pieniędzmi... Podejrzenie pada na Kubę.',
19             'timestamp': 1463415154,
20             'duration': 5765,
21             'upload_date': '20160516',
22         },
23     }
24
25     def _real_extract(self, url):
26         video_id = self._match_id(url)
27         webpage = self._download_webpage(url, video_id)
28         mvp_id = self._search_mvp_id(webpage)
29
30         info_dict = self._extract_from_id(mvp_id, webpage)
31         info_dict.update({
32             'id': video_id,
33             'description': clean_html(info_dict['description']).strip().replace('\r', '\n')
34         })
35
36         return info_dict