[globo] Remove non available test
[youtube-dl] / youtube_dl / extractor / globo.py
1 # coding: utf-8
2 from __future__ import unicode_literals
3
4 import random
5 import math
6
7 from .common import InfoExtractor
8 from ..compat import (
9     compat_str,
10     compat_chr,
11     compat_ord,
12 )
13 from ..utils import (
14     ExtractorError,
15     float_or_none,
16     int_or_none,
17 )
18
19
20 class GloboIE(InfoExtractor):
21     _VALID_URL = '(?:globo:|https?://.+?\.globo\.com/(?:[^/]+/)*(?:v/(?:[^/]+/)?|videos/))(?P<id>\d{7,})'
22
23     _API_URL_TEMPLATE = 'http://api.globovideos.com/videos/%s/playlist'
24     _SECURITY_URL_TEMPLATE = 'http://security.video.globo.com/videos/%s/hash?player=flash&version=17.0.0.132&resource_id=%s'
25
26     _RESIGN_EXPIRATION = 86400
27
28     _TESTS = [{
29         'url': 'http://g1.globo.com/carros/autoesporte/videos/t/exclusivos-do-g1/v/mercedes-benz-gla-passa-por-teste-de-colisao-na-europa/3607726/',
30         'md5': 'b3ccc801f75cd04a914d51dadb83a78d',
31         'info_dict': {
32             'id': '3607726',
33             'ext': 'mp4',
34             'title': 'Mercedes-Benz GLA passa por teste de colisão na Europa',
35             'duration': 103.204,
36             'uploader': 'Globo.com',
37             'uploader_id': 265,
38             'like_count': int,
39         }
40     }, {
41         'url': 'http://globotv.globo.com/canal-brasil/sangue-latino/t/todos-os-videos/v/ator-e-diretor-argentino-ricado-darin-fala-sobre-utopias-e-suas-perdas/3928201/',
42         'md5': 'c1defca721ce25b2354e927d3e4b3dec',
43         'info_dict': {
44             'id': '3928201',
45             'ext': 'mp4',
46             'title': 'Ator e diretor argentino, Ricado Darín fala sobre utopias e suas perdas',
47             'duration': 1472.906,
48             'uploader': 'Canal Brasil',
49             'uploader_id': 705,
50             'like_count': int,
51         }
52     }]
53
54     class MD5:
55         HEX_FORMAT_LOWERCASE = 0
56         HEX_FORMAT_UPPERCASE = 1
57         BASE64_PAD_CHARACTER_DEFAULT_COMPLIANCE = ''
58         BASE64_PAD_CHARACTER_RFC_COMPLIANCE = '='
59         PADDING = '=0xFF01DD'
60         hexcase = 0
61         b64pad = ''
62
63         def __init__(self):
64             pass
65
66         class JSArray(list):
67             def __getitem__(self, y):
68                 try:
69                     return list.__getitem__(self, y)
70                 except IndexError:
71                     return 0
72
73             def __setitem__(self, i, y):
74                 try:
75                     return list.__setitem__(self, i, y)
76                 except IndexError:
77                     self.extend([0] * (i - len(self) + 1))
78                     self[-1] = y
79
80         @classmethod
81         def hex_md5(cls, param1):
82             return cls.rstr2hex(cls.rstr_md5(cls.str2rstr_utf8(param1)))
83
84         @classmethod
85         def b64_md5(cls, param1, param2=None):
86             return cls.rstr2b64(cls.rstr_md5(cls.str2rstr_utf8(param1, param2)))
87
88         @classmethod
89         def any_md5(cls, param1, param2):
90             return cls.rstr2any(cls.rstr_md5(cls.str2rstr_utf8(param1)), param2)
91
92         @classmethod
93         def rstr_md5(cls, param1):
94             return cls.binl2rstr(cls.binl_md5(cls.rstr2binl(param1), len(param1) * 8))
95
96         @classmethod
97         def rstr2hex(cls, param1):
98             _loc_2 = '0123456789ABCDEF' if cls.hexcase else '0123456789abcdef'
99             _loc_3 = ''
100             for _loc_5 in range(0, len(param1)):
101                 _loc_4 = compat_ord(param1[_loc_5])
102                 _loc_3 += _loc_2[_loc_4 >> 4 & 15] + _loc_2[_loc_4 & 15]
103             return _loc_3
104
105         @classmethod
106         def rstr2b64(cls, param1):
107             _loc_2 = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789-_'
108             _loc_3 = ''
109             _loc_4 = len(param1)
110             for _loc_5 in range(0, _loc_4, 3):
111                 _loc_6_1 = compat_ord(param1[_loc_5]) << 16
112                 _loc_6_2 = compat_ord(param1[_loc_5 + 1]) << 8 if _loc_5 + 1 < _loc_4 else 0
113                 _loc_6_3 = compat_ord(param1[_loc_5 + 2]) if _loc_5 + 2 < _loc_4 else 0
114                 _loc_6 = _loc_6_1 | _loc_6_2 | _loc_6_3
115                 for _loc_7 in range(0, 4):
116                     if _loc_5 * 8 + _loc_7 * 6 > len(param1) * 8:
117                         _loc_3 += cls.b64pad
118                     else:
119                         _loc_3 += _loc_2[_loc_6 >> 6 * (3 - _loc_7) & 63]
120             return _loc_3
121
122         @staticmethod
123         def rstr2any(param1, param2):
124             _loc_3 = len(param2)
125             _loc_4 = []
126             _loc_9 = [0] * ((len(param1) >> 2) + 1)
127             for _loc_5 in range(0, len(_loc_9)):
128                 _loc_9[_loc_5] = compat_ord(param1[_loc_5 * 2]) << 8 | compat_ord(param1[_loc_5 * 2 + 1])
129
130             while len(_loc_9) > 0:
131                 _loc_8 = []
132                 _loc_7 = 0
133                 for _loc_5 in range(0, len(_loc_9)):
134                     _loc_7 = (_loc_7 << 16) + _loc_9[_loc_5]
135                     _loc_6 = math.floor(_loc_7 / _loc_3)
136                     _loc_7 -= _loc_6 * _loc_3
137                     if len(_loc_8) > 0 or _loc_6 > 0:
138                         _loc_8[len(_loc_8)] = _loc_6
139
140                 _loc_4[len(_loc_4)] = _loc_7
141                 _loc_9 = _loc_8
142
143             _loc_10 = ''
144             _loc_5 = len(_loc_4) - 1
145             while _loc_5 >= 0:
146                 _loc_10 += param2[_loc_4[_loc_5]]
147                 _loc_5 -= 1
148
149             return _loc_10
150
151         @classmethod
152         def str2rstr_utf8(cls, param1, param2=None):
153             _loc_3 = ''
154             _loc_4 = -1
155             if not param2:
156                 param2 = cls.PADDING
157             param1 = param1 + param2[1:9]
158             while True:
159                 _loc_4 += 1
160                 if _loc_4 >= len(param1):
161                     break
162                 _loc_5 = compat_ord(param1[_loc_4])
163                 _loc_6 = compat_ord(param1[_loc_4 + 1]) if _loc_4 + 1 < len(param1) else 0
164                 if 55296 <= _loc_5 <= 56319 and 56320 <= _loc_6 <= 57343:
165                     _loc_5 = 65536 + ((_loc_5 & 1023) << 10) + (_loc_6 & 1023)
166                     _loc_4 += 1
167                 if _loc_5 <= 127:
168                     _loc_3 += compat_chr(_loc_5)
169                     continue
170                 if _loc_5 <= 2047:
171                     _loc_3 += compat_chr(192 | _loc_5 >> 6 & 31) + compat_chr(128 | _loc_5 & 63)
172                     continue
173                 if _loc_5 <= 65535:
174                     _loc_3 += compat_chr(224 | _loc_5 >> 12 & 15) + compat_chr(128 | _loc_5 >> 6 & 63) + compat_chr(
175                         128 | _loc_5 & 63)
176                     continue
177                 if _loc_5 <= 2097151:
178                     _loc_3 += compat_chr(240 | _loc_5 >> 18 & 7) + compat_chr(128 | _loc_5 >> 12 & 63) + compat_chr(
179                         128 | _loc_5 >> 6 & 63) + compat_chr(128 | _loc_5 & 63)
180             return _loc_3
181
182         @staticmethod
183         def rstr2binl(param1):
184             _loc_2 = [0] * ((len(param1) >> 2) + 1)
185             for _loc_3 in range(0, len(_loc_2)):
186                 _loc_2[_loc_3] = 0
187             for _loc_3 in range(0, len(param1) * 8, 8):
188                 _loc_2[_loc_3 >> 5] |= (compat_ord(param1[_loc_3 // 8]) & 255) << _loc_3 % 32
189             return _loc_2
190
191         @staticmethod
192         def binl2rstr(param1):
193             _loc_2 = ''
194             for _loc_3 in range(0, len(param1) * 32, 8):
195                 _loc_2 += compat_chr(param1[_loc_3 >> 5] >> _loc_3 % 32 & 255)
196             return _loc_2
197
198         @classmethod
199         def binl_md5(cls, param1, param2):
200             param1 = cls.JSArray(param1)
201             param1[param2 >> 5] |= 128 << param2 % 32
202             param1[(param2 + 64 >> 9 << 4) + 14] = param2
203             _loc_3 = 1732584193
204             _loc_4 = -271733879
205             _loc_5 = -1732584194
206             _loc_6 = 271733878
207             for _loc_7 in range(0, len(param1), 16):
208                 _loc_8 = _loc_3
209                 _loc_9 = _loc_4
210                 _loc_10 = _loc_5
211                 _loc_11 = _loc_6
212                 _loc_3 = cls.md5_ff(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 0], 7, -680876936)
213                 _loc_6 = cls.md5_ff(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 1], 12, -389564586)
214                 _loc_5 = cls.md5_ff(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 2], 17, 606105819)
215                 _loc_4 = cls.md5_ff(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 3], 22, -1044525330)
216                 _loc_3 = cls.md5_ff(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 4], 7, -176418897)
217                 _loc_6 = cls.md5_ff(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 5], 12, 1200080426)
218                 _loc_5 = cls.md5_ff(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 6], 17, -1473231341)
219                 _loc_4 = cls.md5_ff(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 7], 22, -45705983)
220                 _loc_3 = cls.md5_ff(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 8], 7, 1770035416)
221                 _loc_6 = cls.md5_ff(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 9], 12, -1958414417)
222                 _loc_5 = cls.md5_ff(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 10], 17, -42063)
223                 _loc_4 = cls.md5_ff(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 11], 22, -1990404162)
224                 _loc_3 = cls.md5_ff(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 12], 7, 1804603682)
225                 _loc_6 = cls.md5_ff(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 13], 12, -40341101)
226                 _loc_5 = cls.md5_ff(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 14], 17, -1502002290)
227                 _loc_4 = cls.md5_ff(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 15], 22, 1236535329)
228                 _loc_3 = cls.md5_gg(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 1], 5, -165796510)
229                 _loc_6 = cls.md5_gg(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 6], 9, -1069501632)
230                 _loc_5 = cls.md5_gg(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 11], 14, 643717713)
231                 _loc_4 = cls.md5_gg(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 0], 20, -373897302)
232                 _loc_3 = cls.md5_gg(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 5], 5, -701558691)
233                 _loc_6 = cls.md5_gg(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 10], 9, 38016083)
234                 _loc_5 = cls.md5_gg(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 15], 14, -660478335)
235                 _loc_4 = cls.md5_gg(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 4], 20, -405537848)
236                 _loc_3 = cls.md5_gg(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 9], 5, 568446438)
237                 _loc_6 = cls.md5_gg(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 14], 9, -1019803690)
238                 _loc_5 = cls.md5_gg(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 3], 14, -187363961)
239                 _loc_4 = cls.md5_gg(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 8], 20, 1163531501)
240                 _loc_3 = cls.md5_gg(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 13], 5, -1444681467)
241                 _loc_6 = cls.md5_gg(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 2], 9, -51403784)
242                 _loc_5 = cls.md5_gg(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 7], 14, 1735328473)
243                 _loc_4 = cls.md5_gg(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 12], 20, -1926607734)
244                 _loc_3 = cls.md5_hh(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 5], 4, -378558)
245                 _loc_6 = cls.md5_hh(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 8], 11, -2022574463)
246                 _loc_5 = cls.md5_hh(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 11], 16, 1839030562)
247                 _loc_4 = cls.md5_hh(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 14], 23, -35309556)
248                 _loc_3 = cls.md5_hh(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 1], 4, -1530992060)
249                 _loc_6 = cls.md5_hh(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 4], 11, 1272893353)
250                 _loc_5 = cls.md5_hh(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 7], 16, -155497632)
251                 _loc_4 = cls.md5_hh(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 10], 23, -1094730640)
252                 _loc_3 = cls.md5_hh(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 13], 4, 681279174)
253                 _loc_6 = cls.md5_hh(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 0], 11, -358537222)
254                 _loc_5 = cls.md5_hh(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 3], 16, -722521979)
255                 _loc_4 = cls.md5_hh(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 6], 23, 76029189)
256                 _loc_3 = cls.md5_hh(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 9], 4, -640364487)
257                 _loc_6 = cls.md5_hh(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 12], 11, -421815835)
258                 _loc_5 = cls.md5_hh(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 15], 16, 530742520)
259                 _loc_4 = cls.md5_hh(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 2], 23, -995338651)
260                 _loc_3 = cls.md5_ii(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 0], 6, -198630844)
261                 _loc_6 = cls.md5_ii(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 7], 10, 1126891415)
262                 _loc_5 = cls.md5_ii(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 14], 15, -1416354905)
263                 _loc_4 = cls.md5_ii(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 5], 21, -57434055)
264                 _loc_3 = cls.md5_ii(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 12], 6, 1700485571)
265                 _loc_6 = cls.md5_ii(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 3], 10, -1894986606)
266                 _loc_5 = cls.md5_ii(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 10], 15, -1051523)
267                 _loc_4 = cls.md5_ii(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 1], 21, -2054922799)
268                 _loc_3 = cls.md5_ii(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 8], 6, 1873313359)
269                 _loc_6 = cls.md5_ii(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 15], 10, -30611744)
270                 _loc_5 = cls.md5_ii(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 6], 15, -1560198380)
271                 _loc_4 = cls.md5_ii(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 13], 21, 1309151649)
272                 _loc_3 = cls.md5_ii(_loc_3, _loc_4, _loc_5, _loc_6, param1[_loc_7 + 4], 6, -145523070)
273                 _loc_6 = cls.md5_ii(_loc_6, _loc_3, _loc_4, _loc_5, param1[_loc_7 + 11], 10, -1120210379)
274                 _loc_5 = cls.md5_ii(_loc_5, _loc_6, _loc_3, _loc_4, param1[_loc_7 + 2], 15, 718787259)
275                 _loc_4 = cls.md5_ii(_loc_4, _loc_5, _loc_6, _loc_3, param1[_loc_7 + 9], 21, -343485551)
276                 _loc_3 = cls.safe_add(_loc_3, _loc_8)
277                 _loc_4 = cls.safe_add(_loc_4, _loc_9)
278                 _loc_5 = cls.safe_add(_loc_5, _loc_10)
279                 _loc_6 = cls.safe_add(_loc_6, _loc_11)
280             return [_loc_3, _loc_4, _loc_5, _loc_6]
281
282         @classmethod
283         def md5_cmn(cls, param1, param2, param3, param4, param5, param6):
284             return cls.safe_add(
285                 cls.bit_rol(cls.safe_add(cls.safe_add(param2, param1), cls.safe_add(param4, param6)), param5), param3)
286
287         @classmethod
288         def md5_ff(cls, param1, param2, param3, param4, param5, param6, param7):
289             return cls.md5_cmn(param2 & param3 | ~param2 & param4, param1, param2, param5, param6, param7)
290
291         @classmethod
292         def md5_gg(cls, param1, param2, param3, param4, param5, param6, param7):
293             return cls.md5_cmn(param2 & param4 | param3 & ~param4, param1, param2, param5, param6, param7)
294
295         @classmethod
296         def md5_hh(cls, param1, param2, param3, param4, param5, param6, param7):
297             return cls.md5_cmn(param2 ^ param3 ^ param4, param1, param2, param5, param6, param7)
298
299         @classmethod
300         def md5_ii(cls, param1, param2, param3, param4, param5, param6, param7):
301             return cls.md5_cmn(param3 ^ (param2 | ~param4), param1, param2, param5, param6, param7)
302
303         @classmethod
304         def safe_add(cls, param1, param2):
305             _loc_3 = (param1 & 65535) + (param2 & 65535)
306             _loc_4 = (param1 >> 16) + (param2 >> 16) + (_loc_3 >> 16)
307             return cls.lshift(_loc_4, 16) | _loc_3 & 65535
308
309         @classmethod
310         def bit_rol(cls, param1, param2):
311             return cls.lshift(param1, param2) | (param1 & 0xFFFFFFFF) >> (32 - param2)
312
313         @staticmethod
314         def lshift(value, count):
315             r = (0xFFFFFFFF & value) << count
316             return -(~(r - 1) & 0xFFFFFFFF) if r > 0x7FFFFFFF else r
317
318     def _real_extract(self, url):
319         video_id = self._match_id(url)
320
321         video = self._download_json(
322             self._API_URL_TEMPLATE % video_id, video_id)['videos'][0]
323
324         title = video['title']
325
326         formats = []
327         for resource in video['resources']:
328             resource_id = resource.get('_id')
329             if not resource_id or resource_id.endswith('manifest'):
330                 continue
331
332             security = self._download_json(
333                 self._SECURITY_URL_TEMPLATE % (video_id, resource_id),
334                 video_id, 'Downloading security hash for %s' % resource_id)
335
336             security_hash = security.get('hash')
337             if not security_hash:
338                 message = security.get('message')
339                 if message:
340                     raise ExtractorError(
341                         '%s returned error: %s' % (self.IE_NAME, message), expected=True)
342                 continue
343
344             hash_code = security_hash[:2]
345             received_time = int(security_hash[2:12])
346             received_random = security_hash[12:22]
347             received_md5 = security_hash[22:]
348
349             sign_time = received_time + self._RESIGN_EXPIRATION
350             padding = '%010d' % random.randint(1, 10000000000)
351
352             signed_md5 = self.MD5.b64_md5(received_md5 + compat_str(sign_time) + padding)
353             signed_hash = hash_code + compat_str(received_time) + received_random + compat_str(sign_time) + padding + signed_md5
354
355             resource_url = resource['url']
356             signed_url = '%s?h=%s&k=%s' % (resource_url, signed_hash, 'flash')
357             if resource_id.endswith('m3u8') or resource_url.endswith('.m3u8'):
358                 m3u8_formats = self._extract_m3u8_formats(
359                     signed_url, resource_id, 'mp4', entry_protocol='m3u8_native',
360                     m3u8_id='hls', fatal=False)
361                 if m3u8_formats:
362                     formats.extend(m3u8_formats)
363             else:
364                 formats.append({
365                     'url': signed_url,
366                     'format_id': resource_id,
367                     'height': resource.get('height'),
368                 })
369
370         self._sort_formats(formats)
371
372         duration = float_or_none(video.get('duration'), 1000)
373         like_count = int_or_none(video.get('likes'))
374         uploader = video.get('channel')
375         uploader_id = video.get('channel_id')
376
377         return {
378             'id': video_id,
379             'title': title,
380             'duration': duration,
381             'uploader': uploader,
382             'uploader_id': uploader_id,
383             'like_count': like_count,
384             'formats': formats
385         }
386
387
388 class GloboArticleIE(InfoExtractor):
389     _VALID_URL = 'https?://.+?\.globo\.com/(?:[^/]+/)*(?P<id>[^/]+)\.html'
390
391     _VIDEOID_REGEXES = [
392         r'\bdata-video-id=["\'](\d{7,})',
393         r'\bdata-player-videosids=["\'](\d{7,})',
394         r'\bvideosIDs\s*:\s*["\'](\d{7,})',
395         r'\bdata-id=["\'](\d{7,})',
396         r'<div[^>]+\bid=["\'](\d{7,})',
397     ]
398
399     _TEST = {
400         'url': 'http://g1.globo.com/jornal-nacional/noticia/2014/09/novidade-na-fiscalizacao-de-bagagem-pela-receita-provoca-discussoes.html',
401         'md5': '307fdeae4390ccfe6ba1aa198cf6e72b',
402         'info_dict': {
403             'id': '3652183',
404             'ext': 'mp4',
405             'title': 'Receita Federal explica como vai fiscalizar bagagens de quem retorna ao Brasil de avião',
406             'duration': 110.711,
407             'uploader': 'Rede Globo',
408             'uploader_id': 196,
409             'like_count': int,
410         }
411     }
412
413     @classmethod
414     def suitable(cls, url):
415         return False if GloboIE.suitable(url) else super(GloboArticleIE, cls).suitable(url)
416
417     def _real_extract(self, url):
418         display_id = self._match_id(url)
419         webpage = self._download_webpage(url, display_id)
420         video_id = self._search_regex(self._VIDEOID_REGEXES, webpage, 'video id')
421         return self.url_result('globo:%s' % video_id, 'Globo')