2 from __future__ 
import unicode_literals
 
   4 from .common 
import InfoExtractor
 
   7     compat_urllib_parse_urlencode
, 
  19 class UOLIE(InfoExtractor
): 
  20     IE_NAME 
= 'uol.com.br' 
  21     _VALID_URL 
= r
'https?://(?:.+?\.)?uol\.com\.br/.*?(?:(?:mediaId|v)=|view/(?:[a-z0-9]+/)?|video(?:=|/(?:\d{4}/\d{2}/\d{2}/)?))(?P<id>\d+|[\w-]+-[A-Z0-9]+)' 
  23         'url': 'http://player.mais.uol.com.br/player_video_v3.swf?mediaId=15951931', 
  24         'md5': '4f1e26683979715ff64e4e29099cf020', 
  28             'title': 'Miss simpatia é encontrada morta', 
  29             'description': 'md5:3f8c11a0c0556d66daf7e5b45ef823b2', 
  30             'timestamp': 1470421860, 
  31             'upload_date': '20160805', 
  34         'url': 'http://tvuol.uol.com.br/video/incendio-destroi-uma-das-maiores-casas-noturnas-de-londres-04024E9A3268D4C95326', 
  35         'md5': '2850a0e8dfa0a7307e04a96c5bdc5bc2', 
  39             'title': 'Incêndio destrói uma das maiores casas noturnas de Londres', 
  40             'description': 'Em Londres, um incêndio destruiu uma das maiores boates da cidade. Não há informações sobre vítimas.', 
  41             'timestamp': 1470674520, 
  42             'upload_date': '20160808', 
  45         'url': 'http://mais.uol.com.br/static/uolplayer/index.html?mediaId=15951931', 
  46         'only_matching': True, 
  48         'url': 'http://mais.uol.com.br/view/15954259', 
  49         'only_matching': True, 
  51         'url': 'http://noticias.band.uol.com.br/brasilurgente/video/2016/08/05/15951931/miss-simpatia-e-encontrada-morta.html', 
  52         'only_matching': True, 
  54         'url': 'http://videos.band.uol.com.br/programa.asp?e=noticias&pr=brasil-urgente&v=15951931&t=Policia-desmonte-base-do-PCC-na-Cracolandia', 
  55         'only_matching': True, 
  57         'url': 'http://mais.uol.com.br/view/cphaa0gl2x8r/incendio-destroi-uma-das-maiores-casas-noturnas-de-londres-04024E9A3268D4C95326', 
  58         'only_matching': True, 
  60         'url': 'http://noticias.uol.com.br//videos/assistir.htm?video=rafaela-silva-inspira-criancas-no-judo-04024D983968D4C95326', 
  61         'only_matching': True, 
  63         'url': 'http://mais.uol.com.br/view/e0qbgxid79uv/15275470', 
  64         'only_matching': True, 
  67     def _real_extract(self
, url
): 
  68         video_id 
= self
._match
_id
(url
) 
  70         video_data 
= self
._download
_json
( 
  71             # https://api.mais.uol.com.br/apiuol/v4/player/data/[MEDIA_ID] 
  72             'https://api.mais.uol.com.br/apiuol/v3/media/detail/' + video_id
, 
  74         media_id 
= compat_str(video_data
['mediaId']) 
  75         title 
= video_data
['title'] 
  76         ver 
= video_data
.get('revision', 2) 
  78         uol_formats 
= self
._download
_json
( 
  79             'https://croupier.mais.uol.com.br/v3/formats/%s/jsonp' % media_id
, 
  81         quality 
= qualities(['mobile', 'WEBM', '360p', '720p', '1080p']) 
  83         for format_id
, f 
in uol_formats
.items(): 
  84             if not isinstance(f
, dict): 
  86             f_url 
= f
.get('url') or f
.get('secureUrl') 
  91                 'r': 'http://mais.uol.com.br', 
  93             for k 
in ('token', 'sign'): 
  97             f_url 
= update_url_query(f_url
, query
) 
  99             if format_id 
== 'HLS': 
 100                 m3u8_formats 
= self
._extract
_m
3u8_formats
( 
 101                     f_url
, media_id
, 'mp4', 'm3u8_native', 
 102                     m3u8_id
='hls', fatal
=False) 
 103                 encoded_query 
= compat_urllib_parse_urlencode(query
) 
 104                 for m3u8_f 
in m3u8_formats
: 
 105                     m3u8_f
['extra_param_to_segment_url'] = encoded_query
 
 106                     m3u8_f
['url'] = update_url_query(m3u8_f
['url'], query
) 
 107                 formats
.extend(m3u8_formats
) 
 110                 'format_id': format_id
, 
 112                 'quality': quality(format_id
), 
 115         self
._sort
_formats
(formats
) 
 118         for tag 
in video_data
.get('tags', []): 
 119             tag_description 
= tag
.get('description') 
 120             if not tag_description
: 
 122             tags
.append(tag_description
) 
 125         for q 
in ('Small', 'Medium', 'Wmedium', 'Large', 'Wlarge', 'Xlarge'): 
 126             q_url 
= video_data
.get('thumb' + q
) 
 137             'description': clean_html(video_data
.get('description')), 
 138             'thumbnails': thumbnails
, 
 139             'duration': parse_duration(video_data
.get('duration')), 
 142             'timestamp': parse_iso8601(video_data
.get('publishDate'), ' '), 
 143             'view_count': int_or_none(video_data
.get('viewsQtty')),