]>
Raphaël G. Git Repositories - youtubedl/blob - youtube_dl/extractor/rozhlas.py
2 from __future__
import unicode_literals
4 from . common
import InfoExtractor
11 class RozhlasIE ( InfoExtractor
):
12 _VALID_URL
= r
'https?://(?:www\.)?prehravac\.rozhlas\.cz/audio/(?P<id>[0-9]+)'
14 'url' : 'http://prehravac.rozhlas.cz/audio/3421320' ,
15 'md5' : '504c902dbc9e9a1fd50326eccf02a7e2' ,
19 'title' : 'Echo Pavla Klusáka (30.06.2015 21:00)' ,
20 'description' : 'Osmdesátiny Terryho Rileyho jsou skvělou příležitostí proletět se elektronickými i akustickými díly zakladatatele minimalismu, který je aktivní už přes padesát let'
23 'url' : 'http://prehravac.rozhlas.cz/audio/3421320/embed' ,
24 'only_matching' : True ,
27 def _real_extract ( self
, url
):
28 audio_id
= self
._ match
_ id
( url
)
30 webpage
= self
._ download
_ webpage
(
31 'http://prehravac.rozhlas.cz/audio/ %s ' % audio_id
, audio_id
)
33 title
= self
._ html
_ search
_ regex
(
34 r
'<h3>(.+?)</h3>\s*<p[^>]*>.*?</p>\s*<div[^>]+id=["\' ] player
- track
',
35 webpage, ' title
', default=None) or remove_start(
36 self._og_search_title(webpage), ' Radio Wave
- ')
37 description = self._html_search_regex(
38 r' < p
[ ^
>]+ title
=([ " \' ])(?P<url>(?:(?!\1).)+)\1[^>]*>.*?</p>\s*<div[^>]+id=[" \' ] player
- track
',
39 webpage, ' description
', fatal=False, group=' url
')
40 duration = int_or_none(self._search_regex(
41 r' data
- duration
=[ " \' ](\d+)', webpage, 'duration', default=None))
45 'url': 'http://media.rozhlas.cz/_audio/ %s .mp3' % audio_id,
47 'description': description,