]>
 
 
Raphaël G. Git Repositories - youtubedl/blob - youtube_dl/extractor/rozhlas.py 
 
 
 
 
 
 
 
 
   2  from  __future__ 
import  unicode_literals
 
   4  from  . common 
import  InfoExtractor
 
  11  class  RozhlasIE ( InfoExtractor
):  
  12      _VALID_URL 
=  r
'https?://(?:www\.)?prehravac\.rozhlas\.cz/audio/(?P<id>[0-9]+)'  
  14          'url' :  'http://prehravac.rozhlas.cz/audio/3421320' ,  
  15          'md5' :  '504c902dbc9e9a1fd50326eccf02a7e2' ,  
  19              'title' :  'Echo Pavla Klusáka (30.06.2015 21:00)' ,  
  20              'description' :  'Osmdesátiny Terryho Rileyho jsou skvělou příležitostí proletět se elektronickými i akustickými díly zakladatatele minimalismu, který je aktivní už přes padesát let'  
  23          'url' :  'http://prehravac.rozhlas.cz/audio/3421320/embed' ,  
  24          'only_matching' :  True ,  
  27      def  _real_extract ( self
,  url
):  
  28          audio_id 
=  self
._ match
_ id
( url
)  
  30          webpage 
=  self
._ download
_ webpage
(  
  31              'http://prehravac.rozhlas.cz/audio/ %s '  %  audio_id
,  audio_id
)  
  33          title 
=  self
._ html
_ search
_ regex
(  
  34              r
'<h3>(.+?)</h3>\s*<p[^>]*>.*?</p>\s*<div[^>]+id=["\' ] player
- track
',  
  35              webpage, ' title
', default=None) or remove_start(  
  36              self._og_search_title(webpage), ' Radio Wave 
-  ')  
  37          description = self._html_search_regex(  
  38              r' < p
[ ^
>]+ title
=([ " \' ])(?P<url>(?:(?!\1).)+)\1[^>]*>.*?</p>\s*<div[^>]+id=[" \' ] player
- track
',  
  39              webpage, ' description
', fatal=False, group=' url
')  
  40          duration = int_or_none(self._search_regex(  
  41              r' data
- duration
=[ " \' ](\d+)', webpage, 'duration', default=None))  
  45              'url': 'http://media.rozhlas.cz/_audio/ %s .mp3' % audio_id,  
  47              'description': description,