]>
Raphaël G. Git Repositories - youtubedl/blob - youtube_dl/extractor/ard.py
2 from __future__
import unicode_literals
6 from . common
import InfoExtractor
13 class ARDIE ( InfoExtractor
):
14 _VALID_URL
= r
'^https?://(?:(?:www\.)?ardmediathek\.de|mediathek\.daserste\.de)/(?:.*/)(?P<video_id>[^/\?]+)(?:\?.*)?'
17 'url' : 'http://www.ardmediathek.de/das-erste/guenther-jauch/edward-snowden-im-interview-held-oder-verraeter?documentId=19288786' ,
18 'file' : '19288786.mp4' ,
19 'md5' : '515bf47ce209fb3f5a61b7aad364634c' ,
21 'title' : 'Edward Snowden im Interview - Held oder Verräter?' ,
22 'description' : 'Edward Snowden hat alles aufs Spiel gesetzt, um die weltweite \xdc berwachung durch die Geheimdienste zu enttarnen. Nun stellt sich der ehemalige NSA-Mitarbeiter erstmals weltweit in einem TV-Interview den Fragen eines NDR-Journalisten. Die Sendung vom Sonntagabend.' ,
23 'thumbnail' : 'http://www.ardmediathek.de/ard/servlet/contentblob/19/28/87/90/19288790/bild/2250037' ,
25 'skip' : 'Blocked outside of Germany' ,
28 def _real_extract ( self
, url
):
29 # determine video id from url
30 m
= re
. match ( self
._ VALID
_U RL
, url
)
32 numid
= re
. search ( r
'documentId=([0-9]+)' , url
)
34 video_id
= numid
. group ( 1 )
36 video_id
= m
. group ( 'video_id' )
38 webpage
= self
._ download
_ webpage
( url
, video_id
)
40 title
= self
._ html
_ search
_ regex
(
41 [ r
'<h1(?:\s+class="boxTopHeadline")?>(.*?)</h1>' ,
42 r
'<meta name="dcterms.title" content="(.*?)"/>' ,
43 r
'<h4 class="headline">(.*?)</h4>' ],
45 description
= self
._ html
_ search
_ meta
(
46 'dcterms.abstract' , webpage
, 'description' )
47 thumbnail
= self
._ og
_ search
_ thumbnail
( webpage
)
50 media_info
= self
._ download
_ json
(
51 'http://www.ardmediathek.de/play/media/ %s ' % video_id
, video_id
)
52 # The second element of the _mediaArray contains the standard http urls
53 streams
= media_info
[ '_mediaArray' ][ 1 ][ '_mediaStreamArray' ]
55 if '"fsk"' in webpage
:
56 raise ExtractorError ( 'This video is only available after 20:00' )
61 'quality' : s
[ '_quality' ],
65 format
[ 'format_id' ] = ' %s-%s ' % (
66 determine_ext ( format
[ 'url' ]), format
[ 'quality' ])
68 formats
. append ( format
)
70 self
._ sort
_ formats
( formats
)
75 'description' : description
,
77 'thumbnail' : thumbnail
,