]>
Raphaël G. Git Repositories - youtubedl/blob - youtube_dl/extractor/jeuxvideo.py
6 from . common
import InfoExtractor
9 class JeuxVideoIE ( InfoExtractor
):
10 _VALID_URL
= r
'http://.*?\.jeuxvideo\.com/.*/(.*?)-\d+\.htm'
13 u
'url' : u
'http://www.jeuxvideo.com/reportages-videos-jeux/0004/00046170/tearaway-playstation-vita-gc-2013-tearaway-nous-presente-ses-papiers-d-identite-00115182.htm' ,
15 u
'md5' : u
'046e491afb32a8aaac1f44dd4ddd54ee' ,
17 u
'title' : u
'GC 2013 : Tearaway nous présente ses papiers d \' identité' ,
18 u
'description' : u
'Lorsque les développeurs de LittleBigPlanet proposent un nouveau titre, on ne peut que s \' attendre à un résultat original et fort attrayant. \n ' ,
22 def _real_extract ( self
, url
):
23 mobj
= re
. match ( self
._ VALID
_U RL
, url
)
25 webpage
= self
._ download
_ webpage
( url
, title
)
26 xml_link
= self
._ html
_ search
_ regex
(
27 r
'<param name="flashvars" value="config=(.*?)" />' ,
28 webpage
, u
'config URL' )
30 video_id
= self
._ search
_ regex
(
31 r
'http://www\.jeuxvideo\.com/config/\w+/\d+/(.*?)/\d+_player\.xml' ,
32 xml_link
, u
'video ID' )
34 config
= self
._ download
_ xml
(
35 xml_link
, title
, u
'Downloading XML config' )
36 info_json
= config
. find ( 'format.json' ). text
37 info
= json
. loads ( info_json
)[ 'versions' ][ 0 ]
39 video_url
= 'http://video720.jeuxvideo.com/' + info
[ 'file' ]
43 'title' : config
. find ( 'titre_video' ). text
,
46 'description' : self
._ og
_ search
_ description
( webpage
),
47 'thumbnail' : config
. find ( 'image' ). text
,