]>
Raphaël G. Git Repositories - youtubedl/blob - youtube_dl/extractor/kontrtube.py
1b45b67b0579d9fb06462f587651bc8f83e4751d
   2 from __future__ 
import unicode_literals
 
   6 from .common 
import InfoExtractor
 
   9 class KontrTubeIE(InfoExtractor
): 
  11     IE_DESC 
= 'KontrTube.ru - Труба зовёт' 
  12     _VALID_URL 
= r
'http://(?:www\.)?kontrtube\.ru/videos/(?P<id>\d+)/.+' 
  15         'url': 'http://www.kontrtube.ru/videos/2678/nad-olimpiyskoy-derevney-v-sochi-podnyat-rossiyskiy-flag/', 
  16         'md5': '975a991a4926c9a85f383a736a2e6b80', 
  20             'title': 'Над олимпийской деревней в Сочи поднят российский флаг', 
  21             'description': 'md5:80edc4c613d5887ae8ccf1d59432be41', 
  22             'thumbnail': 'http://www.kontrtube.ru/contents/videos_screenshots/2000/2678/preview.mp4.jpg', 
  27     def _real_extract(self
, url
): 
  28         mobj 
= re
.match(self
._VALID
_URL
, url
) 
  29         video_id 
= mobj
.group('id') 
  31         webpage 
= self
._download
_webpage
(url
, video_id
, 'Downloading page') 
  33         video_url 
= self
._html
_search
_regex
(r
"video_url: '(.+?)/?',", webpage
, 'video URL') 
  34         thumbnail 
= self
._html
_search
_regex
(r
"preview_url: '(.+?)/?',", webpage
, 'video thumbnail', fatal
=False) 
  35         title 
= self
._html
_search
_regex
(r
'<title>(.+?) - Труба зовёт - Интересный видеохостинг</title>', webpage
, 
  37         description 
= self
._html
_search
_meta
('description', webpage
, 'video description') 
  39         mobj 
= re
.search(r
'<div class="col_2">Длительность: <span>(?P<minutes>\d+)м:(?P<seconds>\d+)с</span></div>', 
  41         duration 
= int(mobj
.group('minutes')) * 60 + int(mobj
.group('seconds')) if mobj 
else None 
  43         view_count 
= self
._html
_search
_regex
(r
'<div class="col_2">Просмотров: <span>(\d+)</span></div>', webpage
, 
  44             'view count', fatal
=False) 
  45         view_count 
= int(view_count
) if view_count 
is not None else None 
  48         comment_str 
= self
._html
_search
_regex
(r
'Комментарии: <span>([^<]+)</span>', webpage
, 'comment count', 
  50         if comment_str
.startswith('комментариев нет'): 
  53             mobj 
= re
.search(r
'\d+ из (?P<total>\d+) комментариев', comment_str
) 
  55                 comment_count 
= int(mobj
.group('total')) 
  60             'thumbnail': thumbnail
, 
  62             'description': description
, 
  64             'view_count': view_count
, 
  65             'comment_count': comment_count
,