Imported Upstream version 2016.08.17

[youtubedl] / youtube_dl / extractor / dailymotion.py
diff --git a/youtube_dl/extractor/dailymotion.py b/youtube_dl/extractor/dailymotion.py

index 2e6226ea0774af2e636cbc4b4a4ca9f1ecb763a3..496883d15bbc0b3e1a3503d0545ea1e46c33e6c9 100644 (file)
--- a/youtube_dl/extractor/dailymotion.py
+++ b/youtube_dl/extractor/dailymotion.py
@@ -16,6 +16,7 @@ from ..utils import (
      sanitized_Request,
      str_to_int,
      unescapeHTML,
+    mimetype2ext,
  )
  
  
@@ -111,6 +112,13 @@ class DailymotionIE(DailymotionBaseInfoExtractor):
          }
      ]
  
+    @staticmethod
+    def _extract_urls(webpage):
+        # Look for embedded Dailymotion player
+        matches = re.findall(
+            r'<(?:(?:embed|iframe)[^>]+?src=|input[^>]+id=[\'"]dmcloudUrlEmissionSelect[\'"][^>]+value=)(["\'])(?P<url>(?:https?:)?//(?:www\.)?dailymotion\.com/(?:embed|swf)/video/.+?)\1', webpage)
+        return list(map(lambda m: unescapeHTML(m[1]), matches))
+
      def _real_extract(self, url):
          video_id = self._match_id(url)
  
@@ -153,18 +161,19 @@ class DailymotionIE(DailymotionBaseInfoExtractor):
                      type_ = media.get('type')
                      if type_ == 'application/vnd.lumberjack.manifest':
                          continue
-                    ext = determine_ext(media_url)
-                    if type_ == 'application/x-mpegURL' or ext == 'm3u8':
+                    ext = mimetype2ext(type_) or determine_ext(media_url)
+                    if ext == 'm3u8':
                          formats.extend(self._extract_m3u8_formats(
                              media_url, video_id, 'mp4', preference=-1,
                              m3u8_id='hls', fatal=False))
-                    elif type_ == 'application/f4m' or ext == 'f4m':
+                    elif ext == 'f4m':
                          formats.extend(self._extract_f4m_formats(
                              media_url, video_id, preference=-1, f4m_id='hds', fatal=False))
                      else:
                          f = {
                              'url': media_url,
                              'format_id': 'http-%s' % quality,
+                            'ext': ext,
                          }
                          m = re.search(r'H264-(?P<width>\d+)x(?P<height>\d+)', media_url)
                          if m:
@@ -322,7 +331,9 @@ class DailymotionPlaylistIE(DailymotionBaseInfoExtractor):
  
              for video_id in re.findall(r'data-xid="(.+?)"', webpage):
                  if video_id not in video_ids:
-                    yield self.url_result('http://www.dailymotion.com/video/%s' % video_id, 'Dailymotion')
+                    yield self.url_result(
+                        'http://www.dailymotion.com/video/%s' % video_id,
+                        DailymotionIE.ie_key(), video_id)
                      video_ids.add(video_id)
  
              if re.search(self._MORE_PAGES_INDICATOR, webpage) is None: