[generic] Add support for BOMs (Fixes #4753)

[youtube-dl] / youtube_dl / extractor / generic.py
diff --git a/youtube_dl/extractor/generic.py b/youtube_dl/extractor/generic.py

index 7a5bf939237ff45731fd3befca5ad0b7dfc0df1f..b893d8149f2c63e081341d2dec2d71ba05f3e64c 100644 (file)
--- a/youtube_dl/extractor/generic.py
+++ b/youtube_dl/extractor/generic.py
@@ -17,6 +17,7 @@ from ..utils import (
      ExtractorError,
      float_or_none,
      HEADRequest,
+    is_html,
      orderedSet,
      parse_xml,
      smuggle_url,
@@ -647,7 +648,7 @@ class GenericIE(InfoExtractor):
          # Maybe it's a direct link to a video?
          # Be careful not to download the whole thing!
          first_bytes = full_response.read(512)
-        if not re.match(r'^\s*<', first_bytes.decode('utf-8', 'replace')):
+        if not is_html(first_bytes):
              self._downloader.report_warning(
                  'URL could be a direct video link, returning it as such.')
              upload_date = unified_strdate(