Fix detection of the webpage charset if it's declared using ' instead of "

author Jaime Marquínez Ferrándiz <jaime.marquinez.ferrandiz@gmail.com>

Thu, 29 Aug 2013 09:35:15 +0000 (11:35 +0200)

committer Jaime Marquínez Ferrándiz <jaime.marquinez.ferrandiz@gmail.com>

Thu, 29 Aug 2013 09:35:15 +0000 (11:35 +0200)
author Jaime Marquínez Ferrándiz <jaime.marquinez.ferrandiz@gmail.com>
Thu, 29 Aug 2013 09:35:15 +0000 (11:35 +0200)
committer Jaime Marquínez Ferrándiz <jaime.marquinez.ferrandiz@gmail.com>
Thu, 29 Aug 2013 09:35:15 +0000 (11:35 +0200)
diff --git a/youtube_dl/extractor/common.py b/youtube_dl/extractor/common.py

index a2986cebe5db15d54fbbdf90e87669982ce08aec..77726ee2432fc2bcd6df6ce89dcc560419524051 100644 (file)
--- a/youtube_dl/extractor/common.py
+++ b/youtube_dl/extractor/common.py
@@ -150,7 +150,7 @@ class InfoExtractor(object):
          if m:
              encoding = m.group(1)
          else:
-            m = re.search(br'<meta[^>]+charset="?([^"]+)[ /">]',
+            m = re.search(br'<meta[^>]+charset=[\'"]?([^\'")]+)[ /\'">]',
                            webpage_bytes[:1024])
              if m:
                  encoding = m.group(1).decode('ascii')
author	Jaime Marquínez Ferrándiz <jaime.marquinez.ferrandiz@gmail.com>
	Thu, 29 Aug 2013 09:35:15 +0000 (11:35 +0200)
committer	Jaime Marquínez Ferrándiz <jaime.marquinez.ferrandiz@gmail.com>
	Thu, 29 Aug 2013 09:35:15 +0000 (11:35 +0200)