improved performance by extracting accented chars to top level

author Adam Thalhammer <s3544305@student.rmit.edu.au>

Tue, 3 May 2016 00:40:30 +0000 (10:40 +1000)

committer Adam Thalhammer <s3544305@student.rmit.edu.au>

Tue, 3 May 2016 00:40:30 +0000 (10:40 +1000)
author Adam Thalhammer <s3544305@student.rmit.edu.au>
Tue, 3 May 2016 00:40:30 +0000 (10:40 +1000)
committer Adam Thalhammer <s3544305@student.rmit.edu.au>
Tue, 3 May 2016 00:40:30 +0000 (10:40 +1000)
diff --git a/youtube_dl/utils.py b/youtube_dl/utils.py

index f74f6226809fcb538ea243530097c397387c0e00..a5922b2b53306bda0cf4afccda7c17eeea85632c 100644 (file)
--- a/youtube_dl/utils.py
+++ b/youtube_dl/utils.py
@@ -89,6 +89,11 @@ KNOWN_EXTENSIONS = (
      'wav',
      'f4f', 'f4m', 'm3u8', 'smil')
  
+# needed for sanitizing filenames in restricted mode
+ACCENT_CHARS = dict(zip('ÂÃÄÀÁÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõöøùúûüýþÿ',
+                        itertools.chain('AAAAAA', ['AE'], 'CEEEEIIIIDNOOOOOOUUUUYP', ['ss'],
+                                        'aaaaaa', ['ae'], 'ceeeeiiiionoooooouuuuypy')))
+
  
  def preferredencoding():
      """Get preferred encoding.
@@ -365,11 +370,8 @@ def sanitize_filename(s, restricted=False, is_id=False):
      Set is_id if this is not an arbitrary string, but an ID that should be kept if possible
      """
      def replace_insane(char):
-        accents = dict(zip('ÂÃÄÀÁÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõöøùúûüýþÿ',
-                           itertools.chain('AAAAAA', ['AE'], 'CEEEEIIIIDNOOOOOOUUUUYP', ['ss'],
-                                           'aaaaaa', ['ae'], 'ceeeeiiiionoooooouuuuypy')))
-        if restricted and char in accents:
-            return accents[char]
+        if restricted and char in ACCENT_CHARS:
+            return ACCENT_CHARS[char]
          if char == '?' or ord(char) < 32 or ord(char) == 127:
              return ''
          elif char == '"':
author	Adam Thalhammer <s3544305@student.rmit.edu.au>
	Tue, 3 May 2016 00:40:30 +0000 (10:40 +1000)
committer	Adam Thalhammer <s3544305@student.rmit.edu.au>
	Tue, 3 May 2016 00:40:30 +0000 (10:40 +1000)