2009-08-11 13:11:38 +0000 2009-08-11 13:11:38 +0000
26
26

Как редактировать текст в Unicode в Блокноте++?

Иногда я редактирую английский текст, который включает символы Юникода. По какой-то причине, на моем компьютере, блокнот++ преобразует символы Юникода в ???, тем самым повреждая текст и теряя все эти данные. Я ищу способ редактировать такой текст, сохраняя при этом символы Юникода. Я использую Консоли в качестве Шрифта. Если в шрифте нет всех этих символов, зачем мне терять данные, когда я копирую текст из Блокнота++ (через буфер обмена Windows)?

Ответы (5)

15
15
15
2011-09-17 11:54:32 +0000

Проблема, описанная в вопросе, возникает, когда документ empty/new установлен в “ANSI” и в него вставлены символы Unicode .

Нет никакого автоопределения при использовании с пустым/новым документом, по крайней мере, в версии Блокнота++, на которой я его тестировал (v5.4.5). Для нового документа в Блокноте по умолчанию используется “ANSI”, если только в меню SettingsPreferences → tab New Document/Open Save Directory не установлено значение “ANSI”.

Решение

Решение заключается в установке кодировки в UTF-8 перед вставкой, меню FormatEncode in UTF-8:

Пример

Я скопировал текст в новый документ Блокнот++, Russian (русский язык, русский язык), из Firefox, показывающий страницу Википедии Русский язык _.

Если кодировка not изменена из “ANSI”, это результат:

Если кодировка is изменена, это результат:

Как видно на рисунке ниже (выделена часть Кириллица ), Блокнот++ фактически преобразует символы Юникода в ASCII 63 (шестнадцатеричный 3F), вопросительные знаки. Поэтому символы Юникода теряются (в режиме “ANSI”) при копировании текста через буфер обмена (это not проблема со шрифтом - информация теряется).

Протестировано: Блокнот++ v5.4.5 (UNICODE).

15
15
15
2009-08-11 13:30:37 +0000

Если файл действительно закодирован в Unicode, Блокнот++ должен обнаружить его автоматически. Шрифт Consolas font хорошо работает. Вы можете попробовать один из этих двух пунктов меню:

  • Encoding -> Encode in UTF-8
  • Encoding -> Convert to UTF-8

Я уверен, что первый сделает то, что вы хотите.

5
5
5
2009-08-11 13:30:46 +0000

Есть хорошие новости и плохие новости.

Новости хорошего: Блокнот++ поддерживает Unicode (по крайней мере, из того, что я могу собрать).

Плохие новости: Очевидно, что поддержка Юникода есть только в Windows XP.

На самом деле передо мной не стоит машина с Windows. Насколько я помню, где-то в меню Формат есть меню Кодировка. На самом деле кодировка для Unicode чаще всего UTF-8.

Вот ‘симпатичная’ картинка поддержки Unicode в Блокноте++,

1
1
1
2015-04-14 13:13:05 +0000

Это сработало на меня:

Я изменил шрифт на Courier New в конфигураторе стилей на моем компьютере (Windows 7 с набором символов English/US и румынским для не-уникод набора). Он работает со шрифтами Courier New & Tahoma + кодировка UTF-8.

0
0
0
2018-09-19 10:12:31 +0000

В верхнем меню выберите Encoding, затем выберите Encode in UTF-8 или Encode in UTF-8 Without BOM, после чего вы сможете редактировать текст в кодировке Unicode.

Похожие вопросы

19
8
1
6
4