Кодировка текста – это схема нумерации символов, в которой каждому символу, цифре или знаку присвоено соответствующее число. Кодировку используют для сохранения и обработки текста на компьютере. Каждый раз при сохранении текста в файл он сохраняется с использованием определенной схемы кодирования, и при открытии этого файла необходимо использовать такую же схему, иначе восстановить исходный текст не получится. Самыми популярными кодировками для кириллицы сейчас являются UTF-8, Windows-1251 (CP1251, ANSI).
Для того чтобы программа смогла правильно открыть текстовый файл, иногда приходится вручную менять кодировку, перекодируя текст из одной схемы в другую. Например, не редко возникают проблемы с открытием файлов CSV, XML, SQL, TXT, PHP.
В этой небольшой статье мы расскажем о том, как изменить кодировку текстового файла на UTF-8, Windows-1251 или любую другую.
Блокнот Windows
Если вы используете операционную систему Windows 10 или Windows 11, то вы можете изменить кодировку текста с помощью стандартной программы Блокнот. Для этого нужно открыть текстовый файл с помощью Блокнота и воспользоваться меню «Файл – Сохранить как».
В открывшемся окне нужно указать новое название для файла, выбрать подходящую кодировку и нажать на кнопку «Сохранить».
К сожалению, для подобных задач программа Блокнот часто не подходит. С ее помощью нельзя открывать документы большого размера, и она не поддерживает многие кодировки. Например, с помощью Блокнота нельзя открыть текстовые файлы в DOS 866.
Notepad++
Notepad++ (скачать) является одним из наиболее продвинутых текстовых редакторов. Он обладает подсветкой синтаксиса языков программирования, позволяет выполнять поиск и замену по регулярным выражениям, отслеживать изменения в файлах, записывать и воспроизводить макросы, считать хеш-сумы и многое другое. Одной из основных функций Notepad++ является поддержка большого количества кодировок текста и возможность изменения кодировки текстового файла в UTF-8 или Windows 1251.
Для того чтобы изменить кодировку текста с помощью Notepad++ файл нужно открыть в данной программе. Если программа не смогла правильно определить схему кодирования текста, то это можно сделать вручную. Для этого нужно открыть меню «Кодировки – Кириллица» и выбрать нужный вариант.
После открытия текста можно изменить его кодировку. Для этого нужно открыть меню «Кодировки» и выбрать один из вариантов преобразования. Notepad++ позволяет изменить текущую кодировку текста на ANSI (Windows-1251), UTF-8, UTF-8 BOM, UTF-8 BE BOM, UTF-8 LE BOM.
После преобразования файл нужно сохранить с помощью меню «Файл – Сохранить» или комбинации клавиш Ctrl-S.
Akelpad
Akelpad (скачать) – достаточно старая программа для работы с текстовыми файлами, которая все еще актуальна и может быть полезной. Фактически Akelpad является более продвинутой версией стандартной программы Блокнот из Windows. С его помощью можно открывать текстовые файлы большого размера, которые не открываются в Блокноте, выполнять поиск и замену с использованием регулярных выражений и менять кодировку текста.
Для того чтобы изменить кодировку текста с помощью Akelpad файл нужно открыть в данной программе. Если после открытия файла текст не читается, то нужно воспользоваться меню «Файл – Открыть».
В открывшемся окне нужно выделить текстовый файл, снять отметку «Автовыбор» и выбрать подходящую кодировку из списка. При этом в нижней части окна можно видеть, как будет отображаться текст.
Для того чтобы изменить текущую кодировку текста нужно воспользоваться меню «Файл – Сохранить как» и сохранить документ с указанием новой схемы кодирования.
В отличие от Notepad++, текстовый редактор Akelpad позволяет сохранить файл в практически любой кодировке. В частности, доступны Windows 1251, DOS 886, UTF-8 и многие другие.
Посмотрите также:
- Чем открыть PDF файл в Windows 7 или Windows 10
- Как перевернуть страницу в Word
- Как копировать текст с помощью клавиатуры
- Как сделать рамку в Word
- Как сделать буклет в Word
Автор
Александр Степушин
Создатель сайта comp-security.net, автор более 2000 статей о ремонте компьютеров, работе с программами, настройке операционных систем.
Остались вопросы?
Задайте вопрос в комментариях под статьей или на странице
«Задать вопрос»
и вы обязательно получите ответ.
Notepad++ — отличный текстовый редактор!
В статье о кодировках текста я описал основные моменты, показывающие, почему необходимо учитывать кодировку файла (например, при создании html-страницы). Здесь же я опишу простой способ выставления нужной кодировки текста с помощью простого и быстрого редактора Notepad++.
Чтобы скачать данную программу, заходим на официальный сайт — Notepad-plus-plus.org — далее ищем ссылку «download», кликаем по ней и выбираем «Notepad++ v*** Installer», где вместо звёздочек будет текущая версия редактора. Скачиваем и устанавливаем, никаких сложностей при установке нет.
Чем вообще хорош этот редактор?
Во-первых, подсветка синтаксиса — редактор Notepad++ неплохо понимает разные языки программирования (тип языка определяется по расширению файла, например file.php — php-файл, index.html — html-файл) и производит автоматическую подсветку управляющих конструкций языка.
Notepad++ понимает php и подсвечивает синтаксис языка. Кликабельно
Во-вторых, в нём можно легко изменить кодировку текстового файла на нужную (чтобы быстро её сменить, щёлкаем вкладку «Кодировки», затем «Преобразовать в …» — кликайте рисунок ниже) и, что самое главное, отредактировать любой файл без изменения текущей кодировки (кодировка не «слетает»).
Последняя особенность очень важна, например, при редактировании шаблонов движка вашего сайта (напр., WordPress). Почему? Потому что все файлы WP по умолчанию имеют кодировку Utf-8. Если менять их стандартным блокнотом Windows, то к кодировке Utf-8 добавляется специальная BOM-последовательность. Необязательно знать, что это такое, но из-за неё некоторые функции движка работать вообще не будут. Поэтому так важно, чтобы все файлы шаблонов WP были сохранены в кодировке Utf-8 без BOM.
Преобразование в кодировку Utf-8 без BOM
Теперь, чтобы открыть текстовый файл данным редактором, надо кликнуть по нему правой кнопкой мышки и выбрать соответствующий пункт меню:
Открытие .txt файлов Notepad++
Таким образом, установив на свой компьютер программу Notepad++ можно получить многофункциональный редактор текста с подсветкой синтаксиса и возможностью манипуляций с кодировками.
Loading…
- Таблицы кодировок русской раскладки клавиатуры
- Создание нового текстового документа в Windows
- Смена кодировки текстового файла с помощью Блокнота в Windows.
Таблицы кодировок русской раскладки клавиатуры.
Фишка кодировки текстовых фалов в том, что хранятся не сами буквы (символы), а ссылки на них в таблице кодировок. Если с латинским буквами, арабскими цифрами и основными символами типа точек, тире и запятых никаких проблем не возникает: во многих таблицах кодировок все эти буквы, цифры и символы находятся в одних и тех же ячейках, то с кириллицей всё сложно. Например, в разных кодировках буква Ы
может находиться в ячейке 211, 114 и 69.
Именно поэтому на заре интернета чтобы посмотреть разные сайты с разными кодировками приходилось подбирать кодировку. (Но кто это помнит?) Сейчас кодировка страницы обычно прописана в заголовке страницы, что позволяет браузеру «автоматически» подбирать отображение символов на наших мониторах.
То есть сервер отдаёт не просто HTML-страничку, а указывает, что у неё кодировка Windows-1251
. Браузер таким образом, считывая информацию о кодировке полученного файла, подставляет символы из указанной кодировки.
Но и это ещё не всё веселье. Например, если на сервере установлена операционная система из семейства *nix (с кодировкой по умолчанию UTF-8
), а мы шлём файл из нашей любимой ОС Windows, где кодировка текстовых фалов по умолчанию стоит почему-то ANSI
, то как вы думаете сервер будет работать с текстом, кодировка которой не совпадает с его? Правильно! Как-то будет работать! Но результат работы может быть непредсказуемым и удивительным. =)
Надеюсь, что мотивация для обращение необходимого внимания на кодировку достаточная и можно перейти к сути вопроса: «Как же, чёрт возьми, сохранить файл в нужной кодировке?!»
В этой статье речь пойдёт как раз о том, как сохранить текстовый файл с помощью программы Блокнот (Notepad) в Windows в нужной кодировке.
Для того, чтобы изменить кодировку текстового файла, конечно же сперва его нужно создать. А после того, как файл создан, нужно ещё суметь его открыть. Самый простой способ отрыть файл — это двойной клик левой кнопкой мыши по его иконке в проводнике:
Если до этого настройки Windows не менялись, то файлы с расширением .txt
открываются в Блокноте. (Это ещё один способ, как отрыть Блокнот (Notepad).)
Смена кодировки текстового файла с помощью Блокнота в Windows.
Чтобы поменять кодировку в открывшемся файле, нужно в меню «Файл» текстового редактора Блокнот выбрать пункт «Сохранить как…»:
Откроется диалоговое окно сохранения файла. Для смены кодировки, нужно выбрать из списка предлагаемых необходимый:
После того, как нужная кодировка выбрана, можно кликнуть на кнопку «Сохранить» или просто нажать Enter:
Так как мы не изменили имя файла, то будет перезаписан тот же самый файл. Поэтому возникает справедливый вопрос: «Файл с таким именем уже существует. Заменить?» Ну да, мы к этому и стремимся! Поменять кодировку у этого файла. Поэтому его нужно перезаписать с новой кодировкой. Соглашаемся:
Всё! Миссия по смене кодировки в текстовом файле выполнена! Файл сохранён с новой кодировкой. Можно закрыть текстовый редактор и устроить празднование этого решающего события! =D
Заберите ссылку на статью к себе, чтобы потом легко её найти!
Выберите, то, чем пользуетесь чаще всего:
Как всегда приветствую Вас, ищущего полезную информацию по верстке сайтов. Сегодня мы поговорим о кодировке файлов. Данную тему важно запомнить один раз и больше к ней не возвращаться. Сегодня мы будем говорить о том, как сохранить файл в кодировке utf-8, почему необходимо использовать utf-8?
Что же такое юникод, utf-8, преимущества и минусы можно почитать на Wikipedia, так и на других сайтах, например, мне понравилась статья Дмитрия, в ней интересно описано откуда и почему появились кодировки ASCII, юникод и UTF 8, расширенная ASCII (Windows 1251, CP866, KOI8-R).
Давайте, перейдем к нашей теме и начнем разбираться с проблемами во время нашей верстки сайта.
Основной проблемой неправильной кодировки это отображение текста как кроказябли, непонятные символы и т.д. Так же в кодировке window-1251 отсутствуют специальные символы (что-то типа копирайтов §, ©, ‰) и другие пинтограммы (♥, ☺).
Все это от того, что в cp1251, например, всего 256 символов (что в принципе достаточно для кирилицы), а в Unicode более 100 000 символов. Поэтому я советую создавать html каркас (как html верстальщик) и вообще сайты с кодировкой utf-8. Вы скажите мне достаточно window-1251, так как я использую кириллицу. Полностью согласен с Вами, но если Вы захотите использовать специальные символы, или сделать мультиязычный сайт? Ну, а в связи с тем, что я верстаю для Казахстана, то кодировки cp1251 изначально не подходит, так как обычно используется казахский, русский и английский языки. Лучше запостись символами .
Как сохранить файл в кодировке utf-8 без BOM? (utf-8 without BOM)
Именно так и надо сохранять без BOM (Byte Order Mark или— сигнатура – три символа, которые все портят).
Не все программы способны сохранять файлы в кодировке utf-8 без BOM. Яркий пример – Блокнот от Windows.
Программа Notepad++
Программа шикарная и очень полезная как для верстальщика, так и для программистов, веб-разработчиков. Посетите официальный сайт, там же можно скачать редактор совершенно бесплатно.
Откройте файл и выберите преобразовать в utf-8 без BOM.
Если нажмете кодировать в utf-8 без BOM, то произойдет следующее.
Если сомневаетесь и, чтобы не рисковать всегда делайте backup – резервное копирование!
Программа PhpDesigner
PhpDesigner – удобный редактор. Программа платная.
Немного сложней будет. Для начала проведем настройки для браузеров:
1. Откройте выпадающее меню: Создать новый файл -> Изменить шаблон (Edit template) либо Файл -> Новый… -> Edit templates
2. Выберите Html и вставьте туда следующий код и поставьте галочку на «Использовать данный шаблон для HTML/XHTML» (Use this template for HTML/XHTML):
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8"/> <title>Документ Без Имени</title> </head> <body> </body> </html>
Установка кодировки:
– Пройдите: Инструменты -> Установки (или вызовите через CTRL + E) и выставите соответствующую кодировку.
Для преобразования отдельного файла используйте:
Файл -> Кодировка файла -> utf-8
Текущую кодировку можно увидеть в нижней части программы слева.
Можно, конечно, пойти другим путем. Создать файл, после открыть файл в Notepad++ и сделать соответствующие настройки.
Программа PSpad
Pspad — еще один неплохой текстовый редактор. Кстати, полностью бесплатный. Функций больше чем у Notepad++.
Поменять кодировку текущего файла в Pspad очень просто: Вкладка Формат -> Выбрать необходимую кодировку (например, utf-8)
Кодировка для браузеров по умолчанию:
Создать новый файл (Ctrl + N) -> Из шаблона -> Html -> Html 4.01 Transitional -> Правка…
В charset впишите необходимую кодировку, например:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html lang="cs"> <head> <meta http-equiv="content-type" content="text/html; charset=utf-8"> <meta name="generator" content="PSPad editor, www.pspad.com"> <title>Untitled</title> </head> <body> </body> </html>
Сохраните и закройте шаблон.
Теперь, создавая новый файл из шаблона все будет готово.
Программа Rapid PHP (2010)
Rapid PHP – платный текстовый редактор.
Для настройки кодировки сделайте следующее:
Опции -> Настройки… -> Файл -> utf-8 без BOM (либо другая кодировка)
По умолчанию файл html создается без meta данных. Вставить кодировку (charset) для браузеров можно так:
Вставка -> Кодировка -> Unicode (utf-8) (либо другая необходимая)
Кодировка с помощью .htaccess
С помощью файла .htaccess можно заставить браузер отобразить нужную кодировку. Не советую пользоваться данным методом на работающих сайтах (я обычно использую только для html на локалке, ), но все же метод работающий. Добавьте в файл:
AddDefaultCharset utf-8
Внимание! Ваш хостинг может не поддерживать данные настройки.
Сообщение кодировки для браузеров
Как браузеры понимают, в какой кодировке Вы писали свой файл? Для этого и существует строка (мета данные):
<meta http-equiv="content-type" content="text/html; charset=utf-8">
Т.е. браузер по умолчанию «читает» страницу в кодировке utf-8. Это Вы в принципе, должны знать еще из школьной программы.
В принципе, это основные настройки. Если остались вопросы, отписывайтесь в комметариях, чтобы закрыть эту тему с кодировкой и сохранить себе нервы .
Надеюсь информация была полезной. Спасибо за Ваши like и ретвиты.
с/у УтБ
Постовой: Если Ваш интернет магазин не приносит доходы, то пора сделать полный анализ интернет магазина. Хватит терять потенциальных клиентов!
На десерт сегодня вирусное видео про Светлакова. Но все же мне понравилось, обязательно надо сходить на его фильм