c-sample:toutf
Table of Contents
toutf - автоматическое перекодирование русскоязычных текстов
По мере того как Unicode становится стандартом, приходится перекодировать старые русскоязычные файлы из прочих кодировок в UTF-8. Чтобы не разбираться с кодировкой каждого конкретного файла, можно применить алгоритм распознавания по парам соседних букв.
Вашему вниманию предлагается утилита toutf, выполняющая перекодировку из koi8-r, cp1251 и cp866 в utf-8.
Вызов
toutf [флаги] файл...
Флаги:
- -v, –verbose — показывать подробную информацию
- -f, –force — не спрашивать подтверждение для каждого файла
Пример работы:
$ toutf * File foo.txt has encoding cp1251 Convert to utf-8? (y, N): y File bar.txt has encoding koi8-r Convert to utf-8? (y, N): y
Двоичные файлы, каталоги и специальные файлы затронуты не будут.
Для рекурсивной обработки дерева файлов воспользуйтесь командой:
find . -print0 | xargs -0 toutf
Исходники
Исходный текст можно скачать здесь: toutf.c
Данная программа является свободным программным обеспечением и вы можете распространять ее в соответствии с условиями Стандартной Общественной Лицензии GNU.
c-sample/toutf.txt · Last modified: 2008/04/03 12:36 by 127.0.0.1