Вопросы с тегом 'utf-8'

UTF-8 представляет собой кодировку символов, которая описывает каждую кодовую точку Юникода, используя байтовую последовательность от одного до четырех байтов. Он обратно совместим с ASCII, поддерживая показ всех кодовых точек Unicode.
16
ответов

UTF-8 полностью через

Я настраиваю новый сервер и хочу полностью поддерживать UTF-8 в своем веб-приложении. Я пробовал в прошлом на существующих серверах и всегда, кажется, должен вернуться к ISO-8859-1. Где именно мне нужно установить кодировку/кодировки? Я знаю, что м...
задан 11 нояб. '08 в 0:04
20
ответов

Что отличается между UTF-8 и UTF-8 без спецификации?

Чем отличается UTF-8 и UTF-8 без спецификация? Что лучше?
задан 08 февр. '10 в 21:26
6
ответов

Почему современный Perl избегает UTF-8 по умолчанию?

Интересно, почему большинство современных решений, построенных с использованием Perl, не позволяют UTF-8 по умолчанию. Я понимаю, что для основных сценариев Perl существует много устаревших проблем, где это может нарушить работу. Но, с моей точки зр...
задан 28 мая '11 в 18:12
38
ответов

Excel в CSV с кодировкой UTF8

У меня есть файл Excel, в котором есть некоторые испанские символы (тильды и т.д.), которые мне нужно преобразовать в CSV файл, который будет использоваться в качестве файла импорта. Однако, когда я делаю Save As CSV, он управляет "специальными" испа...
задан 19 нояб. '10 в 3:48
16
ответов

Лучший способ конвертировать текстовые файлы между наборами символов?

Какое самое быстрое и простое средство или способ преобразования текстовых файлов между наборами символов? В частности, мне нужно конвертировать из UTF-8 в ISO-8859-15 и наоборот. Все идет: однострочные шрифты на вашем любимом языке сценариев, сред...
задан 15 сент. '08 в 20:21
13
ответов

В чем разница между UTF-8 и Unicode

Я слышал противоречивые мнения людей - согласно Wikipedia, см. здесь. Это одно и то же, не так ли? Может кто-нибудь уточнить?
задан 13 марта '09 в 20:06
2
ответов

Работа с кодировкой utf-8 в источнике Python

$ cat bla.py u = unicode('d…') s = u.encode('utf-8') print s $ python bla.py File "bla.py", line 1 SyntaxError: Non-ASCII character '\xe2' in file bla.py on line 1, but no encoding declared; see http://www.python.org/peps/pep-0263.html for detail...
задан 09 июня '11 в 10:29
12
ответов

Как заставить UTF-8 работать в Java Webapps?

Мне нужно, чтобы UTF-8 работал в моем Java webapp (сервлеты + JSP, без использования фреймворка) для поддержки äöå и т.д. для обычного финского текста и кириллических алфавитов, таких как ЦжФ для особых случаев. Моя настройка такова: Среда разраб...
задан 26 сент. '08 в 14:48
24
ответов

Можно ли принудительно Excel распознавать файлы CSV UTF-8 автоматически?

Я разрабатываю часть приложения, которое отвечает за экспорт некоторых данных в CSV файлы. Приложение всегда использует UTF-8 из-за его многоязычности на всех уровнях. Но открытие таких файлов CSV (содержащих, например, диакритические буквы, кириллич...
задан 14 мая '11 в 16:53
12
ответов

UTF-8, UTF-16 и UTF-32

В чем разница между UTF-8, UTF-16 и UTF-32? Я понимаю, что все они будут хранить Unicode, и каждый из них использует другое количество байтов для представления символа. Есть ли преимущество в выборе одного над другим?
задан 30 янв. '09 в 20:05
15
ответов

Установка кодировки символов Java по умолчанию?

Как правильно настроить кодировку по умолчанию, используемую программным обеспечением JVM (1.5.x)? Я читал, что -Dfile.encoding=whatever был тем, как идти на старшие JVM... У меня нет такой роскоши по причинам, по которым я не попаду. Я пробовал: ...
задан 12 дек. '08 в 8:31
10
ответов

Что такое Unicode, UTF-8, UTF-16?

Какая основа для Unicode и зачем нужна UTF-8 или UTF-16? Я исследовал это в Google и искал здесь, но это мне не понятно. В VSS при сравнении файлов иногда появляется сообщение о том, что два файла имеют разные UTF. Почему это так? Пожалуйста, объяс...
задан 11 февр. '10 в 3:12
6
ответов

В чем разница между UTF-8 и ISO-8859-1?

В чем разница между UTF-8 и ISO-8859-1?
задан 13 авг. '11 в 8:21
5
ответов

UTF-8: Общие? Бен? Unicode?

Я пытаюсь выяснить, какую сортировку я должен использовать для различных типов данных. 100% содержимого, которое я буду хранить, представлено пользователем. Я понимаю, что вместо UTF-8 Binary я должен использовать UTF-8 General CI (без учета регистр...
задан 26 февр. '10 в 22:03
24
ответов

Обнаруживать кодировку и делать все UTF-8

Я читаю много текстов из разных RSS-каналов и вставляю их в свою базу данных. Конечно, существует несколько различных кодировок символов, используемых в каналах, например. UTF-8 и ISO-8859-1. К сожалению, иногда возникают проблемы с кодировками тек...
задан 26 мая '09 в 16:50