Пример письма с нераспознанным телом:
Отправлено из Microsoft Outlook Express.
дПВТЩК ДЕОШ!
бДТЕУ ЙЪНЕОЙМБ.
C ХЧБЦЕОЙЕН, оБФБМШС
Printer Club,
зТХРРБ ЛПНРБОЙК NBZ
Tel: 258-42-02
жБЛУ: 916-33-44
E-mail: natasha@printers.ru <mailto:natasha@printers.ru>
Internet: www.printers.ru <http://www.printers.ru>
TB пытается прочитать письмо в Windows1251 (Если посмотреть Вид – Кодировка),
а нужно читать в KOI8-R. При этом в Инструменты – Настройки –Отображение - Шрифты для входящих установлено KOI8-R и галочка «по умолчанию для всех…» – снята. Также в Свойствах папки Входящие стоит KOI8-R и галочка принудительного применения «для всех…» тоже снята.
Таких писем немало. В основном из Outlook Express, но есть и с Mail.ru и даже со своего почтового сервера (в здании моей фирмы, но не у меня).
Если KOI8-R применить принудительно для всех, то кракозябрами становятся многие заголовки у тела писем в Windows1251.
Как это исправить?
Отсутствует
В заголовке этого письма указан: Content Type: multipart/mixed; boundary="------------010104070406090007020304".
Есть письма, у которых в заголовках: Content Type: text/html; charset=windows-1251. TB пытается прочитать письмо в Windows1251, а нужно читать тело в KOI8-R.
Возможно эти кракозябры - результат импорта в папку Входящие из Microsoft Outlook 2000 при установке TB?
Отсутствует
вставлю я 5 коп. в продолжение
следующее письмо письмо отображается знаками вопросов полностью (тема, тело) как в списке писем, так в окне просмотра письма
положим, заголовки не по RFC, но в ХТМЛ ж кодировка явно указана
From: =?win-1251?B?zvLk5esg7/Du5ODmIOru7O/g7ejoINHI0S3SxczA?=
Subject: =?win-1251?B?z+Dw8u3l8PHq4P8g8ODx8fvr6uAg6u7s7+Dt6Ogg0cjRLdLFzMAgKDE1LTA1?=
=?win-1251?B?LTIwMDcp?=
----
--b1_24ec0e864596cfbde0281508c20ded5d
Content-Type: text/html; charset = "win-1251"
Content-Transfer-Encoding: 8bit
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01
Transitional//EN">
<html>
<head>
<meta content="text/html; charset=windows-1251"
http-equiv="Content-Type">
</head>
<body style="margin: 0pt; padding: 0pt;
.....
</body>
</html>
Отредактировано observer (15-05-2007 17:40:18)
Отсутствует
Вот что мне написали относительно "стандарта" (цитирую с любезного разрешения автора письма):
Заголовки наших писем отформатировары подобным образом сознательно
(текущий применяемый нами способ кодирования заголовков описан в документе RFC2047).
Основная причина такого выбора заключается в том, что в Рунете
распространено общение с некодированными заголовками гораздо в большей степени, чем с
заголовками, приведенными в соответствие со стандартами. Перевод сообщений от нас на Subject в quoted-printable или base64
вызовет, по меньшей мере, недовольство бОльшей части наших клиентов, которым придется менять
отработанную за многие годы практику. Именно по этой причине предпринятая нами несколько лет
назад попытка привести заголовки писем в соответствие со стандартом завершилась неудачно. Фильтры/скрипты отлажены за много лет и не меняются. Кодирование
заголовков вызовет также проблемы у большинства наших партнеров.
На мое письмо:
Робот nic.ru присылает письма в KOI-8, они читаются нормально.
Но вот тема в списке писем в моем клиенте ThunderBird 2.0.0.6 отображется искаженно, не в win-1251.Возможно, заголовки писем, отправляемые Роботом nic.ru, не соответствуют стандарту, например:
=?koi8-r? ....
Или это недоработка ThunderBird?
Учтут ли это разработчики?
Отсутствует
Microscope
текущий применяемый нами способ кодирования заголовков описан в документе RFC2047
Перевод сообщений от нас на Subject в quoted-printable или base64
вызовет, по меньшей мере, недовольство бОльшей части наших клиентов, которым придется менять
Эти 2 части противоречат друг другу. Пусть ткнут носом где в RFC2047 описано кодирование заголовков не в "quoted-printable" или "base64". Если они не кодируют заголовки в "quoted-printable" или "base64" - чем тогда они вообще их кодируют?
Кодирование
заголовков вызовет также проблемы у большинства наших партнеров.
Партнёрам пора бы оторвать задницу от стула и перейти в 21-й век.
Учтут ли это разработчики?
Разработчикам Thunderbird нет дела до закидонов RU-Center (о которых они к тому же не знают).
Заинтересованные лица могут написать патч и попытаться добиться включения его в Thunderbird.
Do not meddle in the affairs of Wizards, for they are subtle and quick to anger.
Отсутствует
А почему команда ТБ России молчит на эту тему?
Я кроме их заголовка "ТБ всё отображает правильно" ничего на сайте не нашел. Как же до них донести, что проблема всё таки существует, закрывай на неё глаза или нет? Неужели им никто не сообщал в Bug Reports ? А что сами они почту с кривыми заголовками не получают?
Отредактировано arnymars (04-11-2007 21:38:36)
Отсутствует
После активного обсуждения проблемы кодировок писем Рунета с разработчиком Mozilla Corporation, занимающимся отображением нестандартных страниц, получил следующий ответ:
"Тo get this matter forward, you should:
- get a developer to speak for you
- get that developer to work out an algorithm which will properly and
easily, without guessing or wrong results, detect these subjects. It
should not have any impact at all on non-russian users (not wrong
guessing, not speed, and not code size or application design).
- let that developer find out how to proceed."
Под "subjects" он имел в виду как раз plain-text заголовки, почту без строки кодировки, и т.п., предлагая анализиривать техт сообщения для выбора нужной кодировки - как это собственно и делает The Bat.
А вообще, Thunderbird сейчас выделили в отдельную фирму MailCo, и планируют довести число разработчиков за 1-2 года до 10 вместо нынешних 2-х (не ожидали?). Так что как раз хорошее время для Wish-List.
Отсутствует
arnymars
Под "subjects" он имел в виду как раз plain-text заголовки, почту без строки кодировки, и т.п., предлагая анализиривать техт сообщения для выбора нужной кодировки - как это собственно и делает The Bat.
Эта проблема была бы решена, если бы был пофиксен Bug 90584 - charset=... must be applied to non-MIME Subject:/From:/To:/etc. fields
Собственно говоря этот баг скорее всего будет вторым багом в нашей программе Bug Bounty.
Do not meddle in the affairs of Wizards, for they are subtle and quick to anger.
Отсутствует
Unghost,
Я просто сражен: основной разработчик Thunderbird Scott MacGregor отмечает в 2007, что у него за 7 лет не дошли руки исправить баг, решение которого весьма просто и детально описано в том же баг отчете! Наверное пора послать эту ссылку их новому боссу Dave Ascher, он как раз сильно озабочен проблемой расширения рынка для своего почтового клиента.
Отсутствует
arnymars
Я не сказал бы, что решение этого бага очень просто...
Do not meddle in the affairs of Wizards, for they are subtle and quick to anger.
Отсутствует
Да уж, непросто.
Если не указан код заголовка, взять из хедеров код письма, если и там нет - то автоопределение/задано пользователям.
В чем сложность?
Отсутствует
Microscope
Если не указан код заголовка, взять из хедеров код письма,
хедер и есть заголовок.
если и там нет - то автоопределение/задано пользователям.
Это уже сделано.
Do not meddle in the affairs of Wizards, for they are subtle and quick to anger.
Отсутствует
IgorVS
Т.е. судя по Bug List Thunderbird 2.0.0.10 выйдет уже без Bug-а 90584?
С ним разумеется. Bug 90584 не об этом.
И выйдет не 2.0.0.10, а 2.0.0.12
Do not meddle in the affairs of Wizards, for they are subtle and quick to anger.
Отсутствует
Отсутствует
Al_H
Ничего смотреть не надо, всё уже здесь есть
Тема разбита на три строчки, TB декодирует и показывает только первую. Только я не знаю, что написано на этот счёт в стандарте, поэтому не могу уверенно сказать, чья это лажа, TB или клиента отправителя письма.
Отсутствует
Отсутствует
kirill
У вас проблема с темой, subject, а кодировки темы и тела могут отличаться. Поэтому откройте ваше письмо, нажмите Вид -> Исходный текст сообщения и скопируйте то, что вы видите (или только то, что относится к subject) на pastebin.mozilla-russia.org, и киньте сюда ссылку.
Отсутствует
dvdianov
а первый скриншот откуда я сделал?
при чем кодировка темы письма и самого письма? Они разве не могут отличаться?
http://pastebin.mozilla-russia.org/90454
Отредактировано kirill (18-01-2008 12:55:13)
Отсутствует
kirill
Я просмотрел rfc2822, описывающий формат заголовков и теперь могу точно сказать, что в данном случае TB декодирует заголовки неверно. Многострочные заголовки описаны в п. 2.2.3.
Отредактировано sentaus (19-01-2008 13:19:40)
Отсутствует