Я знаю, что данная тема обсуждалась и не один раз.
Почему так импортируется и кто виноват MS Outlook или ТБ, не знаю.
Если вы импортируете из MS Outlook 2003, то у вас могут возникнуть на части писем следующие проблемы:
1. HTML письма у которых указана разная кодировка в Content-Type и теле HTML кода.
Пример:
Content-Type: text/html; charset=windows-1251
в теле же письма в HTML коде написано:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=koi8-r">
В итоге ТБ автоматом отображает его как 1251 не взирая на то, что в html написано, что кодировка другая.
Выход1: Выбираете кодировку руками (но тогда он ломает вам тему)
Выход2: Найти все такие письма, взять кодировку из строки html и подставить в Content-Type.
2. Письма, у которых указано, что они text/plain, а на самом деле они являются html.
Выход: Если тело письма начинается с < - то очень высокая вероятность того, что это html
3. Письма, которые были в кодировке UTF-8, но при импорте, они были перекодированы из win1251 в utf-8
Опять же - не знаю, кто виноват, но если вы напишите Добрый день в utf-8, а потом скажете, что это win1251 и вам нужно это переконвертить в utf-8, то вы получите следующее:
Р в??Р СР В+РЎР'РЎв?№Р в"- Р Т'Р ВчР Р:РЎР?,
Выход: Установить себе предыдущую версию Outloook (то есть ХР)
Насколько я понял, Оутглюк до версии 2003 отдавал часть писем в кодировке Win1251, не смотря на то, что в заголовке у письма стояла другая кодировка. Те, кто писал импорт в ТБ, перекодировали такие письма из win1251 в правильную кодировку.
В оутлуке 2003, компания MS исправила эту ошибку и все письма стали отдавать в той кодировке, в которой изначально было письмо. ТБ же по "старой привычке" занимается повторным конвертированием таких писем.
Итог: После того, как я перешел с MS Outlook 2003 на ХР и сделал импорт в ТБ заново, у меня остались только 1 и 2 проблемы, правда вторая преобразилась, в теле письма указано html, а реально text, но эти проблемы не такие сложные, скриптом это все исправляется.
Отредактировано Jer (26-12-2007 21:04:30)
Отсутствует
И еще...
Тем, кто не хочет мучаться.
Есть такая программа: O2M - она предназначена для конвертации из Оутлук 2002/2003/ХР в dbx
Проверил письма, с которыми у меня были проблемы при конвертации из 2003 и ХР.
Все письма переконвертировались нормально. Полученный в результате файл ТБ понимает.
Правда она платная, но 10$ не так много за то, что получишь все письма в нормальной кодировке.
Отсутствует
Тем, кто не хочет пользоваться платным софтом:
скрипты для конвертации http://forum.mozilla-russia.org/uploaded/convert.zip
Исправляют 1 и 2 проблему.
Для раброты необходим gawk.
1. Разорхивируйте архив
2. Положите туда же gawk.exe
3. Положите туда же файл с письмами из базы ТБ.
4. Запустите convert.bat ИмяФайла
на выходе будет файл с тем же именем, только в конце добавлена буква n.
5. Замените изначальный файл в ТБ.
Отсутствует
Тем, кто не хочет мучаться.
Есть такая программа: O2M - она предназначена для конвертации из Оутлук 2002/2003/ХР в dbx
Подскажи если можно, где взять я не нашел ее через поиск.
ем, кто не хочет пользоваться платным софтом:
скрипты для конвертации http://forum.mozilla-russia.org/uploaded/convert.zip
Исправляют 1 и 2 проблему.
Для раброты необходим gawk.
1. Разорхивируйте архив
2. Положите туда же gawk.exe
3. Положите туда же файл с письмами из базы ТБ.
4. Запустите convert.bat ИмяФайла
на выходе будет файл с тем же именем, только в конце добавлена буква n.
5. Замените изначальный файл в ТБ.
попробовал почему-то получается файл нулевого размера, может я не тот gawk подложил, если можно кинь ссылочку где его взять
Отсутствует
http://www.littlemachines.com/download.php
Обращаю ваше внимание на то, что под каждый Оутглюк своя версия.
gawk:
http://forum.mozilla-russia.org/uploaded/gawk.zip
реально запаковано в формате 7zip - пришлось переименовать расширение в zip, так как файлы формата 7z выкладывать нельзя (хотя я бы разрешил, реально лучше пакует).
Отредактировано Jer (13-02-2008 09:42:14)
Отсутствует
Попробовал как рекомендуют на форуме: длинную цепочку Outlook - Outlook Express - Thunderbird дала тот же результат что и простая конвертация Aid4Mail Outlook-Tunderbird из 314 писем 120 передались коряво.
Попробовал полученный файл перекодировать с помощью скриптов и gawk - результат приятней из 314 битых получилось около 40. Причем письмо которое ранее без gawk перекодировалось нормально, покорявилось. Я так понимаю можно немного изменить скрипты но как, сам не знаю, может у кого есть соображения??? Вот шапка письма:
From - Tue Feb 5 12:08:36 2008
Return-path: <legostaev@company.mail>
Received: from company.mail by office.mail (MDaemon PRO v9.6.3)
with ESMTP id md50000033735.msg
for <legaev@office.mail>; Tue, 05 Feb 2008 10:06:36 +0600
Authentication-Results:
x-ip-helo=pass smtp.helo=company.mail ;
x-ip-mail=pass smtp.mail=legostaev@company.mail
Received: from legostaev by office.mail
(MDaemon PRO v9.5.2)
with ESMTP id md50000125499.msg
for <legaev@office.mail>; Tue, 05 Feb 2008 10:06:10 +0600
From: =?windows-1251?B?y+Xj7vHy4OXiIMLr4OTo7Ojw?= <legostaev@company.mail>
To: =?windows-1251?B?J8vl4+Dl4iDR5fDj5ekn?= <legaev@office.mail>
Subject: =?windows-1251?B?yM/QIPTl4vDg6/w=?=
Date: Tue, 5 Feb 2008 10:06:02 +0600
Message-ID: <000b01c867ac$6c9d8ec0$0200a8c0@basedomain>
MIME-Version: 1.0
Content-Type: multipart/alternative;
boundary="----=_NextPart_000_000C_01C867DE.B737FEC0"
X-Mailer: Microsoft Office Outlook 11
Thread-Index: AchnrGw+Qwc49ngBRmiuqC7ffbP0hQ==
X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2900.2180
X-Spam-Processed: company.mail, Tue, 05 Feb 2008 10:06:10 +0600
(not processed: domain office.mail is excluded from spam check)
X-MDHeloLookup-Result: pass smtp.helo=company.mail
X-MDMailLookup-Result: pass smtp.mail=legostaev@company.mail
X-Spam-Processed: 80.247.110.150, Tue, 05 Feb 2008 10:06:36 +0600
(not processed: message from trusted or authenticated source)
X-Rcpt-To: legaev@office.mail
X-MDRcpt-To: legaev@office.mail
X-Return-Path: legostaev@company.mail
X-Envelope-From: legostaev@company.mail
X-MDaemon-Deliver-To: legaev@office.mail
X-MDAV-Processed: , Tue, 05 Feb 2008 10:06:36 +0600
Status: RO
X-Mozilla-Status: 0001
X-Mozilla-Status2: 00000000
X-Folder: ВходящиеThis is a multi-part message in MIME format.
------=_NextPart_000_000C_01C867DE.B737FEC0
Content-Type: text/plain;
charset="windows-1251"
Content-Transfer-Encoding: quoted-printable
Мне бы оно все равно, но надо 40 пользователей на Thunderbird перевести, а с каждым по часу сидеть разбираться...
Отредактировано Blander (13-02-2008 17:47:17)
Отсутствует
Ну все полная победа!!!
O2M конвертирует нормально письма даже с 3ой кодировкой в теме письма (например первоначальное письмо в KOI-8r ответили в 1251, потом еще раз ответили опять в koi-8 и т.д.). Перекодировал все нормально и идеально читаемо
большое спасибо Jer???
кто ищет, тот всегда...
Отсутствует
Довольно долго мучались с импортом из Outlook 2003 в Thunderbird 2.0.0.9 . Конкретно были проблемы с кодировками тем (тело в одной, письмо в другой) и "разваливались" html письма из-за content-type в plain. Помогли наводки Jer - сделал маленькую приблуду которая сама находит путь к почте и поочередно конвертит всю почту - вобщем достаточно просто запустить exe, нажать ОК и дождаться сообщения о том что процесс закончен.
Процесс такой - импортим почту в TB из Outlook, закрываем TB, запускаем файл, ждем, проверяем.
http://rapidshare.com/files/95050069/MailConverter.exe.html
Отсутствует
Forward
Попробовал, насколько я понимаю это автоматизированная обработка gawk. Пути к базам выцепляет из реестра и конвертит.
Сконвертила все нормально.
Вопрос вот в чем: (я знаю на форуме вопрос не раз поднимался, все попробовал не помогло) если заголовок в KOI8-r а а тело в Win1251 то он в окне просмотра (WIN1251) крокозяблами показывает, если ему вручную скажешь 1251 то все пучком.
Как вы с этой проблемой боролись???
Отсутствует
Blander
Вопрос вот в чем: (я знаю на форуме вопрос не раз поднимался, все попробовал не помогло) если заголовок в KOI8-r а а тело в Win1251 то он в окне просмотра (WIN1251) крокозяблами показывает, если ему вручную скажешь 1251 то все пучком.
Как вы с этой проблемой боролись???
Do you feel lucky, punk?
Отсутствует
Forward
Все нормально, спасибо!!!!
Это я тупанул.
Процесс такой - импортим почту в TB из Outlook, закрываем TB, запускаем файл, ждем, проверяем.
я импортировал программой aid4mail. После того как ты сказал,
хм да вроде не было таких проблем - кинь исходник письма какого-нибудь
Я сделал импорт самим TB и затем запустил файл.
В итоге: письма даже с 3 кодировкой нормальные!!!
Спасибо, огромадное!!!
Отсутствует