Полезная информация

Общайтесь со знакомыми и друзьями в нашем сообществе в Facebook.

№119-03-2014 17:13:11

der56
Участник
 
Группа: Members
Зарегистрирован: 11-03-2014
Сообщений: 7
UA: Firefox 27.0

Thunderbird Извлечение текста письма.

Столкнулся со следующей проблемой: разные почтовики оформляют письмо по своему, создают разные HTML структуры. Тот же textContent порой забирает что-нибудь вроде "<!-- .hmmessage P { margin:0px; padding:0px } body.hmmessage { font-size: 12pt; font-family:Calibri } -->" (hotmail). Отсюда вопрос - как правильно получить чистый текст письма?

И немного оффтоп: почему, если скрипт встроен в .xul, оператор меньше "<" считается, как я понял, частью именно xul'а, а не частью скрипта.
Пример:
Ошибка: некорректно
Источник: chrome://ext/content/overlay.xul
Строка 7, символ 19
Исходный код:
for (var i=0; i < 5; i++){v++;}

Будь он хоть закомментирован, или присвоен как строка var a = "<"; все что после него, считается некорректным.

Отсутствует

 

№219-03-2014 19:48:08

Infocatcher
Not found
 
Группа: Extensions
Зарегистрирован: 24-05-2007
Сообщений: 4339
UA: Firefox 28.0

Re: Thunderbird Извлечение текста письма.

der56 пишет

если скрипт встроен в .xul, оператор меньше "<" ...

Надо или в отдельный файл вынести, или «&lt;» писать.


Прошлое – это локомотив, который тянет за собой будущее. Бывает, что это прошлое вдобавок чужое. Ты едешь спиной вперед и видишь только то, что уже исчезло. А чтобы сойти с поезда, нужен билет. Ты держишь его в руках. Но кому ты его предъявишь?
Виктор Пелевин. Желтая стрела

Отсутствует

 

№319-03-2014 20:17:37

der56
Участник
 
Группа: Members
Зарегистрирован: 11-03-2014
Сообщений: 7
UA: Firefox 27.0

Re: Thunderbird Извлечение текста письма.

Сразу же вынес в отдельный файл. Просто не понимаю логики происходящего (почему "<" воспринимается как закрывающий скрипт тег).

Отсутствует

 

№419-03-2014 20:52:53

Infocatcher
Not found
 
Группа: Extensions
Зарегистрирован: 24-05-2007
Сообщений: 4339
UA: Firefox 28.0

Re: Thunderbird Извлечение текста письма.

Это же XML. Видимо, для упрощения парсера.

http://www.w3.org/TR/2008/REC-xml-20081126/#syntax

The ampersand character (&) and the left angle bracket (<) MUST NOT appear in their literal form, except when used as markup delimiters, or within a comment, a processing instruction, or a CDATA section. If they are needed elsewhere, they MUST be escaped using either numeric character references or the strings " &amp; " and " &lt; " respectively. The right angle bracket (>) may be represented using the string " &gt; ", and MUST, for compatibility, be escaped using either " &gt; " or a character reference when it appears in the string " ]]> " in content, when that string is not marking the end of a CDATA section.


Прошлое – это локомотив, который тянет за собой будущее. Бывает, что это прошлое вдобавок чужое. Ты едешь спиной вперед и видишь только то, что уже исчезло. А чтобы сойти с поезда, нужен билет. Ты держишь его в руках. Но кому ты его предъявишь?
Виктор Пелевин. Желтая стрела

Отсутствует

 

№519-03-2014 21:14:57

der56
Участник
 
Группа: Members
Зарегистрирован: 11-03-2014
Сообщений: 7
UA: Firefox 27.0

Re: Thunderbird Извлечение текста письма.

Это же XML. Видимо, для упрощения парсера.

http://www.w3.org/TR/2008/REC-xml-20081126/#syntax

Благодарю.

Отсутствует

 

Board footer

Powered by PunBB
Modified by Mozilla Russia
Copyright © 2004–2020 Mozilla Russia GitHub mark
Язык отображения форума: [Русский] [English]