Я предполагал, что тестировать в ООо... Ночные сборки Fx3 не поддерживают Hunspell?
Отсутствует
ragnaar
Судя по тому, что Bug 319778 - Replace MySpell with HunSpell не FIXED - нет.
Do not meddle in the affairs of Wizards, for they are subtle and quick to anger.
Отсутствует
Ну если кто-то на исходники применит патч из бага и сделает свою сборку, то...
F.I.R.E.F.O.X.: Fearsome, Intimidating, Redhead-Eating Fiend from the Ominous Xenopolis
Скиньтесь мне на новый MacBook Pro! Кто сколько может!
Отсутствует
Modex
А по-моему, в баге 319778 нет патча рабочего...
ragnaar
Я предлагаю проверять правила полу-автоматически:
1. Куча народу заносит новые слова в словарь.
2. Меньшая куча народу пишет проверочный файл.
3. Этот файл скармливается hunspell.
4. Он должен сгенерировать 2 файла: file.good и file.wrong.
5. Если размер файла с расширением wrong = 0, то все ОК, нет - исправляются ошибки.
Отсутствует
TLemur
С четвёртым пунктом как раз и наблюдаются проблемы. Пока не начнёшь проверять орфографию никакие ошибки файлов словаря и аффиксов не показывают.
Благодарю алфавит за любезно предоставленные буквы.
Отсутствует
Infant
А под линукс нету бинарника hunspell?
Запускаешь из командной строки, передаешь ему параметры, он выдает в ответ, правильно или нет.
Так-то быстрее будет, чем с OOo...
Отсутствует
А под линукс нету бинарника hunspell?
Я не видел... если только в репозиториях дистрибутивов есть... Или кто-то соберет
Отсутствует
ragnaar
На сайте есть в исходниках пакет. Под АСП10 нормально собирается. Под Убунту 6.10 мне не удалось, но я "большой специалист".
Благодарю алфавит за любезно предоставленные буквы.
Отсутствует
Infant
Под Убунту 6.10 мне не удалось, но я "большой специалист".
apt-get install hunspell не катит ?
Do not meddle in the affairs of Wizards, for they are subtle and quick to anger.
Отсутствует
http://www.mozilla-russia.org/projects/ … l#encoding
мой косяк в переводе.
Проблемы с восьмибитными кодировками
Ispell и Myspell используют восьмибитную кодировку ASCII , главным недостатком которой является неуниверсальность. Хотя венгерский язык имеет стандартную кодировку ASCII (ISO 8859-2), она не отражает отразить все нюансы орфографии.
Отразить - лишнее.
«I actually hate programming, but I love solving problems» © Rasmus Lerdorf, PHP's Creator
Отсутствует
stoneflash
поправил, попозже выложу исправление на сайт
Отсутствует
Я скомпилировал hunspell для windows.
Две версии:
С возможностью интерактивной проверки
Без возможности интерактивной проверки, только командная строка
Установка:
1. Скачать файл.
2. Положить его в каталог без пробелов, русских букв и т.п.
3. Запустить exe-файл.
4. Пользоваться
Протестировано на Windows XP SP2 (русская).
Отсутствует
Русский словарь не готов еще?
«I actually hate programming, but I love solving problems» © Rasmus Lerdorf, PHP's Creator
Отсутствует
TLemur
Ну ты знаешь, я всегда готов! Только скажи, что делать.
Добавлено Втр 07 Авг 2007 16:59:09 :
ego
Ведет Тимур
«I actually hate programming, but I love solving problems» © Rasmus Lerdorf, PHP's Creator
Отсутствует
Пока надо готовить голый файл словаря.
Идем в Викитеку (http://ru.wikisource.org/wiki/%D0%9E%D1 … 0%BA%D0%B0, , копируем текст статьи. И удаляем все, кроме собственно слов в именительном падеже, без ударения и помет.
Т.е. из такого: ааро́новцы, -ев, ед. -вец, -вца, тв. -вцем должно остаться такое: аароновец
Добавлено Втр 07 Авг 2007 20:46:48 :
По идее это все делается через один перловский скрипт, но регулярные выражения - моя слабость.
Отсутствует
shutnik
Из такого:
# а 1, нескл., с. (название буквы) # а 2, союз, частица, межд. # а-а-а, межд. # ааро́новец, -вца, тв. -вцем # ааро́новский # ааро́новцы, -ев, ед. -вец, -вца, тв. -вцем # ааро́новщина, -ы # абажу́р, -а # абажу́рный # абажуродержа́тель, -я # абажу́рчик, -а # аба́з, -а # абази́н, -а # абази́нец, -нца, тв. -нцем # абази́нка, -и, р. мн. -нок # абази́нский
надо сделать такое:
а а-а-а аароновец аароновский аароновцы абажур абажурный абажуродержатель абажурчик абаз абазин абазинец абазинка абазинский
Т.е. убрать все пометы, все ударения, все окончания, все омонимы, все символы форматирования вики
Отредактировано TLemur (08-08-2007 09:25:58)
Отсутствует
Я полагаю, можно так:
text .replace(/^# */mg, "") .replace(/́/g, "") // .replace(/[ \t]+/g, " ") .replace(/,.*$/mg, "") .replace(/ *\d+/g, ""); var arr = text.split("\n"); for(var i = 0; i < arr.length - 1; i++) if(arr[i] == arr[i + 1]) arr[i] = ""; var res = arr.join("\n").replace(/\s+/g, "\n");
Отредактировано Infocatcher (08-08-2007 13:10:18)
Прошлое – это локомотив, который тянет за собой будущее. Бывает, что это прошлое вдобавок чужое. Ты едешь спиной вперед и видишь только то, что уже исчезло. А чтобы сойти с поезда, нужен билет. Ты держишь его в руках. Но кому ты его предъявишь?
Виктор Пелевин. Желтая стрела
Отсутствует