А чего тут удивительного? Тут никакой словарь и не поможет, тут уже настоящий искусственный интеллект нужен. Который сам будет контекст определять, подбирать нужные слова и расставлять знаки препинания (и заодно ненавязчиво так советовать выражаться покороче, чтоб не напрягать лишний раз мозг — привет от MS Word wink (в этом месте почему-то сразу незабвенный Скрепыш вспоминается... roll)).
Сам не смог придумать, пришлось поискать в сети… И не заметил ошибки в «что б»! А загадка про то, что словарь не знает таких простейших однобуквенных слов как частицы Б и Ж. А они между прочим в списке 300 самых употребительных слов находятся.
P.S. А флёш и брёвзер вас не удивили? Значит такие слова тоже есть. И это праильно.
Отредактировано Infant (13-10-2008 23:01:48)
Благодарю алфавит за любезно предоставленные буквы.
Отсутствует
MySh
А давайте для начала определимся, для кого словарь. Если для литераторов, работников культуры, аристократов, менеджеров высшего звена(хотя тут я уже не уверен...) — ОК, тогда всё верно, ориентироваться стоит исключительно на классические проверенные временем словари.
Словарь предназначен для всех. И ориентироваться стоит на всех. Но почему это является оправданием добавления всего, что в голову пришло?
Отредактировано Quicksilver tears (13-10-2008 23:00:41)
Отсутствует
А давайте для начала определимся, для кого словарь.
Определиться надо было еще перед первым сообщением. Словарь для проверки орфографии в массовой программе должен быть нацелен на массового пользователя, говорящего или пишущего на определенном языке (в данном случае на русском). Поэтому при составлении словаря надо пользоваться общими нормами языка и не вводить в него специализированные термины, понятия и сокращения. При этом нельзя допускать, что если программа - браузер, то в ее словарь надо вносить все подряд, что связано с ИТ вообще и с Интернет в частности, потому что сеть как среда массовой коммуникации подразумевает вовлеченность в нее абсолютно разных людей с разной лексикой. Особенно сейчас, когда множество людей пишут свои блоги, общаются в форумах и т.д. Таким образом мое мнение, что словарь в базовой поставке должен быть составлен на основе общеупотребительного орфографического словаря. Далее уже каждый пользователь может добавлять в него свои специфические слова и сокращения, подстраивая его под свои нужды.
Кроме того, добавление в словарь жаргонных слов (типа Виндос, Линух, Фряха и проч.) вообще лишено смысла, потому что люди, использующие этот жаргон постоянно заведомо не делают ошибок в этих словах и они будут только мертвых грузом пылиться в недрах словаря, являясь потенциально полезными исключительно для носителей жаргона.
Ну и напоследок. Словарь OpenOffice, на основе которого построен и словарь в Firefox, позволяет описывать внутри себя грамматическую форму слов, чтобы не надо было вносить для каждого все числа, падежи, времена, склонения. Было бы хорошо, если бы новодобавляемые слова описывались с учетом их грамматики или происходила корректировка такого описания для существующих слов вместо добавления отдельных производных.
Welcome to mozilla@conference.jabber.ru
Отсутствует
Quicksilver tears
Давайте оставим это специалистам и не будем заниматься самодеятельностью.
Сколько ждать этих специалистов? Если посмотреть на то, с какой частотой Лебедев обновляет словарь, можно заметить, что между последним и предпоследним патчем прошёл 1 год и 10 месяцев. Предлагаешь ждать до 2010 года?
Хочу также заметить, что при составлении словаря авторы чаще всего ориентируются не на браузеры, а на текстовые процессоры. Ежу понятно, что язык используемый в Интернете имеет значительно более широкую словарную базу чем более формальный вариант применяемый при составлении документов.
Так что автор вполне может сказать - идите вы со своим Фоксом, мы таких слов в бумажных документах не пишем.
@all Предлагаю обсудить следующие временные правила по добавлению слов в словарь.
1) Слова, уже включённые в другие широко известные словари, включать без вопросов.
2) Слова, не включённые в другие словари, добавлять если слово a) Употребляется более x числа лет б) За его добавление высказалось более x человек
Добавлено 13-10-2008 23:17:38
SeLarin
Таким образом мое мнение, что словарь в базовой поставке должен быть составлен на основе общеупотребительного орфографического словаря.
С этим никто не спорит. Ведётся спор, что именно считать "общеупотребительным".
Do not meddle in the affairs of Wizards, for they are subtle and quick to anger.
Отсутствует
Unghost
язык используемый в Интернете имеет значительно более широкую словарную базу чем более формальный вариант применяемый при составлении документов.
Документы бывают разные. И те специфические слова, которые не употребляет в документах бухгалтер, будет употреблять врач и наоборот. При этом вовсе не факт, что специфические слова, употребляемые обоими специалистами, будут иметься в словаре. Также сомнительно, что "язык Интернета" шире "формального варианта", если убрать из него все жаргонизмы и прямые заимствования из других языков.
1) Слова, уже включённые в другие широко известные словари, включать без вопросов.
Разумно.
2) Слова, не включённые в другие словари, добавлять если слово a) Употребляется более x числа лет б) За его добавление высказалось более x человек
Кто будет решать сколько лет употребляется слово? Сколько голосов должно набрать слово для попадания в словарь?
что именно считать "общеупотребительным"
В этом вопросе я солидарен с Quicksilver tears: использовать как базу надо официально опубликованные словари, составленные специалистами по русскому языку.
Welcome to mozilla@conference.jabber.ru
Отсутствует
Infant
И не заметил ошибки в «что б»!
Что б такое придумать, чтоб сюда написать...
_______________
По теме (чтоб не оффтопик :-P):
[23:38]SIO: >_<
[23:38]SeLarin: Да. По словарям.
[23:38]SIO: ааа
[23:39]SeLarin: Квика поддержал открыто. :)
[23:39]SIO: мну на ту тему давно забил и не понимает, чего в ней интересного
[23:39]SIO: какая разница, какие слова в словаре есть, а каких нет
[23:39]SeLarin: Да ничего. Просто ***словарь нафиг не нужен.
[23:39]SeLarin: А собираются сделать именно ***словарь.
[23:40]SeLarin: Хотя мне-то пофиг.
[23:40]SIO: имхо, это должно заботить только ангоста. очередная фалломерка. только между локализаторами
Отредактировано SIO (13-10-2008 23:55:02)
Come here: mozilla@conference.jabber.ru
Отсутствует
SeLarin
Кто будет решать сколько лет употребляется слово?
Например, Google и Yandex.
Сколько голосов должно набрать слово для попадания в словарь?
Высказывайте предложения, я поэтому и поставил x. Я не горю желанием навязывать своё мнение.
В этом вопросе я солидарен с Quicksilver tears: использовать как базу надо официально опубликованные словари, составленные специалистами по русскому языку.
У QT не такая позиция. У QT позиция, что словарь Лебедева вообще нельзя трогать, если у тебя нет диплома лингвиста.
Do not meddle in the affairs of Wizards, for they are subtle and quick to anger.
Отсутствует
Unghost
Например, Google и Yandex.
Я не думаю, что поисковые системы можно использовать в качестве критерия в языковых спорах. К тому же с их использованием невозможно определить время, когда слово стало употребляться широко (а именно срок широкого употребления и можно было бы использовать в качестве критерия при оценке нужности слова в словаре).
Высказывайте предложения
Лично для меня достаточно и одного голоса, но только голос должен быть от человека, который действительно "в теме", а не является "случайным прохожим" в вопросах языка.
P.S. Себя я отношу как раз к случайным прохожим.
Welcome to mozilla@conference.jabber.ru
Отсутствует
SIO
Хотелось обе частицы (Б и Ж) в одном предложении.
Добавлено 14-10-2008 00:22:44
Вообще-то за Советский Союз заседала, кажется, ежегодно специальная комиссия по новоязам и добавляла их в словарь, а также убирала устаревшие слова. Думаю и сейчас эта практика существует. Другое дело, что к этим изданиям получить доступ достаточно проблематично…
Благодарю алфавит за любезно предоставленные буквы.
Отсутствует
Infant
Да, есть такая комиссия (вот положение о ее работе). Правда о ее работе и результатах этой работы ничего не известно.
Welcome to mozilla@conference.jabber.ru
Отсутствует
Infant, в том предложении ни одно слово не было подчеркнуто. Возможно, я не совсем понимаю, что тебя так тревожит, но причем тут "Б и Ж в одном предложении"? То предложение имело целью только показать что в "что б" нет ошибки
Come here: mozilla@conference.jabber.ru
Отсутствует
Я сегодня собрал предложенные тут слова и прогнал их сначала через Microsoft Word 2003, затем то, что осталось нераспознанным, через Gramota.ru.
Вот что получилось. На выходных займусь добавлением распознанных слов в словарь, если по ним не будет возражений.
Do not meddle in the affairs of Wizards, for they are subtle and quick to anger.
Отсутствует
Расскажите мне, что означает русскоязычная аббревиатура БИОС
Добавлено 14-10-2008 22:53:43
"Базовая И туда, и Оттуда Система"?
Ядрёная консоль делает меня сильней!
Отсутствует
krigstask
Расскажите мне, что означает русскоязычная аббревиатура БИОС
Биологические очистные сооружения.
Добавлено 14-10-2008 23:36:31
Или Биоинженерные очистные сооружения. Этот термин не относится к компьютерам.
И ещё http://lingvo.yandex.ru/en?text=БИОС&st_translate=on
Do not meddle in the affairs of Wizards, for they are subtle and quick to anger.
Отсутствует
Не 32-битный, а просто "битный". Так же как метровый, литровый, гектарный. Кстати, почему нет слова "гектарный" в словаре?
Я считаю, что из проверенного списка "в обработке" должны быть добавлены: астрал, аудиокабель, аудиокарта, аудиоэффект, блокировщик, веб, видеозахват, прайсов, прайсы (раз уж есть прайс), термодатчик, шейдер
Со списками из ворда и грамоты-ру полностью согласен, хотя часть слов употребляется вовсе не в том значении. Например сейчас слово жжёт и зачётная сеёчас используются вовсе не для "жжёт мусор" и "зачётная книжка"...
Кстати, слова выпей, жжёт, кличешь, суицид уже есть в словаре.
Расскажите мне, что означает русскоязычная аббревиатура БИОС
БИОреактор Стационарный.
Отредактировано Lain_13 (15-10-2008 17:34:41)
Отсутствует
Вообще нужен лишь базовый словарь, а уж специфичные слова пускай добавляют пользователи сами, или же делать отдельные словари для IT специалистов, литераторов, геологов и прочее.
Каждый ответственен за то добро, которое не совершил.
Отсутствует
А давайте для начала определимся, для кого словарь.
Определиться надо было еще перед первым сообщением. Словарь для проверки орфографии в массовой программе должен быть нацелен на массового пользователя, говорящего или пишущего на определенном языке (в данном случае на русском). Поэтому при составлении словаря надо пользоваться общими нормами языка и не вводить в него специализированные термины
Если этот ваш, так называемый, "массовый пользователь" не пользуется словом Госдума, то его наличие в словаре ему не помешает. А если пользуется, то как раз поможет. Потому, что когда оно в FireFox'е подчёркивается, то это вводит в заблуждение, заставляет думать, что такого слова нет, а это не правильно.
Добавлено 18-10-2008 03:57:51
1) Слова, уже включённые в другие широко известные словари, включать без вопросов.
2) Слова, не включённые в другие словари, добавлять если слово a) Употребляется более x числа лет б) За его добавление высказалось более x человек
Я бы добавил:
*) Не включать нарочито исковерканные слова "превед", "медвед" и т. д. и т. п.
А второй пункт лучше бы сконкретизировать. Например:
*) Добавлять те слова, для которых есть предмет. Флэшка - например. А то флэшка есть, а слова нет. Браузер есть, а слова нет. и т.д. и т. п.
Кстати, в словаре нет слов "сконкретизировать" и "гламур".
Добавлено 18-10-2008 04:07:02
Расскажите мне, что означает русскоязычная аббревиатура БИОС
Нажми при загрузке компьютера кнопку "delete" и попадёшь в БИОС. Или как ты называешь то, во что попал? Опять предмет есть, а слова нет?
БИОС - производное от английской аббревиатуры BIOS расшифровывающейся как Basic Input Output System. Или базовая система ввода вывода.
Кстати, в словаре есть слово "ксерокс". Которое произошло от английского названия фирмы XEROX. Которое на самом деле читается как Зирокс. Просто у нас этого никто не знал.
Добавлено 18-10-2008 04:13:02
Я сегодня собрал предложенные тут слова и прогнал их сначала через Microsoft Word 2003, затем то, что осталось нераспознанным, через Gramota.ru.
Вот что получилось. На выходных займусь добавлением распознанных слов в словарь, если по ним не будет возражений.
С некорректными согласен.
Это нарочито исковерканные слова.
А что означают эти "/K" и "/A" на концах слов?
Отсутствует
Вообще нужен лишь базовый словарь, а уж специфичные слова пускай добавляют пользователи сами, или же делать отдельные словари для IT специалистов, литераторов, геологов и прочее.
А чем они вам помешают, если вы ими не пользуетесь?
Отсутствует
Minor
врядли
Пишется раздельно: вряд ли
безпроцентность
пишется через с
и да, кстати, выше было
раскаиться
пишется через я: раскаяться
Нажми при загрузке компьютера кнопку "delete" и попадёшь в БИОС. Или как ты называешь то, во что попал? Опять предмет есть, а слова нет?
BIOS - это аббревиатура, а не слово... Надо различать понятия.
----------
Комментировать вышесказанное и вышепредложенное не буду, так как не вижу в этом смысла.
Отсутствует
Minor
Нажми при загрузке компьютера кнопку "delete" и попадёшь в БИОС
Да-а-а... BIOS это и всё тут. Транслитерировать аббревиатуры, надо же додуматься.
Ядрёная консоль делает меня сильней!
Отсутствует
Minor
А что означают эти "/K" и "/A" на концах слов?
krigstask
Вы лучше бы букву "ё" наконец прописали туда
Буква ё там давно есть.
Do not meddle in the affairs of Wizards, for they are subtle and quick to anger.
Отсутствует
Квизац_Хадерач
Вообще нужен лишь базовый словарь
Словарь вообще не нужен. Кому надо, и так всё знает.
Minor
Не включать нарочито исковерканные слова "превед", "медвед" и т. д. и т. п.
Кстати, слово «медвед» вполне уже стало нарицательным... Только ни в одном официальном словаре вы его не найдёте.
Браузер есть, а слова нет
«Браузер» теперь есть. А вот «броузера» нет. То есть, у них нет.
krigstask
Транслитерировать аббревиатуры, надо же додуматься.
Отсутствует