Не определился с разделом, пишу в флейм.
Как реализовать задачу.
Есть некий форум совместных покупок. В определенный момент мне необходимо печатать этикетки заказов участников форума.Сам же форум позволяет выводить на печать отчет о собранных заказах и их участниках в формате csv. Но в этом файле, для этикеток очень много лишнего и не хватает нужных данных. Зато есть страница отчета на которой есть все необходимые строки.
Подумал может можно аддон для FF создать, или может что то уже есть подходящее? Там все нужные строки находятся на одной странице. Из всей страницы нужно отфильтровать и выдернуть как то нужные строки и сформировать из них excel/word таблицу. Вот пример таблицы
Скрин web страницы тоже прилагаю. извиняюсь за корявость, наверно будет понятно.
Из web страницы нужны строки:
1. Ник пользователя.
2. Его номер телефона.
3. Город:/район ЕЦ.
4. Название закупки.
Возможно аддон будет цепляться за особенности структуры страницы или за html код, не знаю? Посоветуйте в каком направлении двигаться если заблуждаюсь.
Отсутствует
ты сюда вообще не приплетай, он в таком деле не помощник.
Берешь любой менеджер закачек, например wget, выкачиваешь им нужные страницы и парсишь как тебе хочется.
Я сам написал бытакое на perl, вместе с закачками, парсингом и вставкой куда надо.
FreeBSD 8.2, IceWM
Отсутствует
ты сюда вообще не приплетай, он в таком деле не помощник.Берешь любой менеджер закачек, например wget, выкачиваешь им нужные страницы и парсишь как тебе хочется.Я сам написал бытакое на perl, вместе с закачками, парсингом и вставкой куда надо.
Звучит. Я даже встретил несколько знакомых мне слов.... Попробую wget, может что получится, в остальном не силен((
Отсутствует
ты сюда вообще не приплетай, он в таком деле не помощник.
Ну почему же. Учитывая одно из нововведений 11-й версии - очень даже помощник. Это, плюс нужный xpath query по странице должны дать нужные данные на выходе. Это, разумеется, если нет доступа к БД форума - иначе все делается намного проще, и совсем другими средствами.
А вот генерация word/excel документа действительно к FF не имеет никакого отношения.
Добавлено 17-03-2012 05:10:31
Я сам написал бытакое на perl, вместе с закачками, парсингом
тут сразу вспоминается Jamie Zawinski
Отредактировано hydrolizer (17-03-2012 05:10:31)
Отсутствует
Наверно нужно уточнить немного. Доступа к базе данных действительно нет - проще не получится. По генерации таблицы excel, вовсе не обязательно чтоб это делал FF. Рас уж не получится сделать генерацию FFом, пускай по другому. Но тогда и от фокса вроде как не много толку, так как я и без него могу получить страницу с данными (нужными строками) вручную. У меня задача ставиться сэкономить время на моменте выдергивания нужных данных из кучи данных и формирования из них этикеток(лижбы можно было печатать)
Если и можно как то пропарсить страницу(online или offline, не важно) то я технически не представляю как это делать. Изучать кучу манов нет времени. Если есть возможность изучить тему парсинга узконаправлено и практически, то я не знаю от куда начинать. Может посоветуете...?
Отсутствует
то я не знаю от куда начинать.
Я бы выбрал последний вариант разбора - он наиболее лаконичен и оптимален по быстродействию.
Есть, конечно, еще один вариант, который лично я бы никогда не стал использовать - парсинг разметки как текста с помощью регэкспов.
Отсутствует