Разное > Софт и кодинг

Импорт содержимого <div> в ячейку excel

(1/4) > >>

xenofeel:
Такая задача. Вытащить содержимое тега на сайте (цена на товар) и вставить его в строку экселя. Куда копать? Java или VBA макросы? Может кто делал уже?

FearOfTheLight:
для питона есть beautiful soup. или можно сделать простейший парсер на чём угодно а потом скопипастить в эксель.

находим <div>
выводим на экран название товара
выводим \t
выводим цену товара
выводим \n
СпойлерSystem.out.println(имя_товара + "\t" + цена_товара);[свернуть]повторить

в итоге вероятно надо будет подчистить немного мусора(на знаю, с других <div>'ов например) и результат вставить в эксель.
если нужно автоматически и всё - можно заморочится с очищением мусора через каскад if'ов или еще как а выход перекидывать напрямую в эксель

xenofeel:
Как то это слишком сложно оказалось. В голове намного проще выглядело =)

FearOfTheLight:
скинь пример текста, заверну попроще

Спойлер<div style="color:#0000FF">
  <h3>This is a heading</h3>
  <p>This is a paragraph.</p>
</div>

считываем построчно/побуквенно
если найден  "<div" то переходим на следующую строчку
string a = весь текст между > и <
следующая строчка
string b = весь текст между > и <
print(a + "\t" + b + "\n")

повторить

\t нужен чтобы поставить разделитель, легко узнаваемый для экселя. точка с запятой тоже подойдёт но хз что там за имена могут быть
\n это смела линии. так проще смотреть на это дело[свернуть]
или нужно именно цену? т.е. цифры и неважно чему они соответствуют
тогда совсем просто

Holkin:
Windows вроде \n без \r не понимает.
И почему не вопспользоваться SAX или StAX?

Навигация

[0] Главная страница сообщений

[#] Следующая страница

Перейти к полной версии