2023年1月11日 星期三

Python爬蟲

 Python爬蟲

源自於 https://pala.tw/python-web-crawler/

import requests

from bs4 import BeautifulSoup


tag = input("請輸入定位元素,class前面加上.,id前面加上# ")

res = requests.get('https://hipala.github.io/class-id-example/')

soup = BeautifulSoup(res.text, "html")


for drink in soup.select('{}'.format(tag)):

    print(drink.get_text())


>>> %Run -c $EDITOR_CONTENT

請輸入定位元素,class前面加上.,id前面加上# .半糖

老闆的半糖去冰珍珠奶茶

心儀同事的半糖去冰文山青茶

工讀生的半糖微冰珍珠紅茶

>>> 



https://hipala.github.io/class-id-example/

老闆的半糖去冰珍珠奶茶

資深前輩的無糖去冰綠茶

Pala的無糖微冰鐵觀音

心儀同事的半糖去冰文山青茶

工讀生的半糖微冰珍珠紅茶



<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>辦公室的下午茶</title>
</head>
<body>
<p id="老闆" class="半糖 去冰 珍珠 奶茶">老闆的半糖去冰珍珠奶茶</p>
<p id="資深前輩" class="無糖 去冰 綠茶">資深前輩的無糖去冰綠茶</p>
<p id="Pala" class="無糖 微冰 鐵觀音">Pala的無糖微冰鐵觀音</p>
<p id="心儀同事" class="半糖 去冰 文山青茶">心儀同事的半糖去冰文山青茶</p>
<p id="工讀生" class="半糖 微冰 珍珠 紅茶">工讀生的半糖微冰珍珠紅茶</p>
</body>
</html>


ample/')soup = BeautifulSoup(res.text, "html")
for drink in soup.select('{}'.format(tag)):    print(drink.get_text())

沒有留言:

張貼留言

2024產專班 作業2 (純模擬)

2024產專班 作業2  (純模擬) 1) LED ON,OFF,TIMER,FLASH 模擬 (switch 控制) 2)RFID卡號模擬 (buttom  模擬RFID UID(不從ESP32) Node-Red 程式 [{"id":"d8886...