2023年1月11日 星期三

Python爬蟲

 Python爬蟲

源自於 https://pala.tw/python-web-crawler/

import requests

from bs4 import BeautifulSoup


tag = input("請輸入定位元素,class前面加上.,id前面加上# ")

res = requests.get('https://hipala.github.io/class-id-example/')

soup = BeautifulSoup(res.text, "html")


for drink in soup.select('{}'.format(tag)):

    print(drink.get_text())


>>> %Run -c $EDITOR_CONTENT

請輸入定位元素,class前面加上.,id前面加上# .半糖

老闆的半糖去冰珍珠奶茶

心儀同事的半糖去冰文山青茶

工讀生的半糖微冰珍珠紅茶

>>> 



https://hipala.github.io/class-id-example/

老闆的半糖去冰珍珠奶茶

資深前輩的無糖去冰綠茶

Pala的無糖微冰鐵觀音

心儀同事的半糖去冰文山青茶

工讀生的半糖微冰珍珠紅茶



<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>辦公室的下午茶</title>
</head>
<body>
<p id="老闆" class="半糖 去冰 珍珠 奶茶">老闆的半糖去冰珍珠奶茶</p>
<p id="資深前輩" class="無糖 去冰 綠茶">資深前輩的無糖去冰綠茶</p>
<p id="Pala" class="無糖 微冰 鐵觀音">Pala的無糖微冰鐵觀音</p>
<p id="心儀同事" class="半糖 去冰 文山青茶">心儀同事的半糖去冰文山青茶</p>
<p id="工讀生" class="半糖 微冰 珍珠 紅茶">工讀生的半糖微冰珍珠紅茶</p>
</body>
</html>


ample/')soup = BeautifulSoup(res.text, "html")
for drink in soup.select('{}'.format(tag)):    print(drink.get_text())

沒有留言:

張貼留言

2024_09 作業3 以Node-Red 為主

 2024_09 作業3  (以Node-Red 為主  Arduino 可能需要配合修改 ) Arduino 可能需要修改的部分 1)mqtt broker  2) 主題Topic (發行 接收) 3) WIFI ssid , password const char br...