Python爬蟲
源自於 https://pala.tw/python-web-crawler/
import requests
from bs4 import BeautifulSoup
tag = input("請輸入定位元素,class前面加上.,id前面加上# ")
res = requests.get('https://hipala.github.io/class-id-example/')
soup = BeautifulSoup(res.text, "html")
for drink in soup.select('{}'.format(tag)):
print(drink.get_text())
>>> %Run -c $EDITOR_CONTENT
請輸入定位元素,class前面加上.,id前面加上# .半糖
老闆的半糖去冰珍珠奶茶
心儀同事的半糖去冰文山青茶
工讀生的半糖微冰珍珠紅茶
>>>
https://hipala.github.io/class-id-example/
老闆的半糖去冰珍珠奶茶
資深前輩的無糖去冰綠茶
Pala的無糖微冰鐵觀音
心儀同事的半糖去冰文山青茶
工讀生的半糖微冰珍珠紅茶
<!DOCTYPE html> | ||||||||||
<html lang="en"> | ||||||||||
<head> | ||||||||||
<meta charset="UTF-8"> | ||||||||||
<title>辦公室的下午茶</title> | ||||||||||
</head> | ||||||||||
<body> | ||||||||||
<p id="老闆" class="半糖 去冰 珍珠 奶茶">老闆的半糖去冰珍珠奶茶</p> | ||||||||||
<p id="資深前輩" class="無糖 去冰 綠茶">資深前輩的無糖去冰綠茶</p> | ||||||||||
<p id="Pala" class="無糖 微冰 鐵觀音">Pala的無糖微冰鐵觀音</p> | ||||||||||
<p id="心儀同事" class="半糖 去冰 文山青茶">心儀同事的半糖去冰文山青茶</p> | ||||||||||
<p id="工讀生" class="半糖 微冰 珍珠 紅茶">工讀生的半糖微冰珍珠紅茶</p> | ||||||||||
</body> | ||||||||||
</html> | ample/') | soup = BeautifulSoup(res.text, "html") | for drink in soup.select('{}'.format(tag)): | print(drink.get_text()) |
沒有留言:
張貼留言