目的のサイト <-uaを指定- splash <-- python(requests)
# ここを参考
https://splash.readthedocs.io/en/stable/faq.html
ローカルのsplashサーバーへはrun、メソッドはPOST を指定。
(もっとドキュメントを読む必要あり.....)
以下の2点は確認済み
- リスエストのヘッダーを見ると、期待したuser-agentが設定されている。
- メソッドはGETになっている。(たぶんデフォがGET)
import requests def splash_scripts(): return """ splash:set_user_agent(args.ua) splash:go(args.url) return splash:html() """ def req_page(url): ua = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36' url_local = 'http://localhost:8050/run' prms = { 'lua_source': splash_scripts(), 'url': url, 'ua': ua, # 'wait': 2 } res = requests.post(url_local, json=prms) return res if __name__ == '__main__': # リスエストのヘッダーを確認 url = 'http://tools.up2a.info/ja/requestheaders' # url = 'http://192.168.1.3/' res = req_page(url) print(res.text)
0 件のコメント:
コメントを投稿