目的のサイト <-uaを指定- splash <-- python(requests)
# ここを参考
https://splash.readthedocs.io/en/stable/faq.html
ローカルのsplashサーバーへはrun、メソッドはPOST を指定。
(もっとドキュメントを読む必要あり.....)
以下の2点は確認済み
- リスエストのヘッダーを見ると、期待したuser-agentが設定されている。
- メソッドはGETになっている。(たぶんデフォがGET)
import requests
def splash_scripts():
return """
splash:set_user_agent(args.ua)
splash:go(args.url)
return splash:html()
"""
def req_page(url):
ua = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'
url_local = 'http://localhost:8050/run'
prms = {
'lua_source': splash_scripts(),
'url': url,
'ua': ua,
# 'wait': 2
}
res = requests.post(url_local, json=prms)
return res
if __name__ == '__main__':
# リスエストのヘッダーを確認
url = 'http://tools.up2a.info/ja/requestheaders'
# url = 'http://192.168.1.3/'
res = req_page(url)
print(res.text)
0 件のコメント:
コメントを投稿