利用者・トーク:夜泣き

てすや

利用者:夜泣き/スクリプトについて

提案 - どうせrequestモジュールでpipが必要ならBeautifulSoupも入れてしまえば、HTMLから文字を抜き出す際にgrepやreを使うよりもすっきり書けると思います。貴職がどういうロジックにするつもりなのかまだわかりませんが--Fet-Fe (トーク) 2022年6月16日 (木) 23:26 (JST)

コメント - それは思ってました。標準のみか追加するかの2択しかないんで後者ならたぶん使うことになるでしょう。BeautifulSoupのほうは使ったこと無いってのがネックですがなんとかなるでしょう。--夜泣き (トーク) 2022年6月16日 (木) 23:31 (JST)

返信 - 当職も利用者:Fet-Fe#恒心教徒の皆様へ：当Wikiのソースの魚拓取得をお手伝い下さいで少しだけ使ったので、よろしければ参考にして下さい。不慣れだったので効率の悪い書き方かもしれませんが--Fet-Fe (トーク) 2022年6月17日 (金) 00:33 (JST)

返信 - 出会いに感謝。参考にさせてもらいました。関数アノテーションは知らなかっただけになんとも言えないですわ・・・--夜泣き (トーク) 2022年6月18日 (土) 21:04 (JST)

コメント - 出会いに感謝。すごく読みやすいです。取り敢えず思ったことを

テンプレート:Archiveではなくテンプレート:CallinShowLinkを使っていただけると嬉しいです
DoS攻撃になりかねないのでrequest_onetimeにsleep(1)を入れた方が良いと思います
出力の魚拓がTor用のURLになっています
返り値がNoneの可能性があるときは‎requests.models.Response | None([1])などとした方が良いです
贅沢なことを言うとhttps://github.com/palewire/archiveis/blob/master/archiveis/api.pyみたいな感じで魚拓も自動で取れると理想的ですね当職が前に試したときは何ページかリクエストすると弾かれてしまっていましたあと玉葱だとどうなるかわかりません
あと当職はその書き方をしたことがないのでわからないのですが、doublesoupとかって必要ですか？soupにfindなどした結果にそのままさらにfindなどの処理をすることは多分可能だと思います

--Fet-Fe (トーク) 2022年6月20日 (月) 12:06 (JST)