「利用者・トーク:夜泣き」の版間の差分
ナビゲーションに移動
検索に移動
>夜泣き 編集の要約なし |
>Fet-Fe |
||
6行目: | 6行目: | ||
::{{CM|返信}} - 当職も[[利用者:Fet-Fe#恒心教徒の皆様へ:当Wikiのソースの魚拓取得をお手伝い下さい]]で少しだけ使ったので、よろしければ参考にして下さい。不慣れだったので効率の悪い書き方かもしれませんが--[[利用者:Fet-Fe|Fet-Fe]] ([[利用者・トーク:Fet-Fe|トーク]]) 2022年6月17日 (金) 00:33 (JST) | ::{{CM|返信}} - 当職も[[利用者:Fet-Fe#恒心教徒の皆様へ:当Wikiのソースの魚拓取得をお手伝い下さい]]で少しだけ使ったので、よろしければ参考にして下さい。不慣れだったので効率の悪い書き方かもしれませんが--[[利用者:Fet-Fe|Fet-Fe]] ([[利用者・トーク:Fet-Fe|トーク]]) 2022年6月17日 (金) 00:33 (JST) | ||
:::{{CM|返信}} - 出会いに感謝。参考にさせてもらいました。関数アノテーションは知らなかっただけになんとも言えないですわ・・・--[[利用者:夜泣き|夜泣き]] ([[利用者・トーク:夜泣き|トーク]]) 2022年6月18日 (土) 21:04 (JST) | :::{{CM|返信}} - 出会いに感謝。参考にさせてもらいました。関数アノテーションは知らなかっただけになんとも言えないですわ・・・--[[利用者:夜泣き|夜泣き]] ([[利用者・トーク:夜泣き|トーク]]) 2022年6月18日 (土) 21:04 (JST) | ||
{{CM}} - 出会いに感謝。すごく読みやすいです。取り敢えず思ったことを | |||
* [[テンプレート:Archive]]ではなく[[テンプレート:CallinShowLink]]を使っていただけると嬉しいです | |||
* DoS攻撃になりかねないので<code>request_onetime</code>に<syntaxhighlight lang="python3" inline>sleep(1)</syntaxhighlight>を入れた方が良いと思います | |||
* 出力の魚拓がTor用のURLになっています | |||
* 返り値がNoneの可能性があるときは<syntaxhighlight lang="python3" inline>requests.models.Response | None</syntaxhighlight>([https://docs.python.org/ja/3/library/typing.html#typing.Optional])などとした方が良いです | |||
* 贅沢なことを言うと[https://github.com/palewire/archiveis/blob/master/archiveis/api.py https://github.com/palewire/archiveis/blob/master/archiveis/api.py]みたいな感じで魚拓も自動で取れると理想的ですね [[利用者:Fet-Fe#恒心教徒の皆様へ:当Wikiのソースの魚拓取得をお手伝い下さい|当職が前に試したとき]]は何ページかリクエストすると弾かれてしまっていました あと玉葱だとどうなるかわかりません |
2022年6月20日 (月) 12:06時点における版
てすや
利用者:夜泣き/スクリプトについて
提案 - どうせrequestモジュールでpipが必要ならBeautifulSoupも入れてしまえば、HTMLから文字を抜き出す際にgrepやreを使うよりもすっきり書けると思います。貴職がどういうロジックにするつもりなのかまだわかりませんが--Fet-Fe (トーク) 2022年6月16日 (木) 23:26 (JST)
- コメント - それは思ってました。標準のみか追加するかの2択しかないんで後者ならたぶん使うことになるでしょう。BeautifulSoupのほうは使ったこと無いってのがネックですがなんとかなるでしょう。--夜泣き (トーク) 2022年6月16日 (木) 23:31 (JST)
- 返信 - 当職も利用者:Fet-Fe#恒心教徒の皆様へ:当Wikiのソースの魚拓取得をお手伝い下さいで少しだけ使ったので、よろしければ参考にして下さい。不慣れだったので効率の悪い書き方かもしれませんが--Fet-Fe (トーク) 2022年6月17日 (金) 00:33 (JST)
コメント - 出会いに感謝。すごく読みやすいです。取り敢えず思ったことを
- テンプレート:Archiveではなくテンプレート:CallinShowLinkを使っていただけると嬉しいです
- DoS攻撃になりかねないので
request_onetime
にsleep(1)
を入れた方が良いと思います - 出力の魚拓がTor用のURLになっています
- 返り値がNoneの可能性があるときは
requests.models.Response | None
([1])などとした方が良いです - 贅沢なことを言うとhttps://github.com/palewire/archiveis/blob/master/archiveis/api.pyみたいな感じで魚拓も自動で取れると理想的ですね 当職が前に試したときは何ページかリクエストすると弾かれてしまっていました あと玉葱だとどうなるかわかりません