マヨケーがポアされたため、現在はロシケーがメインとなっています。

「利用者・トーク:夜泣き」の版間の差分

提供:唐澤貴洋Wiki
ナビゲーションに移動 検索に移動
>Fet-Fe
編集の要約なし
>Fet-Fe
12行目: 12行目:
* 返り値がNoneの可能性があるときは‎<syntaxhighlight lang="python3" inline>requests.models.Response | None</syntaxhighlight>([https://docs.python.org/ja/3/library/typing.html#typing.Optional])などとした方が良いです
* 返り値がNoneの可能性があるときは‎<syntaxhighlight lang="python3" inline>requests.models.Response | None</syntaxhighlight>([https://docs.python.org/ja/3/library/typing.html#typing.Optional])などとした方が良いです
* 贅沢なことを言うと[https://github.com/palewire/archiveis/blob/master/archiveis/api.py https://github.com/palewire/archiveis/blob/master/archiveis/api.py]みたいな感じで魚拓も自動で取れると理想的ですね [[利用者:Fet-Fe#恒心教徒の皆様へ:当Wikiのソースの魚拓取得をお手伝い下さい|当職が前に試したとき]]は何ページかリクエストすると弾かれてしまっていました あと玉葱だとどうなるかわかりません
* 贅沢なことを言うと[https://github.com/palewire/archiveis/blob/master/archiveis/api.py https://github.com/palewire/archiveis/blob/master/archiveis/api.py]みたいな感じで魚拓も自動で取れると理想的ですね [[利用者:Fet-Fe#恒心教徒の皆様へ:当Wikiのソースの魚拓取得をお手伝い下さい|当職が前に試したとき]]は何ページかリクエストすると弾かれてしまっていました あと玉葱だとどうなるかわかりません
* あと当職はその書き方をしたことがないのでわからないのですが、doublesoupとかって必要ですか?soupにfindなどした結果にそのままさらにfindなどの処理をすることは多分可能だと思います
--[[利用者:Fet-Fe|Fet-Fe]] ([[利用者・トーク:Fet-Fe|トーク]]) 2022年6月20日 (月) 12:06 (JST)
--[[利用者:Fet-Fe|Fet-Fe]] ([[利用者・トーク:Fet-Fe|トーク]]) 2022年6月20日 (月) 12:06 (JST)

2022年6月20日 (月) 14:12時点における版

てすや

利用者:夜泣き/スクリプトについて

提案 - どうせrequestモジュールでpipが必要ならBeautifulSoupも入れてしまえば、HTMLから文字を抜き出す際にgrepやreを使うよりもすっきり書けると思います。貴職がどういうロジックにするつもりなのかまだわかりませんが--Fet-Fe (トーク) 2022年6月16日 (木) 23:26 (JST)

コメント - それは思ってました。標準のみか追加するかの2択しかないんで後者ならたぶん使うことになるでしょう。BeautifulSoupのほうは使ったこと無いってのがネックですがなんとかなるでしょう。--夜泣き (トーク) 2022年6月16日 (木) 23:31 (JST)
返信 - 当職も利用者:Fet-Fe#恒心教徒の皆様へ:当Wikiのソースの魚拓取得をお手伝い下さいで少しだけ使ったので、よろしければ参考にして下さい。不慣れだったので効率の悪い書き方かもしれませんが--Fet-Fe (トーク) 2022年6月17日 (金) 00:33 (JST)
返信 - 出会いに感謝。参考にさせてもらいました。関数アノテーションは知らなかっただけになんとも言えないですわ・・・--夜泣き (トーク) 2022年6月18日 (土) 21:04 (JST)

コメント - 出会いに感謝。すごく読みやすいです。取り敢えず思ったことを

  • テンプレート:Archiveではなくテンプレート:CallinShowLinkを使っていただけると嬉しいです
  • DoS攻撃になりかねないのでrequest_onetimesleep(1)を入れた方が良いと思います
  • 出力の魚拓がTor用のURLになっています
  • 返り値がNoneの可能性があるときは‎requests.models.Response | None([1])などとした方が良いです
  • 贅沢なことを言うとhttps://github.com/palewire/archiveis/blob/master/archiveis/api.pyみたいな感じで魚拓も自動で取れると理想的ですね 当職が前に試したときは何ページかリクエストすると弾かれてしまっていました あと玉葱だとどうなるかわかりません
  • あと当職はその書き方をしたことがないのでわからないのですが、doublesoupとかって必要ですか?soupにfindなどした結果にそのままさらにfindなどの処理をすることは多分可能だと思います

--Fet-Fe (トーク) 2022年6月20日 (月) 12:06 (JST)