→コード: v2.2.7 jpg以外のファイル形式の画像を取れるよう修正、youtube関係のshort用短縮url判定などのロジック追加
>Fet-Fe (→コード: v2.2.6 編集前のツイートや省略があるかをチェック) |
>Fet-Fe (→コード: v2.2.7 jpg以外のファイル形式の画像を取れるよう修正、youtube関係のshort用短縮url判定などのロジック追加) |
||
6行目: | 6行目: | ||
''' | ''' | ||
ver2.2. | ver2.2.7 2023/3/5恒心 | ||
当コードは恒心停止してしまったhttps://rentry.co/7298gの降臨ショーツイート自動収集スクリプトの復刻改善版です | 当コードは恒心停止してしまったhttps://rentry.co/7298gの降臨ショーツイート自動収集スクリプトの復刻改善版です | ||
416行目: | 416行目: | ||
for image_a in tweet_media.select('.attachment.image a'): | for image_a in tweet_media.select('.attachment.image a'): | ||
try: | try: | ||
media_name: str = re.search(r'%2F([^%]*\.jpg)|%2F([^%]*\.jpeg)|%2F([^%]*\.png)|%2F([^%]*\.gif)', image_a.get('href')). | media_name: str = [group for group in re.search(r'%2F([^%]*\.jpg)|%2F([^%]*\.jpeg)|%2F([^%]*\.png)|%2F([^%]*\.gif)', image_a.get('href')).groups() if group][0] | ||
media_list.append(f"[[ファイル:{media_name}|240px]]") | media_list.append(f"[[ファイル:{media_name}|240px]]") | ||
if self._download_media(media_name): | if self._download_media(media_name): | ||
479行目: | 479行目: | ||
return poll_txt | return poll_txt | ||
def _check_additional_info(self, tweet: bs4.element.Tag, tweet_url: str): | def _check_additional_info(self, tweet: bs4.element.Tag, tweet_url: str) -> None: | ||
if '/i/web/status/' in tweet.text: | if '/i/web/status/' in tweet.text: | ||
print(f"{tweet_url}をには編集前のツイートか省略が存在する可能性があります") | print(f"{tweet_url}をには編集前のツイートか省略が存在する可能性があります") | ||
555行目: | 555行目: | ||
#Nitter上のYouTubeへのリンクをInvidiousのものから直す | #Nitter上のYouTubeへのリンクをInvidiousのものから直す | ||
url_link: str = url.get('href') | url_link: str = url.get('href') | ||
url_link = self._invidious_pattern.sub('youtu.be', url_link) | if re.match('https://[^/]+/[^/]+/', url_link): | ||
url_link = self._invidious_pattern.sub('youtube.com', url_link) | |||
else: | |||
url_link = self._invidious_pattern.sub('youtu.be', url_link) | |||
url.replace_with(self._archive_url(url_link, url_link)) ##テンプレートArchiveに変化 | url.replace_with(self._archive_url(url_link, url_link)) ##テンプレートArchiveに変化 | ||
elif url.get('href').startswith('https://bibliogram.art/'): | elif url.get('href').startswith('https://bibliogram.art/'): |