网站首页 > 编程文章 正文
因为老网站内容使用了第三方的网站的图片外链,随时都可能有图片打不开的风险。于是需要把30多兆的数据库文件中的图片链接提取出来并批量下载下来到oss存储。
首先把网站数据库导出成CSV文件,通过PYthon脚本批量提取出csv文件里面的图片链接。(csv文件需要13M以内)
以下代码提取csv中的图片链接,并打印出来。
import csv
import re
def extract_image_links(csv_file):
image_links = []
with open(csv_file, 'r',encoding='utf-8') as file:
reader = csv.reader(file)
for row in reader:
for item in row:
# 使用正则表达式提取图片链接
matches = re.findall(r'(https?://\S+\.png|https?://\S+\.jpg|https?://\S+\.jpeg|https?://\S+\.gif)', item)
if matches:
image_links.extend(matches)
return image_links
csv_file = '你的文件.csv'
image_links = extract_image_links(csv_file)
for link in image_links:
print(link)
原创转载需要经过作者同意
猜你喜欢
- 2024-10-20 Microsoft Excel 网页版新增导出 CSV 文件功能
- 2024-10-20 保姆式教程|仅靠这个数据库就发到生信3+?这个套路值得耍一耍
- 2024-10-20 Rdatasets:2000+个数据集供你练习数据分析及其可视化!
- 2024-10-20 Commata库:C++中CSV文件处理(csv库的作用)
- 2024-10-20 Data Lake Analytics + OSS数据文件格式处理大全
- 2024-10-20 JS 下载/导出 csv、excel、txt 、img等文件的方法总结
- 2024-10-20 一个超强的机器学习库(机器学习库sklearn)
- 2024-10-20 保姆式教程|TCGA+GEO单基因生信SCI,手把手带你复现
- 2024-10-20 用Python读取csv文件中的沪深300指数历史交易数据
- 2024-10-20 CSV超大文件编辑软件snapde(csv文件大小)
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- spire.doc (59)
- system.data.oracleclient (61)
- 按键小精灵源码提取 (66)
- pyqt5designer教程 (65)
- 联想刷bios工具 (66)
- c#源码 (64)
- graphics.h头文件 (62)
- mysqldump下载 (66)
- sqljdbc4.jar下载 (56)
- libmp3lame (60)
- maven3.3.9 (63)
- 二调符号库 (57)
- 苹果ios字体下载 (56)
- git.exe下载 (68)
- diskgenius_winpe (72)
- pythoncrc16 (57)
- solidworks宏文件下载 (59)
- qt帮助文档中文版 (73)
- satacontroller (66)
- hgcad (64)
- bootimg.exe (69)
- android-gif-drawable (62)
- axure9元件库免费下载 (57)
- libmysqlclient.so.18 (58)
- springbootdemo (64)
本文暂时没有评论,来添加一个吧(●'◡'●)