折雨的天空
需要下载一个book118的文档,找了个工具,需要一点动手能力才行
2022-6-23 我好笨


首先安装python,在win11的命令提示符下,输入python回车,会弹出微软的商店。就在商店里面安装吧。



如果自己下载安装的,需要去配置Path什么的,麻烦。



然后,找到工具的github地址:



GitHub - kerms5/book118: 使用playwright强力驱动的原创力文档book118和豆丁网docin下载工具





下载源码吧。



按照github上的提示进行安装:







pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

# 安装playwright库
pip install playwright -i https://pypi.tuna.tsinghua.edu.cn/simple

# 安装浏览器驱动文件(安装过程稍微有点慢)
python -m playwright install



我加了国内源,不然下载慢,容易报错。也可以配置全局的国内源,临时用一下,麻烦,就带在参数上了。







安装完成以上步骤以后,开始下载文件,这个时候可能会报错:







ModuleNotFoundError: No module named 'requests'



如果报错的话,就执行:



pip install requests

或者试一试

pip3 install requests



issue里面有这个问题:ModuleNotFoundError: No module named 'requests' · Issue #2 · kerms5/book118 · GitHub







好了,修复问题以后,按照官方说法,开始下载:







# book118
python run.py 'https://max.book118.com/html/2017/1105/139064432.shtm'

python3 run.py 'https://max.book118.com/html/2019/0929/6203012025002111.shtm'
# docin
python run.py 'https://www.docin.com/p-1052644960.html'





这个时候,可能又会报错。



微信图片_20220623114224.png







这个时候,你把上面地址边上的单引号去掉,嘿,就可以了。只是我当时下载和记录的时候可以哈,不保证你看到文章的时候还可以。

发表评论:
昵称

邮件地址 (选填)

个人主页 (选填)

内容