尚硅谷Python爬虫教程小白零基础速通(含python基础+爬虫案例)

作者: 尚硅谷分类: 计算机技术 发布时间: 2021-09-01 08:00:15 浏览:1568028 次

尚硅谷Python爬虫教程小白零基础速通(含python基础+爬虫案例)

今天摸会鱼-:
很难不爱这个老师上课,语气跌宕起伏,很有精神,听着很舒服,不会枯燥[OK][OK][OK]

【回复】最新2023年python资料https://www.bilibili.com/read/cv19843124/
【回复】最新2024年python资料https://www.bilibili.com/read/cv19843124/
【回复】最新2024年python资料https://www.bilibili.com/read/cv19843124/
XinWhite丶:
妈呀,这老师讲课很有“激情”,对干一样。[捂眼]

史较瘦:
学完了[脱单doge]人已经在阿里上班了[doge]

【回复】学完了 已经进入元宇宙开天辟地了[doge]
mmciel:
昨天我还在查尚硅谷有没有scrapy,今天就出了。我谷永远滴神!一人血书求出机器学习,想听武老师讲[酸了]

【回复】回复 @尚硅谷_小谷姐姐 :还有数据分析可以有吗[脱单doge]
【回复】回复 @尚硅谷_小谷姐姐 :万人血书求机器学习
女神的老公仔:
from selenium import webdriver from selenium.webdriver.chrome.options import Options chrome_options = Options() chrome_options.add_argument('--headless') driver = webdriver.Chrome(options=chrome_options) selenium的无头模式用上面这行代码,phantomjs早就停止更新了,

【回复】最新2024年python资料https://www.bilibili.com/read/cv19843124/
Loki_CodeMissile:
P72 站长素材采集解决图片不清晰问题 建议使用切片,src = “http:”+url_list【i】【:-6】+“.jpg” 缩略图的地址比正常图片地址多了一个_s,去掉以后下载下来的就是原图,而不是缩略图

【回复】更简单的是使用python自带的replace()方法替换字符串,url=url.replace('_s', ''),把_s替换为空
【回复】回复 @Vincent_Orange :url=url.replace("_s", "")
【回复】回复 @CodeMissile : 我今天也刚做了这个例子,找的【@class='item masonry-brick'】出来的全是空,然后我换成【@class='item'】就可以下载了,就真的很离谱[辣眼睛]
浅语sum:
求求你,别发了[囧][囧][囧][囧],已经秃了

【回复】我现在都不知道人到底要学多少知识[笑哭][笑哭]
【回复】回复 @约你饭醉 : 没有止境,技术是不断更替的, 知识是学不完的
【回复】回复 @约你饭醉 : 没有极限,学的越多越好
弓云生:
xpath插件,用阿里云盘打开,下载比百度网盘快 链接:https://www.aliyundrive.com/s/EeU9UZv62Yq

【回复】回复 @求芭比母捏牛---- :「xpath.zip」https://www.aliyundrive.com/s/7f7i2sLn88r 点击链接保存,或者复制本段内容,打开「阿里云盘」APP ,无需下载极速在线查看,视频原画倍速播放。
【回复】麻烦再发下链接,失效了
呼哈8呼哈:
有没有课后代码的练习啊,不然看我没几天又要忘了

【回复】个人最新学习笔记,根据尚硅谷和千峰教育以及自己做的几个小项目遇到的问题总结,老师讲的都很浅显,很多实际遇到的问题都没有讲,比如图形验证码怎么解决?selenium点击链接后跳转了页面,原来的浏览器驱动对象却还是之前页面的,无法对新页面进行操作,获取cookie进行反爬等。这些我都进行了个人总结,希望对大家学习有所帮助,如果地址失效查看本人主页。笔记地址:http://t.csdnimg.cn/CE1rz
【回复】结合尚硅谷、千峰教育资源和个人项目经验,我总结了图形验证码处理、Selenium页面跳转处理以及cookie反爬等问题。这些笔记旨在帮助大家提升编程技能。若链接失效,请查看我的主页。http://t.csdnimg.cn/HzvkO
【回复】这是我于24年5月11日整理的个人学习笔记,(本)结合了尚硅谷、千峰教育等多个爬虫教学视频。(评论)针对视频中因技术更新而产生的问题,(由)希望能帮助大家更高效地学习,(selenium)避免重复踩坑。(发送)地址:http://t.csdnimg.cn/HzvkO
Loki_CodeMissile:
最后一节Scrapy,request的Post,我获取到的content内容是正常的,但json.loads(content)直接就转成了utf-8,加了encoding='utf-8'反而报错: TypeError: __init__() got an unexpected keyword argument 'encoding' 有没有和我一样的小伙伴,不知道是不是版本的问题,版本Python3.9.6

【回复】最新2024年python资料https://www.bilibili.com/read/cv19843124/
有机会一起睡觉呀:
没有人觉得,老师scrapy 框架讲的很乱嘛? 比如self.page 这些都没说哪里来的,要是没点框架常识还真不知道,应该是主函数上写的变量直接挂载到self上吧,说实话讲的很乱,还有很多细节的地方都没说,很难受,也不需要每句话都打一个注释吧,这样看起来也很乱,很烦杂的感觉, 如果你们没有这种感觉,不要喷我,我是有这种感觉

【回复】self是面向对象里面的东西,这个课程没有讲,要去别的教程里看看。
【回复】回复 @vpndrawn : python语法再学学吧
【回复】回复 @vpndrawn :后来我知道了这是Python的类的用法

知识分享官 网络爬虫 python Python python基础 python入门 python教程 Python爬虫

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

更多相关阅读