【Python爬虫教程】花9888买的Python爬虫全套教程2023完整版现分享给大家!(已更新Scrapy项目)——附赠课程与资料

作者: 小猿Python的主页分类: 计算机技术 发布时间: 2021-10-08 13:34:21 浏览:652279 次

【Python爬虫教程】花9888买的Python爬虫全套教程2023完整版现分享给大家!(已更新Scrapy项目)——附赠课程与资料

夜明神下李舜生:
up分享的视频我也看完了,有一个问题(可能是跟pycharm版本有关系)在selenium章节时候老师讲的web.find_element_by_xpath()上被打上了删除线,是因为版本更新之下该方法要被弃用(但是目前还是可以用的) 解决方法: 导By包from selenium.webdriver.common.by import By 在写语句的时候改成web.find_element(By.XPATH,' ').click() 即可解决

【回复】https://www.bilibili.com/read/cv27952080/?jump_opus=1
【回复】有很多不知道是版本还是什么原因,一样的代码出来的不一样。还是感谢弹幕,提问的人可能看不到,但对后来人帮助非常大[笑哭][打call]
幼儿园的机灵鬼:
爬的越快 入国家编制更快[doge][doge][doge]

【回复】事实上国字头也能碰,前提是你背后也是国字头[doge]之前有个项目爽过一次。
【回复】只要几个网站不要碰就可以 还有国字头的
茶杯和键盘:
学习好危险,怎么都是从从入门到入坑,入坑到入狱,进阶到进橘。。[捂眼]

【回复】想多了你 到哪个程度根本不会做那些事
泽拉梅比斯:
针对P46-P52网易云音乐windows评论安装pycrypto库失败解决办法: 可以在pycharm上安装pycryptodome库,它是pycrypto的延伸版本,用法和pycrypto 是一模一样的, 但是,在使用的时候导包是有问题的,这个时候只要修改一个文件夹的名称就可以完美解决这个问题, 找到pycharm路径下python_list\venv\Lib\site-packages,下面有一个文件夹叫做crypto,将c改成C,对就是改成大写就ok了!!!

星汇电子:
我来说一下,4_7最后结果可能会有的错误。如果有: raise RuntimeError('Event loop is closed') RuntimeError: Event loop is closed 这种错误,解决方法:把 asyncio.run(main()) 改为 loop = asyncio.get_event_loop() (换行) loop.run_until_complete(main())

【回复】回复 @eteng微空 :因为async定义的函数会返回一个 coroutine 协程对象,关于这个对象必须要注册到事件循环中去才可以执行,而我们原来的asyncio.run(main())会自动关闭循环(就是前面提到的Loop event),并且调用_ProactorBasePipeTransport.__del__报错, 而asyncio.run_until_complete()不会.
【回复】https://www.bilibili.com/read/cv25966342/?spm_id_from=333.999.0.0 !!!!
【回复】感谢大佬!解决了。另外同求这么写的原因
wowlola:
砍菜的页面原代码为什么我没有大白菜的数据

【回复】估计是页面更新啦,没那么好爬取了,这是2021,3月的课
-消失的-下雨天:
运行mybaidu.html的时候,显示windows找不到文件'chrome'。是要有谷歌浏览器吗

【回复】可以选edge或者IE,火狐,实在不行搞个绿色版chrome干净免安装一样香[吃瓜]
加拿大原神:
菜价的是不是不让爬了?payload里面数据看不到,用Chrome浏览器和Microsoft edge都看不到

【回复】XHR里面点getcat把url和data粘回去post方法就行了[OK]
【回复】回复 @YYY_YB : 解决了吗[doge]
【回复】我想问一下,我抓去新发地菜价的时候,用的post搞的,但是后面使用page.find的时候怎么定位标签和属性
革斤木公neau:
爬取网易云音乐怎么获取第二页的评论

【回复】为啥我爬取网易云评论代码总有问题,与作者的代码一样的
【回复】第二页请求需要一个传入的数字
李还在数星星:
html标签说成乱码,学过前后端的真看不下去

【回复】人家肯定懂啊,跟小白说的
bili_45231847289:
为什么我取得名字是('肖申克的救赎',) ('霸王别姬',) ('阿甘正传',) ('泰坦尼克号',) ('这个杀手不太冷',) ('美丽人生',) ('千与千寻',) ('辛德勒的名单',) ('盗梦空间',) ('忠犬八公的故事',) ('星际穿越',) ('楚门的世界',) ('海上钢琴师',) ('三傻大闹宝莱坞',) ('机器人总动员',) ('放牛班的春天',)

【回复】输出这么写 print(i.groups("name")【0】)
头七回魂:
放心尽管学 你就算把这课程倒背如流也进不了监狱,因为一个加密就把你挡在门外了

著雍-摄提格:
代码完成了想要的结果,但是会报错Exception ignored in: <function _ProactorBasePipeTransport.__del__ at 0x000001B9E81B4DC0>Traceback (most recent call last):,请问一下这个问题怎么解决?我看网上说的原因是Python垃圾回收机制在回收session对象时,发现 c_api_util 或 tf_session已经被回收了,造成了空指针。但是尝试了网上给的各种方法没有解决。

科技猎手 程序员 PYTHON 学习 教程 编程 野生技术协会 爬虫 python 编程开发

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!